AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 17328
Accepted
ScArcher2
ScArcher2
Asked: 2011-10-14 06:49:06 +0800 CST2011-10-14 06:49:06 +0800 CST 2011-10-14 06:49:06 +0800 CST

Quais são os critérios mínimos de correspondência recomendados para correspondência confiável de pacientes com base demográfica?

  • 772

Ao combinar pacientes com base em dados demográficos, existem recomendações sobre quais campos devem corresponder para que o paciente seja o "Mesmo paciente"?

Sei que os algoritmos serão diferentes para diferentes implementações, só estou curioso para saber se existem práticas recomendadas ou recomendações sobre esse processo.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

etc?

identity
  • 7 7 respostas
  • 2731 Views

7 respostas

  • Voted
  1. Best Answer
    Jaime de los Hoyos M.
    2011-10-14T07:09:15+08:002011-10-14T07:09:15+08:00

    Existe este ótimo ensaio (em espanhol, desculpe) escrito por Pablo Pazos, um engenheiro de CS do Uruguai que trabalha com TI em saúde desde 2006 e fez ótimas contribuições para o campo, no qual descreve um algoritmo para fazer isso.

    Você pode executar o artigo por meio de um tradutor, mas a essência é que as informações básicas para determinar a identidade de uma pessoa são seus nomes e sobrenomes (tanto do pai quanto da mãe), sexo e data de nascimento. Curiosamente, ele exclui especificamente números de identificação como SSN de seus algoritmos de correspondência de identidade, já que "qualquer tipo de identificador NÃO faz parte de sua identidade" (acho que esse ponto pode ser discutível). Além disso, ele exclui atributos como endereço, números de telefone, etc. Uma vez que não estão realmente relacionados com a identidade de alguém, eles não estão associados a "quem alguém realmente é".

    Além disso, ele atribui diferentes "pesos" a cada um dos atributos anteriores, assim:

    • Primeiro nome: 17,5%
    • Nome do meio: 17,5%
    • Sobrenome (pai): 17,5%
    • Sobrenome (mãe): 17,5%
    • Sexo: 10%
    • DOB: 20%

    Com as correspondências encontradas em cada um desses atributos, ele descreve uma metodologia para obter um "índice de correspondência de concordância" composto com o qual as comparações entre os registros podem ser possíveis. Além disso, correspondências "parciais" nos atributos de nome são possíveis usando algoritmos como a distância de Levenshtein .

    Boa leitura, IMO. Desculpe, está em espanhol, mas espero ter conseguido transmitir suas ideias principais.

    • 20
  2. Lynn
    2011-10-19T20:24:47+08:002011-10-19T20:24:47+08:00

    Não existe um único algoritmo mágico para correspondência de pacientes, e duvido que algum dia exista.

    Para começar, existem variações regionais. Como apontou MMattoli, o que funciona bem em um hospital urbano dos Estados Unidos provavelmente não funcionará bem em uma clínica rural australiana que trata aborígenes.

    Além disso, sites individuais têm visões diferentes sobre tolerância a falhas. Se você combinasse apenas quando tivesse certeza absoluta , perderia muitas partidas. Isso causa registros de pacientes duplicados, o que cria todo um outro conjunto de problemas. A maioria dos sites estará disposta a se contentar com quase certeza , mas quão certo é certo o suficiente? Pergunte a 10 pessoas e você obterá 12 respostas.

    Portanto, o "melhor" algoritmo será configurável, para que seus clientes possam ajustá-lo para atender às suas necessidades.

    Ao considerar uma correspondência, diferentes campos oferecem vários graus de confiança.

    Os identificadores específicos de assistência médica oferecem mais confiança, pois todo o seu objetivo é identificar exclusivamente a pessoa dentro do sistema de saúde. Os hospitais geralmente se esforçam para garantir que eles não sejam duplicados.

    Exemplos:

    • Identificação Nacional de Saúde (por exemplo, número do NHS do Reino Unido)
    • Número de registro médico atribuído pelo hospital.

    Outros identificadores de pacientes também podem oferecer alta confiança, dependendo do sistema. Por exemplo, uma identidade militar provavelmente é muito relevante em um hospital militar.

    Exemplos:

    • identidade militar
    • ID do seguro
    • Número da Previdência Social (Nos EUA, o número da Previdência Social geralmente não é considerado uma correspondência de alta confiança, devido à fraude de seguro desenfreada.)

    Na ausência de identificadores únicos, deve-se recorrer à informação demográfica. É desaconselhável fazer correspondência em qualquer campo , mas quanto mais correspondência de campo demográfico, mais confiável será a correspondência.

    Coisas sobre uma pessoa que não mudam com frequência são boas para combinar:

    • Nome
    • Gênero
    • Data de nascimento

    Mas informações ainda mais maleáveis ​​podem ser consideradas na partida para aumentar a confiança:

    • Endereço
    • Número de telefone
    • Endereço de email
    • 13
  3. Andy Judson
    2011-10-21T00:09:04+08:002011-10-21T00:09:04+08:00

    Também vale a pena verificar os sobrenomes anteriores, pois eles mudam com frequência.

    • 7
  4. Jamess
    2011-10-15T01:03:53+08:002011-10-15T01:03:53+08:00

    Além das combinações óbvias dos três seguintes dados em sua pergunta

    First Name
    Last Name
    Date of Birth
    City
    State
    ZIP/Pin Code
    

    Eu pensaria em adicionar phone number (Home and/or Cell)à lista. Hoje em dia é bastante comum e cada um terá um número único e, mesmo que algumas vezes as pessoas mudem seus números de telefone, os números de telefone mais antigos são lembrados pela maioria das pessoas, portanto, podem ser úteis.

    Descobrimos que o endereço geralmente sofre de várias grafias e várias formas de renderização, especialmente em países como a Índia, onde as pessoas usam um idioma local e os softwares de gerenciamento de pacientes 'ainda' usam o inglês.

    • 4
  5. bernd_k
    2011-10-21T03:08:50+08:002011-10-21T03:08:50+08:00

    O gênero nos registros parece muitas vezes ser derivado do primeiro nome. Tenho visto uma variação crescente de gênero para estrangeiros, quando não podemos derivar o gênero do nome.

    Na Alemanha, temos algumas variações adicionais com nomes que contêm o 'Umlaute' como 'äöü', que às vezes são substituídos por 'ae oe ue'.

    • 3
  6. kishore
    2011-10-21T17:12:01+08:002011-10-21T17:12:01+08:00

    Meu pensamento está na ordem abaixo 1). SSN, sobrenome e primeiros 5 caracteres do primeiro nome 2). SSN, data de nascimento e os primeiros 5 caracteres do primeiro nome 3). SSN, data de nascimento e sobrenome 4). SSN, Sexo, Data de Nascimento 5). Sobrenome, primeiros 5 caracteres do primeiro nome, cidade e CEP

    • 1
  7. HLGEM
    2012-05-03T07:23:52+08:002012-05-03T07:23:52+08:00

    Este é um problema realmente difícil nos EUA. Os nomes não são únicos e muitas vezes mudam durante a vida de uma pessoa ou são apresentados de forma diferente (Rob versus Robert, por exemplo), portanto, nunca podem ser usados ​​para identificar o paciente, exceto em conjunto com algumas informações mais confiáveis. O número do plano de saúde e o provedor mudam com muito mais frequência e podem ser os mesmos para vários membros da família. O SSN é supostamente único, mas há fraude em torno dele. O mesmo com o número da carteira de motorista, que obviamente nem todos terão.

    Pessoalmente, eu começaria com o número da apólice de seguro e a combinação de data de nascimento e nome, depois ssn e data de nascimento e combinação de nome. Eu verificaria o endereço e o telefone para me dar uma garantia adicional quando eles correspondessem, mas não muito peso se não correspondessem. Além disso, eu usaria o tipo de sangue como um fator de exclusão se for conhecido (e todos sabemos que os vampiros do hospital estarão coletando amostras de sangue), pois isso não muda. A correspondência de nomes teria que ser uma correspondência difusa devido ao problema de variação de nomes. Outras coisas geralmente devem procurar uma correspondência exata primeiro, uma correspondência difusa se a confiança do nome for realmente alta (pode ter sido um erro de digitação ao inserir o SSN).

    • 1

relate perguntas

  • Por que as pessoas recomendam não usar o nome "Id" para uma coluna de identidade?

  • Esquema de banco de dados com um campo de identidade compartilhado

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve