Ao combinar pacientes com base em dados demográficos, existem recomendações sobre quais campos devem corresponder para que o paciente seja o "Mesmo paciente"?
Sei que os algoritmos serão diferentes para diferentes implementações, só estou curioso para saber se existem práticas recomendadas ou recomendações sobre esse processo.
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
etc?
Existe este ótimo ensaio (em espanhol, desculpe) escrito por Pablo Pazos, um engenheiro de CS do Uruguai que trabalha com TI em saúde desde 2006 e fez ótimas contribuições para o campo, no qual descreve um algoritmo para fazer isso.
Você pode executar o artigo por meio de um tradutor, mas a essência é que as informações básicas para determinar a identidade de uma pessoa são seus nomes e sobrenomes (tanto do pai quanto da mãe), sexo e data de nascimento. Curiosamente, ele exclui especificamente números de identificação como SSN de seus algoritmos de correspondência de identidade, já que "qualquer tipo de identificador NÃO faz parte de sua identidade" (acho que esse ponto pode ser discutível). Além disso, ele exclui atributos como endereço, números de telefone, etc. Uma vez que não estão realmente relacionados com a identidade de alguém, eles não estão associados a "quem alguém realmente é".
Além disso, ele atribui diferentes "pesos" a cada um dos atributos anteriores, assim:
Com as correspondências encontradas em cada um desses atributos, ele descreve uma metodologia para obter um "índice de correspondência de concordância" composto com o qual as comparações entre os registros podem ser possíveis. Além disso, correspondências "parciais" nos atributos de nome são possíveis usando algoritmos como a distância de Levenshtein .
Boa leitura, IMO. Desculpe, está em espanhol, mas espero ter conseguido transmitir suas ideias principais.
Não existe um único algoritmo mágico para correspondência de pacientes, e duvido que algum dia exista.
Para começar, existem variações regionais. Como apontou MMattoli, o que funciona bem em um hospital urbano dos Estados Unidos provavelmente não funcionará bem em uma clínica rural australiana que trata aborígenes.
Além disso, sites individuais têm visões diferentes sobre tolerância a falhas. Se você combinasse apenas quando tivesse certeza absoluta , perderia muitas partidas. Isso causa registros de pacientes duplicados, o que cria todo um outro conjunto de problemas. A maioria dos sites estará disposta a se contentar com quase certeza , mas quão certo é certo o suficiente? Pergunte a 10 pessoas e você obterá 12 respostas.
Portanto, o "melhor" algoritmo será configurável, para que seus clientes possam ajustá-lo para atender às suas necessidades.
Ao considerar uma correspondência, diferentes campos oferecem vários graus de confiança.
Os identificadores específicos de assistência médica oferecem mais confiança, pois todo o seu objetivo é identificar exclusivamente a pessoa dentro do sistema de saúde. Os hospitais geralmente se esforçam para garantir que eles não sejam duplicados.
Exemplos:
Outros identificadores de pacientes também podem oferecer alta confiança, dependendo do sistema. Por exemplo, uma identidade militar provavelmente é muito relevante em um hospital militar.
Exemplos:
Na ausência de identificadores únicos, deve-se recorrer à informação demográfica. É desaconselhável fazer correspondência em qualquer campo , mas quanto mais correspondência de campo demográfico, mais confiável será a correspondência.
Coisas sobre uma pessoa que não mudam com frequência são boas para combinar:
Mas informações ainda mais maleáveis podem ser consideradas na partida para aumentar a confiança:
Também vale a pena verificar os sobrenomes anteriores, pois eles mudam com frequência.
Além das combinações óbvias dos três seguintes dados em sua pergunta
Eu pensaria em adicionar
phone number (Home and/or Cell)
à lista. Hoje em dia é bastante comum e cada um terá um número único e, mesmo que algumas vezes as pessoas mudem seus números de telefone, os números de telefone mais antigos são lembrados pela maioria das pessoas, portanto, podem ser úteis.Descobrimos que o endereço geralmente sofre de várias grafias e várias formas de renderização, especialmente em países como a Índia, onde as pessoas usam um idioma local e os softwares de gerenciamento de pacientes 'ainda' usam o inglês.
O gênero nos registros parece muitas vezes ser derivado do primeiro nome. Tenho visto uma variação crescente de gênero para estrangeiros, quando não podemos derivar o gênero do nome.
Na Alemanha, temos algumas variações adicionais com nomes que contêm o 'Umlaute' como 'äöü', que às vezes são substituídos por 'ae oe ue'.
Meu pensamento está na ordem abaixo 1). SSN, sobrenome e primeiros 5 caracteres do primeiro nome 2). SSN, data de nascimento e os primeiros 5 caracteres do primeiro nome 3). SSN, data de nascimento e sobrenome 4). SSN, Sexo, Data de Nascimento 5). Sobrenome, primeiros 5 caracteres do primeiro nome, cidade e CEP
Este é um problema realmente difícil nos EUA. Os nomes não são únicos e muitas vezes mudam durante a vida de uma pessoa ou são apresentados de forma diferente (Rob versus Robert, por exemplo), portanto, nunca podem ser usados para identificar o paciente, exceto em conjunto com algumas informações mais confiáveis. O número do plano de saúde e o provedor mudam com muito mais frequência e podem ser os mesmos para vários membros da família. O SSN é supostamente único, mas há fraude em torno dele. O mesmo com o número da carteira de motorista, que obviamente nem todos terão.
Pessoalmente, eu começaria com o número da apólice de seguro e a combinação de data de nascimento e nome, depois ssn e data de nascimento e combinação de nome. Eu verificaria o endereço e o telefone para me dar uma garantia adicional quando eles correspondessem, mas não muito peso se não correspondessem. Além disso, eu usaria o tipo de sangue como um fator de exclusão se for conhecido (e todos sabemos que os vampiros do hospital estarão coletando amostras de sangue), pois isso não muda. A correspondência de nomes teria que ser uma correspondência difusa devido ao problema de variação de nomes. Outras coisas geralmente devem procurar uma correspondência exata primeiro, uma correspondência difusa se a confiança do nome for realmente alta (pode ter sido um erro de digitação ao inserir o SSN).