Preciso de um conselho sobre uma mesa que faz parte de um projeto de desenvolvimento em que estou envolvido. Um breve resumo sobre o uso da tabela:
Os dados de vários bancos de dados serão consolidados nesta tabela para fins de pesquisa de texto completo. O índice de texto completo estará em uma única coluna.
Estou tentando decidir sobre o melhor candidato para a chave primária (e o clustering). Haverá dois campos importantes: ID e Tipo. ID é um campo de identidade (que também é chaves primárias+de cluster) nas tabelas de origem. Usar apenas este campo resultará em um conflito porque várias tabelas de origem têm o mesmo campo de ID (identidade). O tipo é uma tabela de consulta. Id e Type juntos são únicos.
Eu criei os seguintes cenários:
- Id e Type como chave primária+clustering.
- Crie um campo de identidade na tabela de destino (principal+clustering), bem como um ID (sincronizado com o campo de identidade da origem) e Tipo.
- Crie um campo de ID separado na tabela de destino (clustering). A chave primária será o ID e o tipo da fonte.
Qual seria a melhor escolha aqui?
Primeiro, estou assumindo que ID e Type são colunas INT. Em segundo lugar, esta será uma tabela um tanto ativa com um bom número de inserções (e possivelmente exclusões). E por último, mas não menos importante, você não vai puxar um "intervalo" de IDs. Por exemplo, você não precisa olhar para ID 10000-15000.
Nesse caso, eu criaria uma terceira coluna que é uma coluna de identidade INT. Faça a chave Primária/Clustered nela. Em seguida, crie uma chave exclusiva em ID + Tipo. Ao tornar a nova coluna a chave agrupada, você evitará problemas de fragmentação causados pela inserção no meio das páginas e acelerará suas inserções. O ID+Tipo de chave exclusiva será usado para suas consultas e será pequeno o suficiente (8 bytes) para que você não veja nenhum problema.
Por último, mas não menos importante, já que você está tentando colocar um índice de texto completo na tabela, precisará de uma única coluna, não nula, chave exclusiva, de preferência um número inteiro. A nova coluna se encaixará admiravelmente nessa conta. (E é claro que sua combinação de ID + Tipo não funcionaria.)