SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

user1664043

Asked: 2025-03-07 23:49:51 +0800 CST2025-03-07 23:49:51 +0800 CST 2025-03-07 23:49:51 +0800 CST

Tabela muito pequena vs PATINDEX

772

Sei que estou entrando em detalhes, mas estou implementando algo para processar um feed multilíngue.

Na tabela de ingestão bruta, que tem aproximadamente 190 milhões de linhas, eu queria capturar tudo o que o fornecedor nos enviou, mas devo repassar apenas as linhas que estão em um pequeno subconjunto de idiomas aprovados.

Originalmente, essa lista era apenas em inglês, mas agora eles querem aumentar a lista de idiomas "aprovados".

Então, tenho vários lugares onde a etapa de processamento é

WHERE lang_code = 'en'

que precisam de ajustes.

Eu criei algumas implementações

Variável de tabela muito pequena na rotina de processamento do feed com 2-3 linhas para códigos "aprovados".
Uma tabela permanente muito pequena contendo 2 a 3 linhas para códigos aprovados.
PATINDEX em uma string de vírgula com códigos aprovados (por exemplo, WHERE PATINDEX('%,'+lang_code+',%', ',en,de,pl,') > 0)

A lista pode crescer para 5 ou 6, mas é improvável que passe de 10.

Para esse tipo de lista muito curta, eu queria saber onde as pessoas podem ver a linha entre implementações de tabela e implementações apenas "nesta sequência curta".

2 respostas

Voted

Dan Guzman · Answer 1 · 2025-03-08T01:10:30+08:00

Best Answer

Dan Guzman

2025-03-08T01:10:30+08:002025-03-08T01:10:30+08:00

Eu traçaria a linha em mais de um e usaria uma ApprovedLanguagetabela permanente com a lang_codecoluna como chave primária. Dessa forma, nenhuma alteração de código é necessária para adicionar ou remover idiomas; apenas adicione/delete linhas conforme os requisitos mudam.

Definitivamente não siga esse PATINDEX(...)caminho, pois essa função não é sargável e impedirá buscas de índice, resultando em baixo desempenho.

5

Rodger Kong · Answer 2 · 2025-03-10T17:03:38+08:00

Rodger Kong

2025-03-10T17:03:38+08:002025-03-10T17:03:38+08:00

Usar string é mais fácil de manter, se a instrução SQL for construída em um aplicativo, a "Linguagem Aprovada" pode ser escrita em um arquivo de configuração, pode ser editada por usuário sem experiência em programação, e há muitas ferramentas que podem processá-la. Usando tabela de dados, apenas DBA ou desenvolvedores podem modificá-la, ou você tem que fazer um editor para o usuário normal.

Você pode usar STRING_SPLITpara tratar cordas.

-2

Tabela muito pequena vs PATINDEX

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Tabela muito pequena vs PATINDEX

2 respostas

relate perguntas