SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

Geezer

Asked: 2022-02-03 10:05:07 +0800 CST2022-02-03 10:05:07 +0800 CST 2022-02-03 10:05:07 +0800 CST

Consulta TSQL para combinar diferentes comprimentos de strings entre si

772

Estou escrevendo um TVF para consultar uma tabela grande (dezenas de milhões de linhas) onde uma string (Código Postal) nessa tabela corresponde a uma string (um código postal parcial (parte de código de saída/setor)) de outra tabela.

Estou atingindo um caso extremo que não consigo resolver.

Para quem não conhece os códigos postais do Reino Unido

Aqui estão alguns dados de exemplo.

DECLARE @tab1 TABLE (Sk INT, Postcode VARCHAR(8))
DECLARE @tab2 TABLE (Sk INT, Coverage VARCHAR(8)) 

INSERT INTO @tab1 (Sk, Postcode) VALUES (1, 'E12 5HH'), (6, 'SW1X 6AA')
INSERT INTO @tab2 (Sk, Coverage) VALUES (1, 'E12'), (1, 'E12 5'), 
                                        (2, 'E1'), (2, 'E11'), (2, 'E13'), 
                                        (3, 'E12 6'),
                                        (4, 'E12 5') ,
                                        (5, 'E12') ,
                                        (7, 'SW1') ,
                                        (8, 'SW1X')

E minha consulta atual

SELECT  S.Sk, 
        S.Postcode, 
        CoverageSk = X.Sk, 
        X.Coverage 
FROM        @tab1   S 
OUTER APPLY (
    SELECT  Sk , 
            Coverage , 
            [Length] = LEN(Coverage) 
    FROM    @tab2
)   X 
WHERE   S.Sk <> X.Sk 
AND     LEFT(S.Postcode,X.[Length] ) = X.Coverage

Esses são meus resultados.

Os dados nas linhas 1 e 4 não devem estar nos resultados. Linha 1, A Cobertura ou o código de saída "E1" não é o mesmo que a parte do código de saída ("E12") do CEP "E12 5HH".

O mesmo para a Linha 4, a Cobertura ou o código de saída "SW1" não é o mesmo que a parte do código de saída ("SW1X") do Código Postal "SW1X 6AA".

1 respostas

Voted

Paul White · Answer 1 · 2022-02-03T10:26:01+08:00

Best Answer

Paul White

2022-02-03T10:26:01+08:002022-02-03T10:26:01+08:00

Idealmente, as tabelas de origem teriam as partes componentes divididas para que você pudesse combiná-las diretamente.

Se isso não for possível, isso funciona para os dados de amostra:

SELECT 
    T1.Sk, 
    T1.Postcode, 
    CoverageSk = T2.Sk, 
    T2.Coverage 
FROM @tab1 AS T1
JOIN @tab2 AS T2
    ON T2.Sk <> T1.Sk
    AND T1.Postcode LIKE 
            CASE
                WHEN CHARINDEX(SPACE(1), T2.Coverage) > 0 
                THEN T2.Coverage
                ELSE T2.Coverage + SPACE(1)
            END + '%';

Sk	Código postal	CoverageSk	Cobertura
1	E12 5HH	4	E12 5
1	E12 5HH	5	E12
6	SW1X 6AA	8	SW1X

O SQL Server pode usar um índice no código postal por meio de uma busca dinâmica :

5

Consulta TSQL para combinar diferentes comprimentos de strings entre si

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Consulta TSQL para combinar diferentes comprimentos de strings entre si

1 respostas

relate perguntas