SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

J. Mini

Asked: 2025-01-02 03:18:13 +0800 CST2025-01-02 03:18:13 +0800 CST 2025-01-02 03:18:13 +0800 CST

Por que funções agregadas agrupadas em um índice columnstore são rápidas?

772

Suponha que uma tabela contenha apenas números inteiros e tenha um índice columnstore agrupado.

CREATE TABLE cci_account
(  
    AccountKey int NOT NULL,  
    UnitSold int,
    INDEX ColStore CLUSTERED COLUMNSTORE
);

então parece que somar uma coluna agrupada por outra é sempre rápido em tal tabela, por exemplo

SELECT
    AccountKey,
    SUM(UnitSold)
FROM
    cci_account
GROUP BY
    AccountKey;

Por que isso é tão rápido? Meu entendimento da arquitetura columnstore é que os segmentos que contêm AccountKeynão têm ideia de qual UnitSoldvalor está em suas linhas. Como, então, o SQL Server consegue agrupar tão rapidamente por AccountKey? Não consigo imaginar nenhum algoritmo que consiga isso.

1 respostas

Voted

David Browne - Microsoft · Answer 1 · 2025-01-02T23:55:35+08:00

Best Answer

David Browne - Microsoft

2025-01-02T23:55:35+08:002025-01-02T23:55:35+08:00

Sua intuição está correta: não é um algoritmo sofisticado ou qualquer tipo de mágica. É só que escanear columnstores é muito rápido. Você pode usar um CCI ordenado para ver o impacto de ter os valores AccountKey classificados, o que é significativo. Mas é "rápido" em ambos os casos. EG

drop table if exists Account 

CREATE TABLE Account
(  
    Id int identity not null,
    AccountKey int NOT NULL,  
    UnitSold int,
    INDEX cci_Account CLUSTERED COLUMNSTORE ORDER(Id)
);

insert into Account(AccountKey, UnitSold)
select value%4000, value%6000/400. 
from generate_series(1,10*1000*1000)

Em seguida, observe as estatísticas de tempo para

SELECT
    AccountKey,
    SUM(UnitSold)
FROM
    Account
GROUP BY
    AccountKey;

Que é:

 SQL Server Execution Times:
   CPU time = 141 ms,  elapsed time = 125 ms.

E então recrie-o com AccountKey como a coluna de classificação CCI

 SQL Server Execution Times:
   CPU time = 15 ms,  elapsed time = 109 ms.

3

Por que funções agregadas agrupadas em um índice columnstore são rápidas?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Por que funções agregadas agrupadas em um índice columnstore são rápidas?

1 respostas

relate perguntas