SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

goodfella

Asked: 2024-12-11 14:30:08 +0800 CST2024-12-11 14:30:08 +0800 CST 2024-12-11 14:30:08 +0800 CST

Existe alguma prática para alinhar o tamanho do bloco do sistema de arquivos com o tamanho do bloco do banco de dados?

772

Este tópico já foi discutido aqui: Entendendo tamanhos de bloco Mas tenho mais algumas coisas a acrescentar para meu caso de uso.

Geralmente, a maioria database systemsusa um padrão block sizede 8 KB, embora alguns permitam que ele seja modificado. Por outro lado, os modernos operating systemsgeralmente usam um 4 KBtamanho de bloco para file systems. Essa discrepância pode resultar em várias physical I/Osolicitações para preencher um único database page.

Um tamanho de bloco de sistema de arquivo menor beneficia random reads, como index lookups, enquanto tamanhos de bloco maiores são vantajosos para sequential scanse heap fetches. Considerando esses pontos, tenho algumas perguntas:

Existe uma prática comum para alinhar o tamanho do bloco do banco de dados com o tamanho do bloco do sistema de arquivos para OLTP?
Em um clustered system(por exemplo, SQL Server Availability Groupsou PostgreSQL streaming replication) com um primário e um ou mais secundários, é aceitável ter tamanhos de bloco de sistema de arquivos diferentes ou isso é algo que deve ser sempre evitado?
Para analytical databasesou columnar tables, é benéfico usar um tamanho de bloco maior?

1 respostas

Voted

Sean Gallardy · Answer 1 · 2024-12-12T02:10:07+08:00

Existe uma prática comum para alinhar o tamanho do bloco do banco de dados com o tamanho do bloco do sistema de arquivos para OLTP?

Na verdade, não. O melhor tamanho de bloco do sistema de arquivos dependerá de muitos outros fatores, como os tamanhos de faixa (ou similares com base na tecnologia), localização (você pode não saber realmente qual armazenamento remoto está usando nos bastidores), drivers, sistema de arquivos e, então, a carga de trabalho real do ambiente, que é a parte mais importante.

Não ajuda, por exemplo, ver um tamanho de bloco de 8k para uma unidade de alocação de 8k para um sistema de banco de dados apenas para ter a maioria/toda a E/S real sendo feita em unidades de 256 KB. O gráfico para tamanho de bloco vs IOPs é geralmente inversamente proporcional, o que significa que conforme o tamanho do bloco aumenta, a quantidade de IOPs diminui enquanto a taxa de transferência geral aumenta.

Em um sistema em cluster (por exemplo, Grupos de Disponibilidade do SQL Server ou replicação de streaming do PostgreSQL) com um primário e um ou mais secundários, é aceitável ter tamanhos de bloco de sistema de arquivos diferentes ou isso é algo que sempre deve ser evitado?

O ideal é que tudo seja a mesma cópia carbono um do outro. Você pode executá-lo sem ser exatamente o mesmo, mas dependendo do seu SO/DBMS isso pode causar problemas de desempenho imprevistos. Por exemplo, se o sistema estiver fazendo replicação física em um nível de bloco, mas um bloco em um sistema tem 512 bytes, mas um bloco em outro sistema tem 16kb (observe que isso é no nível de hardware). Ter tamanhos de bloco de sistema de arquivos diferentes geralmente funciona, com as mesmas ressalvas.

Para bancos de dados analíticos ou tabelas colunares, é benéfico usar um tamanho de bloco maior?

Depende do perfil geral de IO que é criado pelo uso dos recursos. Recursos diferentes funcionam de maneiras diferentes. É melhor obter um rastreamento ETW para o perfil de IO para seu DBMS para entender quais tamanhos e tipos de IO (síncrono/assíncrono) ele prefere para esse recurso/carga de trabalho.

Existe alguma prática para alinhar o tamanho do bloco do sistema de arquivos com o tamanho do bloco do banco de dados?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Existe alguma prática para alinhar o tamanho do bloco do sistema de arquivos com o tamanho do bloco do banco de dados?

1 respostas

relate perguntas