AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 1584
Accepted
bernd_k
bernd_k
Asked: 2011-03-06 08:59:41 +0800 CST2011-03-06 08:59:41 +0800 CST 2011-03-06 08:59:41 +0800 CST

'Evite criar um índice clusterizado com base em uma chave de incremento' é um mito dos dias do SQL Server 2000?

  • 772

Nossos bancos de dados consistem em muitas tabelas, a maioria delas usando uma chave substituta inteira como chave primária. Cerca de metade dessas chaves primárias estão em colunas de identidade.

O desenvolvimento do banco de dados começou nos dias do SQL Server 6.0.

Uma das regras seguidas desde o início foi, conforme você encontra nestas dicas de otimização de índice :

Evite criar um índice clusterizado com base em uma chave de incremento.
Por exemplo, se uma tabela tiver uma chave primária substituta inteira declarada como IDENTITY e o índice clusterizado tiver sido criado nessa coluna, toda vez que os dados forem inseridos nessa tabela, as linhas serão adicionadas ao final da tabela. Quando muitas linhas forem adicionadas, pode ocorrer um "ponto de acesso". Um "ponto de acesso" ocorre quando muitas consultas tentam ler ou gravar dados na mesma área ao mesmo tempo. Um "ponto de acesso" resulta em gargalo de E/S.
Observação. Por padrão, o SQL Server cria um índice clusterizado para a restrição de chave primária. Portanto, nesse caso, você deve especificar explicitamente a palavra-chave NONCLUSTERED para indicar que um índice não clusterizado foi criado para a restrição de chave primária.

Agora, usando SQL Server 2005 e SQL Server 2008, tenho a forte impressão de que as circunstâncias mudaram. Enquanto isso, essas colunas de chave primária são as primeiras candidatas perfeitas para o índice clusterizado da tabela.

sql-server sql-server-2005
  • 5 5 respostas
  • 4948 Views

5 respostas

  • Voted
  1. Best Answer
    gbn
    2011-03-06T12:21:38+08:002011-03-06T12:21:38+08:00

    O mito remonta a antes do SQL Server 6.5, que adicionou bloqueio de nível de linha . E sugerido aqui por Kalen Delaney .

    Tinha a ver com "pontos de acesso" do uso da página de dados e o fato de que uma página inteira de 2k (SQL Server 7 e superior usa 8k páginas) foi bloqueada, em vez de uma linha inserida

    Artigo autorizado encontrado por Kimberly L. Tripp

    "O debate sobre o índice agrupado continua..."

    Hotspots eram algo que tentamos muito evitar ANTES do SQL Server 7.0 por causa do bloqueio no nível da página (e é aqui que o termo hot spot se tornou um termo negativo). Na verdade, não precisa ser um termo negativo. No entanto, como o mecanismo de armazenamento foi reprojetado/reprojetado (no SQL Server 7.0) e agora inclui bloqueio de nível de linha verdadeiro, essa motivação (para evitar pontos de acesso) não existe mais.

    O link na resposta de lucky7_2000 parece dizer que os pontos de acesso podem existir e causam problemas. No entanto, o artigo usa um índice clusterizado não exclusivo no TranTime. Isso requer que um unificador seja adicionado. O que significa que o índice não aumenta monotonicamente (e é muito amplo). O link nessa resposta não contradiz esta resposta ou meus links.

    Em um nível pessoal, acordei em bancos de dados onde inseri dezenas de milhares de linhas por segundo em uma tabela que possui uma coluna IDENTITY bigint como o PK agrupado.

    • 33
  2. mrdenny
    2011-03-07T02:39:53+08:002011-03-07T02:39:53+08:00

    Para resumir, nas versões modernas do SQL Server, uma chave agrupada em uma coluna de identidade é a opção preferida atualmente.

    Eu disse preferido, não obrigatório. Para aplicativos normais que compõem 98% dos bancos de dados do mundo, uma chave agrupada em uma coluna de identidade funciona muito bem.

    • 21
  3. Matt M
    2011-03-06T10:53:54+08:002011-03-06T10:53:54+08:00

    Kimberly Tripp tem uma postagem de blog fantástica sobre esse tópico. Eu poderia parafrasear, mas confie em mim, eu não faria justiça. Dê uma lida.

    OK, então o critério final que procuro em uma chave de agrupamento é: um padrão cada vez maior!
    Se a chave de agrupamento for sempre crescente, as novas linhas terão um local específico onde podem ser colocadas. Se esse local estiver no final da tabela, a nova linha precisará de espaço alocado para ela, mas não precisará abrir espaço no meio da tabela. Se uma linha for inserida em um local que não tem espaço, então o espaço precisa ser feito (por exemplo, você insere com base no sobrenome, então, como as linhas vêm no espaço, será necessário criar onde esse nome deve ser colocado). Se for necessário abrir espaço, ele será feito pelo SQL Server fazendo algo chamado divisão. As divisões no SQL Server são divisões 50/50 – simplesmente – 50% dos dados permanecem e 50% dos dados são movidos. Isso mantém o índice logicamente intacto (o nível mais baixo de um índice – chamado de nível folha – é uma lista duplamente vinculada), mas não fisicamente intacto. Quando um índice tem muitas divisões, diz-se que o índice está fragmentado. Bons exemplos de um índice que está sempre aumentando são as colunas IDENTITY (e elas também são naturalmente únicas, estáticas e naturalmente estreitas) ou algo que segue o máximo possível dessas coisas - como uma coluna de data e hora (ou já que NÃO é muito provável que seja único por si só datetime, identity).

    Enquanto estiver lá, confira algumas de suas outras postagens sobre o tópico de chaves de agrupamento. Há uma boa riqueza de conhecimento a ser obtida em seu site.

    • 9
  4. lucky7_2000
    2011-09-19T05:20:15+08:002011-09-19T05:20:15+08:00

    Confira esta postagem:

    O aumento monotônico de chaves de índice clusterizado pode causar contenção de LATCH por Amit Banerjee da Microsoft.

    A criação de um índice clusterizado com base em uma chave de incremento pode criar pontos de acesso ruins para o desempenho.

    • 4
  5. Paul White
    2022-06-24T01:05:18+08:002022-06-24T01:05:18+08:00

    'Evite criar um índice clusterizado com base em uma chave de incremento' é um mito dos dias do SQL Server 2000?

    Ainda é uma consideração relevante, talvez mais agora do que nunca, à medida que a contagem de núcleos aumenta. Seria muito forte dizer que você deve sempre evitar essa prática.

    O SQL Server 2019 introduziu a OPTIMIZE_FOR_SEQUENTIAL_KEYopção de índice para ajudar a atenuar a contenção de trava de página e o comportamento de comboio de trava que pode ocorrer. Não é uma solução completa.

    Raramente há uma única consideração que domina todas as outras. Se você escolher uma chave de índice não sequencial, talvez seja necessário aceitar as divisões de página e diminuir a densidade média de dados como compensação pela escalabilidade potencialmente aumentada.

    Pam Lahoud da Microsoft escreveu um excelente artigo explicando porque OPTIMIZE_FOR_SEQUENTIAL_KEYé necessário e como funciona, incluído nas referências abaixo:

    • Bastidores em OPTIMIZE_FOR_SEQUENTIAL_KEY por Pam Lahoud
    • PAGELATCH_EX esperas e inserções pesadas de Pedro Lopes
    • Resolva a contenção PAGELATCH_EX de inserção da última página no SQL Server na documentação do produto
    • Chaves sequenciais na CREATE INDEXdocumentação
    • 1

relate perguntas

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

  • Downgrade do SQL Server 2008 para 2005

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve