AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 581
Accepted
Nifle
Nifle
Asked: 2011-01-13 10:33:59 +0800 CST2011-01-13 10:33:59 +0800 CST 2011-01-13 10:33:59 +0800 CST

O "CREATE INDEX" no MySQL é uma operação linear?

  • 772

O que quero dizer é o seguinte:

Se criar um índice em uma tabela com nlinhas leva ttempo. A criação de um índice na mesma tabela 1000*nlevará aproximadamente um 1000*ttempo.

O que estou tentando alcançar é estimar o tempo necessário para criar o índice no banco de dados de produção, criando o mesmo índice no banco de dados de teste muito menor.

mysql index
  • 4 4 respostas
  • 929 Views

4 respostas

  • Voted
  1. Best Answer
    David Spillett
    2011-01-13T11:08:01+08:002011-01-13T11:08:01+08:00

    A criação de índice é essencialmente uma operação de classificação , portanto, na melhor das hipóteses, tem uma complexidade de crescimento da ordem n log nem média (você pode achar que funciona melhor em alguns casos e provavelmente não pior).

    Se todas as suas páginas de dados relevantes couberem na RAM e já estiverem na RAM, e o índice também couber, e seu DBMS não forçar as páginas de índice a serem gravadas antes que a criação seja concluída (portanto, os blocos de índice não são atualizados no disco várias vezes durante a operação), a velocidade de gravação do índice resultante no disco será mais significativa do que o tempo necessário para executar a classificação - portanto, você pode descobrir que está mais próximo de uma relação linear entre o número de linhas e o tempo que a criação do índice leva - mas se você assumir o pior caso, é menos provável que você seja surpreendido de forma desagradável!

    Lembre-se de que, a menos que você não interrompa o acesso ao banco de dados de produção durante a operação, qualquer criação de índice estará competindo por largura de banda de E/S e/ou bloqueios com outras atividades; em outro sistema, mesmo que esteja configurado de forma idêntica.

    • 16
  2. jcolebrand
    2011-01-13T15:12:33+08:002011-01-13T15:12:33+08:00

    Também digno de nota é que, se você puder dividir os fusos para os índices dos fusos para a tabela, poderá trabalhar em dois discos ao mesmo tempo (ainda limitado à velocidade do controlador de disco no meio, se um RAID ou similar, mas ainda assim será mais rápido que um disco).

    Percebo que a criação de um índice não é completamente uma operação simultânea de leitura e gravação, mas acelera consideravelmente as coisas.

    ADVERTÊNCIAS: Eu também sou um cara do MSSQL e, portanto, não tenho certeza sobre o MySQL, mas imagino que o conceito de divisão de eixos não seja específico para SQLServer e Oracle (onde também ouvi falar sobre isso, IIRC ). Eu simplesmente não saberia como definir esse conceito. Mas, em termos do SQLServer, isso significaria ter um grupo de arquivos separado PRIMARYe colocar os índices no outro grupo de arquivos, com o outro grupo de arquivos atribuído a um conjunto de eixos não envolvidos PRIMARY(o posicionamento concedido do eixo versus grupos de arquivos é outra história)

    • 7
  3. RolandoMySQLDBA
    2011-05-15T17:04:19+08:002011-05-15T17:04:19+08:00

    Se esta pergunta fosse feita cerca de 6 anos atrás, eu teria dito enfaticamente NÃO, pois ela se referia ao MySQL 4.x. No entanto, o MySQL 5.x executa a criação de índice linearmente hoje. Acabei de ter uma experiência nostálgica explicando isso em minha resposta à pergunta anterior.

    • 2
  4. Rick James
    2011-06-09T16:08:05+08:002011-06-09T16:08:05+08:00

    Depende.

    Variável #1: Se o MySQL optar por construir o(s) índice(s) em tempo real, ou esperar até que todos os dados estejam inseridos, então faça uma classificação, etc, para construir o índice. Nota: índices UNIQUE (eu acho) devem ser construídos em tempo real para que a UNIQUEness possa ser verificada. A PRIMARY KEY para InnoDB é armazenada com os dados (ou você pode indicar vice-versa), de modo que DEVE ser construída aleatoriamente.

    Variável nº 2: O índice rastreia os dados (por exemplo, AUTO_INCREMENT ou registro de data e hora) versus aleatório (GUID, MD5) ou em algum lugar intermediário (número da peça, nome, id_amigo).

    Variável nº 3 (se o índice for criado dinamicamente): o índice pode caber no cache (key_buffer ou innodb_buffer_pool) ou pode vazar para o disco.

    Os índices que rastreiam os dados são eficientes e praticamente lineares, independentemente da resposta para o número 1.

    Ids aleatórios são uma dor. Se o índice não couber no cache, o tempo para construí-lo será muito pior do que linear, independentemente das outras variáveis. (Não concordo com Rolando neste caso.) Uma enorme tabela InnoDB com um GUID para o PK é dolorosamente lenta para INSERT - planeje 100 linhas/s para discos comuns; talvez 1000 se você tiver SSDs. LOAD DATA e INSERTs em lote não o farão superar a lentidão do armazenamento aleatório.

    3,53 a 5,6 - não mudou muito.

    Vários fusos? A distribuição de RAID é melhor em quase todas as situações do que atribuir manualmente isso aqui e aquilo ali. A divisão manual leva a situações de desequilíbrio -- uma varredura de tabela está presa no disco de dados; uma operação somente de índice está travada no disco de índice; uma consulta solitária atinge primeiro o disco de índice e, em seguida, o disco de dados (sem sobreposição); etc.

    • 1

relate perguntas

  • Existem ferramentas de benchmarking do MySQL? [fechado]

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

  • Quando é o momento certo para usar o MariaDB em vez do MySQL e por quê?

  • Como um grupo pode rastrear alterações no esquema do banco de dados?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve