AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 337637
Accepted
Ivaylo
Ivaylo
Asked: 2024-03-11 18:34:18 +0800 CST2024-03-11 18:34:18 +0800 CST 2024-03-11 18:34:18 +0800 CST

Índice composto com uma coluna de intervalo no meio

  • 772

Meu entendimento é que ao projetar um índice composto, uma coluna que será usada para testes de intervalo deve ser colocada no final desse índice, porque o uso das colunas em índices compostos para após a primeira coluna de intervalo.

O que EXPLAINacontece é que também uma coluna após uma coluna de intervalo é usada pelo otimizador. É por isso que estou confuso e não tenho certeza de como projetar corretamente meus índices compostos.

Abaixo está um exemplo simplificado da minha tabela. Para cada data DatePhá um número de objetos Object. Cada um Objecttem 3 subobjetos subjacentes subObject. subObjecté um nome exclusivo para cada um DatePe é derivado Objectda adição de um número. subObjectpossui um identificador inteiro subObjectId, que geralmente é 0, 1 ou 2 e é único dentro do mesmo Object.

subobjeto Objeto DataP subObjectId contador1
aaa1 aaa 01/06/2019 0 10
aaa2 aaa 01/06/2019 1 13
aaa3 aaa 01/06/2019 2 11
bbb1 bbb 01/06/2019 0 9
bbb2 bbb 01/06/2019 1 6
bbb3 bbb 01/06/2019 2 7
aaa1 aaa 02/06/2019 0 14
aaa2 aaa 02/06/2019 1 12
aaa3 aaa 02/06/2019 2 16

CREATE TABLEo código está abaixo. O mecanismo de tabela é MyISAM e o servidor é MySQL 8.

CREATE TABLE `testTab` (
  `DateP` date NOT NULL,
  `Object` char(6) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NOT NULL,
  `subObject` char(11) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NOT NULL,
  `subObjectId` int NOT NULL,
  `counter1` int DEFAULT NULL,
  ......
  PRIMARY KEY (`subObject`,`DateP`,`subObjectId`) USING BTREE,
  KEY `Object` (`Object`,`DateP`,`subObjectId`) USING BTREE
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci ROW_FORMAT=DYNAMIC 

A coluna mais exclusiva de é KEY, Objectseguida por DateP. O menos exclusivo é subObjectId. Pelo que eu sei, a exclusividade das colunas também é importante para sua ordem em um índice composto - a mais exclusiva deve estar na posição mais à esquerda.

A seguir você pode ver diferentes versões EXPLAINdependendo das condições da WHEREcláusula.

  1. Todas as três colunas do índice composto são apresentadas. No meio está o teste de intervalo de DateP. No entanto, subObjectIda coluna também é usada pelo Optimizer após o teste de alcance. key_lené 31 .
EXPLAIN SELECT DateP,Object,SUM(counter1)
FROM testTab
WHERE Object='aaa' AND DateP>='2019-06-01' AND DateP<='2019-06-10' AND (subObjectId=0 OR subObjectId=1)
GROUP BY Object,DateP
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+-----------------------+
| id | select_type | table   | partitions | type  | possible_keys | key    | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | testTab | NULL       | range | Object        | Object | 31      | NULL |   28 |    19.00 | Using index condition |
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+-----------------------+
  1. A primeira e a segunda colunas são apresentadas na WHEREcláusula, finalizando com o teste de intervalo. key_lené 27 .
EXPLAIN SELECT DateP,Object,SUM(counter1)
FROM testTab
WHERE Object='aaa' AND DateP>='2019-06-01' AND DateP<='2019-06-10'
GROUP BY Object,DateP
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+-----------------------+
| id | select_type | table   | partitions | type  | possible_keys | key    | key_len | ref  | rows | filtered | Extra                 |
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+-----------------------+
|  1 | SIMPLE      | testTab | NULL       | range | Object        | Object | 27      | NULL |   29 |   100.00 | Using index condition |
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+-----------------------+
  1. Apenas a primeira coluna é usada em WHERE. key_lené 24 .
EXPLAIN SELECT DateP,Object,SUM(counter1)
FROM testTab
WHERE Object='aaa' 
GROUP BY Object,DateP
+----+-------------+---------+------------+------+---------------+--------+---------+-------+------+----------+-----------------------+
| id | select_type | table   | partitions | type | possible_keys | key    | key_len | ref   | rows | filtered | Extra                 |
+----+-------------+---------+------------+------+---------------+--------+---------+-------+------+----------+-----------------------+
|  1 | SIMPLE      | testTab | NULL       | ref  | Object        | Object | 24      | const |  417 |   100.00 | Using index condition |
+----+-------------+---------+------------+------+---------------+--------+---------+-------+------+----------+-----------------------+

Minha conclusão é que todas as três colunas do índice composto podem ser usadas, apesar de no meio haver uma coluna para testes de intervalo. Mas posso esperar que o otimizador sempre respeite a terceira coluna?

No meu design atual KEYé desenhado com DatePcoluna no final.

KEY `Object` (`Object`,`subObjectId`,`DateP`) USING BTREE

Mas esta ordem não é adequada para GROUP BYcláusula, que é:

GROUP BY Object,DateP

Neste caso, para agrupamento, acho que apenas Objecta coluna é usada, porque pulo a coluna do meio DateP. A execução da consulta termina com Using temporary.

+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+----------------------------------------+
| id | select_type | table   | partitions | type  | possible_keys | key    | key_len | ref  | rows | filtered | Extra                                  |
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+----------------------------------------+
|  1 | SIMPLE      | testTab | NULL       | range | Object        | Object | 31      | NULL |   20 |   100.00 | Using index condition; Using temporary |
+----+-------------+---------+------------+-------+---------------+--------+---------+------+------+----------+----------------------------------------+
mysql
  • 1 1 respostas
  • 51 Views

1 respostas

  • Voted
  1. Best Answer
    Rick James
    2024-03-12T07:00:50+08:002024-03-12T07:00:50+08:00

    Notas aleatórias:

    • "o índice composto usado para testes de intervalo deve [ter a coluna de intervalo] no final deste índice - verdadeiro; isso é 'deveria', não 'deve'
    • "a [coluna] mais exclusiva deve ser a mais à esquerda [em um índice]" - mito
    • CHARdeve ser usado apenas para strings de comprimento fixo.
    • MyISAM deve ser abandonado pelo InnoDB.
    • “Mas posso esperar que o otimizador sempre respeite a terceira coluna?” -- Experimente WHERE Object='aaa' AND subObjectId=1(sem teste/agrupamento DateP).

    Vamos discutir mais detalhadamente meu primeiro item.

    • Para que um índice seja utilizado de forma eficiente, é WHEREnecessário percorrê-lo, utilizando cada item que encontrar. Pular linhas torna-o menos eficiente.
    • Quando todas as colunas que aparecem em qualquer lugar do SELECTsão encontradas em qualquer lugar do one INDEX , esse índice é chamado de "cobertura". (Nenhum dos seus três exemplos mostra isso - por causa da necessidade counter1.) Um índice de cobertura tem a vantagem extra de não precisar alternar entre o índice e os dados repetidos para encontrar mais colunas.
    • Portanto, o índice ideal é coberto e ordenado da seguinte forma:
    1. todas as colunas testadas apenas =(ou IS NULL) primeiro.
    2. o melhor não =teste a seguir.
    3. outras colunas para torná-la "cobertura". (Isso pode causar problemas se você precisar de muitas colunas ou colunas grandes.)

    Mais notas:

    • GROUP BYe/ou ORDER BYpode puxar a ordem - para evitar uma classificação. Observe que todos os três exemplos podem evitar a classificação porque o índice começa Object, DatePna ordem desejada.
    • Um único INDEX(Object, DateP, subObjectid, counter)seria ideal para a primeira consulta e semiótimo para as outras duas.

    Mais: Livro de receitas de índice

    • 1

relate perguntas

  • Existem ferramentas de benchmarking do MySQL? [fechado]

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

  • Quando é o momento certo para usar o MariaDB em vez do MySQL e por quê?

  • Como um grupo pode rastrear alterações no esquema do banco de dados?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve