Existem ferramentas de benchmarking do MySQL? [fechado]

Question

dr_

Asked: 2018-04-17 05:58:10 +0800 CST2018-04-17 05:58:10 +0800 CST 2018-04-17 05:58:10 +0800 CST

Por que pt-duplicate-key-checker sugere a remoção de um índice composto?

772

Aqui está um trecho da saída da ferramenta Percona pt-duplicate-key-checkerque procura por índices redundantes:

# Key myidx ends with a prefix of the clustered index
# Key definitions:
#   KEY `myidx` (`bar`,`foo`)
#   PRIMARY KEY (`foo`),
# Column types:
#         `bar` mediumint(8) unsigned not null default '0'
#         `foo` mediumint(8) unsigned not null auto_increment
# To shorten this duplicate clustered index, execute:
ALTER TABLE `mydb`.`mytable` DROP INDEX `myidx`, ADD INDEX `myidx` (`bar`);

Por que a ferramenta sugere isso? O índice composto original não pode ser útil?

Pelo que entendi, um índice em barvaleria a pena ser apagado dado um PK (bar,foo), mas não é o caso aqui.

3 respostas

Voted

akuzminsky · Answer 1 · 2018-04-17T20:43:31+08:00

Best Answer

akuzminsky

2018-04-17T20:43:31+08:002018-04-17T20:43:31+08:00

A chave primária é uma parte de qualquer chave secundária no InnoDB.

2

Rick James · Answer 2 · 2018-05-01T20:19:25+08:00

Rick James

2018-05-01T20:19:25+08:002018-05-01T20:19:25+08:00

Discordo da análise dada pela ferramenta.

Quando vejo INDEX(bar, foo), suponho que haja alguma consulta que precise que essas duas colunas, nessa ordem, estejam nesse índice composto.

O fato de fooser o PK, e INDEX(bar)ser idêntico ao índice acima é irrelevante.

Quando vejo apenas INDEX(bar), suponho que há alguma consulta que precisa (bar)sem id.

Quando eu vir os dois, direi que o mais curto é 'redundante' e recomendo removê-lo.

Além disso, "Para encurtar este índice clusterizado duplicado" está errado . INDEX(bar)não é 'mais curto' do que INDEX(bar, foo). E não é um "índice clusterizado. Apenas o PK é "clusterizado".

Se fosse UNIQUE(bar, foo), então eu recomendaria mudar UNIQUEpara INDEX. Isso é para que INSERTsnão seja necessário fazer uma verificação de exclusividade desnecessária.

2

cEz · Answer 3 · 2018-05-03T04:30:36+08:00

Vamos criar uma tabela simples e ver o que o MySQL (5.7.20 MySQL Community Server) tem a nos dizer:

mysql> create table test_dupe_key (foo int unsigned not null auto_increment primary key, bar int unsigned not null, random int unsigned not null default 0, key(bar, foo)) engine=InnoDB;
Query OK, 0 rows affected (0.08 sec)

mysql> show create table test_dupe_key\G
*************************** 1. row ***************************
       Table: test_dupe_key
Create Table: CREATE TABLE `test_dupe_key` (
  `foo` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `bar` int(10) unsigned NOT NULL,
  `random` int(10) unsigned NOT NULL DEFAULT '0',
  PRIMARY KEY (`foo`),
  KEY `bar` (`bar`,`foo`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

mysql> insert into test_dupe_key(bar) values (1), (2), (3);
Query OK, 3 rows affected (0.00 sec)
Records: 3  Duplicates: 0  Warnings: 0

mysql> select * from test_dupe_key;
+-----+-----+--------+
| foo | bar | random |
+-----+-----+--------+
|   1 |   1 |      0 |
|   2 |   2 |      0 |
|   3 |   3 |      0 |
+-----+-----+--------+
3 rows in set (0.00 sec)

Aqui está uma consulta simples que pode ser lida a partir do índice:

mysql> explain format=json select foo, bar from test_dupe_key\G
*************************** 1. row ***************************
EXPLAIN: {
  "query_block": {
    "select_id": 1,
    "cost_info": {
      "query_cost": "1.60"
    },
    "table": {
      "table_name": "test_dupe_key",
      "access_type": "index",
      "key": "bar",
      "used_key_parts": [
        "bar",
        "foo"
      ],
      "key_length": "8",
      "rows_examined_per_scan": 3,
      "rows_produced_per_join": 3,
      "filtered": "100.00",
      "using_index": true,
      "cost_info": {
        "read_cost": "1.00",
        "eval_cost": "0.60",
        "prefix_cost": "1.60",
        "data_read_per_join": "48"
      },
      "used_columns": [
        "foo",
        "bar"
      ]
    }
  }
}
1 row in set, 1 warning (0.00 sec)

Isso mostra que a barra de teclas é usada e tem 2 partes de chave, ambas sendo lidas para produzir um comprimento de chave de 8 (2x4). Agora vamos mudar a chave composta para um único campo e verificar novamente:

mysql> alter table test_dupe_key drop key bar, add key(bar);
Query OK, 0 rows affected (0.12 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> explain format=json select foo, bar from test_dupe_key\G
*************************** 1. row ***************************
EXPLAIN: {
  "query_block": {
    "select_id": 1,
    "cost_info": {
      "query_cost": "1.60"
    },
    "table": {
      "table_name": "test_dupe_key",
      "access_type": "index",
      "key": "bar",
      "used_key_parts": [
        "bar"
      ],
      "key_length": "4",
      "rows_examined_per_scan": 3,
      "rows_produced_per_join": 3,
      "filtered": "100.00",
      "using_index": true,
      "cost_info": {
        "read_cost": "1.00",
        "eval_cost": "0.60",
        "prefix_cost": "1.60",
        "data_read_per_join": "48"
      },
      "used_columns": [
        "foo",
        "bar"
      ]
    }
  }
}
1 row in set, 1 warning (0.00 sec)

Apenas as partes principais e o comprimento agora mudam, o que é esperado, mas ainda é uma leitura de índice. Se transformarmos isso em uma consulta de intervalo no campo PK com uma restrição no campo indexado, vamos ver o que acontece:

mysql> explain format=json select foo, bar from test_dupe_key where bar = 1 and foo > 0\G
*************************** 1. row ***************************
EXPLAIN: {
  "query_block": {
    "select_id": 1,
    "cost_info": {
      "query_cost": "1.20"
    },
    "table": {
      "table_name": "test_dupe_key",
      "access_type": "range",
      "possible_keys": [
        "PRIMARY",
        "bar"
      ],
      "key": "bar",
      "used_key_parts": [
        "bar",
        "foo"
      ],
      "key_length": "8",
      "rows_examined_per_scan": 1,
      "rows_produced_per_join": 1,
      "filtered": "100.00",
      "using_index": true,
      "cost_info": {
        "read_cost": "1.00",
        "eval_cost": "0.20",
        "prefix_cost": "1.20",
        "data_read_per_join": "16"
      },
      "used_columns": [
        "foo",
        "bar"
      ],
      "attached_condition": "((`stack_204076`.`test_dupe_key`.`bar` = 1) and (`stack_204076`.`test_dupe_key`.`foo` > 0))"
    }
  }
}
1 row in set, 1 warning (0.00 sec)

O planejador de consulta considerou o PK para a consulta, mas escolheu o índice para bar, que agora tem uma mudança interessante em relação ao índice anterior lido, pois podemos ver que agora ele mostra como 2 partes principais novamente e um comprimento de 8:

  "key": "bar",
  "used_key_parts": [
    "bar",
    "foo"
  ],
  "key_length": "8"

Isso nos diz que o MySQL acessou o PK que está automaticamente contido no índice secundário

Por que pt-duplicate-key-checker sugere a remoção de um índice composto?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Por que pt-duplicate-key-checker sugere a remoção de um índice composto?

3 respostas

relate perguntas