Existem ferramentas de benchmarking do MySQL? [fechado]

Question

gbn

Asked: 2011-11-12 02:16:04 +0800 CST2011-11-12 02:16:04 +0800 CST 2011-11-12 02:16:04 +0800 CST

Anomalia agregada do MySQL

772

Eu estava verificando a seletividade de algumas colunas para um índice.
Onde está documentado esse comportamento de "ignore o que eu lhe dou"?

Isso dá 4.851.908, 4.841.060 e 1.000.052

SELECT
     COUNT(*), 
     COUNT(DISTINCT Col1), COUNT(DISTINCT Col2)
FROM Sometable;

Isso dá 4.843.634 pares únicos de acordo com a extensão do MySQL

SELECT COUNT(DISTINCT Col1, Col2) FROM Sometable

O seguinte está errado: o COUNT(DISTINCT colx) individual fornece a contagem de pares exclusivos de 4.843.634, independentemente de qualquer coluna de preenchimento ou ordem de expressão.

Eu esperava COUNT(DISTINCT Col1) = 4,841,060, e COUNT(DISTINCT Col1) = 1,000,052.

SELECT COUNT(DISTINCT Col1), COUNT(DISTINCT Col2) FROM Sometable

SELECT COUNT(DISTINCT Col2), COUNT(DISTINCT Col1) FROM Sometable

SELECT COUNT(DISTINCT Col1), 1 AS Filler, COUNT(DISTINCT Col2) FROM Sometable

Mas isso fornece valores corretos novamente com outro agregado (como COUNT(*)acima)

SELECT COUNT(DISTINCT Col1), MAX(col1) AS Filler, COUNT(DISTINCT Col2) FROM Sometable

Dúvidas, caso não tenha ficado claro:

Por que COUNT(DISTINCT Col1), COUNT(DISTINCT Col2)se comporta comoCOUNT(DISTINCT Col1, Col2)
Por que outro agregado é necessário para fazê-lo funcionar?

2 respostas

Voted

Jack Douglas · Answer 1 · 2011-11-13T08:00:22+08:00

Best Answer

Jack Douglas

2011-11-13T08:00:22+08:002011-11-13T08:00:22+08:00

Parece que você está atingindo este bug de regressão:

select count(distinct N1), count(distinct N2) from test.AA" funciona incorretamente
...
"Este bug acontece quando existe um índice único"

Uma das soluções sugeridas é usar sql_buffer_result

7

Aaron Brown · Answer 2 · 2011-11-13T05:21:04+08:00

Sem ver seus resultados exatos, não tenho certeza se entendi qual é o problema. Eu tentei isso em uma tabela aleatória na minha máquina e obtive os resultados que eu esperava.

mysql> select count(*), count(distinct location_country), count(distinct referer_name) from piwik_log_visit;
+----------+----------------------------------+------------------------------+
| count(*) | count(distinct location_country) | count(distinct referer_name) |
+----------+----------------------------------+------------------------------+
|    44176 |                              109 |                          291 |
+----------+----------------------------------+------------------------------+
1 row in set (0.81 sec)


mysql> select count(distinct location_country,referer_name) from piwik_log_visit;
+-----------------------------------------------+
| count(distinct location_country,referer_name) |
+-----------------------------------------------+
|                                           932 |
+-----------------------------------------------+
1 row in set (0.19 sec)

mysql> select count(distinct location_country), count(distinct referer_name) from piwik_log_visit;
+----------------------------------+------------------------------+
| count(distinct location_country) | count(distinct referer_name) |
+----------------------------------+------------------------------+
|                              109 |                          291 |
+----------------------------------+------------------------------+
1 row in set (0.16 sec)

mysql> select count(distinct referer_name), count(distinct location_country) from piwik_log_visit;
+------------------------------+----------------------------------+
| count(distinct referer_name) | count(distinct location_country) |
+------------------------------+----------------------------------+
|                          291 |                              109 |
+------------------------------+----------------------------------+
1 row in set (0.16 sec)

mysql> select count(distinct location_country), 1 as filler, count(distinct referer_name) from piwik_log_visit;
+----------------------------------+--------+------------------------------+
| count(distinct location_country) | filler | count(distinct referer_name) |
+----------------------------------+--------+------------------------------+
|                              109 |      1 |                          291 |
+----------------------------------+--------+------------------------------+
1 row in set (0.16 sec)

mysql> select count(distinct location_country), max(location_country) as filler, count(distinct referer_name) from piwik_log_visit;
+----------------------------------+--------+------------------------------+
| count(distinct location_country) | filler | count(distinct referer_name) |
+----------------------------------+--------+------------------------------+
|                              109 | zw     |                          291 |
+----------------------------------+--------+------------------------------+
1 row in set (0.25 sec)

Você diz

Todos eles dão 4.843.634 também, o que não é o que eu pedi

SELECT COUNT(DISTINCT Col1), COUNT(DISTINCT Col2) FROM Sometable

SELECT COUNT(DISTINCT Col2), COUNT(DISTINCT Col1) FROM Sometable

SELECT COUNT(DISTINCT Col1), 1 AS Filler, COUNT(DISTINCT Col2) FROM Sometable

mas isso não faz o menor sentido. As duas primeiras consultas devem retornar duas colunas, a última deve retornar 3.

Você pode fornecer seus resultados reais alinhados com o que você esperava ver e talvez possamos descobrir se há um problema real ou se você está simplesmente entendendo mal alguma coisa.

Para referência, executei isso no Percona Server 5.5.16

mysql> select @@version;
+---------------+
| @@version     |
+---------------+
| 5.5.16-55-log |
+---------------+
1 row in set (0.00 sec)

EDIT: Eu também tentei isso em um conjunto de dados diferente com ~ 5MM linhas e obtive os mesmos resultados... tudo verificado. Isso foi no Percona Server 5.1.43

Anomalia agregada do MySQL

Como você mysqldump tabela (s) específica (s)?

Como você mostra o SQL em execução em um banco de dados Oracle?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

Como uso currval() no PostgreSQL para obter o último id inserido?

Como executar o psql no Mac OS X?

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Passando parâmetros de array para um procedimento armazenado

Anomalia agregada do MySQL

2 respostas

relate perguntas