Existem ferramentas de benchmarking do MySQL? [fechado]

Question

Michael McGowan

Asked: 2012-01-15 10:56:20 +0800 CST2012-01-15 10:56:20 +0800 CST 2012-01-15 10:56:20 +0800 CST

Tabelas separadas ou particionar uma tabela enorme?

772

Estou construindo uma tabela bastante grande que inclui uma coluna específica, my_column. Há um pequeno número de valores possíveis para my_column, e cada valor exclusivo de my_columndeve ter o mesmo número de linhas associadas a ele. Além disso, é provável que as consultas sejam focadas apenas em um único valor específico de my_columncada vez. Vejo que uma opção seria particionar essa tabela grande com base nos valores de my_column. A outra opção, a meu ver, seria criar uma tabela totalmente separada, de modo que cada tabela se associe exatamente a um valor de my_column. Eu gostaria de saber o que me levaria a escolher uma opção em detrimento da outra.

Pelo que entendi, uma tabela grande particionada parece ser a maneira "correta" ou "pura" de fazer isso, pois esse parece ser o principal caso de uso para partições. No entanto, suspeito que, por razões práticas, a segunda opção seja melhor, e é para isso que estou inclinado. Não sei se isso importa, mas estou lidando com tabelas MyISAM.

2 respostas

Voted

RolandoMySQLDBA · Answer 1 · 2012-01-15T22:02:17+08:00

Tenho uma sugestão em relação à sua segunda opção.

Se você precisar manter as tabelas MyISAM com cada my_columnvalor único separado de outras tabelas MyISAM, você pode querer olhar para o mecanismo de armazenamento MERGE (Mrg_MyISAM) como uma alternativa ao particionamento de tabelas.

Isso permitirá que suas múltiplas tabelas MyISAM dentro do mesmo banco de dados que possuem estruturas de tabela idênticas e layout de índice sejam mapeadas juntas de forma que uma única consulta atinja todas as tabelas MyISAM.

Suponha que você tenha uma tabela da seguinte forma:

CREATE TABLE tb1
(
    my_column INT NOT NULL
    id INT NOT NULL AUTO_INCREMENT,
    name VARCHAR(30),
    PRIMARY KEY (my_column,id),
    KEY name (my_column,name)
) ENGINE=MyISAM;

e você tem 3 dessas tabelas (tb1, tb2, tb3) onde

my_column para tb1 = 1
my_column para tb2 = 2
my_column para tb3 = 3

Você pode mesclá-los em um único mapeamento de tabela da seguinte maneira:

CREATE TABLE tbmerge LIKE tb1;
ALTER TABLE tbmerge ENGINE=Mrg_MyISAM UNION=(tb1,tb2,tb3);

Para realizar uma busca em todas as tabelas, basta usar tbmerge. Por exemplo, suponha que você queira ver todos os nomes de tb2 que começam com 'Jack', execute esta consulta:

SELECT name FROM tbmerge WHERE my_column=2 AND name LIKE 'Jack%';

Dado o design da tabela, você sempre deve especificar o valor para my_column. Na verdade, para cada índice que tb1 possui, certifique-se de que my_column seja sempre a primeira coluna. A razão? Uma consulta em tbmerge é sempre uma consulta em tb1, tb2, tb3 (todas as tabelas subjacentes). Caso contrário, esta consulta

SELECT name FROM tbmerge WHERE name LIKE 'Jack%';

experimentará um desempenho horrível porque executará varreduras de tabela em todas as tabelas subjacentes. Planeje cuidadosamente os índices que você usará, seguindo essa regra simples (usando my_column como a primeira coluna de cada índice)

Há um benefício adicional: você pode INSERT nas tabelas subjacentes conforme sua conveniência, trabalhando assim com o

Discuti isso usando tabelas MERGE em uma postagem anterior (4 de janeiro de 2012) .

Mike Lue · Answer 2 · 2012-01-16T19:59:36+08:00

O particionamento é melhor se a maioria das consultas em seu sistema:

Concentre-se em um único valor (como você mencionou).
As linhas esperadas são de pelo menos 50% (veja detalhes abaixo) para o total de linhas nesse valor.

Digamos que a seguinte consulta seja adequada para ser revisada para particionamento :

SELECT *
FROM single_table
WHERE my_column = $dedicated_value$

O particionamento não é significativamente melhor do que uma única tabela se suas consultas tiverem outras condições que tornem o resultado apenas uma parte trivial do total de linhas nesse valor. Como exemplo a seguir (suponha que haja um índice composto nas colunas participantes):

SELECT *
FROM single_table
WHERE my_column = $dedicated_value$
    AND some_other_column = $another_dedicated_value$

A porcentagem de linhas esperadas

A porcentagem usada para avaliar a estratégia depende de quantos valores distintos em "my_column" e o tamanho da linha de sua tabela única original.

Quanto menos valores distintos você tiver, menos porcentagem de linhas esperadas deve ser considerada. Quanto mais tamanho de linha você tiver, menos porcentagem de linhas esperadas deve ser considerada.

É melhor projetar alguns experimentos para refletir sua estimativa.

Tabelas separadas ou particionar uma tabela enorme?

A porcentagem de linhas esperadas

Como ver a lista de bancos de dados no Oracle?

Quão grande deve ser o mysql innodb_buffer_pool_size?

Listar todas as colunas de uma tabela especificada

restaurar a tabela do arquivo .frm e .ibd?

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Tabelas separadas ou particionar uma tabela enorme?

2 respostas

A porcentagem de linhas esperadas

relate perguntas