Onde posso encontrar o log lento do mysql?

Question

Déjà vu

Asked: 2017-10-29 22:38:43 +0800 CST2017-10-29 22:38:43 +0800 CST 2017-10-29 22:38:43 +0800 CST

Implementando uma consulta, dois tipos de estratégias

772

As tabelas ainda não foram criadas, mas para simplificar existem as tabelas a groupse an . itemsUm grupo contém um id de item (e um id de grupo). E vários grupos podem conter o mesmo id de item.

Por exemplo

CREATE TABLE groups (
          gid int,
          iid int,
          primary key(gid,iid)
);
CREATE TABLE items (
          iid int primary key,
          label char(5)
);

e vamos colocar alguns dados neles, para ajudar a visualizar o próximo problema

insert into items values (1,"pen"),(2,"gum"),(3,"cat"),(4,"dog"),
                         (5,"hug"),(6,"art"),(7,"fun");

insert into groups values(1,1),(1,2),(1,3),(2,4),(2,5),(2,6),(3,1),
                         (3,4),(4,2),(4,3),(4,5),(4,6),(4,7);

Recuperar itens de vários grupos (por exemplo, grupos 1,2,3,4) usa a DISTINCTpara remover duplicatas

(1) SELECT DISTINCT i.iid,i.label FROM groups g JOIN items i ON g.iid=i.iid 
    WHERE g.gid in (1,2,3,4) ORDER BY i.iid;

Mas como as tabelas eventualmente conterão mais dados, essa consulta usando uma subconsulta seria mais eficiente

(2) SELECT i.iid,i.label FROM items i 
    JOIN (SELECT DISTINCT iid FROM groups WHERE gid IN (1,2,3,4)) AS s
    ON i.iid=s.iid ORDER BY i.iid;

já que distinctse aplica apenas aos ids dos itens, apesar da sobrecarga de usar uma subconsulta?

Ou este sugerido por @hypercube (ver comentários):

(3) SELECT i.iid,i.label FROM items AS i 
    WHERE EXISTS
       (SELECT * FROM groups AS g WHERE g.gid IN (1,2,3,4) AND i.iid=g.iid)
    ORDER BY i.iid

Para informação, eventualmente

a tabela de itens terá entre 50 a 100 mil linhas
um grupo provavelmente terá de 5 a 10 mil itens
os IDs de grupos a serem selecionados em uma única consulta estão no intervalo de 5 a 20
probabilidade de um item fazer parte de 2 grupos selecionados: 50%
probabilidade de um item fazer parte de 3 grupos selecionados: 30%
probabilidade de um item fazer parte de 4 grupos selecionados: 10%

1 respostas

Voted

Rick James · Answer 1 · 2017-11-01T03:50:08+08:00

Best Answer

Rick James

2017-11-01T03:50:08+08:002017-11-01T03:50:08+08:00

(1) é simples e direto. Pode ser o mais eficiente.

(2) é uma aceleração comum. Mas brilha quando a parte não indexada (apenas i.labelno seu caso) é volumosa e/ou a chave na tabela ( i.id) não é o PRIMARY KEY. Portanto, se o seu exemplo for diluído do código real, (2) pode superar (1).

(3) é improvável que seja eficiente, pois precisa atingir items50 ~ 100K vezes.

Questões laterais:

Não use CHARa menos que a coluna realmente tenha comprimento fixo; em vez disso, use VARCHAR.

Eu suponho que você esteja usando o InnoDB. (MyISAM, devido ao manuseio diferente de PRIMARY KEY, será menos eficiente.)

Se groupsfor uma tabela de mapeamento muitos:muitos, veja minhas dicas . Provavelmente ajudará (3) alguns.

1

Implementando uma consulta, dois tipos de estratégias

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Implementando uma consulta, dois tipos de estratégias

1 respostas

relate perguntas