Existe um ganho de desempenho ao manipular dados com procedimentos armazenados em vez de alimentá-los em funções após a recuperação?

Question

Thomas Johnson

Asked: 2014-07-19 07:28:58 +0800 CST2014-07-19 07:28:58 +0800 CST 2014-07-19 07:28:58 +0800 CST

Ajustando o Mongo (TokuMX) para leituras em massa mais rápidas

772

Quais opções eu tenho para ajustar o MongoDB/TokuMX para ler os resultados de consultas com grandes conjuntos de resultados? Atualmente, estou em um único servidor (sem sharding) com os dados em uma unidade SSD. Minhas consultas são simplesmente {field: value}com um índice no campo. A coleção tem ~1B de registros, dos quais estou recuperando ~50M.

Olhando para cima, parece que há picos alternados de CPU mongod (~ 200% CPU, ou seja, 100% de 2 núcleos) e momentos em que parece que mongod está esperando por IO.

Que tipo de coisas posso tentar para melhorar o tempo de consulta?

1 respostas

Voted

Leif Walsh · Answer 1 · 2014-07-19T11:13:31+08:00

A primeira coisa a olhar é db.serverStatus().ft. Isso tem várias métricas que podem ser úteis para descobrir onde você está gastando tempo. Estes estão documentados aqui: http://docs.tokutek.com/tokumx/tokumx-server-status.html

Normalmente, a maneira de melhorar o tempo de consulta é garantir que você tenha o índice correto para sua consulta. Você pode estar fazendo uma consulta {field: value}e ter um índice em {field: 1}, mas se não estiver projetando em sua consulta, ainda estará fazendo muitas consultas pontuais de volta ao índice de chave primária para obter o documento completo, o que é muito ineficiente . Você pode querer adicionar outros campos ao índice para torná-lo abrangente e, em seguida, projetar para esses campos, por exemplo, indexar {field: 1, other: 1, fields: 1}e, em seguida, certifique-se de projetar em sua consulta como db.foo.find({field: "val"}, {field: 1, other: 1, fields: 1}).

Como alternativa, você pode usar uma chave primária personalizada se essas{field: 1, _id: 1} forem suas consultas mais comuns ou, em vez disso, apenas criar a chave secundária em {field: 1}uma chave de agrupamento .

Se você quiser mais ajuda, seria ótimo se você pudesse fornecer sua configuração de servidor, esquema de coleção ( db.foo.getIndexes()está bem) e estatísticas ( db.foo.stats()), consultas de amostra realistas e cardinalidade e saída de arquivos db.serverStatus().ft.

Ajustando o Mongo (TokuMX) para leituras em massa mais rápidas

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Ajustando o Mongo (TokuMX) para leituras em massa mais rápidas

1 respostas

relate perguntas