AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 56168
Accepted
dotancohen
dotancohen
Asked: 2014-01-06 02:25:37 +0800 CST2014-01-06 02:25:37 +0800 CST 2014-01-06 02:25:37 +0800 CST

Selecione cada n-ésima linha, não puxe a tabela inteira

  • 772

À luz da discussão Meta sobre permitir perguntas básicas de SQL em dba.SE , apresento um problema que estou tendo agora, para o qual a resposta no Stack Overflow é inadequada e ingênua. Espero que haja uma solução melhor para o problema do que as apresentadas no SO (já que estou enfrentando esse problema em um aplicativo), e dba.SE parece ser o lugar perfeito para encontrar uma resposta melhor.

Aqui está a pergunta original no Stack Overflow: Como você seleciona cada n-ésima linha do mysql?

Aqui está a resposta aceita:

SELECT * 
FROM ( 
    SELECT 
        @row := @row +1 AS rownum, [column name] 
    FROM ( 
        SELECT @row :=0) r, [table name] 
    ) ranked 
WHERE rownum % [n] = 1 

O problema crítico com a resposta aceita é que ela requer puxar a tabela inteira para uma tabela temporária. Portanto, abordei essa preocupação no título desta pergunta.

Considere também que a tabela pode ter excluído linhas, portanto, uma consulta alternativa que fosse simplesmente testar WHERE MODa chave primária também não é uma boa solução. Id est, a chave primária não é confiável para ser sequencial.

Existe uma maneira melhor de formular uma consulta que retornaria a cada segundo, décimo ou n-ésima linha arbitrária, que não exija puxar a tabela inteira para a memória, mas também considere as linhas excluídas?

Cada n-ésima linha pode ser definida como tal:

n =  2: Rows 0, 2, 4, 6, 8, ...
n = 10: Rows 0, 10, 20, 30, ...
n = 42: Rows 0, 42, 84, 126, ...

Meu banco de dados de destino é o MySQL 5.5 rodando em uma distribuição Linux comum derivada do Debian.

EDIT: Em resposta à resposta de Thomas:

A solução sugerida não produz o resultado esperado, veja abaixo:

mysql> SELECT 
    ->     @i:=@i+1 AS iterator 
    ->     , t.name
    -> FROM 
    ->     events AS t,
    ->     (SELECT @i:=0) AS dummy
    -> WHERE @i % 10 = 0
    -> ORDER BY name ASC;
+----------+-------+
| iterator | name |
+----------+-------+
|        1 |     0 |
+----------+-------+
1 row in set (0.29 sec)

mysql> select count(*) from events;
+----------+
| count(*) |
+----------+
|   892507 |
+----------+
1 row in set (0.17 sec)
mysql
  • 2 2 respostas
  • 20237 Views

2 respostas

  • Voted
  1. Best Answer
    Gord Thompson
    2014-01-09T09:30:14+08:002014-01-09T09:30:14+08:00

    Para dados de teste emevents

    id  txtcol
    --  ------
     1  event0
     2  event1
     4  event2
     5  event3
     6  event4
     8  event5
     9  event6
    

    Recupere os valores da chave primária em ordem crescente

    SELECT id FROM events ORDER BY id
    

    Envolva isso em uma consulta para atribuir uma classificação baseada em zero

    set @row:=-1;
    SELECT @row:=@row+1 AS rownum, id 
    FROM
        (
            SELECT id FROM events ORDER BY id
        ) AS sorted
    

    Envolva isso em uma consulta para selecionar a primeira linha e cada terceira linha depois disso

    set @row:=-1;
    SELECT id
    FROM
        (
            SELECT @row:=@row+1 AS rownum, id 
            FROM
                (
                    SELECT id FROM events ORDER BY id
                ) AS sorted
        ) as ranked
    WHERE rownum % 3 = 0
    

    Por fim, envolva isso em uma consulta para recuperar as outras colunas

    set @row:=-1;
    SELECT events.*
    FROM
        events
        INNER JOIN
        (
            SELECT id
            FROM
                (
                    SELECT @row:=@row+1 AS rownum, id 
                    FROM
                        (
                            SELECT id FROM events ORDER BY id
                        ) AS sorted
                ) as ranked
            WHERE rownum % 3 = 0
        ) AS subset
            ON subset.id = events.id
    

    retornando

    id  txtcol
    --  ------
     1  event0
     5  event3
     9  event6
    
    • 5
  2. Thomas Kejser
    2014-01-06T07:14:48+08:002014-01-06T07:14:48+08:00

    Para amostrar cada n-ésima linha aleatoriamente, eu usaria uma função de hash na chave.

    Por exemplo, se você quiser a 10ª linha, poderá expressar sua consulta assim:

    SELECT foo, bar 
    FROM MyTable 
    WHERE CRC32(key) % 10 = 0
    

    Supondo que você escolha uma função de hash (como CRC32) com um bom spread, isso deve proteger contra buracos keyque existem como resultado de exclusões.

    Estritamente falando, isso não é garantido para amostrar EXATAMENTE 1/n da tabela. Mas se a tabela for grande o suficiente para que você se preocupe com o desempenho dela, presumo que a solução o aproxime o suficiente.

    É importante perceber que não existe um "número de linha" em um banco de dados relacional. Uma tabela é simplesmente um conjunto não ordenado de tuplas. Os índices na tabela podem armazenar as tuplas em uma determinada ordem, mas isso ainda não adiciona nenhuma forma de numeração de linha aos dados. Isso significa que um número de linha só tem significado na presença de uma cláusula ORDER BY.

    Em outras palavras, se você quer dizer que deseja a enésima linha com relação a alguma forma de ordenação da tabela, então você deve expressar algo com um ORDER BY no SELECT. Por exemplo, isso fará:

    SELECT 
        @i:=@i+1 AS iterator 
        , t.foo
        , t.bar
    FROM 
        MySql AS t,
        (SELECT @i:=0) AS dummy
    WHERE @i % 10 = 0
    ORDER BY somecolumn
    

    Se somecolumnfor o índice primário, essa consulta deve ser executada sem classificação ou tabela temporária. Mas você ainda precisa visitar todas as linhas para obter o resultado.

    • 1

relate perguntas

  • Existem ferramentas de benchmarking do MySQL? [fechado]

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

  • Quando é o momento certo para usar o MariaDB em vez do MySQL e por quê?

  • Como um grupo pode rastrear alterações no esquema do banco de dados?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve