AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 612
Accepted
ravikanth
ravikanth
Asked: 2011-01-15 00:05:47 +0800 CST2011-01-15 00:05:47 +0800 CST 2011-01-15 00:05:47 +0800 CST

Randomizando o conteúdo da tabela e armazenando-o de volta na tabela

  • 772

Eu tenho uma tabela com pelo menos um milhão de registros. Essas linhas foram criadas por um aplicativo personalizado que lê vários conjuntos de sites do SharePoint e armazena as urls do item na tabela. Agora, como lemos os conjuntos de sites de maneira serial, os primeiros milhares de linhas pertencem ao primeiro conjunto de sites, os próximos milhares pertencem ao segundo conjunto de sites e assim por diante.

Tenho outro app que lê essa tabela de forma sequencial. Porém, desta forma acabo enviando requisições HTTP para o mesmo conjunto de sites por mais tempo.

Sei que poderia obter resultados aleatórios da tabela em meu segundo aplicativo. Mas, isso não é uma opção. Não posso mudar a maneira como o segundo aplicativo funciona.

Agora, a pergunta é: como posso pegar todas as linhas da tabela, embaralhá-las e armazená-las de volta na tabela?

Atualização: SQL Server 2008 R2 é meu servidor de banco de dados

sql-server sql-server-2008-r2
  • 2 2 respostas
  • 178 Views

2 respostas

  • Voted
  1. Best Answer
    David Spillett
    2011-01-15T02:34:07+08:002011-01-15T02:34:07+08:00

    Se o aplicativo de chamada estiver definindo explicitamente uma ordem específica em sua consulta (se você estiver executando o MSSQL, poderá verificar isso executando uma sessão do criador de perfil enquanto o aplicativo faz o seu trabalho, outros DMBSs terão opções de registro semelhantes), então não há nada que você possa fazer fazer e se não for, você não pode garantir completamente qualquer ordem particular.

    Se nenhuma cláusula ORDER BY explícita for fornecida, os dados sairão em uma ordem que é oficialmente "indefinida" - será a ordem que o servidor achar mais conveniente. Para uma única consulta de tabela, provavelmente será a ordem da chave primária. No MSSQL, se você tiver um índice clusterizado, os resultados provavelmente sairão nessa ordem para uma única consulta de tabela. Para consultas de várias tabelas, é ainda menos claro, pois depende de qual caminho o planejador de consulta escolhe para obter seus resultados (que sem dicas de índice explícitas podem variar ao longo do tempo como o saldo de dados nas tabelas, conforme estimado pelo estatísticas de índice que o servidor mantém, alterações).

    Se a tabela não tiver índice clusterizado ou chave primária, é provável que os dados saiam em uma ordem arbitrária semelhante à ordem em que os dados foram inseridos. Neste caso você pode tentar:

    SELECT * INTO temp_table FROM table_to_be_reordered
    DELETE table_to_be_reordered
    INSERT table_to_be_reordered SELECT * FROM temp_table ORDER BY NEWID()
    

    ou isso pode ser mais rápido

    INSERT table_to_be_reordered SELECT * FROM temp_table ORDER BY NEWID()
    DROP TABLE table_to_be_reordered
    EXEC sp_rename 'temp_table', 'table_to_be_reordered'
    

    Acima, NEWID () é a função do MSSQL para retornar um UUID e usa IDs aleatórios em vez de sequenciais por padrão - em outros DMBSs, você deve encontrar uma função semelhante que possa usar. Tenha cuidado com sua escolha de função: por exemplo, no MSSQL, a função RAND () é avaliada uma vez por consulta, não uma vez por linha, portanto SELECT * FROM somewhere ORDER BY RAND(), não teria o efeito desejado (você pode ver por que executando algo como SELECT RAND(), * FROM some_table).

    Se você estiver usando MSSQL (sua pergunta não indicou qual DBMS você está direcionando) e ainda não possui um índice clusterizado na tabela e possui uma coluna suficientemente aleatória (uma coluna UUID, por exemplo) ou pode adicionar uma sem perturbar o aplicativo de chamada, você pode criar um índice clusterizado naquele que seria mais rápido do que o SELECT INTO / DELETE / SELECT INTO acima. Mas, novamente: isso não terá nenhum efeito se o aplicativo estiver solicitando explicitamente os resultados em uma ordem específica e pode não ter nenhum efeito de outra forma.

    • 10
  2. Gaius
    2011-01-15T02:06:46+08:002011-01-15T02:06:46+08:00

    Você não especifica qual banco de dados, mas no Oracle você pode fazer isso:

    CREATE TABLE RAND_TABLE AS (SELECT * FROM ORIG_TABLE ORDER BY DBMS_RANDOM.RANDOM());
    

    Você precisará de espaço suficiente em seu tablespace TEMP para lidar com a classificação. Então, se desejar, você pode renomear as tabelas ORIG_TABLEe RAND_TABLEtrocá-las. Não acho que seja possível embaralhar uma mesa "no local".

    • 4

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve