AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 148833
Accepted
Michael Green
Michael Green
Asked: 2016-09-06 04:06:20 +0800 CST2016-09-06 04:06:20 +0800 CST 2016-09-06 04:06:20 +0800 CST

Como o PolyBase coleta estatísticas de tabelas externas?

  • 772

Os livros on-line têm a dizer sobre a otimização de consultas no PolyBase:

O otimizador de consulta toma uma decisão baseada em custo para enviar a computação para o Hadoop quando isso melhorar o desempenho da consulta. Ele usa estatísticas em tabelas externas para tomar a decisão baseada em custo. A computação push cria tarefas MapReduce e aproveita os recursos computacionais distribuídos do Hadoop.

Minha pergunta - como e quando o otimizador coleta essas estatísticas?

Dentro do mecanismo relacional do SQL Server, as estatísticas podem ser criadas implícita ou explicitamente, envelhecem conforme ocorrem as gravações e podem ser atualizadas explicitamente ou durante a manutenção da tabela. Existem estratégias semelhantes empregadas no PolyBase?

Dado que os dados podem ser carregados no blob do Hadoop/Azure sem que o SQL Server os veja no caminho, e os volumes de dados serão grandes (provavelmente) a criação de estatísticas ad hoc em tempo de execução por meio de amostragem ou similar parece uma estratégia improvável para mim.

sql-server sql-server-2016
  • 1 1 respostas
  • 1611 Views

1 respostas

  • Voted
  1. Best Answer
    Michael Green
    2016-09-12T18:31:18+08:002016-09-12T18:31:18+08:00

    A criação e manutenção das estatísticas do PolyBase está nas mãos do DBA.

    O guia "primeiros passos" fornece várias etapas para estabelecer o PolyBase, a última das quais é CREATE STATISTICS referenciando a tabela externa.

    A documentação em CREATE STATISTICS declara:

    Estatísticas para tabelas externas

    Ao criar estatísticas de tabela externa, o SQL Server importa a tabela externa para uma tabela temporária do SQL Server e, em seguida, cria as estatísticas. Para estatísticas de amostras, apenas as linhas de amostra são importadas. Se você tiver uma tabela externa grande, será muito mais rápido usar a amostragem padrão em vez da opção de varredura completa.

    e mais abaixo

    Limitações e Restrições

    A atualização de estatísticas não é suportada em tabelas externas. Para atualizar as estatísticas em uma tabela externa, elimine e recrie as estatísticas.

    A partir disso concluo que cabe ao administrador do sistema

    • criar estatísticas apropriadas para a carga de trabalho pretendida
    • monitorar estatísticas obsoletas
    • implementar procedimentos de manutenção para estatísticas externas
    • garantindo que haja espaço suficiente para a "tabela temporária" (TempDB?)

    Imagina-se que, à medida que o produto amadurece e ganha força, mais recursos do mecanismo de dados atual (criação automática e estatísticas de atualização automática) serão transferidos para o PolyBase. Por outro lado, você realmente quer esperar pelos resultados enquanto uma loja de 5 PB é amostrada?

    • 3

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve