AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 7840
Accepted
SCO
SCO
Asked: 2011-11-14 10:54:54 +0800 CST2011-11-14 10:54:54 +0800 CST 2011-11-14 10:54:54 +0800 CST

Balanceamento de carga / MPP com Postgres 9.1

  • 772

Estou tentando configurar um testbed para análise de bigdata (basicamente em torno de 2 a 3 TB de base, gravação leve [apenas alimentando o banco de dados], mas possivelmente leitura de consultas intensivas para fins de análise).

Como tenho um pouco de experiência com PostgreSQL básico (mas com base de 10 GB), estava pensando em tentar a nova replicação síncrona 9.1 para obter o balanceamento de carga. O objetivo é fazer com que o Tableau seja muito responsivo. Assim, eu poderia evitar os custosos MPP GreenPlum, AsterData e outros.

No entanto, eu queria saber se: - ir direto para bancos de dados MPP, GreenPlum por exemplo, foi uma boa idéia? (para 2-3 TB, o Greenplum é realmente necessário?) - uma vez que a replicação síncrona esteja funcionando, como devo configurar meus aplicativos? O balanceamento de carga é feito pelo mestre ou é necessária outra solução (Pgpool por exemplo)?

Obrigado por suas percepções!

postgresql
  • 1 1 respostas
  • 1433 Views

1 respostas

  • Voted
  1. Best Answer
    ConcernedOfTunbridgeWells
    2011-11-14T14:34:58+08:002011-11-14T14:34:58+08:00

    Em princípio, deve ser possível fazer 2-3 TB sem recorrer a uma arquitetura sem compartilhamento, mas o Vanilla PostgreSQL ainda não possui uma boa funcionalidade de consulta paralela. Tudo o que você conseguirá com a replicação é a capacidade de distribuir consultas para nós individuais. Não acredito que o PostgreSQL ofereça suporte a consultas federadas prontas para uso e ficaria muito surpreso ao descobrir que o Tableau tem suporte direto para fragmentação no cliente. Eu acho que o PostgreSQL não funcionará muito bem em um conjunto de dados tão grande.

    Há um trabalho em andamento em um recurso de consulta paralela para PostgreSQL, mas o AFAIK não está incluído na versão 9.1. Meu instinto é que algum lançamento nos próximos anos incluirá esse recurso, mas ainda não chegou lá. Não vejo evidências de muito esforço sendo colocado em um recurso de consulta federada.

    Outra opção: SQL Server

    A menos que você seja casado com o Postgres, talvez descubra que o SQL Server oferece uma opção econômica para o Greenplum para um conjunto de dados de 2 a 3 TB. Ele é licenciado pelo soquete em vez do núcleo, portanto, uma caixa Xeon ou Opteron carregada de 2 a 4 soquetes oferece uma boa relação custo-benefício como plataforma. Para uma base de usuários menor, acredito que você ainda pode licenciar a Enterprise Edition por CAL também.

    Algumas matrizes de disco 24/25 em um controlador RAID de ponta farão leituras sequenciais com rapidez suficiente para saturar um slot PCIe-x8 (2 GB/s). Uma simples consulta de varredura de tabela com SQL Server manipulará dados nessa taxa sem usar muita CPU (obviamente, dependendo da computação real), portanto, você terá algum espaço para adicionar controladores e matrizes se desejar uma E/S mais rápida.

    O SQL Server também vem com um bom conjunto de ferramentas de BI, incluindo um servidor OLAP. O Tableau não é barato, cerca de £ 1.800 / assento da última vez que olhei. Dependendo do número de usuários, você pode descobrir que as ferramentas 'boas o suficiente' que acompanham o SQL Server podem compensar os custos da licença do banco de dados de qualquer maneira. A maioria das ferramentas de relatórios de terceiros também funciona bem com o SQL Server.

    Isenção de responsabilidade: não sou um Microsoftie obstinado, mas fiz muito trabalho de BI com SQL Server e Oracle na última década. O SQL Server é, na verdade, uma boa plataforma de BI.

    • 3

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve