AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 1099
Accepted
David
David
Asked: 2011-02-07 05:46:35 +0800 CST2011-02-07 05:46:35 +0800 CST 2011-02-07 05:46:35 +0800 CST

Por que tantas soluções MPP são baseadas em PostgreSQL em vez de MySQL?

  • 772

Astor Data, Greenplum e GridSQL permitem processamento paralelo massivo de consultas SQL. Eles também são todos construídos em torno da tecnologia PostgreSQL. Isso é apenas devido a problemas de licenciamento ou há outros motivos? Para mim, parece que o MyISAM, não sendo compatível com ACID e, portanto, não tendo os mesmos problemas com o MVCC (como visto aqui ), pois o PostgreSQL é muito mais adequado para a construção de data warehouses de alto desempenho. Afinal, a carga OLAP não requer transações, tanto quanto posso ver.

mysql postgresql
  • 4 4 respostas
  • 6327 Views

4 respostas

  • Voted
  1. Best Answer
    Peter Eisentraut
    2011-02-07T16:29:51+08:002011-02-07T16:29:51+08:00

    É principalmente uma questão de licença. Esses desenvolvimentos acabam corrigindo o código de maneira bastante pesada; portanto, se você fosse lidar com o MySQL, teria que abrir o código-fonte do seu código ou ficar à mercê do proprietário corporativo do MySQL por toda a vida do seu negócio. Algumas ofertas para o MySQL contornam isso implementando seu trabalho como um mecanismo de armazenamento, mas isso não oferece toda a flexibilidade de que precisam e, invariavelmente, acabam corrigindo o núcleo do MySQL também.

    • 14
  2. rvs
    2011-02-07T10:46:56+08:002011-02-07T10:46:56+08:00

    Vejo duas razões:

    1) historicamente, o PostgreSQL tinha melhor planejador de consultas e analisador de estatísticas. Isso pode não ser verdade agora, mas alguns anos atrás o PostgreSQL era muito melhor que o MySQL em consultas complexas, que são as OLAP.

    2) O PostgreSQL tem melhor suporte de programação de funções/triggers/etc.

    • 11
  3. CodeMoney
    2013-04-03T08:03:34+08:002013-04-03T08:03:34+08:00

    Como Peter Eisentraut apontou corretamente, antes de mais nada é uma questão de licenciamento. O Postgres é licenciado sob um contrato semelhante ao BSD, o que o torna essencialmente "gratuito para todos", desde que você dê crédito aos desenvolvedores originais em seu trabalho derivado.

    O debate MVCC versus locking scheduler tem sido o assunto de mais do que algumas 'guerras santas' online. Os debates sobre os méritos de vários mecanismos de armazenamento têm sido igualmente controversos.

    Os méritos de diferentes mecanismos de armazenamento de linha principal (também conhecidos como armazenamento de linha) são IMHO amplamente irrelevantes quando se trata de MPP RDBMS construído para cargas de trabalho analíticas por dois motivos:

    1. Embora as peculiaridades do mecanismo de armazenamento sejam importantes para o processamento de transações ACID em cargas de trabalho do tipo OLTP, em um ambiente típico de armazenamento de dados, você precisa oferecer suporte a apenas um tipo de "transação" - um carregamento em lote. Idealmente, é o carregamento em lote que deve ser totalmente bem-sucedido ou falhar completamente.
    2. Bancos de dados analíticos, baseados em mecanismos de armazenamento de armazenamento de coluna, em muitos casos superarão qualquer implementação de armazenamento de linha. A Vertica foi uma loja de colunas desde o início, a Teradata e a Greenplum recentemente adicionaram a funcionalidade de armazenamento de colunas a seus produtos.
    • 6
  4. Randolph
    2012-12-05T18:34:14+08:002012-12-05T18:34:14+08:00

    Construí um sistema MPP no MySQL e descartei o sistema por dois motivos:

    1) é Oráculo

    2) é a falta de junções de hash - loop aninhado e junções de índice não escalam para o nível exigido em um sistema MPP - novamente porque a Oracle inibiu a entrega prometida de junções de hash na linha de código 5.x depois de assumir a propriedade.

    Os sistemas de big data MPP devem ter junções que não sejam de complexidade geométrica. - Junções de complexidade linear ou logarítmica devem ser uma forte preferência para verdadeiros sistemas de big data.

    Em vez disso, implantei o Actian vetorialmente no novo sistema DeepCloud MPP, mantendo uma compatibilidade drizzle/MySQL no nível do usuário.

    Os usuários que desejam análises rápidas de big data podem baixar o DeepCloud em http://www.deepcloud.co

    • 4

relate perguntas

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

  • Quando é o momento certo para usar o MariaDB em vez do MySQL e por quê?

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

  • Como um grupo pode rastrear alterações no esquema do banco de dados?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve