AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 13931
Accepted
Jeremy Beard
Jeremy Beard
Asked: 2012-02-27 00:23:18 +0800 CST2012-02-27 00:23:18 +0800 CST 2012-02-27 00:23:18 +0800 CST

Por que os bancos de dados relacionais não atendem às escalas de Big Data?

  • 772

Costuma-se repetir que o problema do Big Data é que os bancos de dados relacionais não podem ser dimensionados para processar os enormes volumes de dados que agora estão sendo criados.

Mas quais são essas limitações de escalabilidade às quais as soluções de Big Data, como o Hadoop, não estão vinculadas? Por que o fragmento Oracle RAC ou MySQL ou MPP RDBMS como Teradata (etc.) não consegue essas proezas?

Estou interessado nas limitações técnicas - estou ciente de que os custos financeiros de clustering RDBMS podem ser proibitivos.

scalability
  • 3 3 respostas
  • 20104 Views

3 respostas

  • Voted
  1. Best Answer
    Dave Markle
    2012-02-27T05:14:04+08:002012-02-27T05:14:04+08:00

    A MS acabou de ter uma palestra sobre tecnologia na Holanda, onde discutiram algumas dessas coisas. Começa devagar, mas entra na essência do Hadoop por volta dos 20 minutos.

    A essência disso é que "depende". Se você tiver um conjunto de dados organizado de maneira sensata (pelo menos um pouco) fácil de particionar que (pelo menos um pouco) seja homogêneo, deve ser bastante fácil escalar para esses altos volumes de dados com um RDBMS, dependendo do que você está fazendo .

    Hadoop e MR parecem ser mais voltados para situações em que você é forçado a grandes varreduras distribuídas de dados, especialmente quando esses dados não são necessariamente tão homogêneos ou estruturados quanto os que encontramos no mundo RDBMS.

    A quais limitações as soluções de Big Data não estão vinculadas? Para mim, a maior limitação a que eles não estão sujeitos é ter que fazer um esquema rígido com antecedência. Com as soluções de Big Data, você coloca grandes quantidades de dados na "caixa" agora e adiciona lógica às suas consultas posteriormente para lidar com a falta de homogeneidade dos dados. Do ponto de vista do desenvolvedor, a compensação é a facilidade de implementação e flexibilidade no front-end do projeto, versus complexidade na consulta e consistência de dados menos imediata.

    • 15
  2. BenjaminBallard
    2012-02-29T08:56:28+08:002012-02-29T08:56:28+08:00

    O pioneiro e pesquisador de banco de dados Michael Stonebraker co-escreveu um artigo que discute as limitações das arquiteturas de banco de dados tradicionais. Geralmente, eles escalam com hardware mais caro, mas têm dificuldade em escalar com hardware mais comum em paralelo e são limitados pela arquitetura de software herdada que foi projetada para uma era mais antiga. Ele afirma que a era do BigData exige várias novas arquiteturas de banco de dados que aproveitam a infraestrutura moderna e otimizam para uma determinada carga de trabalho. Exemplos disso são o projeto C-store, que levou ao banco de dados comercial Vertica Systems, e o projeto H-store que levou ao VoltDB, um banco de dados OLTP SQL em memória projetado para cargas de trabalho de BigData de alta velocidade. (Divulgação completa, eu trabalho para VoltDB).

    Você pode achar este webinar interessante sobre este tópico. Ele responde a alguns dos mitos que surgiram com o sucesso dos bancos de dados NoSQL. Basicamente, ele afirma que o SQL não era o problema, não deveria ser necessário abrir mão dos recursos tradicionais do banco de dados, como consistência, para obter desempenho.

    • 6
  3. sunil
    2012-03-02T21:29:24+08:002012-03-02T21:29:24+08:00

    Não é inteiramente verdade que o RDBMS não pode escalar. No entanto, a verdade parcial na declaração depende da arquitetura. Na lista que você deu, o Oracle RAC é diferente do resto (MySQL fragmentado e Teradata). A principal diferença é o disco compartilhado versus as arquiteturas sem compartilhamento.

    As arquiteturas de disco compartilhado, como o Oracle RAC, sofrem com o dimensionamento porque, em algum momento ou outro, todas as máquinas em execução devem sincronizar em alguma parte dos dados. Por exemplo, o gerenciador de bloqueio global é um assassino. Você pode continuar ajustando-o até certo ponto, mas acabará batendo em uma parede. Se você não puder adicionar máquinas facilmente, deverá ter menos máquinas, mas superpoderosas, que podem queimar seu bolso. No caso de arquiteturas sem compartilhamento (ou dados fragmentados), cada máquina se apropria de alguns dados. Não precisa sincronizar com outras máquinas se quiser atualizar alguns dados.

    Em seguida, vem a geração de bancos de dados NoSQL. Eu os trataria como um subconjunto de bancos de dados RDBMS tradicionais. Nem todos os aplicativos neste mundo precisarão de todas as funcionalidades oferecidas pelo RDBMS. Se eu quiser usar o banco de dados como cache, não me importaria com a durabilidade. Pode ser que, em alguns casos, eu também não me importe com a consistência. Se toda a minha pesquisa de dados for baseada em uma chave, não preciso de suporte para consultas de intervalo. Posso não precisar de índices secundários. Não preciso de toda a camada de processamento/otimização de consultas que todos os bancos de dados tradicionais possuem.

    • 5

relate perguntas

  • Como alguém dimensiona o SQL Server 2008 ou 2012?

  • Tabelas/servidores de fragmentação do MySQL ou outros métodos para reduzir os tamanhos das tabelas?

  • Quais são as heurísticas de fragmentação para o MySQL - número de registros por tabela e número de tabelas por instância?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como ver a lista de bancos de dados no Oracle?

    • 8 respostas
  • Marko Smith

    Quão grande deve ser o mysql innodb_buffer_pool_size?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    restaurar a tabela do arquivo .frm e .ibd?

    • 10 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve