AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 4943
Accepted
Razvan Popovici
Razvan Popovici
Asked: 2011-08-23 14:15:50 +0800 CST2011-08-23 14:15:50 +0800 CST 2011-08-23 14:15:50 +0800 CST

Conjunto de dados em terabyte

  • 772

Tenho a sensação de que a maioria dos sistemas de banco de dados se originou nos anos 80 e implementa estereotipicamente tabelas, transações ACID e restrições. Eles foram construídos pensando na escassez de memória, disco e poder de processamento.

Gostaria de saber se existe algum sistema de armazenamento (não necessariamente acessível por meio do SQL) capaz de lidar com o seguinte:

  • grafos (consultando a la SPARQL).
  • matriz (n-dimensional) também esparsa. Suporte de algoritmos triviais de matriz, como SVD, agrupamento.
  • gerenciamento eficiente de grandes (tamanho terabyte) de dados que não mudam continuamente; a mudança está acontecendo por meio de lotes diários.
  • fazer uso de grandes sistemas de disco (14 TB de RAID5 custa hoje menos de US$ 1.500). Isso significa mais espaço para índices, resultados pré-calculados, etc.
  • fazer uso de GPU/vários núcleos/processadores/nós, para uma grande consulta e indexação.

Sei que a maioria dos itens estão implementados em algum lugar (Apache Cassandra, SPARQL, Netezza, Exadata), mas não tenho conhecimento de nenhum produto que possa implementar todos.

performance graph
  • 1 1 respostas
  • 787 Views

1 respostas

  • Voted
  1. Best Answer
    Richard
    2011-08-24T04:49:18+08:002011-08-24T04:49:18+08:00

    Acho que muitos desses itens estão no horizonte (ou além).

    SPARQL, por exemplo, é algo que não vejo os bancos de dados incorporando tão cedo. O mais próximo que vi é SDB , uma interface que processa SPARQL e o envia para um banco de dados padrão.

    Além disso, usar GPUs como processadores genéricos ainda é algo revolucionário. Ainda não pegou no mundo do banco de dados. Nesta fase, ainda está no mundo da academia e da teoria.

    Há apenas um grupo (que consegui encontrar) que está desenvolvendo um banco de dados para aproveitar a GPU. Alenka é um projeto de código aberto, mas ainda está em desenvolvimento.

    Além disso, há um novo algoritmo de classificação chamado GPUTeraSort no horizonte. Mas (sendo um algoritmo), não conheço nenhum banco de dados específico que o use neste momento.

    Finalmente, há um site, GPGPU , para computação de propósito geral em GPUs que você pode querer ficar de olho. À medida que surgirem bancos de dados que usam a GPU, este será o site que o reportará.

    Dito tudo isso, usar vários núcleos ou vários processadores é quase o status quo. SQL Server, MySQL, Oracle - todos os principais bancos de dados usam multi-threading.


    Em última análise, os itens que você está pedindo são algo que atualmente está muito além do mundo do banco de dados.

    Você também pode tentar postar isso no StackOverflow, pois eles podem ter algumas ideias de como lidar com dados em nível de Terabyte usando gráficos, SPARQL, aprimoramentos de GPU etc. No entanto, a resposta deles provavelmente será algo como: "Sim , você pode fazer isso, mas seria um enorme sistema customizado."

    • 5

relate perguntas

  • Existe um ganho de desempenho ao manipular dados com procedimentos armazenados em vez de alimentá-los em funções após a recuperação?

  • Como você ajusta o MySQL para uma carga de trabalho pesada do InnoDB?

  • Como determinar se um Índice é necessário ou necessário

  • Onde posso encontrar o log lento do mysql?

  • Como posso otimizar um mysqldump de um banco de dados grande?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve