AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 188332
Accepted
johnny
johnny
Asked: 2017-10-13 08:26:05 +0800 CST2017-10-13 08:26:05 +0800 CST 2017-10-13 08:26:05 +0800 CST

Os dados ELT acabam em um RDBMS?

  • 772

Acho que estou confundindo as coisas.

No ETL, a conversão de dados começa no Banco de Dados A e termina no Banco de Dados B, ambos são bancos de dados relacionais. Talvez eu tenha um sistema de 20 anos. Eu uso ETL para obter os dados entre os dois bancos de dados. Eu não sei para que mais o ETL é usado.

No ELT, é o mesmo, exceto que os dados do banco de dados A nunca terminam no banco de dados B? Em vez disso, os dados brutos estão em tabelas ou alguma outra estrutura de dados no Servidor B, do Banco de Dados A, mas requer algo como o Hadoop para transformar esses dados em algo que um aplicativo especificamente projetado para usar o Hadoop?

Edit: fiz de novo. Hadoop != ELT. Eu estava olhando apenas para o Hadoop e pensei que fosse o ELT ou a manifestação dele. edit: e esse ELT significava que você exigia uma estrutura de dados de arquivo não RDBMS exclusiva em vez de um RDBMS e você despejou o RDBMS completamente.

etl
  • 5 5 respostas
  • 875 Views

5 respostas

  • Voted
  1. Best Answer
    indiri
    2017-10-13T08:44:56+08:002017-10-13T08:44:56+08:00

    Eu acho que isso vai ser mais fácil com um exemplo:

    O banco de dados A tem a tabela C. O banco de dados B tem a tabela D. C e D são muito semelhantes, mas não idênticos, e os dados precisam ser limpos antes de serem carregados em D.

    • ETL

      Um programa ETL (SSIS, Pentaho, qualquer que seja) extrai os dados da tabela C. Em seguida, ele faz algumas alterações nos dados para limpá-los e colocá-los no formato necessário. O processo ETL então move/copia esses dados para a tabela D no banco de dados B.

    • ELT

      Os dados da Tabela C são extraídos. Ele é carregado no banco de dados B como tabela C. O banco de dados B agora tem duas tabelas, C e D. Um processo de banco de dados (SQL, um trabalho, o que for) agora faz algumas alterações nos dados da tabela C e os coloca no formato necessário. Esse mesmo processo copia os dados agora limpos para a tabela D. A tabela temporária C não é mais necessária no banco de dados B e pode ser excluída ou truncada.

    Em ambos os casos, os dados agora são carregados no Banco de Dados B, Tabela D. O aplicativo front-end continua a usar a Tabela D.

    • 3
  2. CalZ
    2017-10-13T08:32:10+08:002017-10-13T08:32:10+08:00

    Tanto no ETL quanto no ELT, os dados de A terminam em B. Não, você não precisa do Hadoop para ELT. Na verdade, usar o Hadoop entre dois bancos de dados seria mais parecido com ETL.

    Talvez um diagrama ajude: insira a descrição da imagem aqui

    • 2
  3. Anthony Genovese
    2017-10-13T08:32:18+08:002017-10-13T08:32:18+08:00

    TLDR; Você está pensando demais. ETL é apenas um conceito, movendo quaisquer dados de um lugar para outro. Quer você extraia, depois carregue, depois transforme, ou extraia, transforme ou carregue, é tudo a mesma coisa.

    ETL significa Extract, Transform and Load, que é um processo usado para coletar dados de várias fontes, transformar os dados de acordo com as regras/necessidades de negócios e carregar os dados em um banco de dados de destino. A necessidade de usar ETL surge do fato de que, na computação moderna, os dados de negócios residem em vários locais e em muitos formatos incompatíveis. Por exemplo, os dados de negócios podem ser armazenados no sistema de arquivos em vários formatos (documentos do Word, PDF, planilhas, texto simples, etc), ou podem ser armazenados como arquivos de e-mail ou podem ser mantidos em vários servidores de banco de dados como MS SQL Server, Oracle e MySQL, por exemplo. Lidar com todas essas informações de negócios com eficiência é um grande desafio e o ETL desempenha um papel importante na solução desse problema.

    Extrair, transformar e carregar

    O processo ETL tem 3 etapas principais, que são Extrair, Transformar e Carregar.

    Extrair – A primeira etapa do processo de ETL é extrair os dados de várias fontes. Cada um dos sistemas de origem pode armazenar seus dados em um formato completamente diferente dos demais. As fontes geralmente são arquivos simples ou RDBMS, mas quase qualquer armazenamento de dados pode ser usado como fonte para um processo ETL.

    Transformar – Uma vez que os dados foram extraídos e convertidos no formato esperado, é hora da próxima etapa do processo de ETL, que é transformar os dados de acordo com um conjunto de regras de negócios. A transformação de dados pode incluir várias operações, incluindo, mas não se limitando a filtrar, classificar, agregar, juntar dados, limpar dados, gerar dados calculados com base em valores existentes, validar dados, etc.

    Carregar – A etapa final do ETL envolve o carregamento dos dados transformados no destino de destino, que pode ser um banco de dados ou data warehouse.

    Fonte http://www.sql-tutorial.net/ETL.asp

    • 0
  4. Evan Carroll
    2017-10-13T08:45:03+08:002017-10-13T08:45:03+08:00

    ELT, "extrair, carregar, transformar" na verdade não existe e pode ser totalmente ignorado. O artigo da wikipedia não possui citações e é mencionado apenas no site "smartdatacollective.com". É provável que seja uma punheta de marketing ou um troll inteligente.

    Mas vamos nos divertir, como seria...

    A ideia toda é tal que você não transforme a entrada antes de colocá-la na loja, ou "lago". Isso não é um novo paradigma ou merece um novo termo. Temos bancos de dados que fazem isso, ou seja, o sistema de arquivos. E não chamamos cpum script ELT.

    A ideia de que você faria isso com intenção também é bastante estranha. É apenas uma tentativa de dignificar a má prática. Dado um banco de dados inode, xmlblob_Lake, eu pensaria que todo administrador de banco de dados estabelecido se encolheria em resposta e não pensaria "uau, uso legal do ELT".

    • -1
  5. Vaibhav
    2019-10-03T13:39:42+08:002019-10-03T13:39:42+08:00

    Há muitas maneiras de pensar em ter um sistema ELT e também tratar o Hadoop como um projeto ELT.

    1. Armazéns de dados com altíssima qualidade de chaves em todos os bancos de dados de aplicativos.
    2. Tipos de transformações que podem ser de centenas de maneiras, dependendo de como o usuário quer ver as informações. Os usuários acessam os dados com base em uma lista predefinida de transformações (por exemplo, em um relatório de Planejamento e Análise Financeira, podemos ter Cálculos no acumulado do ano, YTD-1, YTD-2, YTD-3, QTD, QTD-1, QTD-2, QTD3, mês até a data..... 100s de tais cálculos são usados ​​pelos analistas)

    Uma implementação do Hadoop geralmente obtém dados de várias fontes de dados. E ter uma camada de extração de dados como Pig ou Hive realizando as transformações é bastante semelhante a um design ELT.

    Quanto à diferenciação entre ETL e ELT, é baseada no escopo do projeto.

    • -2

relate perguntas

  • Duplicando algumas linhas de um fluxo de dados no SSIS

  • Script ActiveX lançando erro de tempo de execução dentro do pacote DTS

  • SQL 2008: erro de trabalho do agente ao abrir arquivos Excel usando o pacote DTS

  • Algum código aberto / ETL gratuito por aí? [fechado]

  • Como posso usar um ETL?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve