AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 135
Accepted
Spredzy
Spredzy
Asked: 2011-01-05 00:30:15 +0800 CST2011-01-05 00:30:15 +0800 CST 2011-01-05 00:30:15 +0800 CST

Como posso usar um ETL?

  • 772

Eu sei que essas letras significam Extrair, Transformar e Carregar.

Mas, quando o usei no início, pensei que durante a fase Transform eu poderia fazer muitas junções diferentes nos dados que extraí de fontes de dados, mais tarde percebi que fazer uma junção em um ETL diferente não é tão útil .

  • Então, o que fazemos na fase Transform?
  • Calcule e emita o resultado ?
  • Transformação de string?
  • As fontes de dados de entrada devem ser apenas csv, xml ou arquivo simples?
  • Se as junções não forem tão úteis, devemos fazer apenas a transformação de alto nível dentro de um ETL?

obrigada

etl
  • 3 3 respostas
  • 1448 Views

3 respostas

  • Voted
  1. Best Answer
    Brian Ballsun-Stanton
    2011-01-05T00:57:22+08:002011-01-05T00:57:22+08:00

    Extract Transform and Load é a preparação de dados estrangeiros para serem inseridos em seu banco de dados ou data warehouse

    Observando os fundamentos do ETL, o designer de data warehouse Bill Inmon observa :

    Era uma vez, em um passado não tão distante, que não havia software ETL (extrair, transformar e carregar). Se você quisesse construir um data warehouse, teria que escrever código para obter dados de uma fonte para o destino apropriado. Havia muito código – muito código repetitivo.

    Depois de escrever seu código, você tinha que mantê-lo. Toda vez que um sistema legado mudava, você fazia manutenção manual em seu código. Cada vez que uma definição de destino mudava, você tinha que fazer manutenção manual em seu código. Toda vez que um usuário final queria algo novo, você tinha que fazer manutenção em seu código.

    A partir daqui, uma infinidade de produtos ETL proliferou, como Inmon descreve em sua breve história de produtos ETL . Eles eram populares porque eram ferramentas de software projetadas para extrair dados de sistemas em mudança , transformá-los de acordo com regras específicas e carregá-los em data warehouses. Esse processo de software significava que os humanos estavam envolvidos apenas no elemento crítico do loop: desvendar erros de dados carregados. Ao automatizar ao máximo possível, o processo ETL forneceu às empresas uma maneira perfeita de não apenas carregar seus bancos de dados atuais em um data warehouse, mas também a capacidade de carregar conjuntos de dados futuros dos mesmos bancos de dados, para que o data warehouse possa fornecer continuamente resultados futuros.

    Para responder especificamente à sua pergunta, diferentes bancos de dados fornecem diferentes extratos. As transformações são aplicadas para normalizar os dados. A normalização é tanto no sentido específico do banco de dados, alterando os padrões dos dados para corresponder ao data warehouse receptor, quanto no sentido humano, garantindo que os mesmos dados em sistemas diferentes pareçam iguais para o sistema de entrada.

    As fontes de dados podem ser qualquer coisa para a qual você possa codificar uma transformação, já que a finalidade da transformação é aplicar regras aos dados recebidos de forma que se ajustem ao seu modelo de dados. A junção de conjuntos de dados diferentes só deve ser realizada se necessário. Confie em seu banco de dados de destinatários para sincronizar os resultados.

    • 11
  2. Bob Blackburn
    2011-01-05T10:54:43+08:002011-01-05T10:54:43+08:00

    Aqui estão alguns usos:

    • Limpeza de dados (as datas do sistema antigo não possuem data e hora e você deve validar os campos de data inteira.
    • Verifique se há órfãos
    • normalizar dados (pegamos 17 tabelas de empréstimo e produzimos 5)
    • Mesclar dados de vários sistemas de origem
    • Criar tabelas agregadas
    • 4
  3. Joe
    2011-01-05T11:53:03+08:002011-01-05T11:53:03+08:00

    Além do que foi mencionado, uma grande parte da minha "Transformação" é feita fazendo a conversão de unidades, já que a maioria dos meus bancos de dados rastreia dados científicos provenientes de diferentes fontes. Então, quando eu "normalizo" os dados, é o que nosso campo chama de "harmonização de dados" (colocar coisas em escalas/quadros de referência semelhantes para que possam ser comparados diretamente), não necessariamente "normalização de banco de dados", embora eu possa ter que fazer alguns extras massageando para obter os dados organizados em torno de diferentes conceitos para caber em nosso sistema.

    Meus problemas comuns são:

    • tempo : adicionar/subtrair devido a épocas diferentes, possivelmente tendo que lidar com segundos bissextos (por exemplo, postgres sempre assume que 31 de dezembro é o mesmo número de segundos, então eu teria que subtrair alguns segundos para exibir o tempo com precisão)
    • faixas espectrais : nanômetros x Ångstrom, comprimento de onda x frequência x elétron-volts
    • sistemas de coordenadas : (este realmente é péssimo, pois o que está parado em um quadro de referência pode estar se movendo em outro)
    • 2

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como você mostra o SQL em execução em um banco de dados Oracle?

    • 2 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

    • 6 respostas
  • Marko Smith

    Como uso currval() no PostgreSQL para obter o último id inserido?

    • 10 respostas
  • Marko Smith

    Como executar o psql no Mac OS X?

    • 11 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Marko Smith

    Passando parâmetros de array para um procedimento armazenado

    • 12 respostas
  • Martin Hope
    Manuel Leduc Restrição exclusiva de várias colunas do PostgreSQL e valores NULL 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler Quando uma chave primária deve ser declarada sem cluster? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - Qual é melhor como chave primária? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick Como posso otimizar um mysqldump de um banco de dados grande? 2011-01-04 13:13:48 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve