AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / user-1926

Tony's questions

Martin Hope
Tony
Asked: 2015-10-22 06:04:40 +0800 CST

Componente SSIS Merge executando um UNION em vez de mesclar

  • 1

Eu tenho um pacote para combinar dados de vários bancos de dados. Estou tentando reunir dois conjuntos de dados para que possam ser gravados em uma única tabela.

Há um comum SSIS_ID (DT_I4)usado para corresponder linhas e as outras colunas que desejo trazer para o mesmo conjunto de dados também são DT_I4.

Aqui está a seção do fluxo onde está o problema; como você pode ver, os dados de ambos os caminhos são classificados SSIS_IDantes de entrar no Merge:

fluxo de dados SSIS

E aqui está a configuração do componente Merge. A intenção é colocar o CRO_CompanyIDe Sponsor_CompanyIDpara o mesmo SSIS_IDem uma única linha:

Mesclar configuração

No entanto, a saída da mesclagem está agindo como um UNION; há 1.532 linhas entrando pela esquerda e 4.303 pela direita, resultando em 5.835 linhas na saída.

Um visualizador de dados na saída mostra o problema:

insira a descrição da imagem aqui

Posso contornar esse problema processando os dados de uma maneira diferente, mas estou realmente me incomodando por não conseguir fazer isso funcionar.

Alguma sugestão sobre o que fiz de errado ou não fiz para poder combinar os dados dessa maneira?

Estou usando o SSIS para SQL Server 2008, mas não havia uma tag para essa versão.

sql-server sql-server-2008
  • 1 respostas
  • 436 Views
Martin Hope
Tony
Asked: 2011-06-14 07:02:11 +0800 CST

Existem ferramentas para realizar a comparação de dados entre dois esquemas diferentes?

  • 11

Estamos migrando nosso banco de dados para um novo esquema, mas queremos validar se os dados foram movidos corretamente.

As ferramentas tradicionais de comparação de dados podem comparar dois bancos de dados em busca de diferenças se os esquemas forem os mesmos. No nosso caso, houve alterações nos designs das tabelas, mas todos os dados do esquema antigo estão no novo, apenas foram movidos um pouco e preciso ter certeza de que estão corretos. Temos dezenas de milhões de linhas, portanto a inspeção manual não é uma opção.

Existem ferramentas que possam auxiliar nesse tipo de comparação?

Caso contrário, existem bibliotecas/frameworks que possam ajudar a iniciar o desenvolvimento de uma solução personalizada?

Fico feliz em usar uma solução específica de banco de dados, se necessário, neste caso para o SQL Server 2008.

Minha solução: estou comparando os dois conjuntos de dados criando um VIEWde cada tabela no banco de dados antigo com os mesmos campos da nova tabela do banco de dados.

Em seguida, comparo os dados usando a técnica descrita aqui: A maneira mais curta, rápida e fácil de comparar duas tabelas no SQL Server: UNION !

Tive sorte nessa migração, pois a estrutura geral da tabela é semelhante ao banco de dados antigo, com campos movidos de uma tabela para outra, descartados ou adicionados. No caso dos descartados e adicionados não há o que comparar, para os campos que foram movidos ou agregados eu faço cálculos na view para fornecer as informações corretas para comparação.

A UNIONcomparação me mostra apenas as linhas com diferenças, portanto, assim que os dados estiverem corretos, obtenho um conjunto de resultados vazio.

sql-server sql-server-2008
  • 4 respostas
  • 8767 Views
Martin Hope
Tony
Asked: 2011-06-08 01:28:39 +0800 CST

Duplicando algumas linhas de um fluxo de dados no SSIS

  • 7

Eu tenho um fluxo de dados para migrar dados de um banco de dados antigo para um novo. O design antigo tinha todos os dados e informações históricas (alterações) armazenados em uma única tabela com uma "versão" (inteiro incrementado) na linha.

O novo design tem duas tabelas, uma para o estado "atual" dos dados e uma tabela de auditoria (ou histórico) que registra as alterações usando um gatilho. Portanto, existe apenas uma linha para os dados "atuais" e há muitas linhas de histórico.

Em meu pacote SSIS, estou usando os seguintes componentes para copiar os dados atuais para uma tabela, mas enviar todos os dados para a tabela de auditoria.

fluxo de dados SSIS

O Multicast é usado para dividir o fluxo de dados e a Divisão Condicional identifica a linha "atual" e a envia para a tabela Order (a tabela não é realmente chamada Order , antes que alguém comente sobre o uso de uma palavra reservada para um nome de tabela).

Criei este fluxo porque não consegui ver uma maneira de usar o Conditional Split para enviar todos os dados para o destino Audit e apenas a linha atual para o outro.

Presumo que criar todos os dados duplicados e, em seguida, descartá-los em um destino de lixo não seja muito eficiente e, como tenho cerca de 52 milhões de linhas para migrar, estou preocupado que a transformação demore dias.

Existe uma maneira melhor (mais eficiente) de obter a divisão de dados?

Nota sobre os dados: apliquei um row_number()aos dados que me permitem identificar a linha "atual" como número 1, todas as linhas, incluindo "atual", precisam ir para o destino da tabela de auditoria.

EDIT: Encontrei uma alternativa para a divisão multicast e condicional sugerida por esta postagem no blog do SSIS Junkie: várias saídas de uma transformação de script síncrona

Ele usa um componente de script para enviar dados para uma ou mais saídas. Estou tentando esse método para ver se é mais rápido, mas depois de ver a resposta e a sugestão de Kenneth sobre a remoção do destino da lixeira, não tenho certeza se será.

sql-server-2008 etl
  • 1 respostas
  • 6857 Views

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve