Melhores práticas para conectar bancos de dados que estão em diferentes regiões geográficas

Question

GShenanigan

Asked: 2011-01-20 09:05:49 +0800 CST2011-01-20 09:05:49 +0800 CST 2011-01-20 09:05:49 +0800 CST

Remova o campo da chave composta e reúna os dados duplicados

772

Estou procurando a melhor maneira de alterar a chave primária em uma tabela no meu banco de dados sem ter que reinserir completamente os dados dos arquivos novamente. A modificação que farei removerá parte da chave primária, o que resultará em dezenas de milhares de linhas que precisam ser agrupadas.

A parte da chave que está sendo removida é um campo de data, que originalmente era necessário para ajudar a identificar exclusivamente os dados recebidos. No entanto, a maneira como esse campo é atribuído na fonte (fora do meu controle) mudou desde então e agora queremos manter apenas a ocorrência mais antiga de um registro específico e descartar as ocorrências posteriores.

O restante dos campos na chave (4 FK's) produzirá registros exclusivos.

Presumo que vou precisar transferir os dados para outra tabela, fazer a alteração e depois inserir novamente? Ou há um modo melhor?

3 respostas

Voted

jcolebrand · Answer 1 · 2011-01-20T09:21:55+08:00

Best Answer

jcolebrand

2011-01-20T09:21:55+08:002011-01-20T09:21:55+08:00

Se os quatro registros ditarem um único e você quiser o primeiro por data, então por que não inserir em outra tabela, truncar e inserir de volta assim que terminar a reconfiguração da tabela (ou criar uma nova tabela com as colunas corretas, inserir em, então renomear depois de descartar?) Não acho que isso possa ser melhorado, a menos que você queira excluir de onde não é igual a, mas a inserção deve ser mais rápida (precisa ser testada para ter certeza)

5

Eric Humphrey - lotsahelp · Answer 2 · 2011-01-20T10:35:10+08:00

Eric Humphrey - lotsahelp

2011-01-20T10:35:10+08:002011-01-20T10:35:10+08:00

--Drop existing Primary Key
ALTER TABLE [<table>] DROP CONSTRAINT [<pk_constraint>];
GO

--Delete all rows except the first for each <Id>, ordered by <MyDateCol>
WITH delCTE AS (
  SELECT <Id>, ROW_NUMBER() OVER(PARTITION BY Id ORDER BY <MyDateCol>) AS RowNum
  FROM dbo.<Table>
)
DELETE a
FROM <table> a
JOIN delCTE b
  ON b.<Id> = a.<Id>
WHERE b.RowNum > 1;
GO

--Create the new Primary Key
ALTER TABLE [<table>] ADD CONSTRAINT [<pk_constraint>] PRIMARY KEY (<cols>);
GO

3

Marian · Answer 3 · 2011-01-20T10:44:30+08:00

Marian

2011-01-20T10:44:30+08:002011-01-20T10:44:30+08:00

Você pode copiar os dados da sua tabela para um arquivo usando BCP (cópia em massa), truncar a tabela, remover o PK antigo, criar um novo PK (apenas 4 colunas), importar dados do arquivo bcp usando um script (como o script de Eric) que ignora o duplicatas.

Para muitas linhas, nada pode superar a cópia em massa :).

3

Remova o campo da chave composta e reúna os dados duplicados

Como você mysqldump tabela (s) específica (s)?

Como você mostra o SQL em execução em um banco de dados Oracle?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Posso ver Consultas Históricas executadas em um banco de dados SQL Server?

Como uso currval() no PostgreSQL para obter o último id inserido?

Como executar o psql no Mac OS X?

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Passando parâmetros de array para um procedimento armazenado

Remova o campo da chave composta e reúna os dados duplicados

3 respostas

relate perguntas