Backups de banco de dados no Oracle - Exportar o banco de dados ou usar outras ferramentas?

Question

Asked: 2023-12-11 18:51:58 +0800 CST2023-12-11 18:51:58 +0800 CST 2023-12-11 18:51:58 +0800 CST

Instrução Oracle inserindo dados duplicados

772

Estou usando esta instrução para inserir registros de outra tabela:

SQL> insert into city(city_code, country_code, city)
select distinct(city_code), country_code, city_name
from airport_final;

  2    3  
9012 rows created.

Encontrei muitos registros duplicados:

SQL> SELECT city_code, COUNT(city_code)
FROM airport_final
GROUP BY city_code
HAVING COUNT(city_code) > 1;

VRA        2
WBU        3
YMQ        4
YPR        2

330 rows selected.

Não sei se estou selecionando registros distintos, mas por que está inserindo duplicatas

Atenciosamente

1 respostas

Voted

Paul W · Answer 1 · 2023-12-11T22:53:56+08:00

DISTINCTopera em toda a linha (todas as colunas listadas), não em uma coluna, portanto não pode ser usado para obter exclusividade em apenas uma coluna.

Você precisa GROUP BYda chave que pretende ser única e usar algum tipo de função de agregação nos outros atributos:

insert into city(city_code, country_code, city)
select city_code, 
       MAX(country_code), 
       MAX(city_name)
from airport_final
group by city_code

Algo semelhante pode ser feito com funções de janelas, como ROW_NUMBERas quais você garante que todos os atributos não-chave sejam obtidos da mesma linha, seguindo qualquer lógica de prioridade que você deseja implementar na ORDER BYcláusula:

insert into city(city_code, country_code, city)
select city_code,
       country_code,
       city_name
  from (select city_code, 
               country_code, 
               city_name,
               ROW_NUMBER() OVER (PARTITION BY city_code ORDER BY city_name) seq
        from airport_final)
  where seq = 1

Na realidade, você provavelmente tem dados sujos com divergências sobre o nome da cidade e/ou país que cada código de cidade representa. Você se deparará com o problema de decidir qual associação é correta e qual não. No exemplo acima, peguei apenas o nome da cidade com classificação alfabética mais baixa, mas a lógica apropriada pode ser bem diferente. Isso dependerá de você e de seus dados. Mas você tem que fazer algo para escolher entre as diferentes associações se quiser uma tabela digitada por código de cidade. Você pode achar impossível fazer isso com o código e, em vez disso, ter que colocá-lo no Excel e remover manualmente as entradas incorretas, limpando-o usando a inteligência humana. Embora isso seja lamentável, é uma lição aprendida sobre o que acontece quando as regras de normalização não são seguidas.

Instrução Oracle inserindo dados duplicados

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Instrução Oracle inserindo dados duplicados

1 respostas

relate perguntas