AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 289665
Accepted
rubengavidia0x
rubengavidia0x
Asked: 2021-04-13 01:56:53 +0800 CST2021-04-13 01:56:53 +0800 CST 2021-04-13 01:56:53 +0800 CST

SELECT DISTINCT em dados de espaço extra de uma única coluna (sem duplicatas)

  • 772

Olá estou tendo problemas com os dados desta coluna

cities
Charlotte
Cincinnati
Cleves
Columbus
Fairfield
Fresno
Los  Angeles -- HERE IS THE PROBLEM
Los Angeles
Madison
Manhatttan  Beach
New York
Orange
Palo Alto
Phoenix
Sacramento
San Francisco
Takoma  Park -- maybe this city must have problems also
Tarrytown
Valencia
Washington

Como posso filtrar esse valor, qual é a maneira mais fácil com o trim? eu fiz minha pesquisa, mas encontro instruções sql longas que não entendo se isso puder ajudar é um erro simples.

Esta é a consulta:

-- 3. Write a query that will list all the cities that have customers with a heading of Cities. Only
-- list each city once (no duplicates) and sort in descending alphabetical order.

select distinct customer_city as cities
FROM customers
ORDER BY customer_city ASC

-- left Los  Angeles
sql-server duplication
  • 2 2 respostas
  • 767 Views

2 respostas

  • Voted
  1. Best Answer
    HandyD
    2021-04-14T19:29:25+08:002021-04-14T19:29:25+08:00

    Como Erik disse nos comentários, você deve corrigir dados ruins em vez de tentar consultá-los, mas se você absolutamente não puder corrigir os dados, a consulta abaixo obterá a lista distinta de cidades substituindo espaços duplos por um único espaço:

    SELECT DISTINCT REPLACE(customer_city, '  ', ' ') as cities
    FROM customers
    ORDER BY customer_city ASC
    

    Este é um exemplo realmente básico, no entanto, se os dados de entrada não estiverem sendo validados, esse pode não ser o único tipo de espaço em branco que você está encontrando causando duplicação.

    Antes do SQL 2017, você precisa encadear várias instruções REPLACE para substituir vários caracteres. Por exemplo, este código substitui espaços duplos e caracteres de tabulação por um único espaço:

    SELECT DISTINCT REPLACE(REPLACE(customer_city, '  ', ' '), CHAR(9), ' ') as cities
    FROM customers
    ORDER BY customer_city ASC
    

    Em 2017, você pode usar a função TRANSLATE para trocar todos os caracteres que está procurando por um único caractere e substituir esse caractere por nada para garantir que encontre todas as duplicatas exatas:

    SELECT DISTINCT REPLACE(TRANSLATE(customer_city, CHAR(9) + CHAR(10) + CHAR(13) + CHAR(32), '####'), '#', '') as cities
    FROM customers
    ORDER BY customer_city ASC
    

    Isso significa que você não precisa repetir REPLACE para cada caractere que deseja remover, basta adicionar o código do caractere ( + CHAR(?) ) à função TRANSLATE e adicionar outro caractere de substituição (#). Como você pode ver, o exemplo TRANSLATE substitui 4 caracteres por basicamente a mesma quantidade de código que a substituição de dois caracteres nas versões anteriores.

    • 1
  2. David Spillett
    2021-04-15T03:06:31+08:002021-04-15T03:06:31+08:00

    Como já foi dito, corrigir os dados é a melhor maneira de lidar com situações como essa, se possível. Você pode consertá-lo no local ou se, por algum motivo, precisar manter os valores errados (talvez eles correspondam aos valores em outro sistema ao qual o seu está fracamente acoplado, que se tornou dependente desses valores), talvez mantendo um coluna de sombra com dados normalizados como sugere Akina.

    Se você estiver lidando com uma grande quantidade de dados, aplicar uma função em DISTINCTpode ser uma má ideia, porque a operação distinta implica uma classificação que, para um número significativo de linhas, pode resultar em um caro spool para o disco. Se você tiver um índice apropriado no customer_cityplanejador de consulta, poderá usá-lo para remover a necessidade de classificar. Você pode minimizar o efeito disso executando a função no resultado do DISTINCTe depois fazendo novamente:

      SELECT DISTINCT 
             FunctionToNormaliseCity(customer_city)
        FROM (SELECT DISTINCT customer_city FROM customers) AS subq
    ORDER BY FunctionToNormaliseCity(customer_city)
    

    Observe também a classificação pelos mesmos valores (o resultado da função) para tentar evitar uma classificação extra após executar a DISTINCTclassificação e o filtro. Obviamente, para pequenas quantidades de dados, isso é um exagero e, em vez disso, você deve manter a consulta mais simples para tornar o código mais fácil de entender.

    • 1

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve