AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 115364
Accepted
orokusaki
orokusaki
Asked: 2015-09-18 06:55:48 +0800 CST2015-09-18 06:55:48 +0800 CST 2015-09-18 06:55:48 +0800 CST

Por que o Postgres ORDER BY parece ignorar parcialmente os sublinhados iniciais?

  • 772

Eu tenho uma animaltabela com um name varchar(255), e adicionei linhas com os seguintes valores:

Piranha
__Starts With 2
Rhino
Starts With 1
0_Zebra
_Starts With 1
Antelope
_Starts With 1

Quando executo esta consulta:

zoology=# SELECT name FROM animal ORDER BY name;
      name       
-----------------
0_Zebra
Antelope
Piranha
Rhino
_Starts With 1
_Starts With 1
Starts With 1
__Starts With 2
(8 rows)

Observe como as linhas são classificadas em uma ordem que implica que a entrelinha _é usada para colocar as _Starts With 1linhas antes da Startslinha, mas o __no __Starts With 2parece ignorar esse fato, como se o 2no final fosse mais importante do que os dois primeiros caracteres.

Por que é isso?

Se eu classificar com Python, o resultado é:

In  [2]: for animal in sorted(animals):
   ....:     print animal
   ....:     
0_Zebra
Antelope
Piranha
Rhino
Starts With 1
_Starts With 1
_Starts With 1
__Starts With 2

Além disso, a ordem do Python sugere que os sublinhados vêm depois das letras, o que indica que a classificação do Postgres das duas primeiras _Startslinhas antes da Startslinha está incorreta.

Nota: estou usando o Postgres 9.1.15

Aqui estão minhas tentativas de encontrar o agrupamento:

zoology=# select datname, datcollate from pg_database;
  datname  | datcollate  
-----------+-------------
 template0 | en_US.UTF-8
 postgres  | en_US.UTF-8
 template1 | en_US.UTF-8
 zoology   | en_US.UTF-8
(4 rows)

E:

zoology=# select table_schema, 
    table_name, 
    column_name,
    collation_name
from information_schema.columns
where collation_name is not null
order by table_schema,
    table_name,
    ordinal_position;
 table_schema | table_name | column_name | collation_name 
--------------+------------+-------------+----------------
(0 rows)
postgresql postgresql-9.1
  • 2 2 respostas
  • 5423 Views

2 respostas

  • Voted
  1. Best Answer
    dezso
    2015-09-18T07:28:47+08:002015-09-18T07:28:47+08:00

    Como você não definiu um agrupamento diferente para sua coluna em questão, ele usa o de todo o banco de dados, que é en_US.UTF8- exatamente como na minha caixa de teste. Eu observo exatamente o mesmo comportamento, tome isso como um consolo :)

    O que vemos é aparentemente um caso de elementos de collation variáveis . Dependendo do personagem e do agrupamento, vários comportamentos diferentes são possíveis. Aqui o sublinhado (e o hífen e alguns outros também) são usados ​​apenas para desempatar - 'a' e '_a' são equivalentes na primeira rodada, então o empate entre eles é resolvido levando-se em consideração o sublinhado.

    Se você deseja classificar ignorando os sublinhados (e hífens, pontos de interrogação e exclamação no meu exemplo), pode definir uma ordem em uma expressão:

    SELECT * 
    FROM (VALUES ('a'), 
                 ('b1'), 
                 ('_a'), 
                 ('-a'), 
                 ('?a'), 
                 ('!a1'), 
                 ('a2')
         ) t (val) 
    ORDER BY translate(val, '_-?!', '');
    

    Em meus experimentos, adicionar um novo valor à lista geralmente altera a ordem entre itens iguais, mostrando que eles são tratados de maneira realmente igual.

    • 6
  2. maxschlepzig
    2019-07-07T04:23:55+08:002019-07-07T04:23:55+08:00

    A função de classificação do Python compara strings elementarmente por seus números de ponto de código Unicode - sem considerar as regras de agrupamento definidas na localidade atual (que está ativa em seu ambiente).

    Observe que os números de ponto de código Unicode dos caracteres ASCII são iguais aos números de código ASCII . E em ASCII os caracteres A-Zsão ordenados antes de _qual é ordenado antes a-z; enquanto os dígitos 0-9são ordenados antes A-Z.

    IOW, ao lidar com strings ASCII , a ordem das strings do Python é igual à ordenação lexicográfica byte-wise.

    Você obtém a mesma ordem no Postgres especificando as regras de agrupamento de localidade C com uma cláusula de agrupamento como esta:

    SELECT name FROM animal ORDER BY name COLLATE "C";
    

    Observe que as regras de agrupamento de outras localidades podem ser pouco intuitivas e complicadas, por exemplo, porque podem compactar vários caracteres como parte da comparação.

    • 1

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve