AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 167566
Accepted
Suncatcher
Suncatcher
Asked: 2017-03-20 09:21:11 +0800 CST2017-03-20 09:21:11 +0800 CST 2017-03-20 09:21:11 +0800 CST

Consultando linhas não ASCII do Postgres

  • 772

A [:ascii:]classe funciona no Postgres? Ele não está listado em sua ajuda , no entanto, vejo exemplos na web que o utilizam.

Eu tenho um banco de dados UTF-8, onde collation e c_typ e são en_US.UTF-8, e a versão do Postgres é 9.6.2. Quando procuro linhas não ASCII como esta:

select title from wallabag_entry where title ~ '[^[:ascii:]]';

Recebo símbolos Unicode e não Unicode (saída completa está aqui ) :

Сталинская правозащитница: мать Меленкова бабушка Настя
Дневник НКВДиста Шабалина: Знает ли Москва положение на фронте?
Бег по городу и поездка на осле: как в средневековье наказывали прелюбодеев
Как комиссар Крекшин в 1740-е чуть не отменил историю России
Have you heard of Saint Death? Don’t pray to her.
Архаїчна українська мова: перевага чи недолік?
Гренада не их
China’s marriage rate is plummeting because women are choosing autonomy over 

O que há de errado com esta consulta?

postgresql utf-8
  • 1 1 respostas
  • 20300 Views

1 respostas

  • Voted
  1. Best Answer
    joanolo
    2017-03-20T10:30:57+08:002017-03-20T10:30:57+08:00

    Respondendo sua pergunta: [:ascii:]funciona. Você pode ter alguns caracteres em seu texto que não reconhece como não ASCII , mas eles estão lá. Eles podem ser algo como um espaço inquebrável , por exemplo, ou qualquer outro caractere de espaço Unicode .

    Não é estranho ter espaços inquebráveis ​​(  ) em textos que você copia e cola de uma página da web, mas você não percebe que eles estão lá.

    Aqui está um exemplo para mostrar:

    WITH t(t) AS
    (
        VALUES 
          ( 'Сталинская правозащитница: мать Меленкова бабушка Настя' ),
          ( 'Дневник НКВДиста Шабалина: Знает ли Москва положение на фронте?' ),
          ( 'Бег по городу и поездка на осле: как в средневековье наказывали прелюбодеев' ),
          ( 'Как комиссар Крекшин в 1740-е чуть не отменил историю России' ),
          ( 'Have you heard of Saint Death? Don’t pray to her.' ),
          ( 'Архаїчна українська мова: перевага чи недолік?' ),
          ( 'Гренада не их' ),
          ( 'China’s marriage rate is plummeting because women are choosing autonomy over ' )
    
    )
    SELECT 
        t,  regexp_replace(t, '([^[:ascii:]])', '[\1]', 'g') AS t_marked
    FROM 
        t 
    WHERE 
        t ~ '[^[:ascii:]]' ;
    

    Isso é o que você recebe:

                                           t                                       |                                                                                                 t_marked                                                                                                  
    -------------------------------------------------------------------------------+-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
     Сталинская правозащитница: мать Меленкова бабушка Настя                       | [С][т][а][л][и][н][с][к][а][я] [п][р][а][в][о][з][а][щ][и][т][н][и][ц][а]: [м][а][т][ь] [М][е][л][е][н][к][о][в][а] [б][а][б][у][ш][к][а] [Н][а][с][т][я]
     Дневник НКВДиста Шабалина: Знает ли Москва положение на фронте?               | [Д][н][е][в][н][и][к] [Н][К][В][Д][и][с][т][а] [Ш][а][б][а][л][и][н][а]: [З][н][а][е][т] [л][и] [М][о][с][к][в][а] [п][о][л][о][ж][е][н][и][е] [н][а] [ф][р][о][н][т][е]?
     Бег по городу и поездка на осле: как в средневековье наказывали прелюбодеев   | [Б][е][г] [п][о] [г][о][р][о][д][у] [и] [п][о][е][з][д][к][а] [н][а] [о][с][л][е]: [к][а][к] [в] [с][р][е][д][н][е][в][е][к][о][в][ь][е] [н][а][к][а][з][ы][в][а][л][и] [п][р][е][л][ю][б][о][д][е][е][в]
     Как комиссар Крекшин в 1740-е чуть не отменил историю России                  | [К][а][к] [к][о][м][и][с][с][а][р] [К][р][е][к][ш][и][н] [в] 1740-[е] [ч][у][т][ь] [н][е] [о][т][м][е][н][и][л] [и][с][т][о][р][и][ю] [Р][о][с][с][и][и]
     Have you heard of Saint Death? Don’t pray to her.                             | Have you heard of Saint Death? Don[’]t pray to her.
     Архаїчна українська мова: перевага чи недолік?                                | [А][р][х][а][ї][ч][н][а] [у][к][р][а][ї][н][с][ь][к][а] [м][о][в][а]: [п][е][р][е][в][а][г][а] [ч][и] [н][е][д][о][л][і][к]?
     Гренада не их                                                                 | [Г][р][е][н][а][д][а] [н][е] [и][х]
     China’s marriage rate is plummeting because women are choosing autonomy over  | China[’]s marriage rate is plummeting because women are choosing autonomy over 
    

    Você pode ver a partir disso, que seu problema é o caractere de apóstrofo certo . ASCII suporta apenas o apóstrofo. Apóstrofo esquerdo e apóstrofo direito são extensões Unicode tipograficamente corretas.

    dbfiddle aqui

    Você pode verificar também com versões anteriores em http://rextester.com/UKIQ48014 (PostgreSQL 9.5) e http://sqlfiddle.com/#!15/4c563/1/0 (PostgreSQL 9.3)


    Os textos que acho que você acha que são puro ASCII e não são :

     WITH t(t) AS
     (
         VALUES 
           ('A fully ASCII text!'),
           ('Have you heard of Saint Death? Don’t pray to her.'),
           ('China’s marriage rate is plummeting because women are choosing autonomy over ')
     )
     SELECT 
        regexp_replace(t, '([^[:ascii:]])', '[\1]', 'g') AS t_marked
     FROM 
        t 
     WHERE 
        t ~ '[^[:ascii:]]' ;
    
    | t_marcado |
     | :------------------------------------------------- ----------------------------- |
     | Você já ouviu falar da Santa Morte? Não ore para ela. |
     | A taxa de casamento na China está despencando porque as mulheres estão escolhendo a autonomia |
     

    dbfiddle aqui

    Esses textos estão usando ' em vez de ' para marcar apóstrofos.

    Verifique a pontuação: Por que a aspa simples correta (U+2019), e não o apóstrofo semanticamente distinto (U+0027), é o caractere de apóstrofo preferido em Unicode? ... para ver que você não é a primeira pessoa a encontrar esse problema.

    • 33

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve