AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 688760
Accepted
Dmitry Grigoryev
Dmitry Grigoryev
Asked: 2022-02-01 12:22:14 +0800 CST2022-02-01 12:22:14 +0800 CST 2022-02-01 12:22:14 +0800 CST

Como encontrar um nome de localidade para uma determinada codificação de caracteres?

  • 772

A página man para setlocaleparece dizer que o código do idioma e o nome da codificação de caracteres são suficientes para definir a localidade apropriada:

Um nome de localidade geralmente tem o formato language[_territory][.codeset][@modifier], em que language é um código de idioma ISO 639, território é um código de país ISO 3166 e codeset é um conjunto de caracteres ou identificador de codificação como ISO- 8859-1 ou UTF-8.

No entanto, um teste rápido mostra que apenas a parte "modificadora" de um nome de localidade é opcional:

void tryLocale(const char * locid)
{
    char * result = std::setlocale(LC_CTYPE, locid);
    std::cout << locid << " = " << (result ? result : "fail") << std::endl;
}

int main()
{
    tryLocale("de");           // de = fail
    tryLocale("de_DE");        // de_DE = fail
    tryLocale("de_DE.CP1252"); // de_DE.CP1252 = de_DE.CP1252
    tryLocale("de.CP1252");    // de.CP1252 = fail
    tryLocale(".CP1252");      // .CP1252 = fail
}

Meu problema é que eu só sei o nome da codificação desejada (por exemplo ISO-8859-1, ) e posso criar o código do idioma (por exemplo, en). Não tenho ideia de como encontrar um nome de país apropriado (por exemplo US, ), e não estou interessado em um país de qualquer maneira: só quero que funções como tolowerno meu aplicativo usem a página de código correta.

character-encoding locale
  • 1 1 respostas
  • 185 Views

1 respostas

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2022-02-01T12:38:30+08:002022-02-01T12:38:30+08:00

    Acho que você vai ter que passar por eles. Em zsh:

    for l (${(f)"$(locale -a)"}) 
      [[ $(LC_ALL=$l locale charmap) = ISO-8859-1 ]] && print -r -- $l
    

    Ou o mesmo usando seu $langinfoarray associativo especial no zsh/langinfomódulo:

    zmodload zsh/langinfo
    for LC_ALL (${(f)"$(locale -a)"})
      [[ $langinfo[CODESET] = ISO-8859-1 ]] && print -r -- $LC_ALL
    

    Listaria todas as localidades disponíveis que usam ISO-8859-1 como charmap.

    Mas observe que a categoria em que LC_CTYPEo charmap / codeset é especificado também abrange a classificação de caracteres: o que é uma letra minúscula, o que é pontuação etc. tolower()o próximo, mesmo se o mesmo conjunto de códigos for usado.

    Por exemplo, veja como as letras minúsculas Iestão ınas localidades turcas do GNU, independentemente de qual charmap está sendo usado (UTF-8, ISO-8859-9...), enquanto ina maioria das outras localidades que também usam UTF-8.

    Você pode dar uma olhada nas definições de origem de localidade, por exemplo com:

    (cd /usr/share/i18n/locales && pcregrep -Me '(?ms)^LC_CTYPE.*?^END' -- *)
    

    Em um sistema GNU para ver as diferenças entre localidades para a LC_CTYPEcategoria. Você não encontrará o charmap lá, as localidades para combinações desses arquivos e os charmaps são gerados usando localedef -i thosefiles -f charmap, embora apenas algumas combinações façam sentido, veja /usr/share/i18n/SUPPORTEDa lista.

    Por exemplo, a en_GBlocalidade em seu sistema pode ter sido gerada com localedef -i locales/en_GB -f charmaps/ISO-8859-1.gze en_GB.UTF-8aquela com localedef -i locales/en_GB -f charmaps/UTF-8.gz.

    Então aqui, talvez você precise encontrar uma localidade que use ISO-8859-1como charmap, mas também com regras de transliteração e classificações de caracteres que façam sentido na Grã-Bretanha continental para o inglês britânico ou para falantes de alemão na Itália / Alemanha etc, como por exemplo que satisfaçam:

    [[ $(locale language)  = 'British English' &&
       $(locale territory) = 'United Kingdom' &&
       $(locale charmap)   = ISO-8859-1 ]]
    

    O que deve restringir um pouco a escolha.

    Observe que languagee territorysão extensões GNU não padrão, o que explica por que você não as encontrará nos arquivos $langinfo. A documentação da GNU libc ( info libc langinfo) menciona apenas:

    O arquivo 'langinfo.h' define muito mais símbolos, mas nenhum deles é oficial. Usá-los não é portátil e o formato dos valores de retorno pode mudar. Portanto, recomendamos (sic) que você não os use.

    /usr/include/langinfo.hno meu sistema tem:

      _NL_IDENTIFICATION_LANGUAGE,
      _NL_IDENTIFICATION_TERRITORY,
    

    Veja também locale -k LC_IDENTIFICATION, locale -k LC_CTYPEpara a lista de palavras-chave suportadas para uma determinada categoria de localidade em sistemas GNU ( locale -kc LC_ALLcostumava funcionar, mas aparentemente não funciona mais hoje em dia).

    • 5

relate perguntas

  • caracteres estranhos na saída do comando após a atualização do RHEL para 7.3

  • Como traduzir caracteres Unicode? [duplicado]

  • Problemas com tremas (não consigo digitar no terminal + não consigo abrir arquivos)

  • Como fazer com que `less` entenda a página de código?

  • Arch Linux: Falha ao definir a localidade. Corrija seu sistema

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve