AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 688760
Accepted
Dmitry Grigoryev
Dmitry Grigoryev
Asked: 2022-02-01 12:22:14 +0800 CST2022-02-01 12:22:14 +0800 CST 2022-02-01 12:22:14 +0800 CST

如何查找给定字符编码的语言环境名称?

  • 772

的手册页setlocale似乎说语言代码和字符编码名称足以设置适当的语言环境:

语言环境名称通常采用语言[_territory][.codeset][@modifier] 形式,其中语言是 ISO 639 语言代码,地区是 ISO 3166 国家代码,代码集是字符集或编码标识符,如 ISO- 8859-1 或 UTF-8。

但是,一个快速测试表明,只有语言环境名称的“修饰符”部分是可选的:

void tryLocale(const char * locid)
{
    char * result = std::setlocale(LC_CTYPE, locid);
    std::cout << locid << " = " << (result ? result : "fail") << std::endl;
}

int main()
{
    tryLocale("de");           // de = fail
    tryLocale("de_DE");        // de_DE = fail
    tryLocale("de_DE.CP1252"); // de_DE.CP1252 = de_DE.CP1252
    tryLocale("de.CP1252");    // de.CP1252 = fail
    tryLocale(".CP1252");      // .CP1252 = fail
}

我的问题是我只知道所需的编码名称(例如ISO-8859-1),我可能会想出语言代码(例如en)。我不知道如何找到一个合适的国家名称(例如US),而且我对一个国家也不感兴趣:我只希望tolower我的应用程序中的功能使用正确的代码页。

character-encoding locale
  • 1 1 个回答
  • 185 Views

1 个回答

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2022-02-01T12:38:30+08:002022-02-01T12:38:30+08:00

    我认为您将不得不遍历它们。在zsh:

    for l (${(f)"$(locale -a)"}) 
      [[ $(LC_ALL=$l locale charmap) = ISO-8859-1 ]] && print -r -- $l
    

    或者在模块中使用其$langinfo特殊的关联数组zsh/langinfo:

    zmodload zsh/langinfo
    for LC_ALL (${(f)"$(locale -a)"})
      [[ $langinfo[CODESET] = ISO-8859-1 ]] && print -r -- $LC_ALL
    

    将列出所有使用 ISO-8859-1 作为charmap 的可用语言环境。

    但请注意,LC_CTYPE指定charmap / codeset 的类别还包括字符分类:什么是小写字母,什么是标点符号等以及音译(如 所使用的tolower()),两者都可能因地区/国家而异下一个即使使用相同的代码集。

    例如,看看 GNU 土耳其语语言环境中的小写字母如何I,ı无论使用什么字符映射(UTF-8、ISO-8859-9...),而i大多数其他语言环境也使用 UTF-8。

    您可以查看语言环境源定义,例如:

    (cd /usr/share/i18n/locales && pcregrep -Me '(?ms)^LC_CTYPE.*?^END' -- *)
    

    在 GNU 系统上查看该LC_CTYPE类别跨区域设置的差异。您不会在其中找到charmap,这些文件和charmaps 组合的区域设置是使用生成的localedef -i thosefiles -f charmap,尽管只有一些组合有意义,请参阅/usr/share/i18n/SUPPORTED列表。

    例如,en_GB您系统上的语言环境可能是使用 生成的,localedef -i locales/en_GB -f charmaps/ISO-8859-1.gz而en_GB.UTF-8使用localedef -i locales/en_GB -f charmaps/UTF-8.gz.

    因此,在这里,也许您需要找到一个ISO-8859-1用作charmap 的语言环境,但还需要具有在英国大陆对英国英语或在意大利/德国等讲德语的人有意义的音译规则和字符分类,例如满足:

    [[ $(locale language)  = 'British English' &&
       $(locale territory) = 'United Kingdom' &&
       $(locale charmap)   = ISO-8859-1 ]]
    

    这应该会稍微缩小选择范围。

    请注意,languageandterritory是非标准的 GNU 扩展,这就解释了为什么你不会在 zsh 中找到它们$langinfo。GNU libc 文档 ( info libc langinfo) 仅提及:

    文件“langinfo.h”定义了更多的符号,但没有一个是官方的。使用它们是不可移植的,并且返回值的格式可能会改变。因此,我们建议(原文如此)您不要使用它们。

    /usr/include/langinfo.h在我的系统上有:

      _NL_IDENTIFICATION_LANGUAGE,
      _NL_IDENTIFICATION_TERRITORY,
    

    另请参阅locale -k LC_IDENTIFICATION,locale -k LC_CTYPE以获得 GNU 系统上给定语言环境类别支持的关键字列表(locale -kc LC_ALL过去可以使用,但现在显然不再使用)。

    • 5

相关问题

  • RHEL 升级到 7.3 后命令输出中出现奇怪的字符

  • 如何翻译 Unicode 字符?[复制]

  • 变音符号的问题(无法输入终端+无法打开文件)

  • 如何让`less`理解代码页?

  • Arch Linux:设置语言环境失败。修复你的系统

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve