RHEL 升级到 7.3 后命令输出中出现奇怪的字符

Question

Dmitry Grigoryev

Asked: 2022-02-01 12:22:14 +0800 CST2022-02-01 12:22:14 +0800 CST 2022-02-01 12:22:14 +0800 CST

如何查找给定字符编码的语言环境名称？

772

的手册页setlocale似乎说语言代码和字符编码名称足以设置适当的语言环境：

语言环境名称通常采用语言[_territory][.codeset][@modifier] 形式，其中语言是 ISO 639 语言代码，地区是 ISO 3166 国家代码，代码集是字符集或编码标识符，如 ISO- 8859-1 或 UTF-8。

但是，一个快速测试表明，只有语言环境名称的“修饰符”部分是可选的：

void tryLocale(const char * locid)
{
    char * result = std::setlocale(LC_CTYPE, locid);
    std::cout << locid << " = " << (result ? result : "fail") << std::endl;
}

int main()
{
    tryLocale("de");           // de = fail
    tryLocale("de_DE");        // de_DE = fail
    tryLocale("de_DE.CP1252"); // de_DE.CP1252 = de_DE.CP1252
    tryLocale("de.CP1252");    // de.CP1252 = fail
    tryLocale(".CP1252");      // .CP1252 = fail
}

我的问题是我只知道所需的编码名称（例如ISO-8859-1），我可能会想出语言代码（例如en）。我不知道如何找到一个合适的国家名称（例如US），而且我对一个国家也不感兴趣：我只希望tolower我的应用程序中的功能使用正确的代码页。

1 个回答

Voted

Stéphane Chazelas · Answer 1 · 2022-02-01T12:38:30+08:00

我认为您将不得不遍历它们。在zsh：

for l (${(f)"$(locale -a)"}) 
  [[ $(LC_ALL=$l locale charmap) = ISO-8859-1 ]] && print -r -- $l

或者在模块中使用其$langinfo特殊的关联数组zsh/langinfo：

zmodload zsh/langinfo
for LC_ALL (${(f)"$(locale -a)"})
  [[ $langinfo[CODESET] = ISO-8859-1 ]] && print -r -- $LC_ALL

将列出所有使用 ISO-8859-1 作为charmap 的可用语言环境。

但请注意，LC_CTYPE指定charmap / codeset 的类别还包括字符分类：什么是小写字母，什么是标点符号等以及音译（如所使用的tolower()），两者都可能因地区/国家而异下一个即使使用相同的代码集。

例如，看看 GNU 土耳其语语言环境中的小写字母如何I，ı无论使用什么字符映射（UTF-8、ISO-8859-9...），而i大多数其他语言环境也使用 UTF-8。

您可以查看语言环境源定义，例如：

(cd /usr/share/i18n/locales && pcregrep -Me '(?ms)^LC_CTYPE.*?^END' -- *)

在 GNU 系统上查看该LC_CTYPE类别跨区域设置的差异。您不会在其中找到charmap，这些文件和charmaps 组合的区域设置是使用生成的localedef -i thosefiles -f charmap，尽管只有一些组合有意义，请参阅/usr/share/i18n/SUPPORTED列表。

例如，en_GB您系统上的语言环境可能是使用生成的，localedef -i locales/en_GB -f charmaps/ISO-8859-1.gz而en_GB.UTF-8使用localedef -i locales/en_GB -f charmaps/UTF-8.gz.

因此，在这里，也许您需要找到一个ISO-8859-1用作charmap 的语言环境，但还需要具有在英国大陆对英国英语或在意大利/德国等讲德语的人有意义的音译规则和字符分类，例如满足：

[[ $(locale language)  = 'British English' &&
   $(locale territory) = 'United Kingdom' &&
   $(locale charmap)   = ISO-8859-1 ]]

这应该会稍微缩小选择范围。

请注意，languageandterritory是非标准的 GNU 扩展，这就解释了为什么你不会在 zsh 中找到它们$langinfo。GNU libc 文档 ( info libc langinfo) 仅提及：

文件“langinfo.h”定义了更多的符号，但没有一个是官方的。使用它们是不可移植的，并且返回值的格式可能会改变。因此，我们建议（原文如此）您不要使用它们。

/usr/include/langinfo.h在我的系统上有：

  _NL_IDENTIFICATION_LANGUAGE,
  _NL_IDENTIFICATION_TERRITORY,

另请参阅locale -k LC_IDENTIFICATION，locale -k LC_CTYPE以获得 GNU 系统上给定语言环境类别支持的关键字列表（locale -kc LC_ALL过去可以使用，但现在显然不再使用）。

如何查找给定字符编码的语言环境名称？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何查找给定字符编码的语言环境名称？

1 个回答

相关问题