我正在重读 Joel Spolsky 的经典博客文章绝对最低限度每个软件开发人员绝对、肯定地必须了解 Unicode 和字符集(没有借口!)并注意到这段话:
最终,这个免费的 OEM 被编入了 ANSI 标准 (强调我的)。在 ANSI 标准中,每个人都同意如何处理低于 128 的字符,这与 ASCII 几乎相同,但是有很多不同的方法来处理 128 及以上的字符,具体取决于您居住的地方。这些不同的系统称为代码页。
这篇文章指的是哪个 ANSI 标准?可以肯定的是,美国国家标准协会已经发布了许多标准(毕竟,这就是他们实际所做的),但我一直无法弄清楚是哪一个。
我对这可能暗示的最接近的猜测是,这实际上是在谈论 ISO-8859,也许该文件在被采纳为国际标准之前就开始作为美国标准使用;但这在标准化“代码页”和“OEM”字符集的上下文中没有意义。
维基百科的代码页文章提到了一个 IBM 标准,并指出 IANA 维护着代码页映射的注册表,但显然,它们都不是 ANSI。
我的理解是 ANSI 没有对任何现代 8 位字符集进行标准化,并且“ANSI”在这种情况下通常指的是微软现在已经废弃的混淆术语(其中“ANSI”当时显然是指当前的选定的代码页)。
有没有我忽略的标准?还是 Joel 的博客上只是(喘息)一个错误?