我注意到术语“插入符号”特指该符号的反向变体,即向上指向。
奇怪的是,搜索插入符号并没有轻易揭示有关其倒置形式的任何信息;我遇到的最接近的东西是vel,但这似乎无关。
有谁知道这个符号的正确白话名称是什么?
如何根据 OpenType 功能的 Unicode 标准正确书写任意分数frac
?
我的用例是:我在文本文档(UTF-8)中写入数据,并有自己编写的程序从该文件创建 html 标记。
不同的来源给出了不同的指示。分子和分母应该怎么写?使用普通数字还是上标和下标?分子和分母的分离应该用分数斜线(U+2044)来写,不是吗?
解释性编辑:我主要想知道如何根据 Unicode 标准在纯文本文件中编写分数。没有额外的标记。有了正确的分数,我可以测试哪种字体支持 html 中的这些。即使我不确定 css 字体设置如何影响此主题OpenType_fonts_guide。链接的示例仅使用数字和 Solidus,但启用了特定的 OpenType 功能。
这是我最近遇到过几次的问题。这是我最近的经历:
尝试浏览https://www.scape.sc/release.php?id=48,该页面包含日语文本。这个页面的日文完全是乱码,显示为unicode方形字符、符号和各种拉丁重音字符。即使在html源代码中也是如此,所以我不认为这是字体选择的问题。
该网站使用我从webhint.io 文章中了解到的一种声明字符集的过时方法,<META Http-equiv="Content-Type" Content="text/html; charset=utf8">
. 尽管文章确实提到这在当今不应该成为问题。
这是我在浏览器中访问原始 html 时的样子:
<TR><TD>2.</TD><TD>記憶ã¨ç©º</TD><TD> <I>(kioku to sora)</I></TD></TR>
过去,我发现在互联网档案馆的 Wayback Machine 上搜索存在此问题的旧版本网站会正确显示日文字符。我目前的情况也是如此。
在 Wayback Machine 的以下两个示例中,第一个链接来自 2016 年的捕获,页面源和呈现的页面都使用有效/未损坏的日语字符。第二个是 2023 年的,显示的乱码与我在自己的机器上看到的一样,这让我更有信心这不是我的问题。
2016 年的原始 html:
<tr><td>2.</td><td>記憶と空</td><td> <i>(kioku to sora)</i></td></tr>
2023 年的原始 html:
<tr><td>2.</td><td>記憶ã¨ç©º</td><td> <i>(kioku to sora)</i></td></tr>
我怀疑这是网站管理员的错误,可能是 2016 年至今的某个时候在文本编辑器中对网站进行更改时出现了一些字符集不匹配。这听起来合理吗?有什么方法可以恢复“损坏的”unicode 并避免依赖 Wayback Machine 上旧的站点捕获吗?
TL;DR:网站曾经包含有效的 unicode,现在不再包含。怎么会出现这样的问题呢?最终用户能否反转/使问题文本清晰?
我拥有 Unicode 域κλαρα-σωλις.ευ
,应该将其转换为xn----ylba7abgd9bnh0e.xn--qxa6a
,但许多服务将 URL 转换为xn----ylba7abgd9buc7d.xn--qxa6a
.
网站喜欢https://www.punycoder.com/
并https://dencode.com/string
返回错误的 A-Label 版本。
这导致 GMail 和 Outlook 出现问题,因为它们无法解析我的域,并且我无法将电子邮件发送到我的邮件服务器。
有人知道这种错误转换的根本原因吗?是否有图书馆做错了?还是他们使用过时的标准?
UNICODE 为一个字符使用 2 个字节,因此它有大或小的字节序差异。例如,字符哈是54 C8
十六进制的。因此,它的 UTF-8 是:
11100101 10010011 10001000
UTF-8 使用 3 个字节来表示相同的字符,但它没有大端或小端。为什么?
我有一组混合了希伯来语和英语的纯文本文件。这些文件是从 90 年代末到 2000 年代初,显然是用 NisusWriter 编写的。
当我打开文本文件时,英文行会正确呈现,但希伯来语行会像这样混乱 mojibake:
Â∆˙ŸÙœÏ∆À˙À̆††ÂŸ‰À÷Õ·†††‡Œ˙†††‰ÀÚ⁄·«„À‰††††
我写了一个循环来运行 iconv 它支持的每种编码,但没有一个输出是固定的
在前 3 行运行 hexdump -C(一个是英文,一个是混杂的希伯来语,一个是拉丁字符的音译)给出以下结果。看起来混乱的希伯来语写成 just 。字符
00000010 50 2e 20 31 31 30 20 20 2d 20 41 56 4f 44 41 48 |P. 110 - AVODAH|
00000020 0d 0d 20 f8 d9 f6 cd e4 a0 ac a0 a0 a0 e9 d9 e9 |.. .............|
00000030 cb a0 a0 a0 e0 db ec dd e4 cd d8 e9 f0 e5 c6 a0 |................|
00000040 ac a0 a0 a0 e1 c6 d9 f2 cc ee c6 d9 ea cb a0 a0 |................|
00000050 a0 e9 cf f9 dd d9 f8 cb e0 cd ec a0 ac 0d 0d 52 |...............R|
00000060 65 2d 74 7a 65 68 d5 2c 20 20 20 20 41 64 6f 6e |e-tzeh., Adon|
00000070 61 69 20 20 20 20 20 20 45 2d 6c 6f 2d 68 65 69 |ai E-lo-hei|
00000080 d5 2d 6e 75 20 2c 20 20 20 20 20 20 20 62 65 2d |.-nu , be-|
00000090 61 6d 2d 63 68 61 d5 20 20 20 20 20 20 20 20 79 |am-cha. y|
000000a0 69 73 2d 72 61 2d 65 6c d5 20 0d 62 65 20 70 6c |is-ra-el. .be pl|
000000b0 65 61 73 65 64 2c 20 20 20 20 41 64 6f 6e 61 69 |eased, Adonai|