是否有一个工具(命令行很好)可以将重音字符转换为 Ubuntu 中的 HTML 实体?最好是递归的并且不转换 html/php 标签。
e.g.
from: é
to: é
or: é
是否有一个工具(命令行很好)可以将重音字符转换为 Ubuntu 中的 HTML 实体?最好是递归的并且不转换 html/php 标签。
e.g.
from: é
to: é
or: é
Recode 可以转换为 HTML 实体:
在 recode 中有一些稍微不同的 HTML 转换;见
info recode HTML
。如果要重新编码文件或某些文件,可以使用
对于递归操作,请使用
find
命令,例如上面的 find 命令只会显示文件。请确保您只找到了正确的文件,而不是任何二进制文件,也没有在不需要的目录中找到任何文件。备份或使用文件的副本而不是真实文件也是一个好主意。如果您找到了正确的 find 命令,请 append
-exec your_command {} +
,其中 your_command 是recode ..html
上面的命令,而{}
表示 find 给出的要重新编码的文件:但是请稍等,有一个重要的警告:
recode ..html
假设您的输入文件与您在命令行上使用的字符集(编码)相同。如果您的所有文件都使用“现代”UTF-8,它会正常工作,因为 Ubuntu 使用标准中的 UTF-8。但是,如果您的某些文件使用较旧的 ISO-8859-1 或其他字符集,则会复杂得多。可能是sed。教程在这里
http://www.grymoire.com/Unix/Sed.html#uh-6
对于你的例子,也许命令
(如果我错了,请修复我,有一段时间没看到 sed 了)
图形用户界面
可能默认安装的gedit,ctrl+H
查看http://www.text-symbols.com/tools/escape-chars/的来源
拿那个 javascript,在可以做一些 IO (node.js) 的 js 环境中执行它,然后使用它
find -exec
来查找所有要转换的文件,并在所有必要的文件上执行基于节点的转换器。受 Denwerko 关于 sed 使用的建议的启发,我编写了一个文档齐全且易于阅读的开源 bash 脚本,该脚本可以转换 HTML 实体中的重音字母。你可以在这里找到它:http ://www.lugato.co.uk/silvio_dwl.html 享受吧!;)
在某些情况下,您想为重音字符(à、è、ì、ò、ù、...)生成实体,但又想保留 HTML 代码(因此不要省略“<”和“>”并避免转义已经转义在这些情况下,您可以使用以下代码: $string = str_replace(array("<", ">"), array("<", ">"), htmlentities($string, ENT_NOQUOTES, 'UTF-8 ', FALSE)); 此代码兼容 PHP >= 5.2.3
(来源)