我在记事本++中有一些我以前从未见过的条目。我在许多行上突出显示了正方形SGCI
SSA
PU1
PU2
MW
,SPA
如果在此处复制/粘贴,则所有的正方形都将转换为/成为 ``
我正在寻找一种从条目中删除这些的方法。谷歌表示它们是“控制字符”,但我无法尝试手动删除它们。
尝试过[\x00-\x09\x0B-\x0C\x0E-\x1F]
,但显然它没有/不包括有问题的角色。
这是一些行的示例,以防我的原始帖子不够清楚。
这是文件本身。
我在记事本++中有一些我以前从未见过的条目。我在许多行上突出显示了正方形SGCI
SSA
PU1
PU2
MW
,SPA
如果在此处复制/粘贴,则所有的正方形都将转换为/成为 ``
我正在寻找一种从条目中删除这些的方法。谷歌表示它们是“控制字符”,但我无法尝试手动删除它们。
尝试过[\x00-\x09\x0B-\x0C\x0E-\x1F]
,但显然它没有/不包括有问题的角色。
这是一些行的示例,以防我的原始帖子不够清楚。
这是文件本身。
所有这些字符都是 UTF8
[\x{0080}-\x{0099}]
或[\x00-\x09\x0B-\x0C\x0E-\x1F]
LEAVE EMPTY
或任何你想要的解释:
您可以调整范围以完全满足您的需求。
截图(之前):
我从您的示例文件中提取了一些行。
截图(之后):
在这里,我用作
XXX
替换来查看替换完成的位置。可能启用了“显示所有字符”和/或“显示空白和制表符”。通过查看 -> 显示符号禁用它们,然后选择它们。
SGCI
或'Single Graphic Character Introducer' (U+0099) 和PU2
' Private Use Two' (U+0092) 是 'Latin-1-supplement' 块的一部分,它来自[\x80-\xFF]
. 在这里您可以看到此块中的所有字符。因此,要删除两者
SGCI
,PU2
您需要找到:无所取代。
[\x00-\x09\x0B-\x0C\x0E-\x1F]
LEAVE EMPTY
解释:
截图(之前):
截图(之后):