建立clamcour的问题

Question

user176105

Asked: 2018-11-22 07:57:16 +0800 CST2018-11-22 07:57:16 +0800 CST 2018-11-22 07:57:16 +0800 CST

文本文件打不开

772

扫描方式

sudo date >> clam &&
    clamscan -r  -i --detect-pua --remove /home >> clam &&
    date >> clam

返回未打开的文件

错误信息：

Could not open the file /home/alaa/clam.
pluma has not been able to detect the character encoding.
Please check that you are not trying to open a binary file.
Select a character encoding from the menu and try again.

输出uname -a：

4.15.0-39-generic #42~16.04.1-Ubuntu SMP Wed Oct 24 17:05:15 UTC 2018 i686 athlon i686 GNU/Linux

文本文件

1 个回答

Voted

wjandrea · Answer 1 · 2018-11-22T11:41:24+08:00

第 542 行有一堆空字节。我不知道为什么，但我可以告诉你我是如何发现它以及如何解决它的。

首先，我从您的链接下载了文件，然后运行file clam，它说clam: data，这意味着它包含不应出现在 UTF-8 文本文件中的字节/字符，否则会显示UTF-8 Unicode text.

然后我写了这个管道来查找非打印字符：

< clam python3 -c 'import sys; [print(repr(line.rstrip("\n"))) for line in sys.stdin]' |
    grep -n '\\'

输出（其中\x00表示空字节）：

542:'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00ن يول  2 11:58:51 EET 2018'

说明：

< clamclam-通过标准输入读取。
python3- Python 3 原生支持 Unicode，因此它是一个很好的工具。
[... for line in sys.stdin]- 遍历标准输入的每一行。
print(repr(line.rstrip("\n")))- 打印每一行的表示，不包括尾随换行符。非打印字符将由反斜杠序列表示。
grep -n '\\'- 打印包含反斜杠和行号的行。

请注意，这是一种快速而肮脏的方法。

要修复它，只需删除空字节。tr对此很方便：

tr -d '\0' < clam > clam.txt

然后用 . 确认输出文件是否良好file clam.txt。它说clam.txt: UTF-8 Unicode text，所以是的，这很好。

文本文件打不开

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

文本文件打不开

1 个回答

相关问题

建立clamcour的问题

如何查看上次 Clamscan 扫描的结果？

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？