删除文件名后缀最小的文件

Question

cheersmate

Asked: 2020-02-14 01:30:37 +0800 CST2020-02-14 01:30:37 +0800 CST 2020-02-14 01:30:37 +0800 CST

file 命令如何区分文本和 LaTeX 文件？

772

我有许多.ipynb文本文件（Jupyter notebooks）。所有这些都包含一些 LaTeX 标记。但是当我运行时file，我得到：

$ file nb_*          
nb_1.ipynb:      ASCII text
nb_2.ipynb:      ASCII text
nb_3.ipynb:      ASCII text, with very long lines
nb_4.ipynb:      LaTeX document, ASCII text, with very long lines
nb_5.ipynb:      text, with very long lines

如何file区分这些？我希望所有文件都具有相同的类型。

（为什么文件应该具有相同的类型？我正在将它们上传到在线系统进行共享。系统以某种方式对它们进行分类并以不同方式对待它们，我不可能改变这一点。我怀疑平台使用file或可能在内部使用libmagic和想解决这个问题。）

2 个回答

Voted

phg · Answer 1 · 2020-02-14T02:02:06+08:00

Best Answer

phg

2020-02-14T02:02:06+08:002020-02-14T02:02:06+08:00

文件类型识别由所谓的魔术模式驱动。用于分析 TeX系列源代码的魔法文件包含许多宏名称，这些名称会导致文件被归类为LaTeX。每场比赛都分配了一个强度，例如 15 in case of\begin和 18 for \chapter。这使得启发式算法更能抵抗误报，例如对 Plain TeX 或 ConTeXt 文档的错误分类，这些文档恰好用这些名称定义了自己的宏。

28

cheersmate · Answer 2 · 2020-02-14T01:39:45+08:00

cheersmate

2020-02-14T01:39:45+08:002020-02-14T01:39:45+08:00

我发现了一个似乎file将文件分类为 LaTeX 的字符串：

$ cat text
a
b
$ cat latex
a
\begin
b
$ file text latex
text:  ASCII text
latex: LaTeX document, ASCII text

所以至少我可以通过向当前分类为文本的文件添加一些环境来强制所有文件具有相同的类型。

2

file 命令如何区分文本和 LaTeX 文件？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

file 命令如何区分文本和 LaTeX 文件？

2 个回答

相关问题