我正在使用pandoc
将 LaTeX 文档转换为 Word 格式。源文档包含需要保存在输出中的各种交叉引用。但是,当使用交叉引用过滤器时pandoc
抱怨它没有安装:
$ pandoc main.tex --filter pandoc-crossref -o main.docx
Error running filter pandoc-crossref:
Could not find executable pandoc-crossref
安装了一个带有 Python 过滤器绑定的包:
$ dpkg -l | grep pandoc
ii pandoc 2.5-3build2 amd64 general markup converter
ii pandoc-data 2.5-3build2 all general markup converter - data files
ii python3-pandocfilters 1.4.2-2 all python3 bindings for Pandoc's filters
所以我假设过滤器包含在通用pandoc
包中。可能是缺少交叉引用过滤器。
但是没有其他可用的过滤器包:
$ aptitude search pandoc | grep filter
p pandoc-plantuml-filter - Pandoc filter: converts PlantUML code blocks to PlantUML images
i A python3-pandocfilters - python3 bindings for Pandoc's filters
$ aptitude search pandoc | grep cross
$
这个过滤器是不是根本没有打包,需要手动安装?或者还有其他在 Ubuntu 上使用它的方法吗?
此过滤器未打包为标准 Ubuntu 软件包。
它在https://github.com/jgm/pandoc/wiki/Pandoc-Filters上有所提及,因此您可以从https://github.com/lierdakil/pandoc-crossref手动下载并安装它。
为了获得可重现的结果,您必须使用以下命令获得最新的
pandoc
和预编译的二进制文件:pandoc-crossref
请注意,这
man pandoc-crossref
将起作用。然后
pandoc main.tex --filter pandoc-crossref -o main.docx
按照您的计划进行测试。但为了获得更高效的结果,我建议开始使用bookdown(RMarkdown Markdown 扩展),它会以简化的形式为您完成所有工作。在这里可以统一Rmd输入格式和多种输出格式,包括TeX、PDF、ePub、HTML、docx、odt等。检查https://github.com/rstudio/bookdown-demo存储库作为起点。
无法从 PPA 或任何其他打包资源中获取此过滤器。因此,最安全的选择是在系统中编译过滤器,正如 N0rbert 建议的那样。但是,过滤器存储库中的编译说明不适用于 Ubuntu。这些说明期望系统拥有最先进的软件,而在 Ubuntu 提供的打包软件生态系统中通常不是这种情况。以下是让它在我的系统上运行的说明。
要编译
pandoc-crossref
,您必须安装haskell-stack
编译过滤器的工具链。这是第一个棘手的问题。Universe 提供的
haskell-stack
软件包非常旧,可以追溯到 2018 年,这意味着它实际上无能为力。幸运的是,程序可以自行更新,运行以下命令:现在可以克隆源代码。但是,必须获得正确的版本,最近的版本编译失败。这是因为
pandoc
Universe 中的包也很旧,从 2019 年开始,因此必须签出匹配的版本:最后可以编译过滤器:
这将安装已编译的过滤器
${HOME}/.local/bin
,在我的情况下就可以了。这个方法是在这个线程中找到的。