我的目标是将包含数学的文档(https://galileo.phys.virginia.edu/classes/252/lorentztrans.html)转换为格式正确的公式的word文档。
为什么只有 Microsoft Word 你问?我正在从这个讲义中自学物理。我在 onenote 中记下了所有笔记(在我的 Ipad 上,使用 ipencil 手写方程式和手绘图表)。问题是,OneNote 与 Microsoft Word 具有相同的方程系统。如果将其转换为 Word,则将其转换为 OneNote。
我已经通过谷歌搜索尝试了所有的可能性。我尝试了以下方法但没有成功。
方法一:复制粘贴 MathML 到 MS Word 中。它适用于一些简单的方程式,我在其他地方找到了。但奇怪的是,它不适用于该网站上的任何方程式。我认为这个网站的 MathML 有一些奇怪的地方。
方法 2:使用 pandoc 从 HTML 转换为 docx。我保存了此页面的 html(仅)。然后用了pandoc -s input.html -o output.docx
。它跳过了所有的方程式。
方法 3:直接复制粘贴到 MS Word 和 Apache OpenOffice Write 中。
我不介意先转换成中间格式,然后再转换成 Word。
注意:我正在寻找一种自动解决方案,因为我需要为数百页执行此操作。作者以这种格式写了各种讲义。
文档中的数学标签如下所示:
XML 命名空间以独立于协议的 URI 的形式给出,即它以 . 开头
//
。这是不正确的,它必须使用http:
协议,如下所示:http://www.w3.org/1998/Math/MathML
.Pandoc 也对此感到困惑,因为它不是有效的 MathML,因此不能将其识别为方程。
http:
如果添加前缀,它会很好地工作。因此,解决方案是在输入的 HTML 文档中进行搜索和替换,修复 xmlns 属性,然后将修复的结果传递给 pandoc。