希望有人给出答案。已经断断续续地工作了一周。
目标:将旧的在线博客(为所有者)转换为 10 个 Word 文档,总计 3200 页。每个博客的每个部分都有 5 种格式中的一种(标题、日期、类型、摘要、内容)。文档中的每个部分都将具有与之关联的相同样式,因此只能通过样式表对其进行调整(即更改每个标题的字体大小)。
到目前为止,我的方法是:我已经抓取了每个博客页面,并将每个页面的每个部分都保存在数据库中。我的想法是从数据库中导出所有文本,并<SPAN class="...">...</SPAN>
添加到每个部分并保存为文本文件。然后将文本文件导入Word。
我几乎成功了。Word 导入样式,将它们添加到样式库并导入应用新样式的文本。问题是添加到图库的样式仅是CARACTER样式类型。所以我可以改变字体,但不能改变段落。无行距、无段距、无居中等。
无论我怎么尝试,都无法让Word使其成为PARAGRAPH样式类型,这正是我所需要的。除了 SPAN,我还尝试了几种不同的标签。我尝试text-align: center
在类中添加 a 以强制 Word 将其视为段落样式,但它只是被忽略了。我也尝试在导入之前在 Word 中定义新样式,但是文本只是导入而没有任何样式。
有人能帮忙吗?如果您想自己尝试导入,请将下面的示例代码保存到文本文件中,然后在 Word 中:Insert - Object - Text from File。谢谢!
编辑:由于一些示例内容,我可以看到标签<LI class ="...>
作为段落样式类型导入。所以我知道 Word 有能力做到这一点。
<!DOCTYPE html>
<html>
<head>
<style>
.articleTitle{
font-family: Georgia;
font-size: 16pt;
text-align: center;
}
</style>
</head>
<body>
<span class="articleTitle">A few of my favorite fruits</span><p/>
</body>
</html>
创建 Word 文档中的 styles.xml 后如何修改它?如果您更改为 zip,然后提取 styles.xml,您可以将样式的属性更改为 w:type="paragraph"。我用一个空白的 Word 文档做了一个快速测试,创建了一个字符样式,然后修改了 xml,重新打开了文档,它是一个段落样式,然后我可以修改它。显然,只需使用 Word 文档的副本进行试验,看看会发生什么。