AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / coding / 问题

问题[ms-word](coding)

Martin Hope
Kishieel
Asked: 2025-04-07 17:50:09 +0800 CST

如何在 DOCX 文件中存储隐藏的持久元数据,使其在编辑后依然有效

  • 6

我正在寻找一种方法,将机器可读的元数据添加到我生成的 DOCX 报告中。目标是允许用户修改文档的样式,然后将其重新上传到系统,同时保留元数据。

第一次尝试时,我天真地尝试将元数据存储在评论中,但我注意到一些编辑器,特别是 Microsoft Word,在修改后会删除我的评论并生成没有它们的 DOCX 文件。

我也尝试了结构化文档标签,但 Google Docs 和 Microsoft Word 都会在样式修改后删除它们。

最后,我尝试使用自定义 XML,但 Google Docs 和 Microsoft Word 都删除了我添加的属性和标签。

我搜索了很多,但还是没找到有效的解决方案。有人遇到过类似的问题吗?可以分享一些建议吗?

PS1

由于即使是小型 DOCX 文件中也包含太多行,因此我创建了一个极简的 repo,以便更好地展示我迄今为止的尝试。每次尝试都放在一个单独的目录中。每个目录包含:

  • Document.docx — 使用一些隐藏元数据手动创建的基础文件。
  • ModifiedWithGoogle.docx 和 ModifiedWithWord.docx — 在 Google Docs 或 Microsoft Word 中编辑文档后的结果。
  • 解压每个 .docx 文件的内容,以便更轻松地检查内部 XML。

仓库:https://github.com/kishieel/docx-metadata

第一次尝试时,我使用注释添加了元数据。这在 Google Docs 上效果很好,即使使用剪切粘贴移动文本,注释也能保留。然而,Microsoft Word 删除了所有注释。也许 Word 需要一种不同的注释创建方式?

示例输入:

<!-- 1_comments/Document/word/document.xml -->
<w:document ...>
  <w:body>
    <w:p>
      <w:commentRangeStart w:id="0" />
      <w:r>
        <w:t xml:space="preserve">Lorem ipsum dolor sit amet, consectetur adipiscing elit. Mauris quis mollis tellus. Aenean at maximus nunc.</w:t>
      </w:r>
      <w:commentRangeEnd w:id="0" />
    </w:p>
  </w:body>
</w:document>
<!-- 1_comments/Document/word/comments.xml -->
<w:comments ...>
  <w:comment w:id="0" w:date="2025-04-07T09:10:21.783Z">
    <w:p>
      <w:r>
        <w:t xml:space="preserve">Some metadata #1</w:t>
      </w:r>
    </w:p>
  </w:comment>
</w:comments>

在第二种方法中,我尝试使用 SDT。在这种情况下,Microsoft Word 保留了它们(尽管它将每个句子拆分成了单独的单词,这可能是默认行为,也可能是出了什么问题)。Google Docs 将它们从修改后的文件中完全删除了。

示例输入:

<!-- 2_structured_document_tags/Document/word/document.xml -->
<w:document ...>
  <w:body>
    <w:p>
      <w:sdt>
        <w:sdtPr>
          <w:tag w:val="Some metadata #1" />
          <w:alias w:val="Some alias #1" />
        </w:sdtPr>
        <w:sdtContent>
          <w:r>
            <w:t xml:space="preserve">Lorem ipsum dolor sit amet, consectetur adipiscing elit. Mauris quis mollis tellus. Aenean at maximus nunc.</w:t>
          </w:r>
        </w:sdtContent>
      </w:sdt>
    </w:p>
  </w:body>
</w:document>

准备好后我将提供自定义 XML 示例。

ms-word
  • 1 个回答
  • 57 Views
Martin Hope
Anubix
Asked: 2024-10-24 01:44:35 +0800 CST

如何在不使用 VBA 的情况下将文本转换为超链接?

  • 5

我们有一个带有下拉列表的模板。最终用户从列表中选择,然后应将超链接插入文档主体(在光标处)。问题是,超链接以纯文本形式出现。最终用户必须单击超链接的末尾并按下空格键。只有这样,自动更正才会启动并将文本转换为真正的超链接。

在 Word 中我可以做些什么来查找/替换纯文本或将其转换为超链接?

我不被允许使用 VBA。

ms-word
  • 1 个回答
  • 18 Views
Martin Hope
Iofacture
Asked: 2023-08-23 00:21:30 +0800 CST

MS Word 显示两组不同的内置目录

  • 5

我正在重写我们的产品文档,并且遇到了内置目录模板的问题。到目前为止,我们所有的文档的内置函数都是这样的:

典型目录

然而,在这个特定的文档中,我看到了这个,但我无法拥有它:

目录异常

这是相同的 Word 版本,并且两个文档保存为相同的文件类型。

ms-word
  • 1 个回答
  • 12 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    重新格式化数字,在固定位置插入分隔符

    • 6 个回答
  • Marko Smith

    为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会?

    • 2 个回答
  • Marko Smith

    VScode 自动卸载扩展的问题(Material 主题)

    • 2 个回答
  • Marko Smith

    Vue 3:创建时出错“预期标识符但发现‘导入’”[重复]

    • 1 个回答
  • Marko Smith

    具有指定基础类型但没有枚举器的“枚举类”的用途是什么?

    • 1 个回答
  • Marko Smith

    如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误?

    • 6 个回答
  • Marko Smith

    `(表达式,左值) = 右值` 在 C 或 C++ 中是有效的赋值吗?为什么有些编译器会接受/拒绝它?

    • 3 个回答
  • Marko Smith

    在 C++ 中,一个不执行任何操作的空程序需要 204KB 的堆,但在 C 中则不需要

    • 1 个回答
  • Marko Smith

    PowerBI 目前与 BigQuery 不兼容:Simba 驱动程序与 Windows 更新有关

    • 2 个回答
  • Marko Smith

    AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String”

    • 1 个回答
  • Martin Hope
    Fantastic Mr Fox msvc std::vector 实现中仅不接受可复制类型 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant 使用 chrono 查找下一个工作日 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor 构造函数的成员初始化程序可以包含另一个成员的初始化吗? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský 为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul C++20 是否进行了更改,允许从已知绑定数组“type(&)[N]”转换为未知绑定数组“type(&)[]”? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann 为什么 {2,3,10} 和 {x,3,10} (x=2) 的顺序不同? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller 在 5.2 版中,bash 条件语句中的 [[ .. ]] 中的分号现在是可选的吗? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench 为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng 为什么 `dict(id=1, **{'id': 2})` 有时会引发 `KeyError: 'id'` 而不是 TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String” 2024-03-20 03:12:31 +0800 CST

热门标签

python javascript c++ c# java typescript sql reactjs html

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve