这似乎是一个“页码块”,在 .docx 格式的 ISO 规范(ISO/IEC 29500-1 基础和标记语言参考)中描述如下:
17.3.3.22 pgNum (Page Number Block)
This element specifies the presence of a page number block at the current location in the run content. A page
number block is a non-editable region of text which shall display the current page using ascending decimal
numbers. [Note: The page number block is a legacy construct used for compatibility with older word processors,
and should not be produced unless it was consumed while reading a document – it is recommended that the
PAGENUM field is used in its place. end note]
A page number block shall be displayed using ascending decimal numbers, regardless of the languages specified
in the parent run’s lang property (§17.3.2.20).
[Example: Consider a WordprocessingML run with the following run content:
<w:r>
<w:t xml:space="preserve">This is the current page: </w:t>
<w:pgNum />
</w:r>
This run specifies that a page number block must be placed after the text string literal This is the current
page: in the document. Assuming that this content is on the first page, this run would be displayed as follows:
This is the current page: 1
(以这些字符之一和您的第一个“eumot”开头的“运行”的 Word Open XML 代码是
<w:r><w:pgNum/></w:r><w:r><w:t>eumot</w:t></w:r>
)
我不知道源文本中的什么构造会导致这种情况,但如果您需要知道,并且它是 HTML 源,那么查看底层 HTML 代码应该相当容易。
这似乎是一个“页码块”,在 .docx 格式的 ISO 规范(ISO/IEC 29500-1 基础和标记语言参考)中描述如下:
(以这些字符之一和您的第一个“eumot”开头的“运行”的 Word Open XML 代码是
)
我不知道源文本中的什么构造会导致这种情况,但如果您需要知道,并且它是 HTML 源,那么查看底层 HTML 代码应该相当容易。
如果您只需要摆脱它们,选择角色并使用 Edit->Replace 将它们替换为(无)似乎确实会删除其中的一些,但不是全部。编辑:如果您使用 VBA 和 AscW(Selection) 查找这些字符的字符代码,则为 0。所以我尝试使用高级查找/替换,而不使用通配符,以
^0
(无)查找和替换。这似乎确实有效。[[由于这一发现,您可能不需要使用我在下面建议的那种东西:
您也许可以这样做,但是当我尝试这样做时,我看到一条消息,提示某些自定义内容控件将无法保存,因此这可能行不通。
可以从 .docx 中提取 XML 文档,删除所有 pgNum 元素,然后将其放回原处,但我现在没有时间描述该过程或找到有用的链接。
<:pgNum/>
什么都不替换