AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1509306
Accepted
hippietrail
hippietrail
Asked: 2019-12-12 10:15:50 +0800 CST2019-12-12 10:15:50 +0800 CST 2019-12-12 10:15:50 +0800 CST

每个 XML 文件/流/等必须以“<”字符开头,还是 BOM 后跟“<”字符?

  • 772

我正在做一些文件类型检测,并希望更稳健地处理 XML 检测。

我添加了对可选的初始 Unicode BOM(字节顺序标记)的支持,后跟<8 位或 UTF-16 编码的字符。

(这只是一个初始测试。如果此测试通过,那么我会继续尝试将其解析为 XML,但除非它看起来像 XML,否则我不会这样做,因为它更占用资源。)

我查看了 XML 标准,但行话变得很认真,我不确定我是否正确遵循了所有语法规则,尤其是对于 XML 更深奥的特性。我没有在标准中看到任何关于它可以以什么字符开头的具体内容。

特别是,我不确定 XML 文件或流以空格开头是否合法<

xml file-format
  • 1 1 个回答
  • 18 Views

1 个回答

  • Voted
  1. Best Answer
    Michael Kay
    2019-12-12T11:53:52+08:002019-12-12T11:53:52+08:00

    文档实体必须始终以“<”开头,但如果没有 XML 声明,则可以在其前面加上空格。

    外部解析实体不需要初始“<”。外部解析的实体通常不会自行解析,只有在从文档实体中的实体引用直接或间接引用时才会解析。

    规范实际上并没有那么复杂。

    [1]     document       ::=      prolog element Misc*
    
    [22]    prolog     ::=      XMLDecl? Misc* (doctypedecl Misc*)?
    [23]    XMLDecl    ::=      '<?xml' VersionInfo EncodingDecl? SDDecl? S? '?>'
    
    [27]    Misc       ::=      Comment | PI | S
    
    [3]     S      ::=      (#x20 | #x9 | #xD | #xA)+
    

    很清楚,如果 XMLDecl 不存在,则文档可以以 Misc 开头,其中包括空格选项。但是,XMLDecl, doctypedecl, element, Comment, 和PI都以“ <”开头。

    • 1

相关问题

  • 如何获取当前用户的 ftype

  • xml中的html链接错误

  • 为什么不同的十六进制编辑器为文件显示不同的二进制文件?

  • 是否有任何图片文件格式嵌入作者、标题等?

  • XML 模式资源管理器不工作

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    Windows 10 服务称为 AarSvc_70f961。它是什么,我该如何禁用它?

    • 2 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Marko Smith

    ssl.SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED] 证书验证失败:无法获取本地颁发者证书 (_ssl.c:1056)

    • 4 个回答
  • Marko Smith

    我如何知道 Windows 安装在哪个驱动器上?

    • 6 个回答
  • Martin Hope
    Albin 支持结束后如何激活 WindowsXP? 2019-11-18 03:50:17 +0800 CST
  • Martin Hope
    fixer1234 “HTTPS Everywhere”仍然相关吗? 2019-10-27 18:06:25 +0800 CST
  • Martin Hope
    Kagaratsch Windows 10 删除大量小文件的速度非常慢。有什么办法可以加快速度吗? 2019-09-23 06:05:43 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    Inter Sys Ctrl+C 和 Ctrl+V 是如何工作的? 2019-05-15 02:51:21 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve