AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 703221
Accepted
quasar
quasar
Asked: 2022-05-20 18:47:23 +0800 CST2022-05-20 18:47:23 +0800 CST 2022-05-20 18:47:23 +0800 CST

POSIX shell 注释与续行

  • 772

编辑以澄清我的问题:

POSIX 说:

如果 <newline> 跟在(未加引号的)<backslash> 之后,shell 应将其解释为行继续。<backslash> 和 <newline> 应在将输入拆分为标记之前删除。

然而,dash或其他实现,首先标记化输入。结果,\<newline>不被识别而是# this is a comment \被丢弃。这种行为是否符合 POSIX?同样,POSIX 说在标记化之前应删除行继续。

下面的过程真的不符合 POSIX 吗?

  1. 阅读整个输入:"echo hello ... \<newline> ... bye"
  2. 搜索未引用\<newline>并删除它们:"echo hello ... bye"
  3. 标记化:"echo"(discard ' ')"hello"(discard ' ')(discard "# ... bye")

在带有 dash-0.5.10.2-6 sh (dash) 的 Ubuntu 上,我们得到以下信息

$ cat /var/tmp/test.sh
echo hello # this is a comment \
echo bye

$ sh /var/tmp/test.sh
hello
bye

这是因为 # 之后的所有内容都被视为注释,并且 \ 之前的所有内容都被丢弃,因此 \<newline> 的行继续不起作用。

但是,POSIX“转义字符(反斜杠)”部分指出

<backslash> 和 <newline> 应在将输入拆分为标记之前删除。

并且由于# 的注释处理是在标记化中完成的,

echo hello # this is a comment \
echo bye

应该相当于

echo hello # this is a comment echo bye

这是否意味着 sh 不符合 POSIX 标准?或者在这种情况下,评论优先于行延续是否有一些理由?

shell posix
  • 3 3 个回答
  • 501 Views

3 个回答

  • Voted
  1. Best Answer
    Kusalananda
    2022-05-20T22:00:15+08:002022-05-20T22:00:15+08:00

    如Token Recognition部分所述,shell 的输入被逐字符扫描以将其划分为令牌。

    [...] shell 应通过将下面的第一个适用规则应用于其输入中的下一个字符,将其输入分解为标记。

    引用作为令牌识别过程的一部分处理,但鉴于问题中的示例,shell 将遇到#引用的换行符之前的。

    当 shell 在扫描输入行期间到达一个未引用的注释字符时,该行的其余部分,包括最后的反斜杠,将作为注释丢弃:

    如果当前字符是 a #,则它和直到(但不包括)下一个的所有后续字符<newline>都应作为注释被丢弃。结束行的<newline>不被视为注释的一部分。


    您引用的标准部分,即引用部分,表示当遇到前面有反斜杠的换行符时......

    <backslash>未引用的 A应保留以下字符的文字值,但 a 除外<newline>。如果 a<newline>跟在<backslash>之后,shell 应将其解释为行继续。在将输入拆分为标记之前<backslash>,<newline>应删除 and。[...]

    请注意,在扫描器实际遇到未引用的反斜杠之前,这不会生效,该反斜杠由令牌识别过程处理:

    如果当前字符是<backslash>、单引号或双引号并且它没有被引用,它将影响到引用文本末尾的后续字符的引用。引用规则如“引用”中所述。

    正如这个答案中已经提到的那样,扫描器将首先遇到注释字符,然后再看到反斜杠,这将触发处理该行其余部分(包括任何引用字符)作为注释的令牌识别规则。因此,行尾换行的引用永远不会生效。

    • 7
  2. Philippos
    2022-05-20T21:55:43+08:002022-05-20T21:55:43+08:00

    有趣的想法。您似乎将反斜杠转义视为在任何标记识别之前应用于整个输入的一个步骤,但事实并非如此。

    输入仍然严格从左到右进行评估,这在不同的情况下是必要的,比如引用:

    echo 'foo\
    bar'
    

    是由于上下文而引用的规则不适用的另一种情况。在这种情况下,上下文是带引号的字符串,在您的情况下,它是根据

    如果当前字符是“#”,则它和所有后续字符直到(但不包括)下一个字符都应作为注释被丢弃。

    引用句子的原因是您可以做到

    ec\
    ho foo
    

    所以你从左到右,逐个标记。如果您仍在正常上下文中,则在令牌拆分之前删除反斜杠 + 换行符,评估很简单echo。

    行为不仅是dash,而且是任何 POSIX shell。

    • 6
  3. quasar
    2022-05-21T02:05:46+08:002022-05-21T02:05:46+08:00

    感谢您的回答。

    我知道我们知道在标记化中是否\被引用,所以我们不能在标记化\<newline>之前删除未引用的。

    <backslash> 和 <newline> 应在将输入拆分为标记之前删除。

    该声明只是说,与其他引用不同,\<newline>立即丢弃。我必须这样想。

    • -1

相关问题

  • 这个命令是如何工作的?mkfifo /tmp/f; 猫/tmp/f | /bin/sh -i 2>&1 | 数控 -l 1234 > /tmp/f

  • FreeBSD 的 sh:列出函数

  • 有没有办法让 ls 只显示某些目录的隐藏文件?

  • grep -v grep 有什么作用

  • 如何将带有〜的路径保存到变量中?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve