除非由用户或用户脚本设置,否则 OFS 的值似乎总是一个空格。即使输入使用选项卡:
$ printf 'one\ntwo\tthree\nfour' | awk '{NF=NF}1' | sed -n l
one$
two three$
four$
但是,对于类似的变量 (ORS),有时会说:不要理会 ORS,以便它保留它应该为您的平台具有的任何值。我可以想象在某些平台上默认的 ORS 可能是\r\n
. 在某些平台上这似乎是明智的。
那么 OFS 的问题是:
- OFS 会在平台之间改变吗?
- 是否有一些 OFS 不是空间的实现?
编辑评论:对于我的问题可能产生的任何混淆,我希望现在很清楚。
无法投票(还)。
正如我(现在)在那里评论的那样,ORS 始终默认为
"\n"
,但在 Windows 上,C 实现(除 awk 外还适用于许多其他程序)转换\n
为 CR LF 和从 CR LF 转换——对于所有\n
字符,无论它们是否由 ORS 生成, 或在输入上匹配 RS。同样,yes OFS 始终默认为 (one) space。FS 也默认为一个空格,但经过特殊处理:当 FS 等于一个空格时,无论是默认设置还是显式设置,字段实际上都由任何空格序列(包括您发布的情况下的选项卡)分割。任何其他单字符 FS 都被视为文字字符,任何多字符值都被视为正则表达式。
因此,对于单空格或正则表达式的情况,可以在分隔符处拆分记录,分隔符因字段和/或记录而异,但如果您通过分配给 NF 或任何字段来重建 $0,则重建的行在所有字段之间使用固定的 OFS 值(如果超过一个)。此外,如果您使用
print x,y,z
多个表达式,它们将由(固定)OFS 分隔。当然,如果您显式打印或以其他方式使用包含(或包含)OFS 的字符串表达式,您将获得 OFS 的值。标准 RS 可以设置为任何单个字符,或空字符串以导致“段落”模式,其中记录被一个或多个空行(连续换行)分割;在这种模式下,除了正常情况外,默认情况下它会在换行符处拆分字段。仅在GNU awk 中,RS 可以设置为多字符正则表达式,并且匹配结果在 RT 中可用。请参阅GNU 文档中本页底部的摘要。