给定一个文件,我想以八进制格式列出它包含的所有字节,每个字节在自己的行中。
为什么会这样:
#!/bin/sh --
newline='
'
od -v -A n -t o1 -- /tmp/file | \
sed -e "s/ /\\${newline}/g" | \
sed -e '/^$/d'
而不是这个:
#!/bin/sh --
newline='
'
od -v -A n -t o1 -- /tmp/file | \
sed -e "s/ /\\${newline}/g" -e '/^$/d'
为什么我必须两次分别调用 sed 才能完成工作?
作为参考, 的输出od
,未经进一步处理,可能类似于以下内容:
047 124 167 141 163 040 142 162 151 154 154 151 147 054 040 141
156 144 040 164 150 145 040 163 154 151 164 150 171 040 164 157
166 145 163 012 011 104 151 144 040 147 171 162 145 040 141 156
144 040 147 151 155 142 154 145 040 151 156 040 164 150 145 040
167 141 142 145 072 012 101 154 154 040 155 151 155 163 171 040
167 145 162 145 040 164 150 145 040 142 157 162 157 147 157 166
145 163 054 012 011 101 156 144 040 164 150 145 040 155 157 155
145 040 162 141 164 150 163 040 157 165 164 147 162 141 142 145
056 012
每个
sed
表达式都作用于整个模式空间。在循环开始时,将一行读入模式空间,然后sed
将每个给定表达式应用于该数据。在您的代码的第二个变体中,您使用替换将换行符插入到模式空间中。第二个表达式 ,
/^$/d
仍将作为一个整体作用于模式空间,而不是作用于模式空间中的每一行,这意味着模式将不匹配(因为缓冲区非空),并且模式空间不会被删除。更改/^$/d
为s/\n\{2,\}//g
将删除两个或多个连续换行符的任何运行(这些将在输出中创建空行),这将起作用。这与代码的第一个变体形成对比,第二个变体
sed
读取第一个的输出sed
。在这种情况下,第二个将单独sed
读取每个生成的行,并删除那些为空的行。简而言之:在模式空间中添加换行符不会
sed
重新考虑每个生成的行作为剩余表达式的单独输入。另一种解决方案:
第一个
sed
表达式,s/ \{2,\}//g
去掉任何两个或多个连续空格的运行,然后第二个表达式将剩余的空格转换为换行符(命令\n
允许y
,即使在 POSIX 中也是如此sed
)。或者,您可以在将所有剩余空格转换为换行符之前删除所有侧翼空格:
(请注意,只有输出的最后一行
od
可能有尾随空格,这就是为什么我将$
其用作第二个表达式的地址。)或者,它可能更直接
awk
:这是因为空行仅存在于输出文件中,在进行替换之后。为什么不
?