通过命令的标准输出以编程方式导出环境变量[重复]

Question

Timothy Swan

Asked: 2018-02-02 12:20:54 +0800 CST2018-02-02 12:20:54 +0800 CST 2018-02-02 12:20:54 +0800 CST

如何在bash中从/向文件打印文字字符？

772

我想按字符过滤文件（为了删除我无法控制生成的无效 xml 字符），但我似乎什至无法将单个字符从一个文件复制到另一个文件。我printf以前复制包括回车在内的文字部分，但现在它不会将回车复制为一个，而是复制为一些空长度的字符串。我的代码：

infile=$1
outfile=$2
touch $outfile
while IFS= read -r -n1 char
do
        # display one character at a time
        printf "%s" "$char" >> $outfile
done < "$infile"
diff $infile $outfile

我不介意使用 sed 或 awk，但我必须对允许的字符进行编码。 Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */

1 个回答

Voted

ilkkachu · Answer 1 · 2018-02-02T13:30:49+08:00

回车不应该是一个问题，read应该读它就好了。换行符（换行符）是，因为它是read. 您可以使用该read -d ''技巧使其工作。

echo $'\r' | { IFS= read -r -n1 x; echo "$x"|xxd; }          # CR
echo $'\n' | { IFS= read -r -n1 x; echo "$x"|xxd; }          # LF fails
echo $'\n' | { IFS= read -d '' -r -n1 x; echo "$x"|xxd; }    # LF ok

但是，就像他们说的那样，你可能不想在 shell 中做这样的事情。tr这正是删除一组固定字符所需要的，但至少 GNUtr适用于字节，而不是字符，因此它对 Unicode 没有多大用处。

如果您的语言环境正确设置为 UTF-8，我认为这个 Perl 应该适用于 UTF-8 数据：

perl -C -pe 'tr/\x09\x0a\x0d\x20-\x{d7ff}\x{e000}-\x{fffd}\x{10000}-\x{10ffff}//cd' < in > out

但更好地测试它，我不习惯 Unicode 怪癖。

tr/abc//cdabc删除（tr///实际上是为了将字符转换为其他字符，请参阅perlop）中未列出的字符。它接受字符列表以及范围，并表示具有十六进制值HH的字符，以及具有值HHHH的字符。所以上面接受, , , 从to等的一切。\xHH\x{HHHH}0x090x0a0x0d0x200xd7ff

上面的列表直接取自问题中提供的列表。我会把它留给最终用户来评估是否应该改变它。

如何在bash中从/向文件打印文字字符？

如何将 GPG 私钥和公钥导出到文件

ssh 无法协商：“找不到匹配的密码”，正在拒绝 cbc

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

如何卸载内核模块“nvidia-drm”？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何在bash中从/向文件打印文字字符？

1 个回答

相关问题