AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 421286
Accepted
Timothy Swan
Timothy Swan
Asked: 2018-02-02 12:20:54 +0800 CST2018-02-02 12:20:54 +0800 CST 2018-02-02 12:20:54 +0800 CST

如何在bash中从/向文件打印文字字符?

  • 772

我想按字符过滤文件(为了删除我无法控制生成的无效 xml 字符),但我似乎什至无法将单个字符从一个文件复制到另一个文件。我printf以前复制包括回车在内的文字部分,但现在它不会将回车复制为一个,而是复制为一些空长度的字符串。我的代码:

infile=$1
outfile=$2
touch $outfile
while IFS= read -r -n1 char
do
        # display one character at a time
        printf "%s" "$char" >> $outfile
done < "$infile"
diff $infile $outfile

我不介意使用 sed 或 awk,但我必须对允许的字符进行编码。 Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */

bash xml
  • 1 1 个回答
  • 1456 Views

1 个回答

  • Voted
  1. Best Answer
    ilkkachu
    2018-02-02T13:30:49+08:002018-02-02T13:30:49+08:00

    回车不应该是一个问题,read应该读它就好了。换行符(换行符)是,因为它是read. 您可以使用该read -d ''技巧使其工作。

    echo $'\r' | { IFS= read -r -n1 x; echo "$x"|xxd; }          # CR
    echo $'\n' | { IFS= read -r -n1 x; echo "$x"|xxd; }          # LF fails
    echo $'\n' | { IFS= read -d '' -r -n1 x; echo "$x"|xxd; }    # LF ok
    

    但是,就像他们说的那样,你可能不想在 shell 中做这样的事情。tr这正是删除一组固定字符所需要的,但至少 GNUtr适用于字节,而不是字符,因此它对 Unicode 没有多大用处。

    如果您的语言环境正确设置为 UTF-8,我认为这个 Perl 应该适用于 UTF-8 数据:

    perl -C -pe 'tr/\x09\x0a\x0d\x20-\x{d7ff}\x{e000}-\x{fffd}\x{10000}-\x{10ffff}//cd' < in > out
    

    但更好地测试它,我不习惯 Unicode 怪癖。

    tr/abc//cdabc删除(tr///实际上是为了将字符转换为其他字符,请参阅perlop)中未列出的字符。它接受字符列表以及范围,并表示具有十六进制值HH的字符,以及具有值HHHH的字符。所以上面接受, , , 从to等的一切。\xHH\x{HHHH}0x090x0a0x0d0x200xd7ff

    上面的列表直接取自问题中提供的列表。我会把它留给最终用户来评估是否应该改变它。

    • 2

相关问题

  • 通过命令的标准输出以编程方式导出环境变量[重复]

  • 从文本文件传递变量的奇怪问题

  • 虽然行读取保持转义空间?

  • `tee` 和 `bash` 进程替换顺序

  • 运行一个非常慢的脚本直到它成功

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    ssh 无法协商:“找不到匹配的密码”,正在拒绝 cbc

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    如何卸载内核模块“nvidia-drm”?

    • 13 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add 返回:“连接代理时出错:没有这样的文件或目录” 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve