AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 456766
Accepted
vivoru
vivoru
Asked: 2018-07-18 05:37:39 +0800 CST2018-07-18 05:37:39 +0800 CST 2018-07-18 05:37:39 +0800 CST

在 "while read -r" 中将 "\r" 视为无

  • 772

我有这行代码逐行读取文本文件。

文本文件有时由 Windows 用户生成,有时由 Unix 用户生成。因此,有时我看到\r\n行尾,有时我只看到\n.

我希望我的脚本能够处理这两种情况并分别到达每一行,而不管换行符是\r, or \n, or \r\n, or \n\r。

while read -r textFileLines; do ... something ...; done < text_file.txt

此代码在\n\r每行末尾与(LF CR) 一起使用,但当我在行尾使用时不起作用!\r\n

测试

  • 使用创建一个新的文本文件Notepad++ v7.5.4

    在此处输入图像描述

  • while read -r LINE; do echo "$LINE"; done < /cygdrive/d/test_text.txt

  • 终端中的输出:

    first_line
    second_line
    third_string
    

为什么没有fourth_output显示线?

shell-script shell
  • 4 4 个回答
  • 6011 Views

4 个回答

  • Voted
  1. ilkkachu
    2018-07-18T06:30:23+08:002018-07-18T06:30:23+08:00

    为什么没有fourth_output显示线?

    在您的图像中,该文件在最后一行末尾缺少换行符。read仅当它读取分隔符(换行符)时才返回 true,并且由于最后一行的末尾不存在,因此read返回 false,循环结束,并且最后一个不完整的行不打印。

    这与回车无关,即使只有 NL,如果最后一行缺少 NL,行为也是一样的。

    在这里,file1有两行以 CRLF 行结尾:

    $ cat -A file1
    foo^M$
    bar^M$
    $ while read x ; do echo "<$x>"; done < file1
    >foo
    >bar
    

    file2缺少以第二行结尾的行:

    $ cat -A file2 ; echo
    foo^M$
    bar
    $ while read x ; do echo "<$x>"; done < file2
    >foo
    

    如果你想让循环也处理最后一行片段,你必须检查read变量read本身返回失败时是否包含任何数据:

    $ while read -r x || [ "$x" ] ; do echo "<$x>"; done < file2
    >foo
    <bar>
    

    如果您想摆脱 CR,您可以在循环中将其删除,例如x=${x%$'\r'};(在 Bash/ksh/zsh 中),或使用 or 等​​预处理tr -d '\r'文件dos2unix。

    • 1
  2. slm
    2018-07-18T05:57:48+08:002018-07-18T05:57:48+08:00

    有明确的工具可以做到这一点。可用于\r\n从文件中剥离的更常见的一种称为dos2unix.

    如果这在您的系统上不可用,您可以使用以下命令之一对您的textFileLines变量执行类似的操作:

    awk
    $ echo "$textFileLines" | awk 1 RS='\r\n' ORS=
    
    sed 1
    $ echo "$textFileLines" | sed -e 's/\r//g'
    
    sed 2
    $ echo $textFileLines | sed $'s/\r//'
    
    tr
    $ echo "$textFileLines" | tr -d '\r'
    

    当然还有很多其他的方法可以做到这一点,这些只是一些比较常见的方法。

    参考

    • 在 Linux 上删除 Windows 换行符(sed 与 awk)
    • 0
  3. Best Answer
    Kusalananda
    2018-07-18T06:13:02+08:002018-07-18T06:13:02+08:00

    如果您有一些文件是 DOS 文本文件,而一些文件是 Unix 文本文件,则您的脚本可以通过以下方式传递所有数据dos2unix:

    dos2unix <filename |
    while IFS= read stuff; do
       # do things with "$stuff"
    done 
    

    Unix 文本文件不会因此而被修改。

    为了另外应对Mac换行符,我相信你应该能够做到

    dos2unix <filename | mac2unix |
    while IFS= read stuff; do
       # do things with "$stuff"
    done 
    

    最后一行没有被read循环输出,因为它没有终止,因此根本不是一行。

    要检测文件是否在最后一行没有终止换行符,如果没有,则添加一个,在bash:

    if [ "$( tail -c 1 filename )" != $'\n' ]; then
        printf '\n' >>filename
    fi
    

    有关的:

    • 为什么使用 shell 循环处理文本被认为是不好的做法?
    • 0
  4. user232326
    2018-07-20T18:48:25+08:002018-07-20T18:48:25+08:00

    执行:

    $ [ -n "$(tail -c1 infile)" ] && echo >> infile
    $ sed 's/\r$\|^\r//g;s/\r/\n/g' infile | while IFS= read -r line
    > do echo "$line" ; done
    DOS       line
    second     DOS
    old  mac   line
    new  mac   line
    end\n\rreverse
    linux      line
    new linux  line
    

    所有问题都解决了。


    描述:

    要更正缺少的最后一个换行符,请使用:

    [ -n "$(tail -c1 infile)" ] && echo >> infile
    

    只有在需要时才会添加尾随换行符(不会更改正确的文件)。

    然后,您可以转换

    • \r\n(DOS 风格)到\n(只需删除行尾的 \r)
    • \n\r(无效的 DOS 样式?)到一\n(在行首删除 \r)
    • 然后(纠正对)将\r(旧MAC)转换为\n

    在 (GNU) sed 的一次调用中:

    sed 's/\r$\|^\r//g;s/\r/\n/g' infile
    

    如果文本文件是这样的测试文件:

    $ cat infile
    DOS       line
    second     DOS
    new  mac   line
    end\n\rreverse
    linux      line
    new linux  line
    no  end   line
    
    $ cat -A infile
    DOS       line^M$
    second     DOS^M$
    old  mac   line^Mnew  mac   line$
    end\n\rreverse$
    ^Mlinux      line$
    new linux  line$
    no  end   line
    
    $  od -An -tc infile
       D   O   S                               l   i   n   e  \r  \n
       s   e   c   o   n   d                       D   O   S  \r  \n
       o   l   d           m   a   c               l   i   n   e  \r
       n   e   w           m   a   c               l   i   n   e  \n
       e   n   d   \   n   \   r   r   e   v   e   r   s   e  \n  \r
       l   i   n   u   x                           l   i   n   e  \n
       n   e   w       l   i   n   u   x           l   i   n   e  \n
       n   o           e   n   d               l   i   n   e
    
    • 0

相关问题

  • 打印文件行及其长度的脚本[关闭]

  • 通过命令的标准输出以编程方式导出环境变量[重复]

  • 按分隔符拆分并连接字符串问题

  • 如何将带有〜的路径保存到变量中?

  • MySQL Select with function IN () with bash array

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    ssh 无法协商:“找不到匹配的密码”,正在拒绝 cbc

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    如何卸载内核模块“nvidia-drm”?

    • 13 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add 返回:“连接代理时出错:没有这样的文件或目录” 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve