AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 748957
Accepted
Dave
Dave
Asked: 2023-06-15 21:38:01 +0800 CST2023-06-15 21:38:01 +0800 CST 2023-06-15 21:38:01 +0800 CST

如何使用 awk 使用另一个文件中的数字从文件中正确提取行?

  • 772

我正在使用 bash 外壳。如果我有行号文件

1
4
7
9

和另一个行文件,其中第一个元素是一个数字,后跟一串文本

1,Michael Jordan
2,Karl Malone,
3,Charles Barkley
4,Greg Anthony
5,Chris Mullen
6,Reggie Miller
7,Billy Owens
8,David Robinson
9,Shaquille O'Neal
10,John Stockton

awk仅当第一个数字属于第一个文件时,如何编写命令从第二个文件中提取行?在上面的例子中,我希望这个结果

1,Michael Jordan
4,Greg Anthony
7,Billy Owens
9,Shaquille O'Neal

我试过这个

awk 'FNR==NR{a[$1];next} $1 in a' /tmp/first_file /tmp/second_file > /tmp/third_file

但它在第三个文件中什么也没有产生。

shell-script
  • 2 2 个回答
  • 81 Views

2 个回答

  • Voted
  1. Best Answer
    steeldriver
    2023-06-15T22:06:36+08:002023-06-15T22:06:36+08:00

    由于您的第二个文件是逗号分隔的,因此您需要将 awk 字段分隔符设置为,- 全局使用-F命令行选项:

    awk -F, 'FNR==NR{a[$1];next} $1 in a' /tmp/first_file /tmp/second_file > /tmp/third_file
    

    或者通过FS内置变量:

    awk 'FNR==NR{a[$1];next} $1 in a' /tmp/first_file FS=, /tmp/second_file > /tmp/third_file
    

    后一种方法允许您处理第一个文件不是逗号分隔(并且有多个字段)的情况。

    • 4
  2. jubilatious1
    2023-06-17T13:50:06+08:002023-06-17T13:50:06+08:00

    使用Raku(以前称为 Perl_6)

    ~$ raku -ne 'BEGIN my @a = "nbr_list.txt".IO.lines.map: *.Int;  \
                 .put if $_.split(",")[0] == any(@a);'  file.csv
    
    #OR
    
    ~$ raku -ne 'BEGIN my @a = "nbr_list.txt".IO.lines.map: *.Int;  \
                 .put if $_.split(",")[0] ~~ any(@a);'  file.csv
    

    Raku 是 Perl 家族中的一种编程语言。正如您一样BEGIN,获取数字列表并将其存储在数组中,@a。然后标志-ne从命令行读取文件而不自动打印(awk类似行为)。

    此处,该行被读入逗号上的主题变量 ( $_),并采用split第一个元素 ( )。[0]这些元素使用==数值相等运算符(第一个代码示例)或 Raku 的~~智能匹配运算符进行比较。在运算符的 RHS 上,@a数组变成了一个any()结点。如果满足条件,则条件输出if行。put

    示例输入:

    1,Michael Jordan
    2,Karl Malone,
    3,Charles Barkley
    4,Greg Anthony
    5,Chris Mullen
    6,Reggie Miller
    7,Billy Owens
    8,David Robinson
    9,Shaquille O'Neal
    10,John Stockton
    

    示例输出(使用nbr_list.txt由 1、4、7、9 组成的文件):

    1,Michael Jordan
    4,Greg Anthony
    7,Billy Owens
    9,Shaquille O'Neal
    

    连接点很有趣,因为它们会自动穿线。对于上述问题,one()联结也有效,甚至可能更有效率。


    另一种方法是使用 Sets:行号被转换为 a Setof Ints。数据按行读取,每个第一列都被强制转换为Int,并检查它是否是(elem)集合中的一个元素。请注意,可以在以下代码中使用infix(elem)或 infix , (Unicode 符号):∈

    ~$ raku -ne 'BEGIN my $set1 = Set.new("nbr_list.txt".IO.lines.map: *.Int);  \
                 .put if $_.split(",").[0].Int (elem) $set1;'  file
    

    https://docs.raku.org/type/Junction
    https://docs-stage.raku.org/type/Junction
    https://raku.org

    • 0

相关问题

  • 在awk中的两行之间减去相同的列

  • 打印文件行及其长度的脚本[关闭]

  • 通过命令的标准输出以编程方式导出环境变量[重复]

  • 按分隔符拆分并连接字符串问题

  • MySQL Select with function IN () with bash array

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve