grep -v grep 有什么作用

Question

Paolo Lorenzini

Asked: 2020-01-12 00:01:59 +0800 CST2020-01-12 00:01:59 +0800 CST 2020-01-12 00:01:59 +0800 CST

基于两列上的变量值的多个数据框的子集行

772

我有多个数据框，如下所示：

df1

col1;col2;col3;col4
cat;1;2;blue
house;1;2;red
dog;5;6;yellow
mouse;7;8;white

df2

col1;col2;col3;col4
cat;3;4;grey
house;7;8;red
dog;5;6;yellow
mouse;3;4;black

df3

col1;col2;col3;col4
cat;5;6;grey
house;3;4;red
dog;5;6;yellow
mouse;9;10;grey

我想对 col2 和 col3 的值等于“cat”的 col2 和 col3 的值的所有行进行子集化 col2 和 col3 的值在每个数据帧中不断变化，因此不是恒定的。输出将是：

df1

col1;col2;col3;col4
cat;1;2;blue
house;1;2;red

df2

col1;col2;col3;col4
cat;3;4;grey
mouse;3;4;black

df3

col1;col2;col3;col4
cat;5;6;grey
dog;5;6;yellow

有什么建议吗？事实上，我可以一直使用 awk：

awk -F";" '{if($2=="1" && $3=="2")print $0}' df1 
awk -F";" '{if($2=="3" && $3=="4")print $0}' df2
awk -F";" '{if($2=="5" && $3=="6")print $0}' df3

但是我有数千个数据框，因此手动输入每行代码的值很麻烦

1 个回答

Voted

RudiC · Answer 1 · 2020-01-12T03:48:02+08:00

Best Answer

RudiC

2020-01-12T03:48:02+08:002020-01-12T03:48:02+08:00

怎么样

awk -F\; '                              # set field separator
FNR == 1        {D1 = D2 = ""           # on new file (= line No. 1), reset variables
                 FN = FILENAME "_tmp"   # compose new filename
                 print > FN             # print header line to new file
                }
/^cat/          {D2 = $2                # if found "cat", set variables D2 and 
                 D3 = $3                # D3
                }
$2 == D2 &&                             # if fields $2 and $3 match variables, i.e. $2 and $3 from "cat" line
$3 == D3        {print > FN             # print line to new file
                }
' df*                                   # work on every "df*" file in sight

然后mv*tmp 文件覆盖原始文件...

1

基于两列上的变量值的多个数据框的子集行

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

基于两列上的变量值的多个数据框的子集行

1 个回答

相关问题