AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 543899
Accepted
Age87
Age87
Asked: 2019-09-27 08:16:56 +0800 CST2019-09-27 08:16:56 +0800 CST 2019-09-27 08:16:56 +0800 CST

计算字段中 TRUE 的数量,报告字段编号、TRUE 的数量和标签(大或小)计数

  • 772

我有在 Linux 机器上运行的代码,它计算在给定列/字段中找到的 TRUES 的数量,将列号和该列中的 TRUE 数量打印为输出。

在新输入中,行(输入中的最后一列)被分配为“大”或“小”(每行三个)。

我想用 2 个或更多 TRUE 计算每列的“小”和“大”的数量。

查找具有 2 个或更多 TRUE 的列的代码(我知道下面的代码忽略输入的第一列):

awk -vtc=2 'NR==1{next};
                NR==2{for(i=2;i<=NF;i++){t[i]=0}};
                {for(i=2;i<=NF;i++){if($i=="TRUE"){t[i]++}}}
                END{
                    for(j in t)
                    if(t[j]>=tc){print(j,t[j])}
                }' input.tsv > output.tsv

输入.tsv:

MT MT MT MT MT MT MT MT MT MT
FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE
FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE TRUE
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE TRUE

输出.tsv:

(第一列:列号;第二列:TRUE 数)

3 3
6 3
9 2
10 2

新输入.tsv

MT MT MT MT MT MT MT MT MT MT CAT
FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE LARGE        
FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE SMALL         
FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE SMALL        
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE SMALL        
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE TRUE LARGE     
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE TRUE LARGE

所需的输出.tsv:

(第三列:分配为小的 TRUE 数;第四列:分配为大的 TRUE 数)

3 3 2 1
6 3 1 2
9 2 1 1
10 2 0 2

非常感谢任何 linux 向导的帮助!

text-processing
  • 3 3 个回答
  • 202 Views

3 个回答

  • Voted
  1. Best Answer
    iruvar
    2019-09-27T15:04:29+08:002019-09-27T15:04:29+08:00

    使用(伪)多维数组的解决方案awk

    awk '
    BEGIN {
        b["TRUE"] = 1
        b["FALSE"] = 0
    }
    FNR > 1 {
        for (i=1; i < NF; ++i)
            a[i, $NF] += b[$i]
    }
    END {
        s = "SMALL"
        l = "LARGE"
        for (j=1; j<=i; ++j)
            if (a[j, s] || a[j, l])
                print j, a[j, s] + a[j, l],
                a[j, s] + 0,
                a[j, l] + 0
    }' input.tsv
    

    或者使用 GNU awk 中可用的真正多维数组

    awk '
    FNR > 1 {
        for (i=1; i < NF; ++i)
            if ($i == t)
                ++a[i][$NF] 
    }
    END {
        for (j in a)
            print j, a[j][s] + a[j][l],
            +a[j][s],
            +a[j][l]
    }' t=TRUE s=SMALL l=LARGE input.tsv
    
    • 3
  2. bu5hman
    2019-09-27T10:48:30+08:002019-09-27T10:48:30+08:00

    不优雅的大锤,但它似乎工作

    #!/bin/bash
    
    cols=$(echo $(head -n 1 file) | awk '{print gsub(/ /, "")}')
    sed -e "1d" -e "s/TRUE/1/g" -e "s/FALSE/0/g" -e "s/ /,/g" file > tmp1
    sed "/,S.*/d" tmp1 > tmp2
    for s in $(seq 1 $cols); do
        tr=$(cut -d, -f$s tmp1 | paste -s -d+ | bc --)
        if [ $tr -gt 0 ]; then
            trl=$(cut -d, -f$s tmp2 | paste -s -d+ | bc --)
            echo $s $tr $(( $tr-$trl )) $trl
        fi
    done | column -t -N Col,True,Small,Large
    rm tmp1 tmp2
    

    输出

    Col  True  Small  Large
    3    3     2      1
    6    3     1      2
    9    2     1      1
    10   2     0      2
    

    编辑

    进攻性稍差awk

    #!/bin/bash
    
    sed -e "1d" -e "s/TRUE/1/g" -e "s/FALSE/0/g" file | awk '{
        for (i=1; i<NF; i++)
            {sumall[i]+= $i; if ($NF == "LARGE") {sumlarge[i]+= $i}};
        } END {
        for (x in sumall)
            if (sumall[x] > 0)
                { print x, sumall[x], sumall[x]-sumlarge[x], sumlarge[x]}
        }' | column -t -N Col,True,Small,Large
    
    • 1
  3. Rakesh Sharma
    2019-09-28T00:50:11+08:002019-09-28T00:50:11+08:00

    这使用了调用不同实用程序的管道:

    $ sed -E '1d;s/FALSE/0/g;/LARGE$/s/TRUE/L/g;s/TRUE/S/g' input.tsv |
      datamash transpose |
      perl -F'\t' -lane '$,="\t"; my %h;
        my $c = grep { /^([LS])$/ && ++$h{$1} } @F;
        print $., $c, $h{S}||0, $h{L}||0 if $c > 1;
      '
    3   3   2   1
    6   3   1   2
    9   2   1   1
    10  2   0   2
    
    • 0

相关问题

  • grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

  • 重新排列字母并比较两个单词

  • 在awk中的两行之间减去相同的列

  • 多行文件洗牌

  • 如何更改字符大小写(从小到大,反之亦然)?同时[重复]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve