AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 409802
Accepted
Anna1364
Anna1364
Asked: 2017-12-09 11:05:49 +0800 CST2017-12-09 11:05:49 +0800 CST 2017-12-09 11:05:49 +0800 CST

如果总和小于特定值,则计算每 2 行的总和并用另一个值替换它们

  • 772

我有一个基因型矩阵(带有表格空间),有 200 万行和 12 列。列是个体,行是 SNP。我每个人的每个 SNP 有 2 行,一个是参考等位基因的数量,另一个是替代等位基因的数量(每 2 行对应一个 SNP,这意味着第 1 行和第 2 行对应于 SNP 1,第 3 和第 4 行对应于SNP2,第 5 行和第 6 行对应于 SNP 3)。

这是一个示例,(2 个 SNP 和 8 个个体):

head genotype
2   3   1   0   0   3   5   3       
18  15  19  18  16  15  13  17      
2   1   0   0   0   1   1   1           
18  19  18  16  20  17  17  23  

对于每个 SNP,如果参考和替代等位基因的总和小于 20,我想用 0 替换两个等位基因,如果它们等于或大于 20,我想保留它们。这是我想要的输出

head (desired_output)
    2   0   1   0   0   0   0   3       
    18  0   19  0   0   0   0   17      
    2   1   0   0   0   0   0   1           
    18  19  0   0   20  0   0   23  

知道如何准确地做到这一点吗?

perl python
  • 1 1 个回答
  • 106 Views

1 个回答

  • Voted
  1. Best Answer
    glenn jackman
    2017-12-09T11:31:42+08:002017-12-09T11:31:42+08:00

    这个想法是将连续的行保存在 2 个数组中,然后通过相应的索引比较数组元素。

    将此保存到文件中,例如“twenty.awk”

    #/usr/bin/env awk
    
    # ref https://www.gnu.org/software/gawk/manual/html_node/Join-Function.html
    function join(array, start, end, sep,    result, i)
    {
        if (sep == "")
            sep = " "
        else if (sep == SUBSEP) # magic value
            sep = ""
        result = array[start]
        for (i = start + 1; i <= end; i++)
            result = result sep array[i]
        return result
    }
    
    {
        split($0, a)
        getline
    
        for (i=1; i<=NF; i++)
            if (a[i] + $i < 20)
                a[i] = $i = 0
    
        print join(a, 1, NF)
        print
    }
    

    然后运行

    awk -f twenty.awk data.file | column -t > data.file.twenty
    
    • 1

相关问题

  • sh脚本以多种语言运行多个文件

  • python2 和 OpenSSL 不能在 Kali 上一起玩 - 如何解决?

  • 从文件中删除间隙模式[关闭]

  • 列表理解中集合的 Python add() 函数

  • 如何在 unix 中获取应用程序的默认版本

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    JSON数组使用jq来bash变量

    • 4 个回答
  • Marko Smith

    日期可以为 GMT 时区格式化当前时间吗?[复制]

    • 2 个回答
  • Marko Smith

    bash + 通过 bash 脚本从文件中读取变量和值

    • 4 个回答
  • Marko Smith

    如何复制目录并在同一命令中重命名它?

    • 4 个回答
  • Marko Smith

    ssh 连接。X11 连接因身份验证错误而被拒绝

    • 3 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Marko Smith

    systemctl 命令在 RHEL 6 中不起作用

    • 3 个回答
  • Marko Smith

    rsync 端口 22 和 873 使用

    • 2 个回答
  • Marko Smith

    以 100% 的利用率捕捉 /dev/loop -- 没有可用空间

    • 1 个回答
  • Marko Smith

    jq 打印子对象中所有的键和值

    • 2 个回答
  • Martin Hope
    EHerman JSON数组使用jq来bash变量 2017-12-31 14:50:58 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Drux 日期可以为 GMT 时区格式化当前时间吗?[复制] 2017-12-26 11:35:07 +0800 CST
  • Martin Hope
    AllisonC 如何复制目录并在同一命令中重命名它? 2017-12-22 05:28:06 +0800 CST
  • Martin Hope
    Steve “root”用户的文件权限如何工作? 2017-12-22 02:46:01 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST
  • Martin Hope
    Cbhihe 将默认编辑器更改为 vim for _ sudo systemctl edit [unit-file] _ 2017-12-03 10:11:38 +0800 CST
  • Martin Hope
    showkey 如何下载软件包而不是使用 apt-get 命令安装它? 2017-12-03 02:15:02 +0800 CST
  • Martin Hope
    youxiao 为什么目录 /home、/usr、/var 等都具有相同的 inode 编号 (2)? 2017-12-02 05:33:41 +0800 CST
  • Martin Hope
    user223600 gpg —list-keys 命令在将私钥导入全新安装后输出 uid [未知] 2017-11-26 18:26:02 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve