AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / user-589662

Matteo's questions

Martin Hope
Matteo
Asked: 2025-04-13 20:51:02 +0800 CST

如何将环境变量传递给 singularity exec

  • 7

我有一条BASH管道,它在某个时刻运行一个具有奇点执行的Singularity容器,如下所示:

singularity exec --bind `pwd`:/folder --bind $d:/results <image>.sif <tool_command> -i /folder/<file>.fastq -v /results/<output>/<file>.vcf -r /folder/<reference>.fna -s <vcf_sample_name> -j 24 -t 24 -o /results/<output_file_suffix>

由于我使用数组同时运行多个实验,因此我正在使用希望添加到的环境变量重新定义实验<output_file_suffix>;它适用于管道的所有步骤,但Singularity似乎无法看到我在脚本中定义的变量......

有人能提供一些建议吗?我查了一下,但--env似乎行不通。提前谢谢!

bash
  • 1 个回答
  • 290 Views
Martin Hope
Matteo
Asked: 2025-02-11 00:25:41 +0800 CST

从一个变量通过管道传输到 uniq,没有显示所需的输出

  • 5

我有一个使用数组作业的管道,需要更改某些步骤的输入数量。我考虑进行测试,uniq因为我的文件夹中唯一改变的部分是最后四个字符(示例中的hap部分)。因此,我的所有路径看起来都像这样:

/mnt/nvme/user/something1/hap1
/mnt/nvme/user/something1/hap2
/mnt/nvme/user/something2/hap1
/mnt/nvme/user/something2/hap2

我正在做的事情如下:

DIR=( "/mnt/nvme/ungaro/something1/hap1" "/mnt/nvme/ungaro/something1/hap2" "/mnt/nvme/ungaro/something2/hap1" "/mnt/nvme/ungaro/something2/hap2" )

for dir in "${DIR[@]}"; do echo $dir | sed 's#/hap[0-9]##' | uniq; done

但是,在删除每个元素的hap部分后,结果输出始终会显示变量中的所有元素,而不会折叠重复的行。

我可能遗漏了什么,可能是强制for打印所有行。如果是这样,有没有办法在一行命令中达到所需的结果?

bash
  • 2 个回答
  • 33 Views
Martin Hope
Matteo
Asked: 2024-11-25 21:34:48 +0800 CST

使用 AWK 复制列并用制表符分隔它们

  • 7

我有一个大文件,其格式tab如下:

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  recombination
chr1    586001  >63041388>63041391      G       A       60      .       AC=80;AF=0.3125;AN=256;AT=>63041388>63041390>63041391,>63041388>63041389>63041391;NS=3;LV=0     GT    1|2|3|

现在,最后一列(第 10 列)出现的数字等于用竖线除以 0 |;但是,我希望实现以下目标:

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  recombination
chr1    586001  >63041388>63041391      G       A       60      .       AC=80;AF=0.3125;AN=256;AT=>63041388>63041390>63041391,>63041388>63041389>63041391;NS=3;LV=0     GT    1|1    2|2    3|3

tab我设法通过替换符号来分隔列|,这让我知道如何复制它们并添加|数字之间的数字。我尝试了几次for循环,但我能做的最好的就是只打印两列,如下所示:

1    1
2    2
3    3
...

否则printf我会得到一行输出但不能保持计数器与初始列相同的值...非常感谢任何帮助,提前谢谢!

text-processing
  • 2 个回答
  • 163 Views
Martin Hope
Matteo
Asked: 2024-08-10 16:13:42 +0800 CST

基于文件大小的命令执行失败,没有明显问题

  • 7

我正在为一个小型管道处理数组作业,碰巧需要一种根据文件大小执行特定命令的方法。我找到了这篇文章和类似的文章,它们描述了如何做到这一点。目前我正在使用以下内容:

find $d/*.fasta -size +100M -exec sh -c '
     chromap -i -r $1 -o $1.index

     chromap --preset hic -x $1.index -r $1 -1 $d/hi-c/${ID}_1.fq.gz -2 $d/hi-c/${ID}_2.fq.gz --SAM -o /dev/stdout -t 48 | \
         samtools view -bS -@ 48 | samtools sort -n -@ 48 | samtools view -h | sed -e "s/\/.//" | samtools view -bS -o ${ID}.bam -@ 48
     ' sh {} \;

除了生物信息和使用的工具都有效之外,它似乎只执行了第一个命令行 — chromap -i -r $1 -o $1.index。然后,出于某种原因,一旦进入第二组指令,脚本就会返回以下内容:

找不到序列文件 /hi-c/_1.fq.gz

这表明它不知道我迄今为止成功使用的环境变量,或者它当时无法计算两个以上的操作?我没有任何线索……我还尝试了一些更简单的东西,例如

mkdir $d/scaffolding
find $d/*.fasta -size +100M -exec sh -c '
     chromap -i -r $1 -o $1.index && mv $1 $1.index $d/scaffolding
' sh {} \;

但 Bash 抱怨:mv: the destination '/scaffolding' is not a directory。

我应该怎么做才能让其中一个(或两个)工作?我是否遗漏了什么,如果有人对这个问题有一些见解,请告诉我!提前致谢。

bash
  • 2 个回答
  • 315 Views
Martin Hope
Matteo
Asked: 2023-10-23 19:48:52 +0800 CST

wget — 通过集群上的多个节点下载多个文件

  • 6

您好,我正在尝试一次下载大量文件;准确地说是279。每个都是大 BAM (~90GB)。我正在工作的集群有多个节点,幸运的是我可以一次分配多个实例。

鉴于这种情况,我想知道是否可以使用wget批处理文件(参见下面的示例)将每个下载分配到单独的节点以独立执行。

批处理文件.txt

<https_link_1> -O DNK07.bam
<https_link_2> -O mixe0007.bam
<https_link_3> -O IHW9118.bam
.
.

原则上,这不仅会加快速度,还会防止运行失败,因为此执行的挂机时间为 24 小时,并且不足以在一台计算机上连续下载所有这些文件。

我的 BASH 脚本如下所示:

#!/bin/bash
#
#SBATCH --nodes=279 --ntasks=1 --cpus-per-task=1
#SBATCH --time=24:00:00
#SBATCH --mem=10gb
#
#SBATCH --job-name=download
#SBATCH --output=sgdp.out
##SBATCH --array=[1-279]%279
#
#SBATCH --partition=<partition_name>
#SBATCH --qos=<qos_type>
#
#SBATCH --account=<user_account>

#NAMES=$1
#d=$(sed -n "$SLURM_ARRAY_TASK_ID"p $NAMES)

wget -i sgdp-download-list.txt

正如你所看到的,我正在考虑使用 an array job(不确定是否有效);或者,我考虑分配 279 个节点,希望 SLURM 能够足够聪明地将每个下载发送到一个单独的节点(不确定......)。如果您知道一种有效的方法,欢迎提出任何建议。提前致谢!

bash
  • 3 个回答
  • 73 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve