多行文件洗牌

Question

user977828

Asked: 2018-02-02 15:04:27 +0800 CST2018-02-02 15:04:27 +0800 CST 2018-02-02 15:04:27 +0800 CST

字符串的连接不起作用

772

DASqv -v -H$H -c$cov $db $i | grep Recommend - | sed "s|Recommend ||g" - | sed "s|'||g" -` by itself produces `DAStrim -g20 -b25

我的目标是将之前的结果与awk '{print $1 " " $2 " "$3 " $db $i"}'整个命令结合起来并通过管道输出到一个输出文件> $(basename $i .las).DAStrim。

不幸的是，我只得到结果bananaDB ./bananaDB.100.las，而不是DAStrim -g20 -b25 bananaDB ./bananaDB.100.las以下代码：

#!/bin/bash

db=bananaDB
H=6973
cov=38

for i in $(find . -type f -name "*.*.las");
do
  #cat <<EOF
  qsub <<EOF

#!/bin/bash -l

#PBS -N DASqv
#PBS -l walltime=48:00:00
#PBS -j oe
#PBS -l mem=1G
#PBS -l ncpus=1
#PBS -M [email protected]
##PBS -m bea

cd \$PBS_O_WORKDIR

source activate thegenemyers


DASqv -v -H$H -c$cov $db $i | grep Recommend - | sed "s|Recommend ||g" - | sed "s|'||g" - | awk '{print $1 " " $2 " "$3 " $db $i"}' > $(basename $i .las).DAStrim

EOF

done

更新

DASqv -v -H$H -c$cov $db $i

制作：

DASqv -c38 bananaDB ./bananaDB.100.las

Input:   16,450reads,   210,758,575 bases (another 9,934 were < H-length)

Histogram of q-values (average 10 best)

                 Input                 QV

    50:    1494189    0.2%       380302   18.0%

    49:     364713    0.0%          484    0.0%
    48:     545846    0.1%          423    0.1%
    47:     650479    0.2%          466    0.1%
    46:     835282    0.3%          548    0.1%
    45:    1054589    0.4%          648    0.1%
    44:    1299423    0.5%          775    0.2%
    43:    1644281    0.7%          895    0.2%
    42:    2036915    0.9%         1193    0.3%
    41:    2571126    1.2%         1334    0.4%
    40:    3518594    1.5%         1647    0.5%
    39:    3641660    1.9%         2046    0.6%
    38:    5026473    2.4%         2291    0.7%
    37:    6243982    3.1%         2708    0.9%
    36:    7600704    3.9%         3301    1.1%
    35:    9313754    4.9%         4002    1.3%
    34:   11257936    6.0%         4676    1.6%
    33:   13508338    7.5%         5544    1.9%
    32:   15981847    9.1%         6552    2.3%
    31:   18648809   11.1%         7771    2.7%
    30:   22290239   13.4%         9124    3.3%
    29:   25083448   16.0%        10624    3.9%
    28:   29566164   19.1%        12874    4.6%
    27:   33339712   22.6%        15482    5.5%
    26:   37891335   26.6%        18869    6.6%
    25:   44146531   31.2%        23307    7.9%
    24:   44948068   35.9%        28142    9.5%
    23:   50951224   41.3%        33590   11.5%
    22:   55009718   47.1%        42157   13.9%
    21:   57456151   53.1%        52181   16.9%
    20:   60635065   59.4%        63207   20.6%
    19:   58423422   65.6%        76426   25.0%
    18:   58472922   71.7%        91565   30.2%
    17:   55127848   77.5%       107289   36.4%
    16:   50395382   82.7%       123758   43.6%
    15:   43893354   87.3%       136465   51.4%
    14:   36509552   91.2%       145632   59.8%
    13:   28654550   94.2%       145540   68.2%
    12:   21245809   96.4%       138232   76.2%
    11:   14560980   97.9%       121403   83.2%
    10:    9345155   98.9%        98071   88.8%
     9:    5395169   99.5%        73996   93.1%
     8:    2894210   99.8%        52246   96.1%
     7:    1335673   99.9%        33845   98.0%
     6:     581470  100.0%        19476   99.2%
     5:     201756  100.0%         9367   99.7%
     4:      76322  100.0%         3760   99.9%
     3:      18979  100.0%         1082  100.0%
     2:       4751  100.0%          264  100.0%
     1:        456  100.0%           41  100.0%
     0:       2686  100.0%           38  100.0%

  Recommend 'DAStrim -g20 -b25'

我错过了什么？

先感谢您。

1 个回答

Voted

cas · Answer 1 · 2018-02-02T16:32:26+08:00

你让事情变得比他们需要的更困难，并且遇到空白和引用问题。尝试以下操作：

第 1 步：创建一个独立脚本，在命令行上给定适当的参数和文件名，对一个或多个数据文件执行您想要的操作。

#!/bin/sh

# use the first 3 arguments for the values to pass to DASqv
db="$1"
H="$2"
cov="$3"

# use shift to get rid of them once we have them in variables, ...
shift 3

# ... so we can loop over the remaining filenames (1 or more) on the command line
for filename in "$@" ; do
  outfile="$(basename "$filename" .las).DAStrim"
  qsub <<EOF
#!/bin/bash -l

#PBS -N DASqv
#PBS -l walltime=48:00:00
#PBS -j oe
#PBS -l mem=30G
#PBS -l ncpus=1
#PBS -M [email protected]
##PBS -m bea

cd "\$PBS_O_WORKDIR"

source activate thegenemyers

DASqv -v -H"$H" -c"$cov" "$db" "$filename" | 
  sed -n -e '/Recommend/ {
               s/Recommend //;
               s/\x27//g;
               s:$: "$db" "$filename":;
               p
             }' > "$outfile"

EOF

done

（sed中间的脚本可能都在一行上，但额外的换行符和缩进使其更具可读性，而不会以任何方式改变它的作用/运行方式。另外，请注意使用\x27删除所有单-引号字符。 0x27是 ASCII 单引号字符的十六进制表示法）

将其另存为 egsubmit-jobs.sh并使用chmod +x submit-job.sh.

第 2 步：测试它

通过手动使用脚本提交作业来测试脚本是否执行您想要的操作。例如运行：

/path/to/submit-jobs.sh bananaDB 6973 38 /path/to/somefile.las

如有必要，修改脚本，直到它完全符合您的要求。

第 3 步：现在使用find脚本提交多个作业：

find . -type f -name '*.las' -exec /path/to/submit-jobs.sh bananaDB 6973 38 {} +

第 4 步：（可选）将第 3 步转换为一个脚本，您可以使用不同的参数运行该脚本，这样您就不必在find ...每次想要使用稍微不同的值再次运行时都键入命令。例如

#!/bin/sh
find . -type f -name '*.las' -exec /path/to/submit-jobs.sh "$1" "$2" "$3"

如果您将其另存为find-and-submit.sh并使用使其可执行chmod +x，您将运行它：

find-and-submit.sh bananaDB 6973 38

这个第 4 步脚本甚至可以为变量设置一个 for 循环，例如，它可以为$cov35 到 45 的值提交作业，而不是要求$cov成为参数之一。

字符串的连接不起作用

如何将 GPG 私钥和公钥导出到文件

ssh 无法协商：“找不到匹配的密码”，正在拒绝 cbc

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

如何卸载内核模块“nvidia-drm”？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

字符串的连接不起作用

1 个回答

相关问题