在非 root 用户上用 bash 替换 zsh

Question

Hot JAMS

Asked: 2021-05-28 07:11:18 +0800 CST2021-05-28 07:11:18 +0800 CST 2021-05-28 07:11:18 +0800 CST

根据列值对行进行排序

772

我需要根据从 min 到 max 的第二列中包含的数字对 csv 填充中的所有 linnes 进行排序，忽略第一列（标题行）：

ID(Prot),   ID(lig),    ID(cluster),    dG(rescored),   dG(before), POP(before)
10V1,   lig1,   1,  0.893101,   -7.2300,    36
10V1,   lig1,   3,  1.04024,    -6.5800,    4
10V1,   lig1,   4,  1.03044,    -6.5200,    7
10V1,   lig10,  1,  0.895754,   -6.0300,    47
10V1,   lig10,  2,  0.668236,   -5.9500,    112
10V1,   lig10,  3,  1.0103, -5.8200,    19
10V1,   lig1001,    1,  0.594972,   -5.6500,    142
10V1,   lig1001,    2,  1.05779,    -5.5000,    10
10V1,   lig1001,    3,  1.11195,    -4.9500,    2
10V1,   lig3,   1,  1.01583,    -5.6000,    20
10V1,   lig3,   2,  0.972203,   -5.2600,    36
10V1,   lig3,   3,  0.694967,   -5.2400,    118
10V1,   lig8,   1,  0.931977,   -7.4000,    25
10V1,   lig8,   2,  1.00413,    -7.1100,    9

应该像 lig1、lig3、lig8、lig10、lig1001 等那样排序：

ID(Prot),   ID(lig),    ID(cluster),    dG(rescored),   dG(before), POP(before)
    10V1,   lig1,   1,  0.893101,   -7.2300,    36
    10V1,   lig1,   3,  1.04024,    -6.5800,    4
    10V1,   lig1,   4,  1.03044,    -6.5200,    7
    10V1,   lig3,   1,  1.01583,    -5.6000,    20
    10V1,   lig3,   2,  0.972203,   -5.2600,    36
    10V1,   lig3,   3,  0.694967,   -5.2400,    118
    10V1,   lig8,   1,  0.931977,   -7.4000,    25
    10V1,   lig8,   2,  1.00413,    -7.1100,    9
    10V1,   lig10,  1,  0.895754,   -6.0300,    47
    10V1,   lig10,  2,  0.668236,   -5.9500,    112
    10V1,   lig10,  3,  1.0103, -5.8200,    19
    10V1,   lig1001,    1,  0.594972,   -5.6500,    142
    10V1,   lig1001,    2,  1.05779,    -5.5000,    10
    10V1,   lig1001,    3,  1.11195,    -4.9500,    2

我试过了

sort -k2.4,2n "${csv}" > sorted.csv

但它没有正确识别第二个值..

1 个回答

Voted

Kamil Maciorowski · Answer 1 · 2021-05-28T08:53:14+08:00

默认情况下sort识别由非空白到空白转换分隔的字段。第二行的第二个字段（第一个是标题）不是lig1nor lig1,，就像 lig1,.

起初不清楚该字段是否包含前导空格或制表符，因为此站点在显示代码时会将制表符转换为多个空格。原始来源告诉我每行的第二个字段包含一个前导选项卡。

此制表符算作字段中的第一个字符，因此您-k2.4,2n的减一。应该是-k2.5,2n。

为了可靠地首先打印标题而不是对其进行排序，请在sort处理其余部分之前先读取并打印它。它可以是你的外壳：

{ IFS= read -r line; printf '%s\n' "$line"; sort -k2.5,2n; } <"${csv}"

或者它可以是head：

{ head -n 1; sort -k2.5,2n; } <"${csv}"

在我的 Debian 10 中，从常规文件读取时，这两个命令都能正常工作。从管道（例如cat "${csv}" | { head …）读取时，head显然可以读取太多并丢弃过多的数据（所以sort不会得到它，它会丢失）。

^{我想 head即使从常规文件中读取也会读得更多，它只是在退出之前回到正确的位置，因此下一个工具可以从那里接管；对于不可搜索的输入，这显然是不可能的。}

read更加小心，总是一次读取一个字节，所以它永远不会读取太多。

根据列值对行进行排序

如何减少“vmmem”进程的消耗？

从 Microsoft Stream 下载视频

Google Chrome DevTools 无法解析 SourceMap：chrome-extension

Windows 照片查看器因为内存不足而无法运行？

支持结束后如何激活 WindowsXP？

远程桌面间歇性冻结

子网掩码 /32 是什么意思？

鼠标指针在 Windows 中按下的箭头键上移动？

VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

根据列值对行进行排序

1 个回答

相关问题