为什么我的 bash shell 脚本将空格更改为换行符？

Question

surfmuggle

Asked: 2022-05-25 01:34:19 +0800 CST2022-05-25 01:34:19 +0800 CST 2022-05-25 01:34:19 +0800 CST

如何对包含特定字符串的文件中的所有行进行分组和计数

772

我想过滤文件中包含的所有行，mySearchString然后将它们组合在一起并计算它们。

示例查找包含的所有行9791

AB-9791___Foo
AB-9791___Foo
DE-9791___Bar
AB-0001___Foo

使用 $ grep "9791" myFile.txt给出了这个结果

AB-9791___Foo
AB-9791___Foo
DE-9791___Bar 
// 0001 was filtered out

这个结果应该像这样分组和计数（如 SQL Group by Count）

AB-9791___Foo     2
DE-9791___BAR     1

这个答案使用 perl，但我们的机器上没有安装 perl。

什么工具（grep、awk、sed或其他）可用于实现第二部分的分组和计数？

更新测试记录

在我的测试文件Test_2.txt中，这些行是写的

AB-9791___Foo
DE-9791___Bar
AB-0001___Foo
AB-9791___Foo
AB-9791___Foo
AB-9791___Foo
DE-9791___Bar
DE-9791___Bar
DE-9791___Bar

我复制并粘贴了每一AB-9791___Foo行，所以它们应该是相同的。运行$ grep '9791' Test_grep_uniq_sort.txt | uniq -c给出了这个结果

  1     AB-9791___Foo
  1     DE-9791___Bar // expected: 4 actual: 1, 2, 1
  3     AB-9791___Foo // expected: 4 actual: 1, 3
  2     DE-9791___Bar
  1     DE-9791___Bar

运行$ sort Test_2.txt > Test_2_sort_0.txt然后使用grep | uniqonTest_2_sort_0.txt几乎返回了预期的输出。

  $ grep '9791' Test_2_sort_0.txt | uniq -c
  4     AB-9791___Foo
  1     DE-9791___Bar // this is due to a missing line break / line feed
  3     DE-9791___Bar

手动添加换行符/换行符后一切正常

2 个回答

Voted

Toto · Answer 1 · 2022-05-25T02:06:50+08:00

Best Answer

Toto

2022-05-25T02:06:50+08:002022-05-25T02:06:50+08:00

你必须sort在文件之前。

你可以像这样使用grep和uniq：

 grep '9791' file1 | uniq -c
      2 AB-9791___Foo
      1 DE-9791___Bar

2

MarrekNožka · Answer 2 · 2022-05-25T02:22:47+08:00

MarrekNožka

2022-05-25T02:22:47+08:002022-05-25T02:22:47+08:00

uniq -c对于计数和awk交换列：

$ uniq -c <<END | awk '{print $2 " " $1;}'
AB-9791___Foo
AB-9791___Foo
DE-9791___Bar
END

AB-9791___Foo 2
DE-9791___Bar 1

这里有一些想法：https ://stackoverflow.com/questions/8627014/count-number-of-similar-lines-in-a-file

1

如何对包含特定字符串的文件中的所有行进行分组和计数

更新测试记录

如何减少“vmmem”进程的消耗？

从 Microsoft Stream 下载视频

Google Chrome DevTools 无法解析 SourceMap：chrome-extension

Windows 照片查看器因为内存不足而无法运行？

支持结束后如何激活 WindowsXP？

远程桌面间歇性冻结

子网掩码 /32 是什么意思？

鼠标指针在 Windows 中按下的箭头键上移动？

VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

如何对包含特定字符串的文件中的所有行进行分组和计数

更新测试记录

2 个回答

相关问题