surfmuggle提出的问题 -computer

surfmuggle

Asked: 2022-05-25 01:34:19 +0800 CST

如何对包含特定字符串的文件中的所有行进行分组和计数

我想过滤文件中包含的所有行，mySearchString然后将它们组合在一起并计算它们。

示例查找包含的所有行9791

AB-9791___Foo
AB-9791___Foo
DE-9791___Bar
AB-0001___Foo

使用 $ grep "9791" myFile.txt给出了这个结果

AB-9791___Foo
AB-9791___Foo
DE-9791___Bar 
// 0001 was filtered out

这个结果应该像这样分组和计数（如 SQL Group by Count）

AB-9791___Foo     2
DE-9791___BAR     1

这个答案使用 perl，但我们的机器上没有安装 perl。

什么工具（grep、awk、sed或其他）可用于实现第二部分的分组和计数？

更新测试记录

在我的测试文件Test_2.txt中，这些行是写的

AB-9791___Foo
DE-9791___Bar
AB-0001___Foo
AB-9791___Foo
AB-9791___Foo
AB-9791___Foo
DE-9791___Bar
DE-9791___Bar
DE-9791___Bar

我复制并粘贴了每一AB-9791___Foo行，所以它们应该是相同的。运行$ grep '9791' Test_grep_uniq_sort.txt | uniq -c给出了这个结果

  1     AB-9791___Foo
  1     DE-9791___Bar // expected: 4 actual: 1, 2, 1
  3     AB-9791___Foo // expected: 4 actual: 1, 3
  2     DE-9791___Bar
  1     DE-9791___Bar

运行$ sort Test_2.txt > Test_2_sort_0.txt然后使用grep | uniqonTest_2_sort_0.txt几乎返回了预期的输出。

  $ grep '9791' Test_2_sort_0.txt | uniq -c
  4     AB-9791___Foo
  1     DE-9791___Bar // this is due to a missing line break / line feed
  3     DE-9791___Bar

手动添加换行符/换行符后一切正常

如何对包含特定字符串的文件中的所有行进行分组和计数

更新测试记录

如何减少“vmmem”进程的消耗？

从 Microsoft Stream 下载视频

Google Chrome DevTools 无法解析 SourceMap：chrome-extension

Windows 照片查看器因为内存不足而无法运行？

支持结束后如何激活 WindowsXP？

远程桌面间歇性冻结

子网掩码 /32 是什么意思？

鼠标指针在 Windows 中按下的箭头键上移动？

VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

surfmuggle's questions

更新测试记录