AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题

问题[wc](unix)

Martin Hope
d-b
Asked: 2024-05-29 02:35:42 +0800 CST

wc 获取文件的字符数但排除每行和文件第一行的初始字符?

  • 5

我有一些文本文件,看起来像这样:

Introduction and some meta data
[00:00.000 --> 00:04.380]  Lorem ipsum dolor sit amet, consectetur adipiscing elit.
[00:04.980 --> 00:07.200]  Sed mattis varius ligula vel egestas.

我想统计字符但排除第一行和时间戳,即只统计其中的字符Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed mattis varius ligula vel egestas.

时间戳的长度各不相同(也可能有小时,在上面的示例中只有分钟)。

我该怎么做呢?

wc
  • 2 个回答
  • 37 Views
Martin Hope
BigBoy1337
Asked: 2022-01-13 10:47:52 +0800 CST

如何在标准输出上显示连续的 wc?[复制]

  • 0
这个问题在这里已经有了答案:
如何使用 gnu texttools 执行连续的“wc -l”? (4 个回答)
9 个月前关闭。

假设你有这个程序:

#!/usr/bin/env python
import time
while True: 
    print("True")
    time.sleep(1)

然后你运行它:

./clock.py | wc -l 

这将永远不会返回任何内容,因为它会在输出字数之前等待输出完成。

我想要运行一些东西而不是 wc -l 来显示 1..2..3 几乎就像一个时钟。

wc
  • 1 个回答
  • 75 Views
Martin Hope
Johnny Rollerfeet
Asked: 2020-02-21 09:55:09 +0800 CST

文本文件中所有重复单词的位置(按字数)

  • 6

我想找到一个单词在文本文件中出现的位置——比如一个单词出现在文本中的单词数量——对于该单词的所有实例,但我什至不确定从哪里开始。我想我需要一个循环,以及 grep 和 wc 的某种组合。

例如,这里有一篇关于 iPhone 11 的文章:

周二,该公司表示,其入门级手机 iPhone 11 的起价为 700 美元,而上一款同类机型的起价为 750 美元,这表明苹果正在关注那些不会竞相购买更昂贵手机的消费者。年。

苹果将​​其更先进的机型 iPhone 11 Pro 和 iPhone 11 Pro Max 的起价保持在 1,000 美元和 1,100 美元。该公司在其硅谷园区举行的 90 分钟新闻发布会上推出了这些新手机。

正文共有81个字。

jaireaux@macbook:~$ wc -w temp.txt 
      81 temp.txt

“iPhone”这个词出现了 3 次。

jaireaux@macbook:~$ grep -o -i iphone temp.txt | wc -w
       3

我想要的输出是这样的:

jaireaux@macbook:~$ whereword iPhone temp.txt 
      24
      54
      57

我会怎么做才能得到那个输出?

grep wc
  • 9 个回答
  • 776 Views
Martin Hope
DN1
Asked: 2020-02-01 02:57:56 +0800 CST

如何查找和计算两个文件中 ID 列的匹配数据?

  • 2

我有两个具有匹配染色体位置 ID 的遗传数据集。我想计算文件 1 的染色体位置 ID 出现在文件 2 中的次数。

例如,我的数据如下所示:

文件 1(染色体位置实际上是我的第 125 列,由 暗示...):

Gene  pval    ... Chromosome position ID
ACE   0.002   ... 01:3290834_CT_C_1
NOS   0.01    ... 03:3304593_GA_G_1
BRCA  0.004 . ... 06:6265733_GA_G_1
CYP3  0.34    ... 09:9433933_GA_G_1

文件 2(染色体位置是我的第一列):

Chromosome position ID  Gene  pval
01:1243933_GA_G_1       ACE   0.002
03:3304593_GA_G_1       NOS   0.01
06:6265733_GA_G_1       BRCA  0.004
09:9433933_GA_G_1       CYP3  0.34

我发现很多问题都给出了匹配行的提取,并根据这些问题应用了代码,但我只想获得两个文件之间匹配染色体位置的计数。

目前我正在使用:

awk -F'|' 'NR==FNR{c[$125]++;next};c[$125]' file2.csv file1.txt > file3.txt

wc -l file1.txt
wc -l file3.txt

文件 1 和 3 的行数与我期望的不完全匹配(我希望所有文件 1 都在文件 2 中)并且为了确定发生了什么我需要找到一种方法来执行匹配计数染色体位置列中的行。如果我能找到一种方法来编码“文件 1 的所有染色体位置是否都匹配/出现在文件 3 中?” 这将是理想的,但即使只是计数现在也有效。

所以输出将是一个数字,计算文件 1 中染色体位置列 $125 与文件 2 染色体位置列 $1 匹配的次数。

我正在使用 Linux。

awk wc
  • 2 个回答
  • 425 Views
Martin Hope
zyy
Asked: 2020-01-10 20:04:31 +0800 CST

如何跳过输出的第一行?[复制]

  • 11
这个问题在这里已经有了答案:
如何使用 shell 命令删除文件的前 n 行和最后一行? (9 个回答)
2年前关闭。

这是问题所在,我想计算一下我在 hpc 中拥有的工作数量,但这不是现成的功能之一。所以我做了这个简单的脚本

squeue -u user_name | wc -l

wheresqueue打印所有作业,如下所示

> squeue -u user_name
   JOBID PARTITION NAME     USER ST       TIME  NODES NODELIST(REASON)
 8840441    theory cteq      fxm PD       0:00      1 (Resources)
 8840442    theory cteq      fxm PD       0:00      1 (Priority)
 8840443    theory cteq      fxm PD       0:00      1 (Priority)
 8840444    theory cteq      fxm PD       0:00      1 (Priority)

这将被输送到wc并计算行数。但是,第一行不是作业的条目。计数时如何指示wc跳过第一行?还是我应该只取它的输出wc和减一?

提前致谢!

wc
  • 4 个回答
  • 21329 Views
Martin Hope
Jellyse
Asked: 2019-05-29 00:47:39 +0800 CST

计算具有特定名称的目录中的文件数

  • 5

我在这里找到了这段代码https://www.tldp.org/HOWTO/Bash-Prompt-HOWTO/x700.html这很好地给了我目录中的文件数量。

ls -1 | wc -l

但我只想知道这些文件中有多少以 2009 开头(例如20091210_005037.nc)。

我试过ls -1 | wc -l 2009*了,但这会慢慢列出所有文件,似乎没有给我一个数字。

ls wc
  • 4 个回答
  • 19637 Views
Martin Hope
Z E Nir
Asked: 2018-10-19 05:57:46 +0800 CST

分析 ps|wc 输出

  • -1

首先 - 我想知道当前有多少进程正在运行,所以我使用了这个命令:

$ ps | wc

我期待一个数字,但输出是:

20 115 844

打印了三个数字 - 它们之间有一个“制表符”大小的空格。

这些数字是什么意思?它们是否与我可以与 ps 一起使用的不同“辅助”有关?这可能不是一个很长的数字——这意味着我的操作系统运行超过 20M 个进程……

谢谢!

ps wc
  • 2 个回答
  • 121 Views
Martin Hope
Ulysses
Asked: 2018-02-01 05:37:08 +0800 CST

使用 -grep 计算以 'bar' 开头并以 'i' 或 'n' 结尾的 6 字母单词的数量

  • 0

我想计算以“bar”开头并以“i”或“n”结尾的 6 个字母单词的数量。

例如,给定这个文件:

barxxi
barxxc
barxxn
barqwq
barovo

输出应为 2(整数),因为这些行匹配:

barxxi
barxxn

我的代码如下,但似乎是错误的:

grep -c 'bar??[ni]' /path/file.txt
grep wc
  • 3 个回答
  • 8201 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve