AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 413712
Accepted
Dimitrios Desyllas
Dimitrios Desyllas
Asked: 2017-12-30 12:38:13 +0800 CST2017-12-30 12:38:13 +0800 CST 2017-12-30 12:38:13 +0800 CST

查找包含十六进制和随机字符串的字符串有多少十六进制值

  • 772

我有~/dummy_hex.txt包含十六进制和随机字符串的文件:

\x12\xA1\xF1\xE3somegibberigh

我想计算上面的字符串有多少个十六进制值(\x^hex_digit^^hex_digit^ 组)。在上面的示例中,我希望运行命令以返回数字4。

换句话说,我想在我的终端上输入:

command ^file_having hex^

并返回值 4

到目前为止,我尝试通过以下方式做到这一点:

sed 's/[^\x[0-9A-Fa-f][0-9A-Fa-f]]//g' dummy_hex.txt | awk '{ print length }'

但是由于正则表达式错误类型,似乎以某种方式返回了错误的结果。你能告诉我如何使用完整的 PCRE 兼容正则表达式和 sed 来做到这一点吗?

或者,我想计算我的字符串包含多少个十六进制值。

编辑 1

另一种方法是计算\x字符串的出现次数,但这可能会计算任何\x可能没有跟随指示十六进制字符串的值的杂散。

 sed 's/[^\x]//g' dummy_hex.txt | awk '{ print length }'

此外,我尝试使用-r启用 PCRE 的选项来做到这一点:

 sed -r 's/^\\x[0-9A-Fa-f][0-9A-Fa-f]]/g' dummy_hex.txt | awk '{ print length }'

但我得到了错误:

sed: -e 表达式 #1, char 31: 未终止的 `s' 命令

text-processing sed
  • 4 4 个回答
  • 1275 Views

4 个回答

  • Voted
  1. Best Answer
    Jeff Schaller
    2017-12-30T13:11:05+08:002017-12-30T13:11:05+08:00

    使用grep支持扩展正则表达式的选项和-o选项:

    grep -Eo '\\x[[:xdigit:]]{2}' input | wc -l
    

    为了满足以下要求command filename:

    function counthex() {
      grep -Eo '\\x[[:xdigit:]]{2}' "$1" | wc -l
    }
    

    作为:

    counthex input
    
    • 2
  2. user232326
    2017-12-30T13:01:08+08:002017-12-30T13:01:08+08:00

    如果您计算没有十六进制的字符:

    $ sed 's/\([^\]*\)\\x[0-9A-Fa-f][0-9A-Fa-f]/\1/g' dummy_hex.txt | LC_ALL=C wc -c
    14
    

    并从整个文件数中减去:

    $ <dummy_hex.txt wc -c
    30
    

    您可以获得十六进制字符的计数(乘以 4)。在一个脚本中:

    #!/bin/bash
    a=$(sed 's/\([^\]*\)\\x[0-9A-Fa-f][0-9A-Fa-f]/\1/g' dummy_hex.txt | wc -c)
    b=$(<dummy_hex.txt wc -c )
    count=$(( (b-a)/4 ))
    echo "$count"
    

    印刷:

    $ ./script
    4
    

    请记住 wc 计算字节数(不是依赖于语言环境的字符)。

    • 1
  3. thrig
    2017-12-30T13:03:14+08:002017-12-30T13:03:14+08:00
    $ cat input
    bla\x12\xA1\xF1
    \xE3bla
    $ perl -nle '$c++ while m/\\x[[:xdigit:]]/g; END { print $c }' input
    4
    $ 
    

    基本上循环而不打印输入(perldoc perlrun),为每个匹配增加一个计数器,然后打印该计数。

    • 1
  4. Dimitrios Desyllas
    2017-12-30T13:04:13+08:002017-12-30T13:04:13+08:00

    另一种解决方案是使用已安装的 perl 来执行此操作:

    perl -lne 'print my $c = () = /\\x[[:xdigit:]]+/' dummy_hex.txt
    

    如果您不想编写脚本(例如,在包含要执行的命令的指令表上),这提供了一个快速简便的单行器。

    • 0

相关问题

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 在awk中的两行之间减去相同的列

  • 多行文件洗牌

  • 如何更改字符大小写(从小到大,反之亦然)?同时[重复]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    JSON数组使用jq来bash变量

    • 4 个回答
  • Marko Smith

    日期可以为 GMT 时区格式化当前时间吗?[复制]

    • 2 个回答
  • Marko Smith

    bash + 通过 bash 脚本从文件中读取变量和值

    • 4 个回答
  • Marko Smith

    如何复制目录并在同一命令中重命名它?

    • 4 个回答
  • Marko Smith

    ssh 连接。X11 连接因身份验证错误而被拒绝

    • 3 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Marko Smith

    systemctl 命令在 RHEL 6 中不起作用

    • 3 个回答
  • Marko Smith

    rsync 端口 22 和 873 使用

    • 2 个回答
  • Marko Smith

    以 100% 的利用率捕捉 /dev/loop -- 没有可用空间

    • 1 个回答
  • Marko Smith

    jq 打印子对象中所有的键和值

    • 2 个回答
  • Martin Hope
    EHerman JSON数组使用jq来bash变量 2017-12-31 14:50:58 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Drux 日期可以为 GMT 时区格式化当前时间吗?[复制] 2017-12-26 11:35:07 +0800 CST
  • Martin Hope
    AllisonC 如何复制目录并在同一命令中重命名它? 2017-12-22 05:28:06 +0800 CST
  • Martin Hope
    Steve “root”用户的文件权限如何工作? 2017-12-22 02:46:01 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST
  • Martin Hope
    Cbhihe 将默认编辑器更改为 vim for _ sudo systemctl edit [unit-file] _ 2017-12-03 10:11:38 +0800 CST
  • Martin Hope
    showkey 如何下载软件包而不是使用 apt-get 命令安装它? 2017-12-03 02:15:02 +0800 CST
  • Martin Hope
    youxiao 为什么目录 /home、/usr、/var 等都具有相同的 inode 编号 (2)? 2017-12-02 05:33:41 +0800 CST
  • Martin Hope
    user223600 gpg —list-keys 命令在将私钥导入全新安装后输出 uid [未知] 2017-11-26 18:26:02 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve