AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 452766
Accepted
user28226
user28226
Asked: 2018-06-30 23:55:03 +0800 CST2018-06-30 23:55:03 +0800 CST 2018-06-30 23:55:03 +0800 CST

用十六进制数值替换不可打印的字符

  • 772

我有一个严重损坏的 Sqlite 文件将所有内容转储到 sql 文件并将其加载到新文件中的常用技巧不起作用,但是使用十六进制编辑器我可以看到我需要恢复的数据在那里

我遇到了这种模式

vim 可以只显示 ASCII 字符,而将其他字节视为二进制数据吗?

vi 将不可打印的字符显示为十六进制

这很棒,会告诉我

‹14›‹07› Testy McTesterson 先生 [email protected]

但是有没有在显示时将其写入文件?

因此,将 vi 在其缓冲区中显示为 ‹14› 的十六进制值实际更改为文本文件中的那些字符

我可以在 vi 中做一个正则表达式搜索替换来做,但是我必须一次为每个不可打印的字符做一个,这是一个非常大的文件

稍后,我计划将‹14›‹07›处理成它应该表示的16位整数,但首先我需要能够将这些作为真实字符放入文本文件中

提前谢谢了

regular-expression vi
  • 2 2 个回答
  • 1779 Views

2 个回答

  • Voted
  1. Best Answer
    meuh
    2018-07-01T04:16:52+08:002018-07-01T04:16:52+08:00

    您可能会查看xxd附带的哪些vim数据,并以十六进制格式转储数据,并在列中转储可打印字符。如果您编辑十六进制,您可以将数据推回xxd -r以将其转换回二进制。

    然而,看看你的最终目标,你可能需要更强大的东西perl,比如我不是专家,但你可能会发现以下有用的东西:

    #!/usr/bin/perl
    # https://unix.stackexchange.com/a/452784/119298
    use strict;
    sub fn{ 
        my ($ch,$ch2,$rest) = @_;
        return sprintf("%5u",(ord($ch)<<8)|ord($ch2)).$rest;
    }
    my $data = join("",<>);
    $data =~ s/(.)(.)([a-zA-Z][ -~]{10,})/fn($1,$2,$3)/ge;
    print $data;
    

    它将标准输入中的所有数据读入变量$data,然后对s/.../.../g由任意 2 个字节后跟一个字母字符(范围 az 和 AZ)、后跟 10 个或更多可打印字符(在范围空间到波浪号,并假设 C 语言环境)。这些部分通过 using 被捕获()为 3 个单独的部分,并由 function 的调用替换fn。这就是e最后的意思。

    该函数只返回一个字符串打印,将 2 个字节转换为整数,并与第三个未更改的参数连接。

    为了提供帮助,这里有一个更简单的版本,它只做你想要的,将非打印字符替换为<..>.

    my $data = join("",<>);
    $data =~ s/([^ -~\n])/sprintf("<%02x>",ord($1))/ge;
    print $data;
    

    这里的模式更简单,即不可打印字符(和换行符)的范围,^意思是not。在查看一个简单的 sqlite 文件时,我发现文本数据之前的字符通常是可打印字符。这就是为什么我使用了一个测试字母起始字符的模式,但您可能需要使用更好的启发式方法。

    • 1
  2. Yuval
    2020-03-31T01:01:35+08:002020-03-31T01:01:35+08:00

    以下将替换 0x00 - 0x20 范围内的非打印字符(不包括 CR、LF、制表符和空格),#xDD#其中DD字符的十六进制表示形式(感谢这个问题很好地定义了范围):

    sed $( (seq 0 8; seq 11 12; seq 14 31) | awk '{ printf("s/\\x%02x/#x%02x#/;", $0, $0) }' )
    

    我seq用来生成替换的字符范围,并awk生成模式sed- 后者进行实际替换。

    你可以用这个来测试它:

    seq 0 32 | awk '{$0 =$0 sprintf("%c",$0)} 1' | sed $( (seq 0 8; seq 11 12; seq 14 31) |  awk '{ printf("s/\\x%02x/#x%02x#/;", $0, $0) }' )
    

    FWIW 对于人们在搜索条件下找到这个的人,在我想处理我自己的损坏文件的高山 docker 图像中,sed不喜欢 NULL 字符,所以我不得不像这样解决它:

    sed $( (seq 1 8; seq 11 12; seq 14 31) |  awk '{ printf("s/\\x%02x/#x%02x#/;", $0, $0) }' ) | tr '\0' '\1' | sed 's/\x01/#x00#/'
    
    • 0

相关问题

  • Tmux 命令模式 - 使用 vi 快捷键

  • 为什么正则表达式与 sed 命令的输入不匹配 [重复]

  • 使用特殊字符转换密码以与期望脚本一起使用

  • 如何在 Debian 9 上的 vi 中插入和删除文本

  • 更少:使用 AND 的多个过滤条件

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    ssh 无法协商:“找不到匹配的密码”,正在拒绝 cbc

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    如何卸载内核模块“nvidia-drm”?

    • 13 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add 返回:“连接代理时出错:没有这样的文件或目录” 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve