dotancohen提出的问题 -unix

dotancohen

Asked: 2025-01-10 05:00:50 +0800 CST

为什么文件在写入之前会发生变化？

7

在 Kubuntu Linux 上，Google Chrome 浏览器会为文件添加校验和，以防止手动编辑文件。所以我正在编写一个脚本来添加校验和。

$ cat .config/google-chrome/Default/Custom\ Dictionary.txt
AATEST
dotancohen
checksum_v1 = 2b7288da7c9556608de620e65308efa4$

没问题，我将复制整个文件（不包括最后一行）并检查其 MD5 哈希值是否与校验和匹配。

$ head -n -1 .config/google-chrome/Default/Custom\ Dictionary.txt > ~/chrome-dict
$ cat ~/chrome-dict
AATEST
dotancohen
$ md5sum ~/chrome-dict
2b7288da7c9556608de620e65308efa4  /home/dotancohen/chrome-dict

正如预期的那样，我们得到了2b7288da7c9556608de620e65308efa4。它匹配！因此，让我们将其添加到文件末尾。

$ { printf "checksum_v1 = " ; printf $(md5sum -z ~/chrome-dict | awk '{print $1}') ; } >> ~/chrome-dict
$ cat ~/chrome-dict
AATEST
dotancohen
checksum_v1 = 08f7dd79a17e12b178a1010057ef5e34$

不，校验和错误！让我们尝试 cat 以确保两个语句之间没有任何内容写入文件printf。

$ head -n -1 .config/google-chrome/Default/Custom\ Dictionary.txt > ~/chrome-dict
$ cat ~/chrome-dict
AATEST
dotancohen
$ { printf "checksum_v1 = " ; printf $(md5sum -z ~/chrome-dict | awk '{print $1}') ; } | cat >> ~/chrome-dict
$ cat ~/chrome-dict
AATEST
dotancohen
checksum_v1 = 08f7dd79a17e12b178a1010057ef5e34$

校验和仍然错误！我们来试试 tmp 文件。

$ head -n -1 .config/google-chrome/Default/Custom\ Dictionary.txt > ~/chrome-dict
$ cat ~/chrome-dict
AATEST
dotancohen
$ { printf "checksum_v1 = " ; printf $(md5sum -z ~/chrome-dict | awk '{print $1}') ; } >> ~/chrome-dict-tmp
$ cat ~/chrome-dict-tmp >> ~/chrome-dict && rm ~/chrome-dict-tmp
$ cat ~/chrome-dict 
AATEST
dotancohen
checksum_v1 = 2b7288da7c9556608de620e65308efa4$

成功了！为什么将输出重定向到文件末尾的一行代码没有~/chrome-dict返回正确的 MD5 哈希值？

dotancohen

Asked: 2022-06-19 11:28:00 +0800 CST

从字符串中删除所有字符，除了特定的多字节范围

1

一个人将如何使用sed或另一种工具来删除除特定多字节范围之外的所有字符？

例如，该范围\xd8\xa0 - \xd9\x8a涵盖以 UTF-8 编码的阿拉伯字符。这是我在使用 sed 时天真的充满希望的尝试：

$ echo "Peace be upon you. السلام عليكم. שלום עליכם. Paz sobre vosotros." | sed -n -e 's|[^\xd8\xa0-\xd9\x8a]||p'
sed: -e expression #1, char 25: Invalid range end

理解sed了多字节字符，那应该给我们留下字符串：

السلام عليكم

我考虑过使用iconv转换为一些特定于阿拉伯语的编码，使用sed，然后转换回来。然而，我正在做的工作并不简单，比如我可能想同时保留阿拉伯语和希伯来语，所以如果可能的话，我想在整个过程中将所有内容都保存在 UTF-8 中。

如果sed不能使用多字节字符，我应该使用什么？我已经搜索了这两个sed和perl解决方案，但没有运气。

请注意，我尝试向UTF-8问题添加标签，但 unix.SE 将其更改为Unicode标签。这里没有 Unicode，这些是存储在磁盘上的编码字符串。我认为应该有一个单独的UTF-8标签。

dotancohen

Asked: 2022-06-11 07:30:21 +0800 CST

为什么“日期”可能会显示 12 小时格式？

2

我总是看到date输出中显示 24 小时。但由于某种原因，我的基于 Debian 的机器现在显示 12 小时时间格式：

$ date
Fri 10 Jun 2022 06:16:47 PM IDT

$ LC_TIME=en_IL.UTF-8 date
Fri 10 Jun 2022 06:17:00 PM IDT

$ LC_ALL=en_IL.UTF-8 date
Fri 10 Jun 2022 18:17:05 IDT

我认为我最近没有改变任何相关的东西。

$ grep LC_ ~/.bashrc
export LC_TIME="en_DK.UTF-8"
$ grep LC_ ~/.profile 
$ locale
LANG=en_IL.UTF-8
LANGUAGE=en_US
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8

我还应该检查或配置什么？

我的目标是拥有这些功能：

24 小时制
YYYY-MM-DD 日期格式
星期从星期日开始
英文文本
啤酒供应低于室温，但不在冰箱冷藏水平
UTF-8 编码

在这些应用程序中：

Bash 命令，例如date.
安基
火狐
雷鸟
KeepassXC
自由办公室
KDE 应用程序，例如 Okular 和 Dolphin
侏儒应用程序

我的设置是 Ubuntu 20.04.4 LTS 上的 KDE 5.18.8。如有必要，我更新到 22.04 没有问题。

dotancohen

Asked: 2022-06-10 00:26:38 +0800 CST

如何知道什么是命令、系统调用、bash 内置函数等？

2

一位同事最近问“什么是man”？在得知并非所有可从 Bash CLI 访问的东西都是命令后，我很谨慎地调用man命令。

man man只是称它为接口：

NAME
       man - an interface to the on-line reference manuals

man有一个可执行文件：

$ which man
/usr/bin/man
$ file /usr/bin/man
/usr/bin/man: ELF 64-bit LSB shared object

程序也是如此man，因为它有一个可执行文件？其他名词可以man是什么？用什么名词来形容呢？真的，我对如何确定任意是什么的一般情况感兴趣，这只是一个thing on the cli例子man。

就此而言，可以在 Bash CLI 上使用的所有东西是什么词？一个包含命令、别名、系统调用等的词？

dotancohen

Asked: 2019-03-13 05:42:51 +0800 CST

谁在吃数据？萨格斯？

2

我正在尝试使用内置的 PHP linter 解析 PHP 文件的递归目录，它的工作原理如下：

$ php -l good.php
No syntax errors detected in good.php

$ php -l bad.php
PHP Parse error:  syntax error, unexpected ''foo'' (T_CONSTANT_ENCAPSED_STRING), expecting ')' in bad.php on line 3
Errors parsing bad.php

我们可以看到通过 linting 的文件输出一行包含No syntax errors，而那些通过 linting 失败的文件输出一行包含Errors parsing.

我看到我在当前目录中递归地有 12147 个 PHP 文件，但是 PHP linter 只输出七行：

$ find . -name \*.php -print0 | xargs -0 ls -l | wc -l
12147

$ find . -name \*.php -print0 | xargs -0 php -l | wc -l
7

由于 PHP 只解析了 7 个文件，我可以使用headwithls来查找一些尚未解析的文件：

$ find . -name \*.php -print0 | xargs -0 ls -l | head
-rw-r--r-- 1 dotan dotan      1927 Jan 13 10:13 ./bootstrap/app.php
-rw-r--r-- 1 dotan dotan      1076 Jan 13 10:13 ./bootstrap/autoload.php
-rw-rw-r-- 1 dotan dotan     25620 Mar 12 12:29 ./bootstrap/cache/services.php
-rw-r--r-- 1 dotan dotan      2493 Jan 13 10:13 ./bootstrap/paths.php
-rwxrwxr-x 1 dotan dotan     20008 Mar 12 12:30 ./config/app.php
-rw-r--r-- 1 dotan dotan      3304 Jan 13 10:13 ./config/auth.php
-rw-r--r-- 1 dotan dotan      1819 Jan 13 10:13 ./config/cache.php
-rw-r--r-- 1 dotan dotan      3751 Jan 13 10:13 ./config/cartalyst.sentinel-addons.social.php
-rw-r--r-- 1 dotan dotan      6849 Jan 13 10:13 ./config/cartalyst.sentinel.php
-rw-r--r-- 1 dotan dotan      1020 Jan 13 10:13 ./config/compile.php
xargs: ls: terminated by signal 13

$ find . -name \*.php -print0 | xargs -0 php -l
No syntax errors detected in ./bootstrap/paths.php
No syntax errors detected in ./vendor/watson/validating/src/ValidatingTrait.php
No syntax errors detected in ./vendor/giggsey/libphonenumber-for-php/src/libphonenumber/data/PhoneNumberMetadata_SI.php
No syntax errors detected in ./vendor/php-vcr/php-vcr/src/VCR/Event/BeforePlaybackEvent.php
No syntax errors detected in ./vendor/laravel/framework/src/Illuminate/Support/Facades/Blade.php
No syntax errors detected in ./resources/views/emails/appointment/updated/body.blade.php
No syntax errors detected in ./app/WL/Modules/Location/Commands/RemoveClientLocationCommand.php

然而，当我尝试解析其中一个文件时，我发现它确实产生了预期的输出（解析通过或失败）：

$ php -l ./bootstrap/cache/services.php
No syntax errors detected in ./bootstrap/cache/services.php

我已经检查过，无论是通过还是失败的 linting 都不会将预期的行打印到 stderr：

$ php -l good.php | grep rr
No syntax errors detected in good.php

$ php -l bad.php | grep rr
PHP Parse error:  syntax error, unexpected ''foo'' (T_CONSTANT_ENCAPSED_STRING), expecting ')' in bad.php on line 3
Errors parsing bad.php

我现在应该检查什么？我的最终目标是整理所有文件，然后用 grepError parsing解决这些问题。

为什么文件在写入之前会发生变化？

从字符串中删除所有字符，除了特定的多字节范围

为什么“日期”可能会显示 12 小时格式？

如何知道什么是命令、系统调用、bash 内置函数等？

谁在吃数据？萨格斯？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

dotancohen's questions