numfmt
即使输入数字在另一个范围内,我也可以输出缩放到 Kilo 的数字吗,就像在这个示例 Giga 中一样?
> LC_NUMERIC="en_US.UTF-8" numfmt --to=si --format=%.6f --suffix=Wh 20621589913
20.621590GWh
在我看来这是一个合理的功能,但我无法通过阅读手册页找到它。
numfmt
即使输入数字在另一个范围内,我也可以输出缩放到 Kilo 的数字吗,就像在这个示例 Giga 中一样?
> LC_NUMERIC="en_US.UTF-8" numfmt --to=si --format=%.6f --suffix=Wh 20621589913
20.621590GWh
在我看来这是一个合理的功能,但我无法通过阅读手册页找到它。
似乎每个核心 Linux 命令都有不同的标准输出格式。此外,其他脚本/应用程序并不总是容易/安全/一致地解析这些格式。
是否有包装器或规范或库提供统一/一致的输出以便于解析(如 JSON 或 UniqueName:Value 编码)?
ps -A
PID TTY TIME CMD
558 tty1 00:00:00 startx
576 tty1 00:00:00 xinit
577 tty1 00:00:37 Xorg
590 tty1 00:00:01 awesome
8281 pts/0 00:00:00 ps
虽然lshw
是键:值输出,但很难解析成唯一的键:值对。
cedar
description: Computer
width: 64 bits
capabilities: smp vsyscall32
*-core
description: Motherboard
physical id: 0
*-memory
description: System memory
physical id: 0
size: 7936MiB
*-cpu
product: Intel(R) Core(TM) i5-6300U CPU @ 2.40GHz
vendor: Intel Corp.
physical id: 1
bus info: cpu@0
size: 2611MHz
capacity: 3GHz
<SNIP>
ls -l
total 36
drwxr-xr-x 2 guy guy 4096 Nov 19 08:41 Desktop
drwxr-xr-x 2 guy guy 4096 Dec 26 13:37 Downloads
drwxr-xr-x 3 guy guy 4096 Nov 7 19:39 go
drwxr-xr-x 6 guy guy 4096 Jan 15 12:42 play
drwxr-xr-x 12 guy guy 4096 Jan 16 19:27 repo
drwxr-xr-x 3 guy guy 4096 Oct 15 18:39 RiderProjects
drwxr-xr-x 8 guy guy 4096 Jan 13 17:38 scripts
drwxr-xr-x 12 guy guy 4096 Jan 10 16:48 source
drwxr-xr-x 6 guy guy 4096 Jan 4 14:31 temp
file /bin/bash
/bin/bash: ELF 64-bit LSB pie executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, BuildID[sha1]=6c75f9f0f273cf6549f078b042c0a3f5a04f0357, for GNU/Linux 4.4.0, stripped
PowerShell Core等一些 shell具有通用的内部对象模型,用于在函数之间进行一致的数据配对。有类似 linux core utils 的东西吗?
lshw
, lscpu
,ps
不是 GNU coreutils
Stéphane Chazelas
的一部分我想创建一个指向相对符号链接的相对符号链接,而不是相对符号链接的目标。似乎在创建相对符号链接时会ln
解析TARGET
而不是指向实际的TARGET
. 这个过程可以跳过吗?在下面的示例中,我想rsym-to-existing-rsym.txt
指向rsym-to-target.txt
,而不是target.txt
。
当我为尚不存在的符号链接创建符号链接时,它可以工作(下面示例中的rsym-to-future-rsym.txt
-> future-rsym-to-target.txt
->target.txt
链)。
# Create initial structure
$ mkdir -p temp
$ touch temp/target.txt
# Now, create relative symlinks
$ ln -s -r temp/target.txt temp/rsym-to-target.txt
$ ln -s -r temp/rsym-to-target.txt temp/rsym-to-existing-rsym.txt
# Note that at this point temp/future-rsym-to-target.txt doesn't exist yet
$ ln -s -r temp/future-rsym-to-target.txt temp/rsym-to-future-rsym.txt
$ ln -s -r temp/target.txt temp/future-rsym-to-target.txt
$ tree -F temp/
# Note that rsym-to-existing-rsym.txt points to target.txt, not to rsym-to-target.txt
temp/
├── future-rsym-to-target.txt -> target.txt
├── rsym-to-existing-rsym.txt -> target.txt
├── rsym-to-future-rsym.txt -> future-rsym-to-target.txt
├── rsym-to-target.txt -> target.txt
└── target.txt
# Maybe the tools I'm using are just nice to me and resolve final paths?
# No, when I delete rsym-to-target.txt symlink rsym-to-existing-rsym.txt still points to target.txt
$ rm temp/rsym-to-target.txt
tree -F temp/
temp/
├── future-rsym-to-target.txt -> target.txt
├── rsym-to-existing-rsym.txt -> target.txt
├── rsym-to-future-rsym.txt -> future-rsym-to-target.txt
└── target.txt
运行时install
(GNU Coreutils 实现),我想知道是否可以保留源文件的所有权和权限。我知道默认情况下它安装为755
,您可以使用 更改它-m
,但是是否可以保留与源文件相同的权限和所有权?
我知道它具有保留所有权和权限的功能,但是在我的情况下,如果可能的话cp
,我需要使用.install
我找不到任何关于这种行为改变的参考
$ mkdir --version
mkdir (GNU coreutils) 9.0
Copyright (C) 2021 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <https://gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
Written by David MacKenzie.
这些文件夹都不存在。
$ mkdir asdfg/qwerty
mkdir: created directory 'asdfg'
mkdir: created directory 'asdfg/qwerty'
但是,对于 mkdir (GNU coreutils) 8.25,行为符合预期。
➜ ~ mkdir asdfg/qwerty
mkdir: cannot create directory ‘asdfg/qwerty’: No such file or directory
我想要一种从参考管理器 Zotero 导出笔记的简单方法。我首先选择多个笔记并将它们拖到一个空白文本文件中。我还希望实现笔记的“原子性”,因此我需要将生成的文本文件拆分,其中包含由破折号分隔的部分中的各个笔记。然后我想使用我给每个注释的标题来命名新文件,即:用每个部分的第一行重命名。我想将这些新文件保存为降价文件。
我编写的脚本是由网络上的贡献者对这些功能中的每一个的建议组成的。在与与我有类似用例的同事分享之前,我试图确保我正确理解了脚本中的命令。我对“head”命令中“$f”周围需要引号的理解(通过阅读 Gilles 对另一个问题的回答 - 请参见下面的参考链接)似乎不正确。我尝试了不带引号的脚本并得到了相同的结果。是否真的不需要双引号,因为“$f”出现在作业的右侧?它们只是因为默认情况下双引号比记住不需要它们更容易吗?任何进一步的解释将不胜感激。
Notes_test.txt 中的输入文件示例如下
This is note 1
It has some notes
--------------------------------------------------
This is note 2
It has some more notes
它的输出应该是两个文件:
This is note 1.md
This is note 2.md
这是我在命令行上使用的脚本:
csplit Notes_test.txt -f_ -z -b'%03d.md' /--------------------------------------------------/1 {*} && sed -i '/./,$!d' *.md && for f in *.md
do
f1=$(head -n1 "$f")
mv -n "$f" "$f1.md"
done
这是我迄今为止对命令的理解:
-fPREFIX 使用 PREFIX 作为输出文件名前缀。在这种情况下,指定了一个下划线:我看到的“_”只是一个占位符。
-z 禁止生成零长度输出文件。我认为这是必要的,因为否则 csplit 将在每次运行结束时通过拆分原始文件生成一个空文件。
-bSuffix 使用 SUFFIX 作为输出文件名的后缀。在这种情况下:“md”
%03d 将 3 位数字作为文件名的占位符。在 FelixJN 的建议下,我在 3 之前添加了零。
/---------------------------------------------------- -/1 指定拆分的分隔符,拆分在“-”行下方 2 行(计数从 0 开始)。
{*} 告诉 bash 运行拆分直到文件结束。正如 Felix 指出的那样,“{n}”是要执行的拆分数。在这种情况下,“*”表示尽可能多地做。
&& 表示在上一条命令完成的情况下执行下面的命令
sed -i 指示 sed 对具有特定后缀的文件进行操作 '/./,$!d' 表示“删除文件头的空白行” 再次感谢 Felix 解释这是指定 sed 工作的范围: 一个 ”。” 表示任何字符,因此它指定文档中出现的第一个字符。由于空行没有任何字符,我们需要应用否定“!” 定义范围后。范围由模式 /"start"/,/"end"/ 定义,以在字符串 "start" 和 "end" 之间应用命令。$ 指的是最后一行,因此范围是文档中的所有非空行。应用否定使用“!” 意思是“NOT”,即告诉 sed 选择与前一个范围相反的值。在这种情况下,第一行之前的所有行都带有任何字符。"d" 然后删除这些行。
*.md 表示“任何名称后缀为 .md”
f1=$(head -n1 "$f") 表示:将 f1 定义为文件的第一行(“head”表示“第一行”)。这是通过使用变量符号“$”来定义“f1”来完成的,它将作为新文件名(减去后缀)的占位符(在脚本的下一行)。“head”是一个 bash 命令,通常输出每个文件的前 10 行: head [OPTION]... [FILE]... 选项 -n1 指定仅输出一行。这里,“$f”不是指定一个特定的文件,而是指定“所有文件”。需要在 "$f" 周围加上引号,以便忽略空格(否则 $f 使用空格作为字段分隔符并进一步拆分文件 - 请参阅下面的参考链接)。
mv -n "$f" "$f1.md" 意思是:将每个文件重命名为 "f1.md"
bash 命令“mv”采用选项和参数: mv [OPTION]... [-T] SOURCE DEST 即:“将 SOURCE 重命名为 DEST。” -n 选项代表 --no-clobber “不要覆盖现有文件”。我认为这是以防万一有文件(注释)具有相同的第一行。
请参阅https://www.tutorialspoint.com/unix_commands/csplit.htm和 coreutils 以了解https://www.gnu.org/software/coreutils/manual/coreutils.pdf 和https://www .howtoforge.com/linux-csplit-command/ Q2.如何使用正则表达式拆分文件?为什么我的 shell 脚本会因空格或其他特殊字符而窒息 ?什么时候需要双引号?
使用expand
,我不明白它将制表符转换为多少个空格。来自info expand
:
默认情况下,expand 将所有制表符转换为空格。它在输出中保留退格字符;他们减少选项卡计算的列数。默认操作等效于 -t 8(每 8 列设置选项卡)。
但是:
$ cat file
aa bb
$ cat -A file
aa^Ibb$
$ wc -m file
6 file
$ expand file > file2
$ cat -A file2
aa bb$
$ wc -m file2
11 file2
在这里,它将选项卡转换为 6 列。为什么?
-b,--之前
分隔符附加到文件中它之前的记录的开头。
而且我无法理解以下输出:
$ echo -e "Hello\nNew\nWorld\n!" > file
$ tac file
!
World
New
Hello
$ tac -b file
!
World
NewHello
New
为什么and之间没有换行符Hello
?
一些 GNU coreutils 实用程序喜欢sort
并shuf
使用文件作为有效地服务于种子的东西。文件大小重要吗?
推荐的方式https://www.gnu.org/software/coreutils/manual/html_node/Random-sources.html使用基于 openssl 的方法,需要相当长的时间。
如果我只使用如下 6 个字母的单词怎么办?这是否会影响所述实用程序创建伪随机性的能力?
shuf -i1-10 --random-source=<(echo durian)
在我的系统(最近更新的 Arch Linux)上,联机帮助页stdbuf
的“BUGS”部分包含以下内容:
在 GLIBC 平台上,指定缓冲区大小,即使用完全缓冲模式将导致未定义的操作。
除了有点好奇为什么会这样以及“未定义的操作”是什么意思之外,我最担心的是这是否意味着我永远不应该为命令指定缓冲区大小,以及它是否会在我面前爆炸如果我愿意。