:>filename.txt
例如:
root@box$ dd if=/dev/zero of=file.txt count=1024 bs=1024
1024+0 records in
1024+0 records out
1048576 bytes (1.0 MB, 1.0 MiB) copied, 0.00536175 s, 196 MB/s
root@box$ ll
total 1024
-rw-r--r-- 1 root root 1048576 Nov 15 14:40 file.txt
root@box$ :>file.txt
root@box$ ll
total 0
-rw-r--r-- 1 root root 0 Nov 15 14:40 file.txt
这与一个不同rm
吗?它是否比其他类似的归零文件或删除文件的方法更快或更慢?
正如您所发现的,这只会清空文件内容(它会截断文件);这与
rm
实际rm
完全删除文件不同。此外,如果文件尚不存在,:>file.txt
将实际创建该文件。:
是一个“什么都不做的命令”,它将成功退出并且不产生任何输出,因此它只是清空文件的一种简短方法。在大多数 shell 中,你可以简单地做得到>file.txt
相同的结果。它也可能比其他方法(例如可能是外部命令)稍微快echo >file.txt
一点echo
。此外,将在使文件没有任何内容的位置
echo >file.txt
放置一个空行。file.txt
:>file.txt
是的,它不同于
rm
.rm
将删除该文件。:>filename.txt
清空文件,将其保留在那里,但大小为零字节。shell 调用
>filename.txt
将一些输出重定向到文件“filename.txt”以完全替换它。因此,shell 必须在将输出写入给定文件之前清除给定文件的所有内容。要重定向的输出是执行命令的输出。喜欢:
将使名为 filename.txt 的文件准确(且仅)包含字符串
Hello
。执行:
将擦除文件中的所有内容,然后写入
New Value
它。如果命令没有输出,例如 command
true
,则文件将保持为空(截断)。一个也是 shell 内置命令的命令是
:
(只是一个双点(冒号))并且没有输出。作为内置命令,它比外部命令true
(也没有输出)更快。所以,要么:将从命名文件中删除所有内容,
filename.txt
如果不存在则将其创建为空文件。这与 rm 不同,因为 rm 会使文件从 中消失
ls
,而不是使文件包含 0 字节。同样,该文件没有被删除(从 给出的列表中消失
ls
)它转换为一个空文件(包含 0 个字节)。它应该比调用外部命令清空文件更快。必须创建一个子 shell 来加载可执行文件和
exec
命令使得外部命令比内置命令慢:
。类似的解决方案是(一些设置
$?
为 1):re:性能:这在 shell 中是尽可能高效的;仅要求内核截断现有文件应该比取消链接文件并重新创建具有相同名称的新 inode 更有效。除非你想删除文件,在这种情况下
rm
还是unlink
它。:
是一个内置的 shell,因此它避免了 fork/exec。true
普通现代贝壳中的等价物也是如此。>foo
或true > foo
通过open(path, O_WRONLY|O_TRUNC|O_CREAT, 0666)
系统调用让 shell 截断文件。或者在 Linux 上使用 DASH 实践,从
strace sh
输出:openat(AT_FDCWD, "foo", O_WRONLY|O_CREAT|O_TRUNC, 0666) = 3
这是等效的。然后它必须
close()
再次到那个FD。事实上,当你使用 DASH 时,它并没有特殊情况:>
,它会跳过以下环节:在 DASH 中使用
> foo
会导致相同的系统调用序列,实际上是重定向 fd1 然后恢复它。我没有检查bash
或其他贝壳。但这仍然比创建一个新进程来运行要便宜得多,该进程
truncate -s 0 foo
将(希望)进行一个可能比+更有效的truncate("foo", 0)
系统调用。open
close
从像 C 这样的语言(或任何具有系统调用绑定的语言)中,截断您不想打开的文件可以通过直接
truncate
系统调用最有效地完成。在 Dash 中,
3>foo
导致以下系统调用序列:打开一个新的 fd 导致它已经是 fd 3,避免任何重复。这是 dash 中最有效的方式,可能比
>foo
. 如果这很重要,那么 shell 脚本对于您的任务来说是错误的语言!!但你确实问了。启用 Spectre+Meltdown 缓解
-ENOSYS
后,在现代 Intel x86-64 上,即使是糟糕的系统调用也至少需要数千个时钟周期,即微秒。syscall
只需一条指令,用户->内核->用户往返行程的数百个。当然,路径查找等需要大量时间,文件系统代码也是如此。并且进入内核模式并返回通常会驱逐一些缓存,从而使用户空间在返回时运行得更慢。元数据写回磁盘后的实际 I/O 成本取决于文件系统。像 XFS 或现代 ext4 这样的 FS 只对整个文件使用 1 个或几个大区,可以在 O(1) 时间内轻松释放大量空间。或者 O(n) 其中
n
是扩展区(碎片)的数量而不是字节大小。根据 FS,如果扩展信息直接存储在 inode 中,而不是间接块中,那么添加到空闲列表中就少了一件事情。
I/O 成本类似于取消链接文件,但您不必释放 inode 或修改目录条目。您仍然需要在截断时更新 inode 中的 mtime 和 ctime,但如果大小发生变化,您无论如何都必须编写它。