AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 699178
Accepted
Fajela Tajkiya
Fajela Tajkiya
Asked: 2022-04-16 05:57:18 +0800 CST2022-04-16 05:57:18 +0800 CST 2022-04-16 05:57:18 +0800 CST

磁盘上的文件与 tar 归档中的文件之间的总大小差异

  • 772

我是一个新的 Linux 用户,还在学习它。据我了解,默认情况下,该tar命令(单独且不带z,j或等选项J)不会压缩文件。它仅将多个文件捆绑到一个文件中。下面是我的测试。

root@u2004:~# du -sh /etc/
11M /etc/
root@u2004:~# tar cf etc.tar /etc
tar: Removing leading `/' from member names
root@u2004:~# du -sh etc.tar 
6.6M    etc.tar
root@u2004:~#

可以看到,/etc目录下的文件一共11M。将它们归档到单个文件后,新的归档文件为 6.6M。大小差异从何而来?是因为文件是连续写入并挤在一起的吗?

tar
  • 1 1 个回答
  • 69 Views

1 个回答

  • Voted
  1. Best Answer
    White Owl
    2022-04-16T07:00:46+08:002022-04-16T07:00:46+08:00

    默认情况下du,以“块”为单位测量文件大小。因此,每个小文件(小于一个块)根据需要占用尽可能多的块,其余部分为空。但它不能被另一个文件使用(因为一个块只能属于一个文件)。因此,您有一些“浪费”的字节数。

    tar另一方面,连接所有文件。“浪费”的空间要少得多。

    如果您想更好地预测 tar 大小,可以使用 key -bfor 。du

    意思是如果你跑

    $ du -shb /etc
    $ du -shb etc.tar 
    

    你会得到彼此更接近的数字。差异将来自文件的描述。第一种情况下的目录大小和第二种情况下的 tar 标头大小。

    要进一步调查,您可以从以下内容开始:

    $ df /some_test_dir
    

    这将告诉您该目录所在的物理设备(列文件系统)

    $ sudo /sbin/dumpe2fs /dev/?? |grep 'Block size'
    

    在此处定义您的设备,您将获得该设备上块的大小。

    如果你这样做du /some_test_dir并且那个目录是空的 - 你会得到一个块大小。

    如果您现在放置一个文件(或许多文件),所有这些文件的长度都为零,那么du在目录上仍然会给出一个块大小 - 这是因为文件根本不占用任何空间,以及关于它们的信息存储在目录的块中。

    对于下一个测试,在这个目录中创建 N 个文件,每个文件的大小都小于一个块。实际大小无关紧要,它必须大于零,小于一个块。现在du目录上会给你(N+1)*block。这里每个文件都占用一个块,而目录本身占用一个块。

    如果您有很多文件(多少取决于文件系统),那么目录本身可以增长,以便在其中存储文件信息。但是目录大小将始终是块大小的倍数。

    • 3

相关问题

  • 从 /var/log 提取和归档以 .log 结尾的文件时删除路径名

  • 此 curl/tar 示例中裸破折号的含义

  • tar 目录只发送修改过的文件块

  • 在 Solaris 上;查找、附加到 tar 球并压缩问题

  • bsdtar:如何避免覆盖现有文件信息?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve