AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 733150
Accepted
g.pickardou
g.pickardou
Asked: 2023-01-26 21:49:38 +0800 CST2023-01-26 21:49:38 +0800 CST 2023-01-26 21:49:38 +0800 CST

应用程序的稀疏文件有多透明?

  • 772

我希望我理解稀疏文件的概念。我也知道cp命令--sparse=...

然而,当谷歌搜索实际应用程序时,我发现关于使用通用操作系统文件 I/O API 读/写文件的应用程序的透明性的含糊不清的陈述(我的意思是不是在极低的水平,只是 fopen(), fclose () ETC)

阅读博客、解释什么是关于应用程序(例如测试编辑器)如何通过显式向稀疏文件写入零来“破坏”稀疏文件时的解释并不清晰。我认为这就是重点,如果有一个稀疏文件,并且应用程序写入零,则不会进行物理存储。应用程序不必知道这一点,也不必处理间隙等事情,这是文件系统的责任。

问题

假设有一个稀疏的现有文件。它对应用程序是否完全透明?假设有一个 1G 的稀疏文件,它的第一个字节是非零的,所有其他字节都是零。当“普通”应用程序打开该文件时,我想它可以打开它,会看到它的长度为 1G,并且可以寻找到中间(0.5G),因为它不是稀疏的,可以写入一个非零字节中间,保存,关闭,它会在文件系统上保持稀疏,不是吗?

文件会“自动”稀疏吗?我的意思是,一个应用程序只是创建一个文件,然后写入一堆零,然后写入,是否是稀疏的?如果不是,应用程序应该如何将该文件创建为稀疏文件?

filesystems
  • 1 1 个回答
  • 546 Views

1 个回答

  • Voted
  1. Best Answer
    Stephen Kitt
    2023-01-26T22:26:06+08:002023-01-26T22:26:06+08:00

    在大多数情况下,稀疏文件对程序是透明的,程序不需要关心它们正在处理的文件是否是稀疏文件。

    稀疏文件是通过跳过块、在文件中创建空洞而不是通过写入零来创建的。如果程序查找文件末尾,然后导致文件大小更新(通过写入更多数据),或将文件“截断”到比其包含的数据更长的长度,则生成的文件将是稀疏的(如果底层文件系统支持稀疏文件)。

    稀疏文件在读取时是透明的(空洞被读取为零),但在写入时不是:将任何数据写入块会强制分配并最终写入。特别是,这意味着如果底层文件系统已满,则在不更改文件长度的情况下写入文件可能会失败。这并不意味着代码编写文件应该有稀疏文件的特殊情况;它只是意味着应该处理所有写入的错误(正如您所期望的那样)。

    的 Linux 实现lseek提供扩展以允许分析文件中的漏洞。

    文件不会自动变得稀疏;这就是 GNUcp的--sparse选项存在的原因——它配置cp为检测零运行本身并在目标中产生漏洞而不是写入它们。如果文件自动变得稀疏,就没有必要了。

    在您的场景中,一个 1G 的文件在开始时有一个字节的数据将在磁盘上有一个块,包含该字节后跟一个块中适合的许多零。文件的其余部分将是一个大洞。向文件中间写入一个零将分配一个块并用零填充它。然后该文件将包含一个块、一个接近 0.5G 的空洞、另一个块和另一个空洞。

    • 11

相关问题

  • 我应该在 NAS 的 SD 卡中使用哪个文件系统?

  • 如何提前知道 .zip 内部是否有父目录

  • Virtualbox 动态分配磁盘 *.vdi 不断增长

  • du/df 和 ls 报告不同的磁盘使用情况

  • Linux 内核开发人员如何处理数百万行代码的工作?他们是一种方法吗?[关闭]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve