如何轻松加密文件？

Question

user732542

Asked: 2019-01-23 01:36:05 +0800 CST2019-01-23 01:36:05 +0800 CST 2019-01-23 01:36:05 +0800 CST

100+ GB tar.gz 文件无法正确解压

772

我使用Download Accelerator Plus在 tar.gz 中下载了一个 120 GB 的数据集，并使用以下命令将其解压缩：

tar -xvzf train_val2018.tar.gz

提取后的数据集应包含略多于 8,142 个文件夹和正好 461,939 个图像文件。

当我打开提取的文件夹时，它确实包含数据集的一部分。但是，其中很大一部分丢失了 - 它仅包含 3,542 个文件夹和 179,689 个文件。

在 Ubuntu 上使用文件资源管理器或内置文件提取器 GUI 来提取它只会变得更糟。我也在 Windows 上尝试过各种应用程序，例如 WinZip、WinRAR 和 7Zip。这些都不起作用，但他们的问题是他们在如此大的数据集上存在内存问题。

文件是否已损坏？该文件的大小与他们在数据集网站中提到的大小相同，并且我已经使用 DAP 下载了几个较大的文件，并且从未遇到过损坏问题。出于这个原因，我想知道内置提取器是否有一些限制或其他问题。

我指的数据集是iNaturalist 2018 Contest Dataset。

2 个回答

Voted

Rinzwind · Answer 1 · 2019-01-23T01:46:59+08:00

Rinzwind

2019-01-23T01:46:59+08:002019-01-23T01:46:59+08:00

文件是否已损坏？

是的。该网站还提供了一个工具供您检查自己。从链接中，我看到了 4 个校验和，其中第一个是供您下载的。

md5sum train_val2018.tar.gz should produce b1c6952ce38f31868cc50ea72d066cc3
md5sum train2018.json.tar.gz should produce bfa29d89d629cbf04d826a720c0a68b0
md5sum val2018.json.tar.gz should produce f2ed8bfe3e9901cdefceb4e53cd3775d
md5sum test2018.tar.gz should produce 4b71d44d73e27475eefea68886c7d1b1
md5sum test2018.json.tar.gz should produce fc717a7f53ac72ed8b250221a08a4502

如果您得到不同的结果，则您的下载已损坏。

2

AtomiX84 · Answer 2 · 2019-01-23T01:55:41+08:00

Best Answer

AtomiX84

2019-01-23T01:55:41+08:002019-01-23T01:55:41+08:00

是的，当然可以。如果您阅读他们有检查步骤：

Running md5sum train_val2018.tar.gz should produce b1c6952ce38f31868cc50ea72d066cc3

如果您不想手动比较 md5sum，您可以创建一个包含以下内容的文件 md5sum-db（名称可以是任何您喜欢的名称）：

b1c6952ce38f31868cc50ea72d066cc3 train_val2018.tar.gz

在压缩数据库所在的文件夹中输入并运行：

md5sum -c md5sum-db

如果哈希检查匹配，您将收到以下输出：

 train_val2018.tar.gz: OK

别的

train_val2018.tar.gz: FAILED
md5sum: WARNING: 1 computed checksum did NOT match

检查 gz 文件的另一种方法是使用测试它：

gunzip -t file.tar.gz

注意：此方法不能确保存档中包含的数据的完整性。

1

100+ GB tar.gz 文件无法正确解压

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

100+ GB tar.gz 文件无法正确解压

2 个回答

相关问题