我正在使用一个映射大型资源文件的库。我正在考虑将该资源文件存储在 gcloud 存储桶中并使用 GCSFuse 使该文件可用于映射,而不是构建我自己的解决方案来手动下载该文件。
出于性能原因,当我通过 gcsfuse 映射到存储桶中的文件时,我想知道何时实际下载文件:如果在我映射时它是一次全部下载,那是理想的。如果在我通过 mmapped 指针访问文件的不同部分时下载了块,我想由于多次调用存储桶,这会变慢,如果是这种情况,我可能会使用另一种方法。
我正在使用一个映射大型资源文件的库。我正在考虑将该资源文件存储在 gcloud 存储桶中并使用 GCSFuse 使该文件可用于映射,而不是构建我自己的解决方案来手动下载该文件。
出于性能原因,当我通过 gcsfuse 映射到存储桶中的文件时,我想知道何时实际下载文件:如果在我映射时它是一次全部下载,那是理想的。如果在我通过 mmapped 指针访问文件的不同部分时下载了块,我想由于多次调用存储桶,这会变慢,如果是这种情况,我可能会使用另一种方法。
这是一个特定于实现的细节,因此请务必阅读文档。从 6ab0a79 开始的 README.md 有这样的说法:
请注意有关下载整个事物的写入、完整对象写入更有效以及语义化.md 中令人惊讶的行为的一点。跳过 fuse 文件系统层,使用 GCS SDK 直接读取和写入整个数据块作为存储 blob 会更有效。但这对这个应用程序使用存储的方式来说是一个重大变化。