clemp6r Asked: 2017-07-28 03:29:36 +0800 CST2017-07-28 03:29:36 +0800 CST 2017-07-28 03:29:36 +0800 CST MongoDB / WiredTiger:从文档中删除属性后减少存储大小 772 我在 4 个节点的副本集上使用 MongoDB 3.4 和 WiredTiger 存储引擎。 我通过删除占用大部分空间的属性来缩小了很多文档,但是文档说此操作不会减少存储大小(仅数据大小),我可以确认这是真的。 所以我尝试使用compact命令:释放了一些空间,但存储大小仍然大于数据大小。是因为它只移动文档但不会减少每个文档已经分配的空间吗? 我是否需要删除并重新创建所有文档才能真正减少存储大小? mongodb wiredtiger 4 个回答 Voted kevinadi 2017-07-28T22:12:24+08:002017-07-28T22:12:24+08:00 只是为了澄清,请小心repairDatabase在副本集节点上使用。repairDatabase旨在用于挽救可读数据,即在磁盘损坏后,因此它可以删除不可读的数据并让 MongoDB 在磁盘损坏时启动。 如果此节点有未检测到的磁盘损坏并且您repairDatabase在其上运行,这可能会导致该特定节点与另一个节点具有不同的数据内容,因为repairDatabase. 由于 MongoDB 假设副本集中的所有节点都包含相同的数据,这可能会导致崩溃和难以诊断问题。由于其性质,这个问题可能会长期处于休眠状态,并突然以复仇的方式表现出来,似乎没有任何明显的原因。 WiredTiger 最终将使用新数据重用空白空间,并且WiredTiger 所做的定期检查点可能会在您无需任何干预的情况下向操作系统释放空间。 如果您确实需要将空间还给操作系统,那么如果您有副本集,则初始同步是最安全的选择。在独立设备上,转储/恢复将获得相同的结果。否则,compact是更安全的选择repairDatabase。请在执行任何这些操作之前备份您的数据,因为在我看来这将被视为一项重大维护。 nvbach91 2019-05-18T05:51:52+08:002019-05-18T05:51:52+08:00 如果您使用 来检查数据库db.stats(),您会发现dataSize和storageSize。storageSize从数据库中删除文档后可能会更大。db.repairDatabase()or命令的使用compact可能不会减少storageSize。在这种情况下,回收磁盘空间的更可靠方法是使用 创建转储存档mongodump,删除数据库,然后使用 恢复它mongorestore。 mongodump --gzip --archive=dump.gzip mongo > db.dropDatabase() mongorestore --gzip --archive=dump.gzip 此解决方案将根据数据库的大小需要停机时间。 仅供参考:删除文档后,MongoDB 不会释放磁盘空间,相反,它将为以后的文档重用该空间,因此storageSize大于dataSize. JJussi 2017-07-28T03:51:27+08:002017-07-28T03:51:27+08:00 如果您使用具有 2 个以上节点的副本集,您可以一次在一个辅助节点上启动初始同步(最后将主节点降级到辅助节点以进行初始同步)。通过从节点 dbPath 中删除所有数据文件。 或者,如果您有“足够”的可用磁盘空间,则可以使用repaireDatabase命令。命令将再次重建所有数据文件。 当然,第三个选项是将数据库及其所有集合导出(转储)到磁盘,删除数据库,然后将所有内容导入回来。 第四个选项是(需要额外空间)将数据库复制到新名称(临时名称),删除旧数据库,再次复制回原始名称,然后删除该临时数据库。这是因为 MongoDB 中没有“renameDatabase”命令。 Best Answer clemp6r 2017-07-29T02:06:28+08:002017-07-29T02:06:28+08:00 我通过删除和重新创建文档,然后compact在我的集合上运行命令来成功。
只是为了澄清,请小心
repairDatabase
在副本集节点上使用。repairDatabase
旨在用于挽救可读数据,即在磁盘损坏后,因此它可以删除不可读的数据并让 MongoDB 在磁盘损坏时启动。如果此节点有未检测到的磁盘损坏并且您
repairDatabase
在其上运行,这可能会导致该特定节点与另一个节点具有不同的数据内容,因为repairDatabase
. 由于 MongoDB 假设副本集中的所有节点都包含相同的数据,这可能会导致崩溃和难以诊断问题。由于其性质,这个问题可能会长期处于休眠状态,并突然以复仇的方式表现出来,似乎没有任何明显的原因。WiredTiger 最终将使用新数据重用空白空间,并且WiredTiger 所做的定期检查点可能会在您无需任何干预的情况下向操作系统释放空间。
如果您确实需要将空间还给操作系统,那么如果您有副本集,则初始同步是最安全的选择。在独立设备上,转储/恢复将获得相同的结果。否则,
compact
是更安全的选择repairDatabase
。请在执行任何这些操作之前备份您的数据,因为在我看来这将被视为一项重大维护。如果您使用 来检查数据库
db.stats()
,您会发现dataSize
和storageSize
。storageSize
从数据库中删除文档后可能会更大。db.repairDatabase()
or命令的使用compact
可能不会减少storageSize
。在这种情况下,回收磁盘空间的更可靠方法是使用 创建转储存档mongodump
,删除数据库,然后使用 恢复它mongorestore
。此解决方案将根据数据库的大小需要停机时间。
仅供参考:删除文档后,MongoDB 不会释放磁盘空间,相反,它将为以后的文档重用该空间,因此
storageSize
大于dataSize
.如果您使用具有 2 个以上节点的副本集,您可以一次在一个辅助节点上启动初始同步(最后将主节点降级到辅助节点以进行初始同步)。通过从节点 dbPath 中删除所有数据文件。
或者,如果您有“足够”的可用磁盘空间,则可以使用repaireDatabase命令。命令将再次重建所有数据文件。
当然,第三个选项是将数据库及其所有集合导出(转储)到磁盘,删除数据库,然后将所有内容导入回来。
第四个选项是(需要额外空间)将数据库复制到新名称(临时名称),删除旧数据库,再次复制回原始名称,然后删除该临时数据库。这是因为 MongoDB 中没有“renameDatabase”命令。
我通过删除和重新创建文档,然后
compact
在我的集合上运行命令来成功。