对于生产备份,MongoDB 建议使用mongodump而不是mongoexport以确保数据的准确性。但是,我需要在备份之前从 MongoDB 数据库中“清除”数据。我不知道除mongoexport之外的任何服务器端数据清理选项。两个问题:
- mongoexport是否访问 RAM 中的 MongoDB 缓存?它会像mongodump那样改变 RAM 中的工作集吗?
- mongodump命令有这个--query选项。“提供 JSON 文档作为查询,可选择限制 mongodump 输出中包含的文档。” 是否需要查询才能排除文档中的某些字段?
(对不起,不知道)
--query将选择或排除整个文档,而不是字段。
不过,这将是一个好主意:
作为对第一个问题的回答,这两个工具(默认情况下)只会遍历
_id
索引以获取数据,然后将其写入磁盘。所以,是的,这两种工具都会同样影响您的工作集,这就是为什么我通常建议在辅助设备上运行它们(如果可能的话,最好是隐藏的辅助设备)。如果您正在处理大量数据,我将在此处的评论中回应 Stennie 并推荐其他备份方法。对于第二个问题,我假设您正在寻找与仅转储特定字段的选项
mongodump
等效的--fields
选项。查询选项可用于过滤结果,但不能与投影一起使用(选择返回的字段) - 这是在 TOOLS-28 中跟踪但尚未计划的mongoexport
功能请求。正如 Stennie 还提到的,这里的另一个选择是编写一个适合您需求的自定义导出器(同样,我仍然建议将它运行在辅助设备上以保护您的工作集)。Mongoexport 实际上确实保留了类型,但它使数据不一致。如果您要导出包含 Ints 和 Longs 的字段,它将分别导出为 Numbers 和 JSON 对象,这可能会使其变得更加困难。
“严格模式。BSON 类型的严格模式表示符合 JSON RFC。任何 JSON 解析器都可以将这些严格模式表示解析为键/值对;但是,只有 MongoDB 内部 JSON 解析器才能识别格式所传达的类型信息。”
https://docs.mongodb.com/manual/reference/mongodb-extended-json/