AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 81545
Accepted
rendybjunior
rendybjunior
Asked: 2014-10-31 19:01:13 +0800 CST2014-10-31 19:01:13 +0800 CST 2014-10-31 19:01:13 +0800 CST

mongodb shard chunk 迁移 500GB 需要 13 天 - 这是慢还是正常?

  • 772

我有 mongodb 分片集群,分片键是散列的。它有 2 个分片副本集。每个副本集有 2 台机器。

我通过添加另外 2 个分片副本集进行了一个实验,它开始重新平衡。

但是,过了一段时间我发现块迁移相当缓慢。移动 1.4GB 数据需要 1 小时。

这让我很担心,这意味着我必须等待 13 天才能完成 500GB 的块迁移!

我对这些东西很陌生,我对它是慢、快还是正常没有感觉。但是,这些数字仍然不能说服我。

实验的附加说明: - 使用 m3 中型 aws 机器 - 没有其他进程运行,只有块迁移 - 默认 mongodb 分片安装,无需进一步配置 - shardkey 使用对象 id (_id) 的散列 - 最大块大小 64MB

mongodb sharding
  • 1 1 个回答
  • 4663 Views

1 个回答

  • Voted
  1. Best Answer
    Adam C
    2014-11-01T03:52:32+08:002014-11-01T03:52:32+08:00

    更新:2018 年 4 月

    这个答案在提出问题时是正确的,但从那时起事情就发生了变化。由于 3.4 版本引入了并行性,我最初引用的票已关闭。有关更多信息,我将在这个更新的答案中介绍一些细节。我将按原样保留其余答案,因为它仍然是一般问题/约束的一个很好的参考,并且对旧版本的任何人都有效。

    原始答案

    如果您有兴趣,我会在M202 高级课程中完整解释块迁移会发生什么。一般而言,我们只是说迁移不是很快,即使对于空块也是如此,因为正在执行内务管理以确保迁移在活动系统中工作(即使只发生平衡,这些仍然会发生)。

    此外,整个集群一次只发生一次迁移——没有并行性。因此,尽管您有两个“完整”节点和两个“空”节点,但在任何给定时间最多发生一次迁移(在具有最多块的分片和最少的分片之间)。因此,添加 2 个碎片在平衡速度方面没有任何好处,只会增加必须移动的块的数量。

    对于迁移本身,块的大小可能约为 30MiB(取决于您填充数据的方式,但通常这将是默认最大块大小的平均值)。您可以运行db.collection.getShardDistribution()以获取其中的一些信息,并在此处查看我的答案以获取有关您的块的更多信息的方法。

    由于没有其他活动正在进行,因此要进行迁移,目标分片(新添加的分片之一)将需要从源分片(原始分片之一)读取约 30MiB 的数据并将配置服务器更新为完成后反映新的块位置。对于没有负载的正常系统来说,移动 30MiB 的数据应该不是太大的瓶颈。

    如果速度很慢,可能有多种原因,但对于不忙的系统来说,最常见的原因是:

    • 源磁盘 I/O - 如果读取时数据不在活动内存中,则必须从磁盘分页
    • 网络 - 如果存在延迟、速率限制、数据包丢失等问题,则读取可能需要相当长的时间
    • 目标磁盘 I/O - 数据和索引必须写入磁盘,大量索引会使情况变得更糟,但通常这在轻负载系统上不是问题
    • 导致中止和迁移失败的迁移问题(配置服务器问题,主要删除问题)
    • 复制滞后 - 用于迁移到副本集、写入关注w:2或w:majority默认使用,并且需要最新的辅助节点来满足它。

    如果系统很忙,那么内存争用,锁争用通常也是这里的嫌疑人。

    要获取有关迁移需要多长时间、是否失败等的更多信息,请查看以下条目config.changelog:

    // connect to mongos
    use config
    db.changelog.find()
    

    正如您所看到的,并且正如我在进行培训/教育时通常告诉人们的那样,如果您知道您将需要 4 个分片,那么通常最好从 4 个分片开始,而不是逐步增加。如果你这样做了,那么你需要知道添加一个分片可能需要很长时间,并且最初是对资源的净负面而不是收益(有关更详细的讨论,请参阅我的分片陷阱系列的第二部分)。

    最后,要跟踪/支持/评论功能请求以提高块迁移的并行性,请查看SERVER-4355

    • 12

相关问题

  • Mongo Map-Reduce 还是分片?

  • 使用集群设置 Mongo

  • MongoDB 的 find 和 findone 调用之间的区别

  • 分片对小集合有效吗?

  • 关于操作/管理 MongoDB 的良好资源

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve