AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 811698
Accepted
mart
mart
Asked: 2016-10-28 07:29:35 +0800 CST2016-10-28 07:29:35 +0800 CST 2016-10-28 07:29:35 +0800 CST

Hadoop 数据节点 - 从一个磁盘开始,稍后添加更多,或者从尽可能多的磁盘开始并平均填充它们

  • 772

关于 Hadoop 集群中的 Datanode 磁盘设置,我想知道以下内容。这两个选项哪个更好:

  1. 将一个(或几个)磁盘添加到 Datanode,并在它们开始填充后附加更多。

  2. 或者从一开始就从尽可能多的磁盘开始并同时填充它们。

其他两个相关的问题:最好获得尽可能大的驱动器,以便为有限数量的驱动器插槽获得最大容量?

单个Datanode可以支持多少存储?(当然这取决于 Datanode 硬件规范,但仍然......任何近似限制?)

hadoop
  • 1 1 个回答
  • 444 Views

1 个回答

  • Voted
  1. Best Answer
    Travis Campbell
    2016-11-05T06:30:21+08:002016-11-05T06:30:21+08:00

    首先,主轴的数量与 mapreduce 作业的性能直接相关(在一定程度上)。通常,您希望每个主轴执行 1-2 个 CPU 内核之类的操作。

    其次,事后平衡额外的主轴可能是一个挑战。直到最近才添加代码来跨主轴进行数据节点内重新平衡。常规平衡器仅在节点之间进行平衡,因此您仍然可以获得不平衡的主轴。有一些支持来调整块放置策略,以便在您添加新主轴时它会随着时间的推移而趋于平稳,但这意味着新数据只会写入最少使用的主轴。

    第三,此时我可能不会做超过 12 个 6TB 驱动器(或每个数据节点约 72TB)。这将处理价值数百万块的数据。除此之外,您开始遇到一些需要集群调整的性能问题,因为诸如数据节点块报告之类的事情花费了太长时间。其中很多将取决于您的用例。

    我见过具有更高驱动器密度的集群,但需要进行大量调整才能使其工作(即使那样仍然存在问题)。

    • 0

相关问题

  • gitosis 干扰 hadoop

  • HDFS 中的“流式数据访问”是什么意思?

  • hadoop - 数据节点退役

  • 什么是 Hadoop,它的用途是什么?[关闭]

  • Hadoop 集群。2 台快速、4 台中等、8 台较慢的机器?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve