背景
我在一个处理生物医学数据的研究部门工作,我们目前正在考虑修改我们的 IT 结构。我们有几种每天生成 GB 数据的仪器,连接到网络隔离的计算机。数据在网络中传输,在传输到大学的国家数据存储服务之前在中间步骤进行处理。
我们需要改进的是短期(~3 个月)存储数据的中间步骤,在此期间研究人员可以访问数据而无需从远程数据中心查询数据。事实上,中间服务器用于许多不同的目的,并且通常会用完空间。我们打算购买一台专用于短期存储仪器数据的 NAS。我被赋予了提出替代方案的责任。
我首先列出了我们需要什么,这导致了以下我们的要求列表:
- 至少 8TB 空间:这对于现代设置来说应该不是真正的问题
- Gb带宽:同上
- 机架安装:这样 NAS 在物理上将靠近我们拥有的其他服务器
- 可扩展:以防我们的数据量在不久的将来增加(我想它会)
- 最少的维护:我们没有自由(在经济上和官僚主义上)拥有全职系统管理员,因为它是最精通技术的科学家帮助进行服务器维护。我们都不是 IT 专业人士...
问题)
我开始阅读有关存储系统的文章,元上最常见问题的列表是一个很好的资源。同样,我发现两个类似的问题询问研究环境中的存储:
然而,这两个问题似乎都集中在长期存储上,也集中在单个设备上,而我最感兴趣的是弄清楚在这种情况下哪些特性/规格/质量是有价值的。
根据先前的知识和最近的阅读,我认为在我们的案例中选择 NAS 时,有几个方面可能很重要:
支持 SAS 驱动器- 它真的很重要吗?我知道 SAS 驱动器的质量通常更高,但假设阵列中存在冗余,那么如果 SATA 磁盘死机有什么大不了的?
链路聚合——我不得不说我不太了解网络层和与之相关的设备,但我对链路聚合的有限理解是,对于多个网卡,NAS 理论上可以将带宽增加一倍/三倍,同样多个链接用于纠错(至少根据 Synology 的说法)。我将不胜感激任何可能帮助我理解这一点并将现实与营销谈话区分开来的信息。
多个网络- 由于我们在某些计算机上的隔离标准,我们能够在两个不同的 VLAN 中使用 NAS 是有意义的。如果 NAS 有两个以太网端口,是否就像将它连接到两个不同的网络一样简单并完成它?
热插拔等——这方面似乎有许多不同的版本。我的理解是热插拔是指连接到NAS的额外磁盘,当一个磁盘发生故障时首先写入。这个对吗?如果是这样,热插拔是一个很酷的功能,还是即使阵列运行单/双冗余也是必须的?
另一个版本的“热交换”(我不确定它是怎么称呼的)允许在服务器在线时更换磁盘,所以它是一种热更换(Drobo 提供类似的东西)。它是通用功能,还是 Drobo 特有的功能?有没有类似的技术可用?有没有我可能不知道的“陷阱”?否则我认为它非常有趣,因为它允许在线扩展存储空间。
上面的功能列表是我一直在思考的一些功能,我真的很感激对这些功能以及我可能错过的其他功能有一些了解。
购买基于ZFS 的设备。任何使用NexentaStor的东西都是一个好的开始,但你听起来好像你也想要/需要供应商支持。
像PogoStorage StorageDirector这样的东西可以工作。
另一个不错的固定选项是DataON NexentaStor产品。
这两家供应商都可以根据您的存储和性能需求来分析和定制解决方案。这不是一个罕见的请求,因此与了解您所在领域的供应商交谈会很有帮助。
为什么选择 ZFS?
所有复选标记都被选中:
几乎所有 NAS(除了较小的消费型号)或 SAN 都支持在线扩展,这意味着如果您需要更多空间,您只需插入更多驱动器,现有卷就可以增长以包含新驱动器。
具有多个端口的 SAN 和 NAS 设备可用于链路聚合或从多个网络进行访问。但是,这两个功能因产品而异。许多人会特别列出支持的链接聚合,但我怀疑您会找到一种列出来自多个网络的访问的产品。这不是一个普遍要求的功能。
您似乎混淆了hot swap和hot spare。
SATA 驱动器可以,只要您使用 SAN/NAS 制造商推荐的驱动器。至少,SATA 驱动器应该是企业级的并且额定用于 RAID 阵列。这些类型的驱动器具有特殊固件,使其更适合在阵列中使用。使用标准消费驱动器(尤其是那些未经 SAN/NAS 制造商认证的驱动器)经常会导致奇怪的故障情况。就整体可靠性和稳定性而言,这绝对是一分钱一分货的情况。
购物问题是题外话
但是,购物问题是题外话,因此不会提供具体的产品推荐。
我建议您联系一些 SAN/NAS 制造商(Synology、Drobo、HP、Dell、EMC)并描述您的需求。他们会推荐产品,您可以在它们之间进行选择。
在执行此操作之前,您需要了解或决定一些事情:
如果您需要与 SAS 驱动器相关的速度,那么对 SAS 驱动器的支持很好。它们的成本高于 SATA,但不如 SSD,而且它们在速度方面介于两者之间。如果速度不是问题,支持很好,但不值得为此付出更多。
Link Aggregation 正是您提到的,将两个真正的 NIC 组合成一个更快的单个 NIC 的能力,我从未听说过纠错,但也许我只是没有在正确的地方寻找。
多个网络通常只涉及连接和配置网卡。
您提供的第一个热插拔定义似乎更像是热备用/备用,其中安装了一个磁盘,可以在另一个正在使用的磁盘发生故障的情况下使用。第二个是我一直理解的热插拔的意思,即更换磁盘时无需关闭机器即可更换磁盘的能力。
至于进一步的考虑,从长远来看,ewwhite 的回答可能会更有用;)