背景
我在一个处理生物医学数据的研究部门工作,我们目前正在考虑修改我们的 IT 结构。我们有几种每天生成 GB 数据的仪器,连接到网络隔离的计算机。数据在网络中传输,在传输到大学的国家数据存储服务之前在中间步骤进行处理。
我们需要改进的是短期(~3 个月)存储数据的中间步骤,在此期间研究人员可以访问数据而无需从远程数据中心查询数据。事实上,中间服务器用于许多不同的目的,并且通常会用完空间。我们打算购买一台专用于短期存储仪器数据的 NAS。我被赋予了提出替代方案的责任。
我首先列出了我们需要什么,这导致了以下我们的要求列表:
- 至少 8TB 空间:这对于现代设置来说应该不是真正的问题
- Gb带宽:同上
- 机架安装:这样 NAS 在物理上将靠近我们拥有的其他服务器
- 可扩展:以防我们的数据量在不久的将来增加(我想它会)
- 最少的维护:我们没有自由(在经济上和官僚主义上)拥有全职系统管理员,因为它是最精通技术的科学家帮助进行服务器维护。我们都不是 IT 专业人士...
问题)
我开始阅读有关存储系统的文章,元上最常见问题的列表是一个很好的资源。同样,我发现两个类似的问题询问研究环境中的存储:
然而,这两个问题似乎都集中在长期存储上,也集中在单个设备上,而我最感兴趣的是弄清楚在这种情况下哪些特性/规格/质量是有价值的。
根据先前的知识和最近的阅读,我认为在我们的案例中选择 NAS 时,有几个方面可能很重要:
支持 SAS 驱动器- 它真的很重要吗?我知道 SAS 驱动器的质量通常更高,但假设阵列中存在冗余,那么如果 SATA 磁盘死机有什么大不了的?
链路聚合——我不得不说我不太了解网络层和与之相关的设备,但我对链路聚合的有限理解是,对于多个网卡,NAS 理论上可以将带宽增加一倍/三倍,同样多个链接用于纠错(至少根据 Synology 的说法)。我将不胜感激任何可能帮助我理解这一点并将现实与营销谈话区分开来的信息。
多个网络- 由于我们在某些计算机上的隔离标准,我们能够在两个不同的 VLAN 中使用 NAS 是有意义的。如果 NAS 有两个以太网端口,是否就像将它连接到两个不同的网络一样简单并完成它?
热插拔等——这方面似乎有许多不同的版本。我的理解是热插拔是指连接到NAS的额外磁盘,当一个磁盘发生故障时首先写入。这个对吗?如果是这样,热插拔是一个很酷的功能,还是即使阵列运行单/双冗余也是必须的?
另一个版本的“热交换”(我不确定它是怎么称呼的)允许在服务器在线时更换磁盘,所以它是一种热更换(Drobo 提供类似的东西)。它是通用功能,还是 Drobo 特有的功能?有没有类似的技术可用?有没有我可能不知道的“陷阱”?否则我认为它非常有趣,因为它允许在线扩展存储空间。
上面的功能列表是我一直在思考的一些功能,我真的很感激对这些功能以及我可能错过的其他功能有一些了解。