最近我购买了 MSA70。不幸的是,我确实正确阅读了规格。在我的项目中,我需要尽可能多的 I/O 操作。MSA70 只有 3Gbps,所以我的问题是:是否有可能通过将更好的控制器更换/添加到 pcie 插槽来将其升级到 6gbps?
我从 HPE ProLiant System Utilities (BIOS) 启动到 HPE Smart Storage Administrator (SSA),以将具有 RAID6(和现有数据)的逻辑驱动器迁移到 RAID5。在开始需要几个小时才能完成的迁移任务后,我唯一能做的就是点击X
右上角的 。之后我被困在屏幕上说:
完成配置后 - 重新启动系统。
这意味着什么?我可以通过 iLO(重置或冷启动)重新启动服务器,还是必须等到迁移完成才能最终启动到我的操作系统?
我有一台带有 Smart Array P400 的 HP ProLiant D7 120DL。执行 BIOS “恢复默认系统设置”后,Smart Array 看不到连接到它的驱动器。
启动服务器时,Smart Array 会检查磁盘,但会发布消息“找不到驱动器”。
BIOS 上是否有启用 Smart Array 的选项?我从“高级选项/SATA 控制器选项/嵌入式 SATA 配置”中启用了 SATA RAID 支持,但我仍然无法从 BIOS 菜单中看到任何其他选项。
BIOS 是 HP RBSU(基于 Rom 的设置实用程序)版本 3.00
我有旧服务器 HP Proliant DL120 G7。我在 RAID 10 中配置了 4 500GB 硬盘。通过此配置,我能够进入 ORCA 设置和连接的硬盘驱动器。然后我将驱动器更改为 4 个 1TB 硬盘。我无法让服务器读取可启动的 USB 来安装 Esx6,并且由于我恢复了 bios 中的默认设置而感到不安。现在它不会读取新的硬盘驱动器,也不会显示按 F8 键进入 ORCA 的选项。
Smart Array 工具搜索驱动器后的错误是:“未配置驱动器阵列”
我搜索了 SmartArray P410 驱动程序,但在任何地方都找不到。我在文档中有链接,但它不再可用。您认为这是驱动程序的问题吗?或者也许 BIOS 中有一个选项可以让我启用智能阵列?
谢谢
HP DL380p Gen8 E5-2640v2 美国 Svr/S-购买
产品编号:653200-B21
嘿,我有可怕但并不少见的:
插槽 0 HP Smart Array P420i 控制器正在初始化…
1783-Slot 0 驱动器阵列控制器故障!
[自检失败(cmd=0h, err=00h, lockup=0DEAD:DEADh)]
我已经重新安装了缓存卡,检查了 SAS 电缆。
我从基于 java 的 iLO4 远程控制台运行 SPP 8.1 iso 并更新了所有内容。它仍然抛出同样的错误。(所有固件都应该是最新的)
目前禁用该设备并尝试使用英特尔嵌入式 sata 控制器尝试运行我刚刚放入的三星 sata SSD,希望能得到一些东西。
这台机器在制造工具中发挥着作用。如果我们能快速修复它,那将是一条路,但我们真的只需要在这个插槽中安装任何 Windows PC。即使数据丢失,我可以做些什么来以任何可能的配置启动 Windows Server 2012?
我尝试安装带有 NVME 驱动器的 PCIE M.2 板 --> 无法从 NVME 启动。但它对 Windows 安装程序是可见的。
我尝试使用普通的三星 2.5" SSD 并将旧硬盘驱动器上的导轨连接到背板上。 --> 服务器看不到它。
我订购了一张用过的 P420 PCIE 卡,希望从主板上拔下现有的 SAS 电缆,并在它到达时将它们插入 PCIE 卡。
我有一个安装了 k8s 的系统(centos 7.8)。
经过几天的正常操作(系统负载约为 30%,磁盘活动约为 60 iops,未饱和),系统进入不稳定状态,不再向磁盘提交任何内容。从图中可以看出iostat -x 5
,avgqu-sz 冻结不再接受 r/w。
问题是我接下来应该去哪里寻找根本原因。
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0,00 0,00 0,00 0,00 0,00 0,00 0,00 169,00 0,00 0,00 0,00 0,00 100,00
dm-0 0,00 0,00 0,00 0,00 0,00 0,00 0,00 186,00 0,00 0,00 0,00 0,00 100,00
dm-1 0,00 0,00 0,00 0,00 0,00 0,00 0,00 7,00 0,00 0,00 0,00 0,00 100,00
avg-cpu: %user %nice %system %iowait %steal %idle
11,36 0,00 1,71 86,94 0,00 0,00
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0,00 0,00 0,00 0,00 0,00 0,00 0,00 169,00 0,00 0,00 0,00 0,00 100,00
dm-0 0,00 0,00 0,00 0,00 0,00 0,00 0,00 186,00 0,00 0,00 0,00 0,00 100,00
dm-1 0,00 0,00 0,00 0,00 0,00 0,00 0,00 7,00 0,00 0,00 0,00 0,00 100,00
avg-cpu: %user %nice %system %iowait %steal %idle
11,41 0,00 1,58 87,01 0,00 0,00
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0,00 0,00 0,00 0,00 0,00 0,00 0,00 169,00 0,00 0,00 0,00 0,00 100,00
dm-0 0,00 0,00 0,00 0,00 0,00 0,00 0,00 186,00 0,00 0,00 0,00 0,00 100,00
dm-1 0,00 0,00 0,00 0,00 0,00 0,00 0,00 7,00 0,00 0,00 0,00 0,00 100,00
/var/log/messages 在强制系统重置之前的最后一条日志行是:
kernel: ACPI Error: SMBus/IPMI/GenericSerialBus write requires Buffer of length 66, found length 32 (20130517/exfield-389)
kernel: ACPI Error: Method parse/execution failed [\_SB_.PMI0._PMM] (Node ffff99c2ba2513c0), AE_AML_BUFFER_LIMIT (20130517/psparse-536)
kernel: ACPI Exception: AE_AML_BUFFER_LIMIT, Evaluating _PMM (20130517/power_meter-339)
虽然,根据这个 RedHat 线程,这不应该是一个问题https://access.redhat.com/discussions/3871951
LE 1:有时我会在很短的时间(不到一分钟)内遇到类似的冻结,然后它会恢复。在 dmesg 输出中,我有:
[Lu aug 17 21:04:07 2020] hpsa 0000:06:00.0: scsi 0:1:0:0: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap+ En+ Exp=1
[Lu aug 17 21:04:15 2020] hpsa 0000:06:00.0: device is ready.
[Lu aug 17 21:04:15 2020] hpsa 0000:06:00.0: scsi 0:1:0:0: reset logical completed successfully Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap+ En+ Exp=1
LE 2:当磁盘不再恢复并且需要重置时,管理保存 dmesg 输出。
[Lu aug 24 13:00:18 2020] hpsa 0000:06:00.0: scsi 0:1:0:0: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap+ En+ Exp=1
[Lu aug 24 13:03:20 2020] INFO: task scsi_eh_0:332 blocked for more than 120 seconds.
[Lu aug 24 13:03:20 2020] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[Lu aug 24 13:03:20 2020] scsi_eh_0 D ffff8c603fc9acc0 0 332 2 0x00000000
[Lu aug 24 13:03:20 2020] Call Trace:
因此 hpsa 进入了这个从未完成的重置逻辑磁盘访问过程。
在我们的 Windows 服务器环境中,我们经常收到 HP 服务器的警报,提示存储缓存模块发生故障。缓存模块的作用到底是什么?
我有一个带有 P420 RAID 控制器的 HP DL380e Gen8,它在我以前的工作中每天 24 小时通电 7 个月,运行几个 VM 时没有任何问题。换工作后,我将家里的服务器关闭了大约 3 个月。我今天在添加 10Gbe 网卡 (HP NC523SFP) 后打开它,服务器启动正常,我登录操作系统 (Centos 7),一切看起来都很好。大约 45 分钟后,我听到服务器风扇以 100% 的速度旋转,然后恢复正常,我连接了一个显示器,并且出现了带有 NMI 错误的红屏死机。在 ILO 上检查错误是指 PCI- E 插槽 1 提升卡 1,这是连接 P420 控制器的位置(10Gbe 在插槽 3 提升卡 1 上)。我以为问题是由 10Gbe 引起的,但在删除它后,服务器仍然出现红屏死机。我' 我还尝试将 10Gbe 移动到转接卡另一侧的 PCI-E 插槽上,但没有任何改变,我还尝试使用电池卸下智能缓存模块并将 P420 移动到插槽 3。我可以检查什么? 我唯一没有尝试过的是在没有连接硬盘驱动器和/或从 P420 移除背板电缆的情况下启动。有可能在转接卡的同一侧有 10Gbe 卡损坏了 P420 控制器?当我第一次使用 10Gbe 启动时,我记得有一条关于启动磁盘/ROM 选项的消息,我之前没有见过,我完全忽略了它。t 尝试在没有连接硬盘驱动器和/或从 P420 移除背板电缆的情况下启动。有可能在转接卡的同一侧有 10Gbe 卡损坏了 P420 控制器?当我第一次使用 10Gbe 启动时,我记得有一条关于启动磁盘/ROM 选项的消息,我之前没有见过,我完全忽略了它。t 尝试在没有连接硬盘驱动器和/或从 P420 移除背板电缆的情况下启动。有可能在转接卡的同一侧有 10Gbe 卡损坏了 P420 控制器?当我第一次使用 10Gbe 启动时,我记得有一条关于启动磁盘/ROM 选项的消息,我之前没有见过,我完全忽略了它。