我有一台 HP Proliant DL580 G7 服务器,从 2015 年开始更新了 P65 BIOS(我认为这是最新的 BIOS)。
我在其中安装了 PCIe 扩展板并安装了 4 个 Tesla K80 GPU。使用 10 针到 8 针电缆将它们连接到 PSU 板。当我打开服务器时,我看到 GPU 上的绿灯亮起。在 BIOS 中,我将 PCIe 设置为使用 Gen 2.0 设置。
安装了 Windows Server 2012 R2(带有更新),并从 Web 安装了所有驱动程序。我在设备管理器中没有任何缺少驱动程序的设备。但是,Tesla K80 GPU 不会出现在设备管理器中。
当我尝试安装官方 NVidia 驱动程序时,我收到“未找到兼容硬件”的错误消息。
我还移除了新安装的 PCIe 扩展板,以防它(不知何故)与主板不兼容,但这也无济于事。
我究竟做错了什么?
更新 1:我使用企业许可证安装了 VMWare ESXi,以查看 Nvidia 设备是否出现在那里,以便我可以使用直通并在 VM 中使用 GPU,但 Nvidia 设备没有出现在该列表中。
我安装了 Ubuntu 20.04,因为与其他 Linux 发行版相比,它具有最好的硬件检测,但它无法加载 GUI。Ubuntu 没有被列为 DL580 G7 的官方支持的操作系统之一,因此我转向下一个选项。
我安装了 RHEL 6.10,因为它是受支持的操作系统之一,当我执行“lspci”时,我没有看到任何 Nvidia 设备。
不幸的是,DL580 G7 上的 BIOS 不支持 MMIO。我得到的最新 rom 是 P65 05/21/2018,但我仍然无法在其中找到 MMIO 支持。如果没有 MMIO,系统无法映射超过 4GB 的 vRAM,因此驱动程序无法识别设备。