我有一个 16 核 Intel Xeon 处理器,可以成功启动到 BIOS 和 GRUB,但无法加载 Ubuntu(或任何操作系统)。事实证明,核心 #14 是所有问题的原因(在使用 memtest86 测试每个单独的核心后发现)。在 BIOS 中,我可以将系统设置为仅使用 2 个内核运行,并且系统在此配置下工作。但我希望能够使用 16 个内核中的 15 个。有没有办法在启动时仅禁用核心#14?
我有一个 16 核 Intel Xeon 处理器,可以成功启动到 BIOS 和 GRUB,但无法加载 Ubuntu(或任何操作系统)。事实证明,核心 #14 是所有问题的原因(在使用 memtest86 测试每个单独的核心后发现)。在 BIOS 中,我可以将系统设置为仅使用 2 个内核运行,并且系统在此配置下工作。但我希望能够使用 16 个内核中的 15 个。有没有办法在启动时仅禁用核心#14?
您可以利用CPU 热插拔功能来实现您的目标。您可以启动 CPU 0-13,然后添加其他 CPU(CPU 15-27 和 29-31)。
所有 Xeon 处理器都具有超线程,因此我假设您的意思是 16 个内核,每个内核 2 个线程,总共 32 个 CPU。这个答案是针对 4 核、每核 2 个线程的处理器编写和测试的,其中核 2 是坏的。
首先,作为 sudo,编辑
/etc/default/grub
并添加最大启动时间 CPUmaxcpus=
到您的GRUB_CMDLINE_LINUX_DEFAULT
行。我的系统示例:曾是:
现在:
我用的地方
maxcpus=2
你会用maxcpus=14
.首先保存 grub 的副本,然后运行
sudo update-grub
。因此,系统将仅使用核心 0 和 1 启动,并且在 CPU 0,1 中处于联机状态:注意:对于默认的 Ubuntu 内核配置,CPU 0 始终在线,并且不存在以下内容:
好的,现在让其他所需的内核和 CPU 联机:
并检查:
所以现在,我有核心 0、1、3 在线和核心 2 离线和 6 个 CPU 可用。请注意,核心 0 = cpus 0 和 4,核心 1 = cpus 1 和 5,...
编辑 1:对于 32 个 CPU,也许您有多个节点(处理器),因此 CPU 映射的核心可能不同。
编辑 2:可能是引导后联机的 CPU 默认使用 intel_pstate CPU 频率缩放驱动程序中的性能调控器,这是内核配置默认值(在引导后 1 分钟更改为 powersave,对于启动启用的 CPU)。您可能需要检查所有 CPU 调控器并将其设置为您的偏好,通常是 powersave 调控器。检查做:
例如,要更改调控器(以 root 身份通知):
一旦你让事情按照你想要的方式工作,你可以在启动步骤后自动执行额外的在线操作(请参阅其他问题和答案以了解“如何”)。
注意:在我看来,您应该能够通过“possible_cpus = n”通过“cpu_possible_mask”操作在一个引导步骤中实现您的目标,但我无法让它工作。别人可能知道。