Eu tenho duas máquinas nas quais executo o mesmo sistema operacional, o mesmo kernel, o mesmo driver de escala de frequência de CPU e o mesmo governador de escala de frequência de CPU.
Um aumentará todas as frequências do núcleo se um processo fixar um núcleo.
Um impulsionará apenas um núcleo físico se houver um processo fixando um núcleo.
Máquina A
CPU: Intel(R) Xeon(R) W-2140B CPU @ 3.20GHz
Scaling driver: intel_pstate
Scaling governor: powersave
OS: Ubuntu 21.10
Kernel: 5.13.0-22-generic
Máquina B
CPU: 11th Gen Intel(R) Core(TM) i5-11600K @ 3.90GHz
Scaling driver: intel_pstate
Scaling governor: powersave
OS: Ubuntu 21.10
Kernel: 5.13.0-22-generic
Observe estes exemplos:
Fixação de dois núcleos na máquina A: (OBSERVE que esta máquina possui Hyperthreading, portanto, aumenta 4 dos 16 núcleos virtuais disponíveis.)
Fixação de dois núcleos na máquina B: (OBSERVE que esta máquina tem 6 núcleos com HT e escala verticalmente todos os 12 núcleos virtuais.)
As capturas de tela são de freqtop , um monitor de frequência de código aberto que eu mesmo escrevi. As marcações laranja mostram a carga em cada núcleo definida como uma porcentagem de ciclos usuário+kernel em relação ao total de ciclos (usuário+kernel+idle.)
Por que a CPU i5-11600K acelera todos os núcleos, mesmo que haja demanda por apenas um?
ATUALIZAÇÃO: Uma diferença que encontrei entre as máquinas é o número de pstates.
Para o Xeon /sys/devices/system/cpu/intel_pstate
está definido para 33, e o corei5 está definido para 42. Não tenho certeza de qual é o significado disso.
Entre as CPUs Intel, existem várias maneiras diferentes de lidar com a limitação do núcleo. É bastante técnico para aprender todos eles. A maioria das pessoas apenas aprende as CPUs que usa. Mas tenho certeza de que é o nível de controle permitido pelo firmware (BIOS, UEFI) e/ou os componentes internos do processador que estão fornecendo esses resultados diferentes.
Eu vejo o mesmo em duas de nossas máquinas, ambas rodando Debian Bullseye, mas com processadores diferentes. Às vezes
$ powertop
pode ser revelador. O objetivo é ajustar o consumo de energia em laptops, mas as informações reveladas em desktops são interessantes por diferentes motivos.Eu uso o powertop para verificar se os núcleos estão rodando no modo turbo e o quanto eles estão estrangulando, entre outras coisas. Funciona para AMD também.
Você escreveu esse monitor, então parece que você sabe mais do que eu sobre o assunto.
Este fórum não seria o lugar para entrar em muitos detalhes, simplesmente porque o material é tão volumoso e técnico. Eu espero que isso ajude.
Consegui fazer com que a máquina corei5 se comportasse de forma mais adequada e apenas aumentasse a frequência dos núcleos para os quais realmente trabalhamos.
Para fazer isso, descobri que precisava alternar o modo do driver intel_pstate.
Em
/sys/devices/system/cpu/intel_pstate/status
você pode alternar entre os modos ativo e passivo .modo ativo: Neste modo, o driver ignora a camada de reguladores de escala da CPUFreq e fornece seus próprios algoritmos de escala para seleção de estado-P.
modo passivo: ...o driver se comporta como um driver de escala CPUFreq normal. Ou seja, ele é invocado por reguladores de escala genéricos quando necessário conversar com o hardware para alterar o P-state de uma CPU...
Se eu li isso corretamente, acho que no modo ativo a CPU tem menos feedback do próprio sistema operacional. Acho que a CPU supõe incorretamente que todos os núcleos precisam ser acelerados.
O que ainda está inexplicável, é o fato de que a CPU Xeon funciona bem em movimento ativo usando o mesmo driver intel_pstate. Mas isso pode ser apenas um palpite de que nem todas as CPUs estão sendo criadas iguais. Ou talvez até uma placa-mãe ou BIOS suspeita que não faça pstates corretamente.