Meu diário está inundado com isso:
journalctl -r
2024-01-10T20:07:01.947911-08:00 dell kernel: pci 0000:01:00.0: [ 0] RxErr (First)
2024-01-10T20:07:01.947686-08:00 dell kernel: pci 0000:01:00.0: device [10ec:8136] error status/mask=00000001/00006000
2024-01-10T20:07:01.947423-08:00 dell kernel: pci 0000:01:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
2024-01-10T20:07:01.946988-08:00 dell kernel: pcieport 0000:00:1d.0: AER: Multiple Corrected error received: 0000:01:00.0
2024-01-10T20:07:01.694824-08:00 dell kernel: pci 0000:01:00.0: [ 0] RxErr (First)
2024-01-10T20:07:01.694573-08:00 dell kernel: pci 0000:01:00.0: device [10ec:8136] error status/mask=00000001/00006000
2024-01-10T20:07:01.694279-08:00 dell kernel: pci 0000:01:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
2024-01-10T20:07:01.693781-08:00 dell kernel: pcieport 0000:00:1d.0: AER: Multiple Corrected error received: 0000:01:00.0
2024-01-10T20:07:01.601284-08:00 dell kernel: pci 0000:01:00.0: [ 0] RxErr (First)
A placa é RTL810xE PCI Express Fast Ethernet controller
a que, de acordo com https://linux-hardware.org/index.php?id=pci:10ec-8136-1028-056a , deseja o driver Realtek r8169.
A página https://wiki.archlinux.org/title/Network_configuration/EthernetRealtek no link / WOL problem
possui uma seção que sugere que há um problema com este driver em uma inicialização dupla do Windows. Esta não é uma máquina de inicialização dupla. Isso éarch linux 6.6.10-arch1-1
Posso dar vida ao cartão, modprobe r8169
mas isso não afeta as mensagens de erro do diário para este dispositivo.
Seu kernel está configurado com o recurso Relatório avançado de erros da porta raiz PCI Express (
CONFIG_PCIEAER
), e o chipset está detectando pequenos erros corrigíveis de link PCIe na comunicação com a NIC RTL810xE no local do barramento 0000:01:00.0 e corrigindo-os automaticamente.Este não é um erro de comunicação de rede: é um erro de link PCIe no computador.
Se esta interface de rede for uma placa complementar, certifique-se de que a placa não esteja danificada, firmemente inserida no slot e que as superfícies do conector da borda da placa estejam limpas. Teste com outra placa de rede do mesmo modelo, se possível.
Caso contrário, e especialmente se esta interface de rede estiver integrada à placa-mãe, os erros poderão ser um "problema conhecido" deste chip específico e/ou design da placa-mãe, e talvez você não consiga eliminar a causa raiz. No entanto, desde que os erros sejam desse
severity=Corrected
tipo, eles não deverão causar problemas.Se um componente que funcionou anteriormente sem erros de repente começar a produzir vários
severity=Corrected
erros, isso pode ser um sinal precoce de falha iminente de hardware. O kernel está reportando-os para que o administrador do sistema possa julgar se a manutenção proativa pode ou não ser apropriada.Ou seja: se o sistema anteriormente funcionava sem esses avisos, pode ser uma boa ideia ter à mão uma placa de rede sobressalente, caso esta falhe.
As
severity=Corrected
mensagens são emitidas utilizando oKERN_WARNING
nível de erro (= numericamente 4). Para se livrar dessas mensagens em seu diário, você pode ajustarsystemd-journald
para armazenar apenas mensagens com prioridade superior a essa:Crie um arquivo nomeado
/etc/systemd/journald.conf.d/silence-kernel-warnings.conf
com o seguinte conteúdo:Isso não afetará erros de
severity=Uncorrected
, o que indicaria corrupção real de dados no respectivo link PCIe. Tais erros são relatados comKERN_ERR
nível de erro (= numericamente 3).Se você estiver construindo seus próprios kernels personalizados, considere desabilitar a
CONFIG_PCIEAER
opção de configuração do kernel.