Estou procurando os instintos de alguém sobre isso. Há cerca de 16 coisas que podem ser, ou que eu poderia tentar, mas espero restringir um pouco com base no conhecimento e sabedoria experiencial de alguém.
O que está acontecendo:
O que está acontecendo, basicamente, é que minha GPU RTX (Zotac, modelo padrão 4090) está simplesmente travando. As telas (incluindo meu headset VR, se eu estiver usando) simplesmente ficam em branco de repente. Ainda consigo ouvir o áudio de tudo e falar no discord, mas até isso para (ontem à noite, consegui continuar falando com meu amigo no discord por algumas horas, nunca ficou a noite toda). O PC basicamente trava lentamente, do qual nunca se recupera.
Eu tive isso até mesmo em jogos de desempenho muito baixo como They Are Billions. Está piorando, primeiro era uma ou duas vezes por sessão de jogo, agora é muito regular - não consigo jogar. Não parece acontecer quando não estou jogando.
Atualização : Agora isso está acontecendo quando não estou jogando também. Acontece aleatoriamente. Às vezes funciona por uma semana inteira, às vezes não passa da tela de login não importa o que eu faça, e então magicamente funciona no dia seguinte, ou faz alguma pequena mudança como mover a RAM para um novo slot...
Eu também às vezes (mas nem sempre) vejo um evento no visualizador de eventos: "Display driver nvlddmkm stopped responding and successfully recovered."
(parece que não recupera). De acordo com isso , era para ser a RAM, e é por isso que tentei substituir a RAM (não ajudou).
Nota : Não é compatibilidade. O sistema estava funcionando bem por 2 anos, e não houve mudanças óbvias quando o problema começou na semana passada. O problema simplesmente se desenvolveu de repente, e está piorando.
Meu palpite:
Meu palpite é que seja a PSU (descartada) ou a própria GPU (testada em outro equipamento, funcionou bem) . Uma delas desenvolveu algum tipo de falha, e meu melhor palpite (e esperança) é a PSU. A PSU tem potência mais do que suficiente, mas é uma marca menos conhecida (e descontinuada) .
O que eu tentei (veja a atualização abaixo):
Eu olhei as temperaturas (e habilitei o registro) e elas nunca aumentaram. Eu também atualizei todos os drivers possíveis etc. (mas não o MOBO) , e testei a GPU com 80% de potência. Eu também executei um teste completo de CPU usando a ferramenta da Intel . Eu não trabalho em TI há anos, mas não era muito bom mesmo naquela época :)
Pergunta:
Alguém tem alguma dica de como posso diagnosticar se é PSU ou GPU (ou possivelmente CPU), sem testar em outra máquina? Ninguém que eu conheço tem uma PSU grande o suficiente para testar minha GPU. Também fico feliz por outras perguntas e sugestões, estou procurando sua sabedoria, pois não confio na minha!
Especificações:
Falando sobre uma caixa do Windows 11. Outras especificações são Aerocool Strike-X 1100W Modular Gaming Quiet Fan PSU 80 Plus Gold, Samsung 1TB 970 EVO M.2 NVMe SSD, ASRock Z690 PG Riptide, 32GB RAM, Intel 12900K, NZXT Kraken X63, 280mm CPU Cooler, e há 2 telas, HDMI e DP.
Atualizar:
- Atualizei tudo que pude pensar, incluindo BIOS e drivers, limpei o gabinete e fiz o máximo de diligência possível
- Substituí a RAM. Ainda tenho o problema.
- Executei o OCCT na GPU e ele travou em 5 minutos (ventiladores barulhentos, tela azul geral aparece se eu deixo assim).
- Levei a GPU para escanear e deixei que eles a testassem em bancada por 90 minutos, e deu tudo certo.
- Comprei uma nova PSU quando cheguei lá e a instalei. Ainda tenho o problema.
Então, amanhã vou desconectar a placa-mãe, levá-la para escanear e também reembolsar a PSU, deixá-los testá-la, provavelmente tentar substituí-la mesmo que passe nos testes (e tome muito cuidado, caso eu precise devolvê-la também). Também farei com que testem a GPU novamente, por que não.
Se não for nada disso, é a CPU (que não está na garantia!), ou algo muito aleatório, como alguma outra peça defeituosa ou cabo em curto, ou é uma combinação de coisas que torna isso exponencialmente mais problemático de diagnosticar. Obviamente, estou tendo muito estresse sobre isso - quaisquer recomendações ou sugestões são bem-vindas!
Levei a GPU para escanear duas vezes, na primeira vez ela executou testes (OCCT) sem problemas por 90 minutos. Na segunda vez ela travou imediatamente com meu adaptador, então eles tentaram novamente com o próprio adaptador deles, e não travou, mas apresentou erros, então eles fizeram o RMA.
Infelizmente, o 4090 já chegou ao fim de sua vida útil, então eles não puderam substituí-lo e, em vez disso, me ofereceram um reembolso de 60%.