Eu tenho uma instância do GCE que está em execução há vários anos. Durante a noite, a instância foi reiniciada com os seguintes registros:
2022-02-13 04:46:36.370 CET compute.instances.hostError Instance terminated by Compute Engine.
2022-02-13 04:47:08.279 CET compute.instances.automaticRestart Instance automatically restarted by Compute Engine.
No entanto, a instância não foi reiniciada.
Eu posso me conectar ao console serial onde vejo isso:
serialport: Connected to ***.europe-west1-b.*** port 1 (
[ TIME ] Timed out waiting for device ***
[DEPEND] Dependency failed for File… ***.
[DEPEND] Dependency failed for /data.
[DEPEND] Dependency failed for Local File Systems.
[ OK ] Stopped Dispatch Password …ts to Console Directory Watch.
[ OK ] Stopped Forward Password R…uests to Wall Directory Watch.
[ OK ] Reached target Timers.
Starting Raise network interfaces...
[ OK ] Closed Syslog Socket.
[ OK ] Reached target Login Prompts.
[ OK ] Reached target Paths.
[ OK ] Reached target Sockets.
[ OK ] Started Emergency Shell.
[ OK ] Reached target Emergency Mode.
Starting Create Volatile Files and Directories...
[ OK ] Finished Create Volatile Files and Directories.
Starting Network Time Synchronization...
Starting Update UTMP about System Boot/Shutdown...
[ OK ] Finished Update UTMP about System Boot/Shutdown.
Starting Update UTMP about System Runlevel Changes...
[ OK ] Finished Update UTMP about System Runlevel Changes.
[ OK ] Started Network Time Synchronization.
[ OK ] Reached target System Time Set.
[ OK ] Reached target System Time Synchronized.
Stopping Network Time Synchronization...
[ OK ] Stopped Network Time Synchronization.
Starting Network Time Synchronization...
[ OK ] Started Network Time Synchronization.
[ OK ] Finished Raise network interfaces.
[ OK ] Reached target Network.
[ OK ] Reached target Network is Online.
You are in emergency mode. After logging in, type "journalctl -xb" to view
system logs, "systemctl reboot" to r
Cannot open access to console, the root account is locked.
See sulogin(8) man page for more details.
Press Enter to continue.
Parece que um dos discos não pode ser conectado – mas o que posso fazer agora? O disco parece estar normalmente disponível no mecanismo de computação.
Receio que você não possa fazer nada com essa VM afetada.
Na documentação do Host Events ou FAQ , você pode encontrar informações:
Instância de VM que está na "nuvem", ainda é uma máquina física que está executando sua carga de trabalho. Infelizmente, esta instância teve uma falha de hardware ou software e não há nada que você possa fazer.
O GCP introduziu algo chamado migração ao vivo que evita esse tipo de situação.
Possível solução alternativa
Como você menciona que os discos são persistentes e ainda visíveis no GCP, você pode tentar reanexá-los a outra VM. Como guiar pode ser encontrado em Criando e anexando uma documentação de disco .
Finalmente encontrei a estranha razão para este erro - veja o original
/etc/fstab
:Mas não existe tal dispositivo neste caminho. Resolvi isso anexando
/dev/sdb
, mas acho que essa não é a melhor solução. Eu me pergunto como isso acontece que o dispositivo de repente desaparece completamente e no final mata a máquina.