多操作系统环境的首选电子邮件客户端

Question

Vojtěch

Asked: 2022-02-13 23:48:32 +0800 CST2022-02-13 23:48:32 +0800 CST 2022-02-13 23:48:32 +0800 CST

谷歌计算引擎中的失败实例

772

我有一个已经运行了几年的 GCE 实例。在夜间，实例重新启动并显示以下日志：

2022-02-13 04:46:36.370 CET compute.instances.hostError Instance terminated by Compute Engine.
2022-02-13 04:47:08.279 CET compute.instances.automaticRestart Instance automatically restarted by Compute Engine.

但是实例没有重新启动。

我可以连接到看到这个的串行控制台：

serialport: Connected to ***.europe-west1-b.*** port 1 (
[ TIME ] Timed out waiting for device ***
[DEPEND] Dependency failed for File… ***.
[DEPEND] Dependency failed for /data.
[DEPEND] Dependency failed for Local File Systems.
[  OK  ] Stopped Dispatch Password …ts to Console Directory Watch.
[  OK  ] Stopped Forward Password R…uests to Wall Directory Watch.
[  OK  ] Reached target Timers.
         Starting Raise network interfaces...
[  OK  ] Closed Syslog Socket.
[  OK  ] Reached target Login Prompts.
[  OK  ] Reached target Paths.
[  OK  ] Reached target Sockets.
[  OK  ] Started Emergency Shell.
[  OK  ] Reached target Emergency Mode.
         Starting Create Volatile Files and Directories...
[  OK  ] Finished Create Volatile Files and Directories.
         Starting Network Time Synchronization...
         Starting Update UTMP about System Boot/Shutdown...
[  OK  ] Finished Update UTMP about System Boot/Shutdown.
         Starting Update UTMP about System Runlevel Changes...
[  OK  ] Finished Update UTMP about System Runlevel Changes.
[  OK  ] Started Network Time Synchronization.
[  OK  ] Reached target System Time Set.
[  OK  ] Reached target System Time Synchronized.
         Stopping Network Time Synchronization...
[  OK  ] Stopped Network Time Synchronization.
         Starting Network Time Synchronization...
[  OK  ] Started Network Time Synchronization.
[  OK  ] Finished Raise network interfaces.
[  OK  ] Reached target Network.
[  OK  ] Reached target Network is Online.
You are in emergency mode. After logging in, type "journalctl -xb" to view
system logs, "systemctl reboot" to r
Cannot open access to console, the root account is locked.
See sulogin(8) man page for more details.
Press Enter to continue.

似乎其中一个磁盘无法连接 - 但现在我该怎么办？该磁盘似乎在计算引擎中通常可用。

2 个回答

Voted

PjoterS · Answer 1 · 2022-02-17T00:56:54+08:00

恐怕您无法对这个受影响的虚拟机做任何事情。

在Host Events文档或常见问题解答中，您可以找到以下信息：

主机错误 ( compute.instances.hostError) 表示托管 VM 的物理计算机上存在硬件或软件问题，导致 VM 崩溃。涉及完全硬件故障或其他硬件问题的主机错误可能会阻止虚拟机的实时迁移。

VM 实例位于“云”中，它仍然是运行您的工作负载的物理机器。不幸的是，此实例出现硬件或软件故障，您无能为力。

GCP 引入了一种称为实时迁移的东西，它可以防止这种情况发生。

Compute Engine 提供实时迁移功能，即使在发生主机系统事件（例如软件或硬件更新）时也能保持虚拟机实例运行，但我想现在配置此事件为时已晚。

...

实时迁移使您的实例在以下期间保持运行：

定期基础设施维护和升级。

数据中心的网络和电网维护。

内存、CPU、网卡、磁盘、电源等硬件出现故障。这是尽最大努力完成的；如果硬件完全失败或以其他方式阻止实时迁移，VM 会崩溃并自动重新启动并记录 hostError。

...

实时迁移不会更改 VM 本身的任何属性或属性。实时迁移过程只是将正在运行的 VM 从一台主机转移到同一区域内的另一台主机。

可能的解决方法

正如您提到的磁盘是持久的并且在 GCP 中仍然可见，您可以尝试将它们重新附加到另一个 VM。如何指南可以在创建和附加磁盘文档中找到。

Vojtěch · Answer 2 · 2022-02-18T06:41:57+08:00

Vojtěch

2022-02-18T06:41:57+08:002022-02-18T06:41:57+08:00

我终于找到了这个错误的奇怪原因 - 见原文/etc/fstab：

/dev/disk/by-id/google-***-data /data ext4 discard,defaults 0 2

但是这条路上没有这样的设备。我通过附加解决了这个问题/dev/sdb，但我想这不是最好的解决方案。我想知道设备突然完全消失并最终杀死机器是怎么发生的。

1

谷歌计算引擎中的失败实例

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

谷歌计算引擎中的失败实例

2 个回答

相关问题