拥有一个运行Discourse数年的 AWS EC2 实例。
由于某些周/月会发生在某些 Discourse 升级后(通过 Discourse 的 Web GUI),系统会停止。然后不再可以通过 SSH 访问它,甚至无法通过 EC2 SSH Web 连接访问。
我通常通过 AWS ECS Web 管理面板重新启动整个机器,然后能够通过 SSH 和 HTTPS 再次连接。
(不幸的是,我没有进一步调查问题的原因)。
今天,Discourse 升级后系统再次挂起。
但这一次,没有重新启动或任何帮助。即使等待了几个小时,系统仍然无法通过 SSH 访问。
EC2 监控也显示我没有高服务器负载:
我的问题
如何再次通过 SSH 访问 EC2 Ubuntu 实例?
更新 1
又一次重新启动并等待一段时间后,系统又回来了,不知从何而来。
对我来说,磁盘似乎有足够的可用空间(没有更多的磁盘空间是我假设系统无法访问的原因之一)。
Filesystem Size Used Avail Use% Mounted on
udev 2.0G 0 2.0G 0% /dev
tmpfs 394M 876K 393M 1% /run
/dev/xvda1 97G 31G 67G 31% /
tmpfs 2.0G 0 2.0G 0% /dev/shm
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 2.0G 0 2.0G 0% /sys/fs/cgroup
/dev/loop1 18M 18M 0 100% /snap/amazon-ssm-agent/1566
/dev/loop0 98M 98M 0 100% /snap/core/10185
/dev/loop2 29M 29M 0 100% /snap/amazon-ssm-agent/2012
/dev/loop3 98M 98M 0 100% /snap/core/10126
overlay 97G 31G 67G 31% /var/lib/docker/overlay2/5a799ab040002ad2ddec94ae85bcbe987543651a0d9478ddc12ab12715da7340/merged
tmpfs 394M 0 394M 0% /run/user/1000
我现在正试图弄清楚是否有任何日志表明中断的原因。
更新 2
根据 heynnema 的要求,以下是完整的结果sudo cat /etc/netplan/*.yaml
:
# This file is generated from information provided by
# the datasource. Changes to it will not persist across an instance.
# To disable cloud-init's network configuration capabilities, write a file
# /etc/cloud/cloud.cfg.d/99-disable-network-config.cfg with the following:
# network: {config: disabled}
network:
version: 2
ethernets:
eth0:
dhcp4: true
match:
macaddress: 06:a0:68:ea:54:4e
set-name: eth0