前面问题的非常详细的描述,TL;我尝试部署的 DR 服务器无法登记,并且我在一些服务器上遇到 UEFI 网络启动问题
我有 4 台服务器(改用桌面塔,不是非常严肃的家庭实验室设置),其中一台用于专用区域 + 机架控制器的目的(使用已安装的 PostgreSQL 数据库,通过 snap 安装 MAAS 2.8 版)(旧 Dimension正是因为这个原因才起作用)。我之前的设置没有列出的问题,部署一切正常,直到我完全重新安装 Ubuntu 以重置 MAAS。(我不小心尝试在 IPv6/IPv4 范围内通过 DHCP 分配 18Qt 地址,结果冻结了,杀死了我的网络,之后 Ubuntu 拒绝启动)从那时起,唯一的区别是我在 DD-WRT 上设置了 IPv6 并更改了子网。(所有 IP 地址/引用都已更改和测试)总体而言,重新安装后 MAAS 有点不稳定,但这可能是安慰剂效应。
对以下问题的一点说明;我一直在使用 DD-WRT/dnsmasq 来控制我的网络的 DHCP,MAAS 控制器无法真正处理当前负载之上的 DHCP。所有 dhcp-boot 记录都完好无损并且可以正常工作(至少对于 IPv4,我正在研究 IPv6 网络引导)(另外,我知道这个设置并不理想,但再一次,这不是一个非常严肃的家庭实验室设置,我我使用 MAAS 是为了方便可扩展性和集中控制,我知道不要对这个非常、坦率地、简陋的设置抱有太大的期望。)
3 台虚拟化主机服务器中有 2 台(我正在尝试使用 MAAS 进行部署,它们是具有最新 BIOS 更新的戴尔 Optiplex 3010)拒绝从 UEFI PXE 启动,卡在Fetching netboot image...
MAAS rackd.log 上说机器结束了抓住bootx64.efi
,grubx64.efi
但仅此而已。在尝试启用安全启动的 UEFI 后,我将机器设置为使用旧版 CSM 启动。它最终在入伍环境中走得更远,但这导致了我的下一个问题......
所有 3 台服务器(包括在 UEFI PXE 上运行的服务器,HP 6300-SFF)一开始就拒绝入伍,并表示Can not apply stage final, no datasource found! Likely bad things to come!
。然后它让我进入主机名下的登录提示ubuntu
(maas-enlistment-node
不像它应该的那样)。在 MAAS UI 上没有一个是可见的。在引导阶段,它也有 6 次未能启动 OpenSSH 守护进程。我的调试操作系统是 Ubuntu 20.04 Focal Fossa,这也是 MAAS 服务器运行的平台。(我尝试了 Ubuntu 18.04,结果相同)。在登录提示符下,我尝试了所有我能想到的密码组合(ubuntu
| ubuntu
, ubuntu
| <nothing>
, root
| ubuntu
, ubuntu
| <my MAAS password>
, maas
|<MAAS password>
等)并且它们都不起作用。他们显然都有连接,因为他们都被 DD-WRT 分配了 IP 地址,并且他们下载了网络引导映像和临时 ramdisk/我可以在他们的 v4 和 v6 地址上成功地 ping 它们。根据控制器面板,所有 MAAS 服务都在运行。
我不太确定从这里去哪里。我在它死之前进行了功能安装,然后重新安装和 IPv6 部署把它搞砸了。可根据要求提供日志文件和 dnsmasq.conf。蒂亚!
(抱歉,如果这是一篇糟糕/长篇的文章,这是我的第一篇文章,已经潜伏了很长时间,但对这里的结构化/节制的工作方式不太熟悉:P)
经过长时间与服务器的斗争,我发现了这个问题。显然 PostgreSQL 数据库中有错误的数据,向主机发送虚假元数据并造成更多混乱。它是如何发生的,我无法理解,但我已经迁移到更理想的虚拟化设置,现在它与 Landscape 一起完美运行。¯\_(ツ)_/¯