我已经在 Proxmox 中运行的全新 18.04 LXC 容器上安装了 Landscape Server 19.10(快速入门)。安装没有问题,Web GUI 运行良好,并且我能够将客户端计算机连接到服务器。
不幸的是,我在 Web GUI 的通知窗格中注意到脚本update_security_db.sh每次运行时都会重复失败(根据 /etc/cron.d/landscape-server,它每小时都会失败一次)。
检查update-security-db.log并手动运行脚本会给我以下错误:
Dec 19 16:40:36 update-security-db ERR Traceback (most recent call last):
Dec 19 16:40:36 update-security-db ERR File "./process-usns", line 7, in <module>
Dec 19 16:40:36 update-security-db ERR canonical.landscape.scripts.usn.run()
Dec 19 16:40:36 update-security-db ERR File "/opt/canonical/landscape/canonical/landscape/scripts/batch.py", line 77, in __call__
Dec 19 16:40:36 update-security-db ERR code = self.run()
Dec 19 16:40:36 update-security-db ERR File "/opt/canonical/landscape/canonical/landscape/scripts/usn.py", line 40, in run
Dec 19 16:40:36 update-security-db ERR changeset = update_from_usn_tool_db(db)
Dec 19 16:40:36 update-security-db ERR File "/opt/canonical/landscape/canonical/landscape/model/package/usn.py", line 237, in update_from_usn_tool_db
Dec 19 16:40:36 update-security-db ERR "WHERE id = %(temp)s.pkg_id" % {"temp": temp_table})
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/store.py", line 109, in execute
Dec 19 16:40:37 update-security-db ERR return self._connection.execute(statement, params, noresult)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/databases/postgres.py", line 306, in execute
Dec 19 16:40:37 update-security-db ERR return Connection.execute(self, statement, params, noresult)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 241, in execute
Dec 19 16:40:37 update-security-db ERR raw_cursor = self.raw_execute(statement, params)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/databases/postgres.py", line 316, in raw_execute
Dec 19 16:40:37 update-security-db ERR return Connection.raw_execute(self, statement, params)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 374, in raw_execute
Dec 19 16:40:37 update-security-db ERR self._run_execution(raw_cursor, args, params, statement)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 392, in _run_execution
Dec 19 16:40:37 update-security-db ERR statement, params or (), error)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/database.py", line 454, in _check_disconnect
Dec 19 16:40:37 update-security-db ERR return function(*args, **kwargs)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/tracer.py", line 248, in trace
Dec 19 16:40:37 update-security-db ERR attr(*args, **kwargs)
Dec 19 16:40:37 update-security-db ERR File "/usr/lib/python2.7/dist-packages/storm/databases/postgres.py", line 463, in connection_raw_execute_error
Dec 19 16:40:37 update-security-db ERR statement, params, "SQL server cancelled statement")
Dec 19 16:40:37 update-security-db ERR storm.exceptions.TimeoutError: 'SQL server cancelled statement', 'UPDATE package SET usn_id = new_package_usn_6KqW4Z.usn_id FROM new_package_usn_6KqW4Z WHERE id = new_package_usn_6KqW4Z.pkg_id', ()
每次运行update_security_db.sh时都会发生此错误。手动运行脚本时,我注意到它成功地从 Ubuntu 服务器卷曲了 USN 文件。然后它将文件传递给process_usns脚本。该脚本会运行几分钟,然后退出并出现上面显示的 SQL 错误。
我基本上直接在一个新容器上安装了landscape-server-quickstart,然后在一个新容器上再次尝试这个过程也给了我同样的问题。奇怪的是,该日志似乎暗示 SQL 服务器处理新下载的 USN 文件存在一些问题。运行脚本时 CPU 和内存利用率很好(我的容器有 4GB RAM 和 2vCPU)。这对我来说是一个问题,因为我设置 Landscape 的主要原因是为多台计算机执行补丁管理。
更新:我今天在 Ubuntu Server 18.04 的新映像上启动了 KVM 虚拟机。得到与以前完全相同的错误(好奇这个问题是否仅在 LXC 中运行时才会出现)。
经过一番调试,我发现这个问题是由于usn.py更新数据库时SQL服务器超时造成的。这可能是因为我的 LXC 主机在高负载下运行,其系统规格低于 Landscape 推荐的规格。当安全更新日志中触发错误时,PostgreSQL 日志也清楚地引用了此超时。
/opt/canonical/landscape/canonical/landscape/model/package/usn.py:235中的以下命令在我的机器上花费的时间比平时要长,因此会触发数据库超时。
我通过在该命令之前添加以下内容快速解决了这个问题。
我对 SQL 没有经验,但这基本上应该将超时时间暂时增加到 10000 毫秒,这对于处理 db 事务来说已经足够了。它在设置为较低值时也有效,但我将其设置为更高以防万一。我无法找出 Landscape 最初设置的超时值。
补丁后,错误消失,USN更新正常工作。这是一个肮脏的黑客,但据我所知它有效。
如果其他人遇到这种情况和上述情况,并且问题不是 SQL 命令运行时间过长,则可能是由于内存不足错误。我使用的虚拟机只有 2GB 内存。
默认情况下,快速入门不会设置交换文件,因此您可以通过执行以下操作来解决此问题:
sudo fallocate -l 1G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
sudo swapon --show
然后,您需要添加到 fstab 以使其永久化。https://www.digitalocean.com/community/tutorials/how-to-add-swap-space-on-ubuntu-20-04