我们有一个运行 bacula 7.4.4 的 debian 拉伸备份服务器(fd、sd 和 director 都是相同的版本)。我尝试将一些运行 debian buster 的新服务器与 bacula fd 9.4.2 连接,但没有成功。当我尝试运行作业时,日志中出现以下错误:
...
[backuphost]-sd JobId 6802: Fatal error: bsock.c:569 Packet size=1073741933 too big from "client:[ip]:9103. Terminating connection.
[backuphost]-dir JobId 6802: Error: getmsg.c:185 Malformed message: Jmsg JobId=6802 type=4 level=1577934200 02-Jan 04:03 [backuphost]-dir JobId 6802: Start Backup JobId 6802, Job=[client]_backup.2020-01-02_04.00.00_11
[backuphost]-sd JobId 6802: Elapsed time=00:00:01, Transfer rate=162 Bytes/second
[backuphost]-dir JobId 6802: Error: getmsg.c:185 Malformed message: Jmsg JobId=6802 type=3 level=1577934200 [client] JobId 6802: Fatal error: backup.c:929 Network send error to SD. Data=51 1 0 ERR=Connection reset by peer
[backuphost]-dir JobId 6802: Error: getmsg.c:185 Malformed message: Jmsg JobId=6802 type=4 level=1577934210 [client] JobId 6802: Error: bsock.c:271 Socket has errors=1 on call to Storage daemon:[hostip]:9103
[backuphost]-dir JobId 6802: Fatal error: bsock.c:569 Packet size=1073741944 too big from "Client: [client]:[clientip]:9102. Terminating connection.
[backuphost]-dir JobId 6802: Fatal error: No Job status returned from FD.
这不是硬件错误或网络/防火墙配置错误,因为所有其他运行 7.4.4 的服务器都在工作,nmap 显示 host->client 9102 已打开,client->host 9103 在所有相关客户端上均已打开,并且错误始终出现在运行 fd 9.4.2 的 3 个客户端上。
经过一番搜索,我尝试了一些配置选项,例如 - 在 fd 和 sd 中更改“最大网络缓冲区大小” - 在 fd 和 sd 中更改“心跳间隔” 每次都出现相同的错误。
作为一种临时解决方法,我在客户端上将 fd 版本降级为 7.4.4,并且备份在配置文件不变的情况下工作。
如果这是版本之间的简单配置差异,我真的很想知道如何修复它,如果它是兼容性错误,那么开发团队应该知道它。发行说明只提到较低的 fd 版本兼容性,而不是更高的。
长期解决方案将是主机升级,但我目前不愿意这样做。