当我在 Python3 中通过 PIL 加载图像,保存它然后再次加载时,我在 Ubuntu 18.04.5 和 Ubuntu 20.04.1 中得到不同的值。我知道重新保存图像会因压缩而改变值,但为什么在 Ubuntu 18.04 中这种改变会有所不同?我尝试过的所有其他操作系统(Ubuntu 20.04+、Fedora 33、Windows 10 20H2)都会给出一个值,但即使在上述所有操作系统中存在相同版本的枕头/PIL、numpy 和 python 时,Ubuntu 18.04 也会有所不同。
加载图像
img = Image.open('Sp_D_CNN_A_art0024_ani0032_0268.jpg')
np.sum(np.array(img))
OUTPUT : 28586794 (Same for all the OS)
保存和加载重复的图像
img.save('temp.jpg', 'JPEG')
tempimg = Image.open('temp.jpg')
np.sum(np.array(tempimg))
OUTPUT : 28581417 (for Ubuntu 18.04.5 and CentOS 8.2.2004)
28582606 (for Ubuntu 20.04+, Fedora 33, Windows 10 20H2)
现在,这里的差异可能看起来非常小,但问题是,在我的错误级别分析算法进一步处理之后,差异变得巨大,并且当我在 Google Colab(在其运行时使用 Ubuntu 18.04.5)上训练我的分割模型时,生成的mask 在 Ubuntu 20.04+、Fedora 33、Windows 10 20H2 中非常不准确。
为什么会发生这种情况,我该如何解决?
其背后的罪魁祸首是枕头(PIL)库使用的底层 libjpeg 版本。虽然 Ubuntu 18.04.5 和 Ubuntu 20.04.1 都具有相同的 libjpeg 包,但默认安装在 Ubuntu 18.04.5 上的枕头版本具有自己的二进制文件。所以解决这个问题的方法是删除当前的枕头并通过从源代码下载和构建它来重新安装它,这样它就可以保证使用系统的 libjpeg。
首先移除当前的枕头模块
然后只需安装此处列出的依赖包: https ://pillow.readthedocs.io/en/stable/installation.html#building-on-linux
然后运行: