通常,所有图像都以 PBM(用于单色图像)、PGM(用于灰度图像)或 PPM(用于彩色图像)文件的形式写入。使用此选项,DCT 格式的图像将保存为 JPEG 文件。所有非 DCT 图像都照常以 PBM/PGM/PPM 格式保存。(内联图像始终以 PBM/PGM/PPM 格式保存。)
—
man pdfimages
来自 Xpdf
默认输出格式为 PBM(用于单色图像)或 PPM(用于非单色图像)。-png 或 -tiff 选项分别更改为默认输出为 PNG 或 TIFF。如果同时指定了 -png 和 -tiff,则 CMYK 图像将写入为 TIFF,而所有其他图像将写入为 PNG。此外,-j、-jp2 和 -jbig2 选项将分别导致 PDF 文件中的 JPEG、JPEG2000 和 JBIG2 图像以其原始格式写入。
—
man pdfimages
来自 poppler
为什么这两种pdfimages
提取图像的实现都是以“神秘的”(我称它们为“神秘”是因为我以前从未听说过)PBM/PGM/PPM 格式(统称为 Netpbm 或 PNM,https://en.wikipedia.org/wiki/Netpbm)而不是 PNG、JPEG 或者 GIF 格式(当然我可能错了)来提取图像?(如果我没记错的话,10 年前和 20 年前它也是最流行的标准)?