Normalmente, todas as imagens são gravadas como arquivos PBM (para imagens monocromáticas), PGM (para imagens em tons de cinza) ou PPM (para imagens coloridas). Com esta opção, as imagens no formato DCT são salvas como arquivos JPEG. Todas as imagens não-DCT são salvas no formato PBM/PGM/PPM normalmente. (As imagens embutidas são sempre salvas no formato PBM/PGM/PPM.)
-
man pdfimages
do Xpdf
O formato de saída padrão é PBM (para imagens monocromáticas) ou PPM para não monocromáticas. As opções -png ou -tiff mudam para a saída padrão para PNG ou TIFF, respectivamente. Se -png e -tiff forem especificados, as imagens CMYK serão gravadas como TIFF e todas as outras imagens serão gravadas como PNG. Além disso, as opções -j, -jp2 e -jbig2 farão com que as imagens JPEG, JPEG2000 e JBIG2, respectivamente, no arquivo PDF sejam gravadas em seu formato nativo.
-
man pdfimages
de poppler
Qual é a razão pela qual ambas as implementações de pdfimages
extração de imagens em formatos "misteriosos" (eu os chamo de "misteriosos" porque nunca ouvi falar deles antes) PBM/PGM/PPM (conhecidos coletivamente como Netpbm ou PNM, https://en. wikipedia.org/wiki/Netpbm ) em vez de PNG, JPEG ou talvez GIF, que são (posso estar errado, é claro) é o padrão de fato no mundo do usuário casual atualmente (e, se bem me lembro, era o mesmo padrão de fato de 10 e 20 anos atrás também)?