Resumindo: alguns programas, incluindo o Okular, exibem em branco algumas das páginas em um pdf específico (mais de 1.000 páginas), mas outros programas, incluindo alguns navegadores da Internet, exibem todas as páginas sem espaços em branco.
Depois de extrair todas as páginas como pdf, o mesmo acontece com as mesmas páginas problemáticas. Eu carreguei um deles no DocDroid para teste. (Faça o download desta página e veja se o seu Okular pode ver seu conteúdo como visto no Firefox ou Vivaldi.)
Mesmo os visualizadores do Android lidam bem com essas páginas/arquivos.
História mais longa:
Eu tenho um pdf de um antigo dicionário digitalizado de quase 1500 páginas. O Okular me mostra que muitas páginas estão em branco. Veja aqui na visão geral:
O mesmo no PDF Arranger:
Isso não foi uma grande surpresa para mim, mas pensei que poderia limpar este dicionário removendo as páginas em branco com o PDF Arranger, ou ainda mais simples extraindo as páginas como pdf ou png, excluindo os espaços em branco (mais facilmente para identificar , selecione e remova do que com a ferramenta mencionada - por causa de seu tamanho minúsculo) e, em seguida, recrie um pdf a partir das páginas restantes.
Os arquivos png extraídos eram os esperados e pude identificar facilmente os espaços em branco: eles tinham menos de 2 KiB de tamanho. As miniaturas dos golfinhos também mostraram os pngs em branco, próximos às imagens vistas acima.
Mas como também extraí as páginas como pdf, fiquei surpreso ao ver que a visualização em miniatura do Dolphin das páginas separadas em pdf agora estava sem espaços em branco! Além disso, não houve diferença perceptível no tamanho entre os PDFs de 1 página.
Abrindo esses arquivos pdf suspeitos de 1 página no Okular, eles ainda eram exibidos em branco, e o mesmo acontecia no Qpdfviewer e no PDF Aranger, mas não no WPS Pdf, Master PDF, LibreOffice-Draw e Firefox: lá, o conteúdo foi visto, a página não estava em branco.
Talvez um detalhe importante:
os arquivos png em branco extraídos (que também são minúsculos) estão totalmente em branco, enquanto as páginas PDF problemáticas (com tamanho inalterado se extraídas como PDF) quando vistas em branco não estão totalmente em branco: uma linha FOOTER na parte inferior ainda é vista e apenas o resto está em branco.
O mesmo comando foi usado para extrair as páginas em pdf e png: pdftoppm
.
Agora identifiquei as páginas problemáticas e posso testar facilmente.
Imprimindo em PDF um desses arquivos em um dos navegadores da família Chromium, como Vivaldi e Opera, o PDF resultante ainda estava em branco (para o Okular e os outros já afetados), a menos que a opção "imprimir como imagem" fosse selecionada em suas configurações. - Se essa opção for selecionada ou se a impressão em pdf for feita no Firefox, isso dará como saída um arquivo pdf que é visto normalmente no Okular!
Testando com outros programas e resumindo:
todas as páginas são vistas por WPS PDF, Master PDF, Firefox, navegador Vivaldi, LibreOffice Draw, ImageMagick, mupdf, PDF Studio Viewer
espaços em branco (com esse rodapé) são exibidos no Okular, Qpdfviewer, PDF Aranger, Falkon (!), Inskape, Krita
Evince (Document Viewer) instalado como snap no Kubuntu não pode abrir o arquivo grande, nem nenhuma das páginas separadas do pdf, mas dá um erro:
Error opening file the.pdf: Permission denied
(ele abre outros arquivos pdf)
Qual poderia ser o problema?
Posso corrigir isso no nível do sistema?
Okular e Qpdfviewer são os únicos visualizadores de PDF que parecem afetados por isso (não importa o problema que os próprios arquivos possam ter).
Prefiro usar o Okular para todos os meus PDFs.
Este é um bug com
poppler
, postado aqui , inicialmente aqui , Evince e Atril (visualizador de PDF do Mint) também são afetados.Para corrigir as páginas, imprimi-as "como pdf" no Firefox (ou Chrome, Vivaldi, Opera - com essas 'imprimir como imagem' também deve ser selecionado). Dependendo da capacidade da RAM, não se deve "imprimir em pdf" mais de 200-300 páginas de uma só vez para evitar congelamentos/travamentos.