Recebi um arquivo PDF que incorpora (centenas de) documentos, que posso acessar diretamente usando a função "Arquivos incorporados" em okular
(mas não encontrei um equivalente em evince
):
Esses documentos são vinculados a elementos de texto específicos no arquivo PDF, usando uma hiperreferência, o que é conveniente para descobrir qual planilha corresponde a qual... No entanto, esses links são aparentemente scripts javascript:
Ao clicar em qualquer um desses links em okular
ou evince
, nada acontece. O botão direito do mouse evince
oferece um menu que parece não saber da existência de um link, okular
nele apenas oferece, Follow this link
mas novamente nada acontece.
Existe alguma maneira de fazer esses links funcionarem em qualquer ferramenta de PDF do Linux, e se não, existe alguma maneira de imprimir o script correspondente a um determinado link, para que eu possa identificar o arquivo correspondente?
Como alternativa, posso exportar em massa todos os documentos incorporados para processamento automático? ( grep
ping meu caminho para os dados relevantes ...)
Sua melhor aposta provavelmente é extrair os arquivos incorporados e, em seguida, usar algo como um navegador da Web que saiba como lidar com links JavaScript corretamente.
Você pode extrair arquivos embutidos usando
pdfdetach
, que deve estar disponível no pacote poppler-utils em seu sistema.