Fui abençoado no contexto de que muitas vezes, se me deparo com algum conteúdo interessante, debate etc. que envolve algum pdf, na maioria das vezes tenho o autor me enviando o conteúdo/pdf ou me enviando o mesmo por mensagem instantânea ou qualquer outra coisa . Com o tempo, esqueço o contexto ou quem me enviou o conteúdo. Embora eu não conheça os limites, tenho certeza de que pelo menos alguns campos podem ser adicionados. Por exemplo, aqui estão os metadados de um arquivo pdf que estou visualizando atualmente.
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
Agora eu pergunto uma maneira pela qual eu poderia adicionar campos como hiperlink (para que eu possa lembrar de onde baixei o arquivo específico) ou from : [email protected]
para que eu sempre possa saber/referir ou descobrir mesmo posteriormente quem compartilhou o conteúdo/arquivo pdf Comigo. Eu vi a página de manual para pdftk ou melhor pdftk-java que está lá no Debian. Há algo chamado update_info
, mas o exemplo compartilhado não facilita para mim entender como se deve usar isso. Alguém poderia ajudar?
Antes de tudo, você precisa exportar os metadados do arquivo em questão. O comando
pdftk file.pdf dump_data output metadata
irá gerar
metadata
, um arquivo contendo todos os metadados defile.pdf
. Dentro deste arquivo você encontrará estruturas da seguinte forma:Você pode criar sua própria chave de metadados adicionando as linhas
ao arquivo. Finalmente, você precisa atualizar os metadados de
file.pdf
comObserve que este último gera um novo arquivo
file2.pdf
. Agora, você tem dois arquivos:file1.pdf
sem os metadados adicionados efile2.pdf
com sua chave de metadados personalizada. Você pode verificar se tudo correu bem com oexiftool
comando que retornaVocê pode usar o pdftk para remover todos os metadados de informações e XMP de um documento copiando suas páginas em um novo PDF, assim:
pdftk A=mydoc.pdf cat A saída mydoc.no_metadata.pdf