A transparência SVG quebra a compatibilidade do PDF/A

Question

user2609605

Asked: 2024-12-28 08:48:31 +0800 CST2024-12-28 08:48:31 +0800 CST 2024-12-28 08:48:31 +0800 CST

ID do trailer do documento em PDF: por que ele consiste em duas strings e como extraí-lo por uma ferramenta de linha de comando

772

Embora existam ferramentas para acessar metadados de PDF como pdfinfo, não encontrei uma maneira adequada de obter o ID do trailer. Em vez disso, uso um editor e pesquiso... Então, minha primeira pergunta é se há uma ferramenta de linha de comando para fazer esse trabalho para mim.

Ainda assim, descubro e me pergunto: O id tem duas partes e o trailer se parece com isso:

trailer << /Info 2 0 R /Root 1 0 R /Size 3656 
/ID [<2442556d3492442c8e034f4bf45c46d4><31415926535897932384626433832795>] >>

Fico pensando sobre a intenção das 2 partes id; a especificação do PDF não diz nada sobre isso. Nos meus PDFs criados em latex, as duas partes coincidem.

Também me pergunto que parece que há ferramentas como qpdfescrever letras minúsculas enquanto outras, como compiladores de látex, parecem usar letras maiúsculas. Isso dificulta os testes de igualdade.

Mesmo a invocação de qpdfwith SOURCE_DATE_EPOCH=hex numbernão altera o resultado. ... Isso é diferente dos compiladores latex.

2 respostas

Voted

mkl · Answer 1 · 2024-12-28T15:50:24+08:00

Sobre sua segunda pergunta

Fico pensando sobre a intenção das 2 partes id; a especificação do PDF não diz nada sobre isso. Nos meus PDFs criados em latex, as duas partes coincidem.

A especificação do PDF explica:

14.4 Identificadores de arquivo

Os identificadores de arquivo PDF devem ser definidos pela entrada de ID no dicionário de trailer de um arquivo PDF (consulte 7.5.5, "Trailer de arquivo"). O valor dessa entrada deve ser uma matriz de duas strings de bytes. A primeira string de bytes deve ser um identificador permanente com base no conteúdo do arquivo PDF no momento em que foi criado originalmente e não deve mudar quando o arquivo PDF for atualizado. A segunda string de bytes deve ser um identificador mutável com base no conteúdo do arquivo PDF no momento em que foi atualizado pela última vez (consulte 7.5.6, "Atualizações incrementais"). Quando um arquivo PDF é gravado pela primeira vez, ambos os identificadores devem ser definidos para o mesmo valor. Se o primeiro identificador na referência corresponder ao primeiro identificador na entrada de ID do arquivo referenciado , e o último identificador na referência corresponder ao último identificador na entrada de ID do arquivo referenciado , é muito provável que o arquivo PDF correto e inalterado tenha sido encontrado. Se apenas o primeiro identificador corresponder, uma versão diferente do arquivo PDF correto foi encontrada.

(ISO 32000-2)

Assim, a primeira parte identifica o documento em todas as revisões e a segunda parte identifica a revisão individual.

Também me pergunto que parece que há ferramentas como qpdf escrevendo letras minúsculas enquanto outras como compiladores latex parecem usar letras maiúsculas. Isso torna os testes de igualdade difíceis.

Strings hexadecimais podem usar letras minúsculas ou maiúsculas, até mesmo uma mistura delas. A comparação de IDs deve estar pronta para lidar com isso.

johnwhitington · Answer 2 · 2024-12-28T21:29:53+08:00

johnwhitington

2024-12-28T21:29:53+08:002024-12-28T21:29:53+08:00

Você pode extrair os IDs no formato JSON com

cpdf -print-dict-entry /ID in.pdf

por exemplo

$ cpdf -print-dict-entry /ID cpdfmanual.pdf
["\u000ez?$?r,~?\"?\nd?\"9","\u000ez?$?r,~?\"?\nd?\"9"]

0

ID do trailer do documento em PDF: por que ele consiste em duas strings e como extraí-lo por uma ferramenta de linha de comando

14.4 Identificadores de arquivo

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

ID do trailer do documento em PDF: por que ele consiste em duas strings e como extraí-lo por uma ferramenta de linha de comando

2 respostas

14.4 Identificadores de arquivo

relate perguntas