AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 79313035
Accepted
user2609605
user2609605
Asked: 2024-12-28 08:48:31 +0800 CST2024-12-28 08:48:31 +0800 CST 2024-12-28 08:48:31 +0800 CST

ID do trailer do documento em PDF: por que ele consiste em duas strings e como extraí-lo por uma ferramenta de linha de comando

  • 772

Embora existam ferramentas para acessar metadados de PDF como pdfinfo, não encontrei uma maneira adequada de obter o ID do trailer. Em vez disso, uso um editor e pesquiso... Então, minha primeira pergunta é se há uma ferramenta de linha de comando para fazer esse trabalho para mim.

Ainda assim, descubro e me pergunto: O id tem duas partes e o trailer se parece com isso:

trailer << /Info 2 0 R /Root 1 0 R /Size 3656 
/ID [<2442556d3492442c8e034f4bf45c46d4><31415926535897932384626433832795>] >>

Fico pensando sobre a intenção das 2 partes id; a especificação do PDF não diz nada sobre isso. Nos meus PDFs criados em latex, as duas partes coincidem.

Também me pergunto que parece que há ferramentas como qpdfescrever letras minúsculas enquanto outras, como compiladores de látex, parecem usar letras maiúsculas. Isso dificulta os testes de igualdade.

Mesmo a invocação de qpdfwith SOURCE_DATE_EPOCH=hex numbernão altera o resultado. ... Isso é diferente dos compiladores latex.

pdf
  • 2 2 respostas
  • 35 Views

2 respostas

  • Voted
  1. Best Answer
    mkl
    2024-12-28T15:50:24+08:002024-12-28T15:50:24+08:00

    Sobre sua segunda pergunta

    Fico pensando sobre a intenção das 2 partes id; a especificação do PDF não diz nada sobre isso. Nos meus PDFs criados em latex, as duas partes coincidem.

    A especificação do PDF explica:

    14.4 Identificadores de arquivo

    Os identificadores de arquivo PDF devem ser definidos pela entrada de ID no dicionário de trailer de um arquivo PDF (consulte 7.5.5, "Trailer de arquivo"). O valor dessa entrada deve ser uma matriz de duas strings de bytes. A primeira string de bytes deve ser um identificador permanente com base no conteúdo do arquivo PDF no momento em que foi criado originalmente e não deve mudar quando o arquivo PDF for atualizado. A segunda string de bytes deve ser um identificador mutável com base no conteúdo do arquivo PDF no momento em que foi atualizado pela última vez (consulte 7.5.6, "Atualizações incrementais"). Quando um arquivo PDF é gravado pela primeira vez, ambos os identificadores devem ser definidos para o mesmo valor. Se o primeiro identificador na referência corresponder ao primeiro identificador na entrada de ID do arquivo referenciado , e o último identificador na referência corresponder ao último identificador na entrada de ID do arquivo referenciado , é muito provável que o arquivo PDF correto e inalterado tenha sido encontrado. Se apenas o primeiro identificador corresponder, uma versão diferente do arquivo PDF correto foi encontrada.

    (ISO 32000-2)

    Assim, a primeira parte identifica o documento em todas as revisões e a segunda parte identifica a revisão individual.

    Também me pergunto que parece que há ferramentas como qpdf escrevendo letras minúsculas enquanto outras como compiladores latex parecem usar letras maiúsculas. Isso torna os testes de igualdade difíceis.

    Strings hexadecimais podem usar letras minúsculas ou maiúsculas, até mesmo uma mistura delas. A comparação de IDs deve estar pronta para lidar com isso.

    • 1
  2. johnwhitington
    2024-12-28T21:29:53+08:002024-12-28T21:29:53+08:00

    Você pode extrair os IDs no formato JSON com

    cpdf -print-dict-entry /ID in.pdf

    por exemplo

    $ cpdf -print-dict-entry /ID cpdfmanual.pdf
    ["\u000ez?$?r,~?\"?\nd?\"9","\u000ez?$?r,~?\"?\nd?\"9"]
    
    • 0

relate perguntas

  • A transparência SVG quebra a compatibilidade do PDF/A

  • Adicione sinal ao PDF usando o antigo iText-2.1.7

  • Adobe DRM não está obtendo arquivos acsm para imagem pdf

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Quando devo usar um std::inplace_vector em vez de um std::vector?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Martin Hope
    Aleksandr Dubinsky Por que a correspondência de padrões com o switch no InetAddress falha com 'não cobre todos os valores de entrada possíveis'? 2024-12-23 06:56:21 +0800 CST
  • Martin Hope
    Phillip Borge Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle? 2024-12-12 20:46:46 +0800 CST
  • Martin Hope
    Oodini Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores? 2024-12-12 06:27:11 +0800 CST
  • Martin Hope
    sleeptightAnsiC `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso? 2024-11-09 07:18:53 +0800 CST
  • Martin Hope
    The Mad Gamer Quando devo usar um std::inplace_vector em vez de um std::vector? 2024-10-29 23:01:00 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST
  • Martin Hope
    MarkB Por que o GCC gera código que executa condicionalmente uma implementação SIMD? 2024-02-17 06:17:14 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve