Qual é a diferença entre Ballard e Guil na Transformada Generalizada de Hough? [fechado]

Question

Dov

Asked: 2023-12-26 02:30:52 +0800 CST2023-12-26 02:30:52 +0800 CST 2023-12-26 02:30:52 +0800 CST

Como ler um PDF contendo várias páginas como imagens no Leptonica

772

O Tesseract usa imagens de carregamento leptonica para fazer OCR:

#include <tesseract/baseapi.h>
#include <leptonica/allheaders.h>
int main() {
    tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
    // Initialize tesseract-ocr with English, without specifying tessdata path
    if (api->Init(NULL, "eng")) {
        fprintf(stderr, "Could not initialize tesseract.\n");
        exit(1);
    }
    // Open input image with leptonica library
    Pix *image = pixRead("./test1dld.png");
    api->SetImage(image);
    ...

No entanto, para a leitura de um lote de testes, a maneira mais fácil seria usar um alimentador de documentos em uma copiadora e fazer com que a máquina enviasse por e-mail o único arquivo PDF resultante, onde cada página é um bitmap. A documentação do leptonica menciona a conversão para pdf, mas não consigo descobrir como ler o pdf, muito menos uma página por vez.

Alguém pode me indicar uma chamada de API que me permita visualizar um arquivo PDF de bitmap um por um como bitmaps individuais? De preferência, ac API e não um comando shell.

1 respostas

Voted

user898678 · Answer 1 · 2023-12-26T04:28:36+08:00

Best Answer

user898678

2023-12-26T04:28:36+08:002023-12-26T04:28:36+08:00

Leptonica é um leitor de imagens - não um leitor de documentos (pdf) (sim, ele pode criar PDF, mas ler PDF é uma história diferente).

Você precisará de outra biblioteca para extrair imagens do PDF. Para python, sugiro tentar pymudpf, para C++ você pode verificar poppler, qpdf. Para CI, não tenho certeza se existe uma solução (gratuita).

1

Como ler um PDF contendo várias páginas como imagens no Leptonica

destaque o código em HTML usando <font color="#xxx">

Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

Por que as compreensões de lista criam uma função internamente?

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

Por que o construtor de uma variável global não é chamado em uma biblioteca?

Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

Somente operações bit a bit para std::byte em C++ 17?

Como ler um PDF contendo várias páginas como imagens no Leptonica

1 respostas

relate perguntas