Tesseract 使用 leptonica 加载图像来执行 OCR:
#include <tesseract/baseapi.h>
#include <leptonica/allheaders.h>
int main() {
tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
// Initialize tesseract-ocr with English, without specifying tessdata path
if (api->Init(NULL, "eng")) {
fprintf(stderr, "Could not initialize tesseract.\n");
exit(1);
}
// Open input image with leptonica library
Pix *image = pixRead("./test1dld.png");
api->SetImage(image);
...
然而,对于批量测试的阅读,最简单的方法是使用复印机上的文档进纸器,并让机器通过电子邮件发送生成的单个 pdf 文件,其中每个页面都是位图。leptonica 文档提到转换为 pdf,但我根本找不到如何从 pdf 中读取,更不用说一次一页了。
谁能向我指出一个 API 调用,让我可以将位图 pdf 文件作为单独的位图一张一张地查看?最好是 ac API,而不是 shell 命令。
Leptonica 是一个图像阅读器 - 不是文档 (pdf) 阅读器(是的,它可以创建 pdf,但阅读 pdf 是另一回事)。
您将需要另一个库来从 pdf 中提取图像。对于 python,我建议尝试 pymudpf,对于 C++,你可以检查 poppler、qpdf。对于 CI,我不确定是否有(免费)解决方案。