AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 54349
Accepted
Boden
Boden
Asked: 2009-08-15 10:09:38 +0800 CST2009-08-15 10:09:38 +0800 CST 2009-08-15 10:09:38 +0800 CST

有什么工具可以以类似于 Acrobat 的 OCR 功能的方式自动对扫描的 PDF 文件进行 OCR?[关闭]

  • 772
关闭。这个问题是题外话。它目前不接受答案。

对产品、服务或学习材料推荐的请求是题外话,因为它们会吸引低质量、固执己见和垃圾邮件的答案,而且这些答案很快就会过时。相反,请描述您正在处理的业务问题、您所做的研究以及迄今为止为解决它所采取的步骤。

7年前关闭。

锁定。这个问题及其答案被锁定,因为这个问题离题但具有历史意义。它目前不接受新的答案或交互。

开源首选,但不是必需的。

我有 Adob​​e Acrobat 8​​,并且非常喜欢 OCR 功能,它基本上可以在扫描文档的顶部放置一个不可见的 OCR 文本层。因此,您在屏幕上看到的是原始扫描文档,但结果是可搜索的。

我正在寻找的是一种自动化这个过程的方法。我目前有一些用于处理和存档扫描文件的脚本,并且正在寻找可以直接插入到此批处理过程中的内容,以类似于我可以使用 Acrobat 执行的方式执行 OCR。

欢迎大家提出建议,谢谢!

pdf document-management ocr
  • 3 3 个回答
  • 5873 Views

3 个回答

  • Voted
  1. Best Answer
    xeon
    2009-08-15T10:19:06+08:002009-08-15T10:19:06+08:00

    我在一个公司文件归档项目中实现了这一点。扫描文件为 tif 文件(单页)。然后使用Cuneiform创建单个 tif 的 hocr 文件。然后使用hocr2pdf输出 PDF 文件。如果有多个扫描页面,我使用 gs 将 PDF 合并为一个 PDF 文档。效果非常好,OCR 足以满足我们的需求,并且可以在任何 PDF 查看器中进行搜索。

    • 8
  2. rlangner
    2010-07-07T04:40:59+08:002010-07-07T04:40:59+08:00

    你看过 WatchOCR 吗?您可以从http://www.watchocr.com下载它。它是一个免费和开源的 OCR 服务器,可以将仅图像 pdf 转换为来自监视文件夹或网络共享的文本可搜索 pdf。

    • 1
  3. Kara Marfia
    2009-08-15T10:26:00+08:002009-08-15T10:26:00+08:00

    我喜欢至强回答的声音,尽管OCRopus听起来很有趣。

    • 0

相关问题

  • cat、pipe 和 acroread - 为什么它偶尔会失败?

  • 如何正确部署 Adob​​e Reader 9.1

  • 如何以高分辨率呈现 html?[关闭]

  • 从 microsoft office word 导出为 pdf [关闭]

  • 主存储的容量优化/重复数据删除选项

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve