当我尝试检测我的 jpeg 上的文本时,它会正确显示它怀疑文本和图像的所有区域,但是当我将它导出到 ODT 时,它只会创建一个带有空文本和图像帧的 ODT。
我必须以tesseract
某种方式配置吗?
(我使用的是 Ubuntu 14.10 32 位)
当我尝试检测我的 jpeg 上的文本时,它会正确显示它怀疑文本和图像的所有区域,但是当我将它导出到 ODT 时,它只会创建一个带有空文本和图像帧的 ODT。
我必须以tesseract
某种方式配置吗?
(我使用的是 Ubuntu 14.10 32 位)
尝试这个:
打开 ocrfeeder 程序。
编辑引擎:点击
Tools
-OCR Engine
选择
Tesseract engine
并单击Edit
它说
arguments engine
为此更改了脚本:要导出文档,请单击
File
-Export
选择所需的输出格式。
如果文档有图片,我建议使用
html
格式文本。如果只有文字最好是使用纯文本格式
txt
。