我有一个在线银行纸质 TAN 列表,如下所示:
001 123456 015 123456 029 123456 043 123456 ...
002 123456 ...
...
我扫描了它,现在我想使用 OCR 来获取文本。
我尝试了 tesseract、gocr 和楔形文字。
所有的程序都没有得到好的结果。我怎样才能对文本进行 OCR?
背景:我想将 TAN 列表存储在 keepass 中。Keepass 确实支持图像,但仅支持 PC 版本。安卓版没有。这就是为什么我想要文字。文本更好,因为您可以使用复制和粘贴。
原始图像的质量通常是 ocr 中的关键资源。(尝试类似 600 dpi 的东西)
我建议你试试 tesserat。
(并且,处理银行业务时,请非常谨慎地选择您存储在设备中的内容......)
我自己找到了这个解决方案:
读取-tan-list.py: