内置 OCR 识别使用注意事项分享

做项目总会遇到各种麻烦,解决问题跟困难程度无关,只要你愿意寻找答案 – Totem

之前发过一篇帖子《 图片缩放强化内置 OCR 识别 》,用于支持不能连接网络,但是又要解决数字识别的问题。在本地测试没有任何问题,放到客户环境缺各种不好使。注意,客户的环境是 32 位的。所以总结了一下,大概有一下几个方面需要注意。

1、pytesseract.py 文件中参数 tesseract_cmd 配置路径是否正确,是否是指向引擎包的路径
64c0c7771db940628973e09656a0ec8e_image.png

2、是否配置了引擎包的环境变量
4b0b4902ee2c412382a810e96c831e6b_image.png

3、安装的 tesseract-ocr 是否跟计算机匹配,区分 32 位和 64 位。可以按照一下连接配置

https://jingyan.baidu.com/article/219f4bf788addfde442d38fe.html。包含引擎包下载地址,tesseract-ocr 软件需要安装才能用。
f01d5702f0df4c398938e5438b5c6bb6_image.png

afc753ce5c004a6b94afcc844029ca3e_image.png