python图像文字识别 - PyTesser,pythonpytesser,那借助python能
python图像文字识别 - PyTesser,pythonpytesser,那借助python能
最近在想没有一个图片文字识别的工具呢?我想到了OCR,国内比较牛逼的汉王OCR。那借助python能否实现呢?于是我找啊找查啊查有关PYthon在这方面探讨的资料,发现PyTesser 这样一个好玩的程序!拿出来分享讨论一下:
PyTesser 是python的一个光学字符识别模块,它结合Tesseract OCR引擎来使用 ,能从一个图片或图像文件取出的字符串并输出。
使用PyTesser ,你无须安装Tesseract OCR引擎,但就必须要先安装PIL模块(Python Image Library, python的图形库)
官方介绍说明:
PyTesser is an Optical Character Recognition module for Python. It takes as input an image or image file and outputs a string.
PyTesser uses the Tesseract OCR engine, converting images to an accepted format and calling the Tesseract executable as an external script. A Windows executable is provided along with the Python scripts. The scripts should work in other operating systems as well.
PyTesser 官方下载地址:http://code.google.com/p/pytesser/downloads/list
PIL库资源地址: http://www.pythonware.com/products/pil/
不过,在测试使用过程中,发觉只对英文内容识别较理想,而对中文无法处理识别!
有兴趣的同学可以试验一下
相关内容
- Python基础 - 命名规范,python基础命名规范,以双下划线开
- python全局变量,,今天有同事问一个关于
- Python 最难的问题,Python难的问题,未解决的问题随处都
- Python正则表达式基础,python正则表达式,1 常用的匹配
- Python入门方法--简单总结+学习方式思考,python学习方式
- python None与Null 的区别,pythonnull,三特性在对象创建时被
- Python的字符串索引和分片,,>>> str="H
- Python基础类型 - 列表类型的所有方法,python列表,list.
- python中文乱码问题大总结,python中文乱码,decode的作用是
- 利用Python的SocketServer框架编写网络服务程序,pythonsoc
评论关闭