python--tesseract，,tesseract的

文章由Byrx.net分享于2021-03-06 03:03:11评论（205）

python--tesseract，,tesseract的

tesseract的介绍

我们爬虫会受到阻碍，其中一个便是我们在模拟登陆或者请求一些数据的时候，出现的图形验证码，因此我们需要一种能叫图形验证码识别成文本的技术。
将图片翻译成文字一般称为光学文字识别(optical character recognition)，简写为OCR
tesseract便是一个非常优秀的开源库，用来识别验证码

Tesseract是一个OCR库，目前由谷歌赞助。Tesseract是目前公认最优秀、最准确的开源OCR库。Tesseract具有很高的识别度，也具有很高的灵活性，他可以通过训练识别任何字体

安装：

Windows系统：

在以下链接下载可执行文件，然后一顿点击下一步安装即可（放在不需要权限的纯英文路径下）：
https://digi.bib.uni-mannheim.de/tesseract/

Linux系统：

可以在以下链接下载源码自行编译。
https://github.com/tesseract-ocr/tesseract/wiki/Compiling
或者在ubuntu下通过以下命令进行安装：

`sudo apt install tesseract-ocr`

`Mac系统：`

`用Homebrew即可方便安装：`

`brew install tesseract`

`设置环境变量：`

安装完成后，如果想要在命令行中使用Tesseract，那么应该设置环境变量。Mac和Linux在安装的时候就默认已经设置好了。在Windows下把tesseract.exe所在的路径添加到PATH环境变量中。

还有一个环境变量需要设置的是，要把训练的数据文件路径也放到环境变量中。在环境变量中，添加一个TESSDATA_PREFIX=C:\path_to_tesseractdata\teseractdata

`在命令行中使用tesseract识别图像：`

`如果想要在cmd下能够使用tesseract命令，那么需要把tesseract.exe所在的目录放到PATH环境变量中。然后使用命令：tesseract 图片路径文件路径。示例：`

`tesseract a.png a`

`那么就会识别出a.png中的图片，并且把文字写入到a.txt中。如果不想写入文件直接想显示在终端，那么不要加文件名就可以了`

python--tesseract





 今日最新热门文章：
 Python爬虫实现vip电影下载，,Python爬虫实现
使用python操作redis（管道），,一、redis连接
python调用有道翻译api实现翻译，,通过调用有
Python 3 的 int 类型详解（为什么 int 不存在溢
python的callback函数原理，,__getattri
Python图像全屏显示，,需要在嵌入式设备上全

 

 相关内容

 python-快速入门，,ref: Calcu
在树莓派上编译安装新版本的Python，,Raspiban W
Python调用java方法，,[本文出自天外归云的
使用python操作redis（管道），,一、redis连接r
python调用有道翻译api实现翻译，,通过调用有道翻译的
Python-鑾峰彇绛夊樊鏁板垪，,鏍囩锛?a hre
Python 3 的 int 类型详解（为什么 int 不存在溢出问题？）
python操作kafka，,mac启动zooke
Python用户界面编程PyQt5的四种的布局方式，,1、QT是C++编
python-神奇的下划线，,2019-12-16

推荐教程：python教程  python问答  python源码实例  python开发工具  python框架

python--tesseract，,tesseract的

python--tesseract，,tesseract的

tesseract的介绍

Tesseract是一个OCR库，目前由谷歌赞助。Tesseract是目前公认最优秀、最准确的开源OCR库。Tesseract具有很高的识别度，也具有很高的灵活性，他可以通过训练识别任何字体

安装：

Windows系统：

在以下链接下载可执行文件，然后一顿点击下一步安装即可（放在不需要权限的纯英文路径下）：
https://digi.bib.uni-mannheim.de/tesseract/

Linux系统：

可以在以下链接下载源码自行编译。
https://github.com/tesseract-ocr/tesseract/wiki/Compiling
或者在ubuntu下通过以下命令进行安装：

`sudo apt install tesseract-ocr`

`Mac系统：`

`用Homebrew即可方便安装：`

`brew install tesseract`

`设置环境变量：`

`在命令行中使用tesseract识别图像：`

`如果想要在cmd下能够使用tesseract命令，那么需要把tesseract.exe所在的目录放到PATH环境变量中。然后使用命令：tesseract 图片路径文件路径。示例：`

`tesseract a.png a`

`那么就会识别出a.png中的图片，并且把文字写入到a.txt中。如果不想写入文件直接想显示在终端，那么不要加文件名就可以了`

相关内容

最新python教程

python~HOT

python--tesseract，,tesseract的

python--tesseract，,tesseract的

tesseract的介绍

Tesseract是一个OCR库，目前由谷歌赞助。Tesseract是目前公认最优秀、最准确的开源OCR库。Tesseract具有很高的识别度，也具有很高的灵活性，他可以通过训练识别任何字体

安装：

Windows系统：

在以下链接下载可执行文件，然后一顿点击下一步安装即可（放在不需要权限的纯英文路径下）：https://digi.bib.uni-mannheim.de/tesseract/

Linux系统：

可以在以下链接下载源码自行编译。https://github.com/tesseract-ocr/tesseract/wiki/Compiling或者在ubuntu下通过以下命令进行安装：

sudo apt install tesseract-ocr

Mac系统：

用Homebrew即可方便安装：

brew install tesseract

设置环境变量：

在命令行中使用tesseract识别图像：

如果想要在cmd下能够使用tesseract命令，那么需要把tesseract.exe所在的目录放到PATH环境变量中。然后使用命令：tesseract 图片路径 文件路径。示例：

tesseract a.png a

那么就会识别出a.png中的图片，并且把文字写入到a.txt中。如果不想写入文件直接想显示在终端，那么不要加文件名就可以了

相关内容

最新python教程

python~HOT

在以下链接下载可执行文件，然后一顿点击下一步安装即可（放在不需要权限的纯英文路径下）：
https://digi.bib.uni-mannheim.de/tesseract/

可以在以下链接下载源码自行编译。
https://github.com/tesseract-ocr/tesseract/wiki/Compiling
或者在ubuntu下通过以下命令进行安装：

`sudo apt install tesseract-ocr`

`Mac系统：`

`用Homebrew即可方便安装：`

`brew install tesseract`

`设置环境变量：`

`在命令行中使用tesseract识别图像：`

`如果想要在cmd下能够使用tesseract命令，那么需要把tesseract.exe所在的目录放到PATH环境变量中。然后使用命令：tesseract 图片路径文件路径。示例：`

`tesseract a.png a`

`那么就会识别出a.png中的图片，并且把文字写入到a.txt中。如果不想写入文件直接想显示在终端，那么不要加文件名就可以了`