使用python库解决登录的验证码识别-图片验证码,识别验证码的pyth
使用python库解决登录的验证码识别-图片验证码,识别验证码的pyth
前言:
在UI自动化测试和爬虫测试中,验证码是个比较头疼的问题,包括:图片验证码,滑块验证码,等一些常见的验证码场景。
识别验证码的python 库有很多,用起来也并不简单,这里推荐一个简单实用的识别验证码的库 ddddocr (带带弟弟ocr)库。
今天先用一个图片验证码示例来演示下:
准备:
1.安装库ddddocr
2.安装库pillow
3.以一个带验证码登录的网站为示例:https://xqctk.jtys.sz.gov.cn/
开始编码:
1代码如下:
1 import time 2 from ddddocr import DdddOcr 3 from selenium import webdriver 4 from selenium.webdriver.common.by import By 5 from PIL import Image # 需安装 pillow 6 7 path = 'https://xqctk.jtys.sz.gov.cn/' 8 9 10 def get_picture_code(locator): 11 pic_save_path = 'D://html.png' 12 cron_path = 'D://code.png' 13 browser.save_screenshot(pic_save_path) # 保存为图片 14 location = browser.find_element(By.XPATH, locator) # 获取需要识别的元素对象 15 size = location.size # 获取需要识别的元素尺寸 16 position = (int(location.location['x']), int(location.location['y']), int(location.location['x'] + size['width']), int(location.location['y'] + size['height'])) 17 Image.open(pic_save_path).crop(box=position).save(cron_path) # crop进行裁剪 18 with open(cron_path, 'rb') as f: 19 img_bytes = f.read() 20 res = DdddOcr().classification(img_bytes) 21 return res 22 23 24 browser = webdriver.Chrome() # 打开浏览器 25 browser.maximize_window() # 浏览器最大化 26 browser.get(path) # 打开网页 27 time.sleep(5) 28 pic_code = get_picture_code("//td[@id='incrementGetValidCodeImg']//img") 29 browser.find_element(By.XPATH, "//input[@id='incrementValidCode']").send_keys(pic_code) 30 time.sleep(5) 31 browser.quit()
运行结果:
相关内容
- Django笔记二十二之多数据库操作,在第十篇笔记的时候
- Python GDAL库在Anaconda环境中的配置,需要注意的是,本文
- Django笔记二十一之使用原生SQL查询数据库,一种是使用
- python中shutil和shutil库的用法,1.复制文件或目录s
- 口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开
- Python加密库 Crypto.Cipher包中 ChaCha20 介绍,Crypto.Cip
- 【K哥爬虫普法】字节前高管,离职后入侵今日头条数据
- 【验证码逆向专栏】某验三代、四代一键通过模式逆向
- Python pydot与graphviz库在Anaconda环境的配置,最近进行随机
- 记一次selenium爬取p站图片的经历(成功啦),
评论关闭