Python识别网站验证码的方法源码,,学习Python教程之前


学习Python教程之前就听说Python做网络爬虫很方便快捷,但在实际应用的时候却遇到一个难题,网站验证码。Python识别网站验证码的方法源码收集到了一贴,自己还没试先贴来分享吧。

简略的看了下Python识别网站验证码的方法源码,使用了python的Image,ImageEnhance,ImageFilter和sys方法类库。

Python识别网站验证码的方法源码如下:

#encoding=utf-8import Image,ImageEnhance,ImageFilterimport sysimage_name = "./22.jpeg"#去处 干扰点im = Image.open(image_name)im = im.filter(ImageFilter.MedianFilter())enhancer = ImageEnhance.Contrast(im)im = enhancer.enhance(2)im = im.convert('1')#im.show() #测试查看s = 12      #启始 切割点 xt = 2       #启始 切割点 yw = 10      #切割 宽 +yh = 15      #切割 长 +xim_new = []for i in range(4): #验证码切割    im1 = im.crop((s+w*i+i*2,t,s+w*(i+1)+i*2,h))    im_new.append(im1)#im_new[0].show()#测试查看xsize, ysize = im_new[0].sizegd = []for i in range(ysize):    tmp=[]    for j in range(xsize):       if( im_new[0].getpixel((j,i)) == 255 ):            tmp.append(1)        else:            tmp.append(0)    gd.append(tmp)#看效果www.iplaypy.comfor i in range(ysize):    print gd[i]

编橙之家文章,

评论关闭