Python爬知乎登陆可以通过cookies绕过验证码吗,pythoncookies,登陆的时候post了登陆
Python爬知乎登陆可以通过cookies绕过验证码吗,pythoncookies,登陆的时候post了登陆
登陆的时候post了登陆信息,但是还是无法获取到登陆后的网页,只有在电脑浏览器上先登陆上,python程序才能获取到登陆后的页面。
这是不是因为验证码的原因?是不是可以通过cookies绕过验证码?
代码如下:
pythonimport requestsheader = { 'User-Agent': "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:34.0) Gecko/20100101 Firefox/34.0", 'Host': "www.zhihu.com", 'Referer': "http://www.zhihu.com/", 'X-Requested-With': "XMLHttpRequest"}payload = {'email': "xxxxxxxxxxxx",'password': "xxxxxxxxxx",'rememberme': 'y',}s = requests.session()r = s.post('http://www.zhihu.com/login', data = payload, headers = header)print r.textrr = s.get('http://zhihu.com/login', headers = header)zhihu_home_page = rr.textprint zhihu_home_page
此外,分别是登陆成功和登陆失败后,POST 返回的 r.text 数据,这是什么意思啊……
大神求解救,这几天我就纠结这个问题了……
需要输入验证码。
如果只是临时一次性抓取的话,可以手工打开浏览器登录,然后取cookies,复制到程序里去请求,user-agent最好跟你浏览器里的一致。
如果是在线实时抓取的话,必须突破验证码,这个难度大,没有试验过。或许有一些现成的库可以破解掉一些简单的验证码。
编橙之家文章,
相关内容
- 求大牛知道http post多并发设置python 2.7环境,python2.7,注
- Python抓取通过电影名称获取视频地址,python电影名称
- 请问特殊符号在cmd中要如何输出呢?,特殊符号cmd输出
- except和finally可以同时在try中使用吗,exceptfinally,try:
- 重新安装yum报ImportError: No module named sqlitecachec错误是何
- Python可以同时控制两个显示屏幕输出吗?,python显示屏幕
- 关于Python修饰类@class的求助,Python修饰类@class,看到文章
- 这个python项目中向原数据中追加添加新数据用什么方法
- Python复杂字典结构变志字符串形式如何操作,python字符
- Python Tornado异步请求线程问题求助,pythontornado,假设有如
评论关闭