Python中使用urllib2防止302跳转的代码例子,pythonurllib2
Python中使用urllib2防止302跳转的代码例子,pythonurllib2
说明:python的urllib2获取网页(urlopen)会自动重定向(301,302)。但是,有时候我们需要获取302,301页面的状态信息。就必须获取到转向前的调试信息。
下面代码将可以做到避免302重定向到新的网页
#!/usr/bin/python # -*- coding: utf-8 -*- #encoding=utf-8 #Filename:states_code.py import urllib2 class RedirctHandler(urllib2.HTTPRedirectHandler): """docstring for RedirctHandler""" def http_error_301(self, req, fp, code, msg, headers): pass def http_error_302(self, req, fp, code, msg, headers): pass def getUnRedirectUrl(url,timeout=10): req = urllib2.Request(url) debug_handler = urllib2.HTTPHandler(debuglevel = 1) opener = urllib2.build_opener(debug_handler, RedirctHandler) html = None response = None try: response = opener.open(url,timeout=timeout) html = response.read() except urllib2.URLError as e: if hasattr(e, 'code'): error_info = e.code elif hasattr(e, 'reason'): error_info = e.reason finally: if response: response.close() if html: return html else: return error_info html = getUnRedirectUrl('http://jb51.net') print html
cookie 只是 HTTP 头中的键值对,你可以手动去请求前赋值,请求完保存。。。
或者使用包可实现:
import cookielib, urllib2cj = cookielib.CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))r = opener.open("example.com/")
这里cj 就会自己去实现请求完存储,和请求前赋值了
官方文档:docs.python.org/2/library/cookielib.html
只有try无异常发生时,才会print 2,你说从不执行print 2,说明try代码块中有问题
相关内容
- python中使用urllib2获取http请求状态码的代码例子,pyth
- python基于mysql实现的简单队列以及跨进程锁实例详解,
- Python编程语言的35个与众不同之处(语言特征和使用技
- Python中的并发编程实例,python并发编程实例
- python实现跨文件全局变量的方法,
- gearman的安装启动及python API使用实例,gearmanpython
- Python中的魔法方法深入理解,python深入理解
- Python中使用logging模块代替print(logging简明指南),py
- Python中__init__和__new__的区别详解,__init___new_
- python实现的一个火车票转让信息采集器,python采集器
评论关闭