微信运动数据抓取(Python)，抓取python,“微信运动”能够向朋

文章由Byrx.net分享于2019-03-23 03:03:43评论（60）

微信运动数据抓取(Python)，抓取python,“微信运动”能够向朋

“微信运动”能够向朋友分享一个包含有运动数据的网页，网页中就有我们需要的数据。url类似于：http://hw.weixin.qq.com/steprank/step/personal?openid=用户的openid，其中有用于对于微信运动的唯一openid，打开fiddler进行抓包，首先打开fiddler，然后打开微信运动点击我的主页，如下：

微信通过请求头区分是否是通过微信浏览器进行的请求，如果用浏览器直接打开链接会出现如下错误提示，说明不是通过微信浏览器打开被微信拦截了：

通过Fiddler的抓包数据我们可以通过伪造Request Headers请求头抓取数据
Fiddler抓包显示：

通过postman伪造请求头模拟微信浏览器。伪造请求头后成功在浏览器中得到了对应的网页内容：

Python实现代码：

import requestsimport reimport jsonclass WechatSprot(object):    def __init__(self, openid):        self.openid = openid    def getInfo(self):        url = "http://hw.weixin.qq.com/steprank/step/personal"        querystring = {"openid": self.openid}        headers = {            ‘host‘: "hw.weixin.qq.com",            ‘connection‘: "keep-alive",            ‘accept‘: "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",            ‘user-agent‘: "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 MicroMessenger/6.5.2.501 NetType/WIFI WindowsWechat QBCore/3.43.691.400 QQBrowser/9.0.2524.400",            ‘accept-encoding‘: "gzip, deflate",            ‘accept-language‘: "zh-CN,zh;q=0.8,en-us;q=0.6,en;q=0.5;q=0.4",            ‘cookie‘: "hwstepranksk=JxMBWw1sxQhxnMgsJnnLh-r0VFzLH6RtJWv5b_j3z8MPs6-J; pass_ticket=p9R%2FqjIh%2BlXt%2BoxP7GIWrqm3Sbf1Minisk%2FNUz5zra4ReETR2ATI8H57zkEERCvG",        }        response = requests.request("GET", url, headers=headers, params=querystring)        res = re.findall(‘window.json = (.+);‘, response.text)        # print(res)        # exit()        return json.loads(res[0])if __name__ == "__main__":    obj = WechatSprot(用户的openid)    print(obj.getInfo())

微信运动数据抓取(Python)





 今日最新热门文章：
 如何离线安装python的whl库，离线pythonwhl,对于
零基础Python爬虫实现(爬取最新电影排行)，
Python编程：从入门到实践——【作业】——第
Selenium2+python自动化42-判断元素（expected_cond
python三数之和，python三数,给定一个包含n个整
python 3.x 爬虫基础---http headers详解，---httphe

 

 相关内容

 【译】：python中的colorlog库，pythoncolorlog库,本文翻译自
Python编程：从入门到实践——【作业】——第六章作业
Python 二级模拟选择题（六），python模拟选择题,1. 算法
python三数之和，python三数,给定一个包含n个整数
python 3.x 爬虫基础---http headers详解，---httpheaders,前言　
python操作excel，pythonexcel,python操作ex
Python学习--和 Oracle 交互，pythonoracle,python 连接o
python padas 学习，pythonpadas,import mat
Python中where()函数的用法，pythonwhere,where（）的用法
Python文件，,1.文件读模式 rf

推荐教程：python教程  python问答  python源码实例  python开发工具  python框架

微信运动数据抓取(Python)，抓取python,“微信运动”能够向朋

微信运动数据抓取(Python)，抓取python,“微信运动”能够向朋

相关内容

最新python教程

python~HOT