想用python抓万达订票信息求个思路,python万达,想在万达电影官网上订《霍
想用python抓万达订票信息求个思路,python万达,想在万达电影官网上订《霍
想在万达电影官网上订《霍比特人2:史矛革之战》的影票(明天、IMAX-3D),但现在还没开始卖。
网址是http://www.wandafilm.com/trade/movie_times.jsp,网页截图如下:
我想写个小程序每过几分钟就按图中的选项检查一下是否有票了
想法是这样的:
1.因为只要是这个订票页面,不管你选择哪个选项网址都不会变,所以应该不能取得整个网页然后解析。
2.然后通过wireshark监听了一下http数据,发现发送请求是:
GET /trade/time.do?m=init&city_code=undefined&cinema_id=842&day=2014_02_22&rond=0.22890089126303792&_=1392950290319 HTTP/1.1
在这个GET请求中并没有看到与影片名/时间/版本相关的数据,另外我点击“影片”/“时间”/“版本”时wireshark都监听不到流量
到这里就不知道怎么做了,之前只用python和c#爬过一次网页,所以没什么这方面的经验,请赐教。
我想你该试试phantom
在你打开网页的时候(还没有选择的时候),已经加载了所有的电影信息,通过如下URL:
http://www.wandafilm.com/js/jsArray/cinemaArray.js
scrapy是python的一个不错爬虫框架。
编橙之家文章,
相关内容
- Python引用非当前目录模块实现方法问题,python当前目录
- 请问python nginx与uwsgi部署Django项目显示两个相同进程是
- 求解斐波那契数列用for计算方法实现的原理,斐波那契
- Python2.3中dump和load应该选哪个json库,python2.3json,为了向
- python书里的函数参数用[]这样写是有何作用?,python书里
- 有没有好的python微博爬虫相关文章推荐,python爬虫,需求
- python3.5里有汉字乱码ascii问题,print也出错如图,python3
- Python大神看下我爬虫下载文档思路可行吗,python大神
- 关于Python线程池大小应该控制在什么范围内最适合,
- Python计算10.0/3结果为3.33333333335正常吗,,环境python2.6.
评论关闭