利用bs4获取58同城城市分类,bs4获取58同城,bs4的一些基本操作练手
利用bs4获取58同城城市分类,bs4获取58同城,bs4的一些基本操作练手
bs4的一些基本操作练手,获取58同城合租页面下的城市分类信息
# -*- coding:utf-8 -*-#! /usr/bin/pythonimport urllibimport os, datetime, sysfrom bs4 import BeautifulSoupreload(sys) sys.setdefaultencoding( "utf-8" ) __BASEURL__ = "<a href="http://bj.58.com/">http://bj.58.com/"__INITURL__ = "<a href="http://bj.58.com/hezu/">http://bj.58.com/hezu/"soup=BeautifulSoup(urllib.urlopen(__INITURL__))lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)f=open('data.txt', 'w')for element in lv1Elements[1:]: f.write((element.get_text() + '\\r\\n')) print element.get_text() url = __BASEURL__ + element.get('href') print url soup=BeautifulSoup(urllib.urlopen(url)) lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a') texts = [t.get_text() for t in lv2Elements] f.write(' '.join(texts) + '\\r\\n\\r\\n')f.close()#该片段来自于http://byrx.net
相关内容
- 下载豆瓣友邻相册,豆瓣友邻相册,开发环境:WIn7,P
- 话说python的数据结构真的很适合快速排序啊,python数据
- 随机生成中文验证码的python代码,中文验证码python,#
- 关于Tk中Treeview的使用方法,tktreeview,#python3.3关于
- 爬虫 爬取网址,爬虫网址,爬取网页上的链接 然后分
- 清空当前目录下,除本脚本文件的所有文本文件(点文件
- RSA算法的简单实现,RSA算法简单实现,#!/usr/bin/e
- Python 将DOC文档转换为PDF,,import sys,
- Django获取当前request,django当前request,django只能在vie
- python redis订阅发布示例代码,pythonredis,可以使用pip in
评论关闭