Python HTMLParser模块,pythonhtmlparser,HTMLParser是p
Python HTMLParser模块,pythonhtmlparser,HTMLParser是p
HTMLParser是python用来解析html的模块。它可以分析出html里面的标签、数据等等,是一种处理html的简便途径。HTMLParser采用的是一种事件驱动的模式,当HTMLParser找到一个特定的标记时,它会去调用一个用户定义的函数,以此来通知程序处理。它主要的用户回调函数的命名都是以handler_开头的,都是HTMLParser的成员函数。当我们使用时,就从HTMLParser派生出新的类,然后重新定义这几个以handler_开头的函数即可。
#-*- encoding: gb2312 -*-import HTMLParserclass MyParser(HTMLParser.HTMLParser): def __init__(self): HTMLParser.HTMLParser.__init__(self) def handle_starttag(self, tag, attrs): # 这里重新定义了处理开始标签的函数 if tag == 'a': # 判断标签<a>的属性 for name,value in attrs: if name == 'href': print valueif __name__ == '__main__': a = '<html><head><title>test</title><body><a href="http: //www.163.com">链接到163</a></body></html>' my = MyParser() # 传入要分析的数据,是html的。 my.feed(a)#该片段来自于http://byrx.net
相关内容
- Python 生肖和星座计算函数,python生肖,def chinese_
- Django 利用url来控制登录,django利用url登录,1. from djan
- Python PIL批量处理处理图片,,图片太大了,上百张图用
- Python 简单的备份文件脚本,python备份脚本,#! /usr/bin/
- Python 神经网络调教程序,python神经网络调教,import ran
- Python 代码行数统计程序,python行数统计程序,import sys
- Python 相似单词,Python单词,给你一个单词a,如果通过
- Django 简化view函数的编写,django简化view函数,1.定义包装
- Python 脚本文件批量改名,,#!/usr/bin/e
- Python 清除CVS和SVN下的目录和子目录,cvssvn,#!/usr/bin/e
评论关闭