python替换html中的空标签,python替换html标签,html中的空行,有可能
python替换html中的空标签,python替换html标签,html中的空行,有可能
html中的空行,有可能是空标签组成的例如<p></p>
或者<div> </div>
或者<p><font> </font></p>
,要替换这样的内容,需要使用正则表达式。
请看下面的代码:
__author__ = 'yukaizhao post @ http://byrx.net/'import redef remove_empty_tag(input): pattern = re.compile(r'<([a-z]+\d?)\b[^>]*>( |[\s ])*</\1>',re.IGNORECASE) maxLoopTimes = 10 i = 0 while i < maxLoopTimes: tem = pattern.sub('',input) if tem == input: input = tem break else: input = tem i += 1 return inputif __name__ == '__main__': output = remove_empty_tag('<div>\n\t </div>hello') print output output = remove_empty_tag('<div><span> </span></div>hello world') print output
上述代码执行后,会输出:
hellohello world
空行不见了!!
相关内容
- 数独人工算法的python实现,人工算法python,目前只有两个
- python使用os.path和hashlib遍历目录计算所有文件的md5值,
- python过滤字符串中不属于指定集合的字符的类,python字
- python清空linux/unix系统共享内存代码,pythonunix,# -*- cod
- python使用蒙特卡洛方法计算圆周率,python蒙特卡洛,蒙特
- UnicodeDecodeError: 'utf8' codec can't decode
- Python读取浮点数|读文本文件,python点数,[Python]代码im
- python调用摄像头摄像并保存图片,,[Python]代码#!
- python 监控 linux cpu 使用率,pythonlinux,[Python]代码
- Python 收取Gmail新邮件并发送到gtalk,pythongtalk,[Python]代码
评论关闭