移除html事件,移除事件,#!/usr/bin/e
文章由Byrx.net分享于2019-03-23 09:03:05
移除html事件,移除事件,#!/usr/bin/e
#!/usr/bin/env python3import redef remove_html_event(html): '''移除html代码中的事件属性''' html = html.replace('\\n', '') #匹配html事件属性及其后面的所有属性 patt1 = r'''<[\\w]+\\s*?.*?\\s(on[\\w]+=(["']{1}).*?\\2)>''' #匹配事件属性 patt2 = r'''on[\\w]+=(["']).*?\\1''' p1 = re.compile(patt1, re.I) p2 = re.compile(patt2, re.I) p1_result = p1.findall(html) for p1_tuple in p1_result: p2_match = p2.match(p1_tuple[0]) try: html = html.replace(p2_match.group(0), '') except IndexError: pass return html;#该片段来自于http://byrx.net
评论关闭