python中django框架通过正则搜索页面上email地址的方法,pythondjango
python中django框架通过正则搜索页面上email地址的方法,pythondjango
本文实例讲述了python中django框架通过正则搜索页面上email地址的方法。分享给大家供大家参考。具体实现方法如下:
import re from django.shortcuts import render from pattern.web import URL, DOM, abs, find_urls def index(request): """ find email addresses in requested url or contact page """ error = '' emails = set() url_string = request.GET.get('url', '') EMAIL_REGEX = re.compile(r'[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,6}', re.IGNORECASE) # use absolute url or domain name url = URL(url_string) if url_string.startswith('http') else URL(domain=url_string,protocol='http') if url_string: try: dom = DOM(url.download(cached=True)) except Exception, e: error = e else: contact_urls = { url.string } # search links of contact page for link in dom('a'): if re.search(r'contact|about', link.source, re.IGNORECASE): contact_urls.add( abs(link.attributes.get('href',''), base=url.redirect or url.string)) for contact_url in contact_urls: # download contact page dom = DOM(URL(contact_url).download(cached=True)) # search emails in the body of the page for line in dom('body')[0].content.split('\n'): found = EMAIL_REGEX.search(line) if found: emails.add(found.group()) data = { 'url': url_string, 'emails': emails, 'error': error, } return render(request, 'index.html', data)
希望本文所述对大家的Python程序设计有所帮助。
相关内容
- python中Flask框架简单入门实例,pythonflask
- Python使用Flask框架同时上传多个文件的方法,
- Python使用Flask框架获取当前查询参数的方法,pythonflas
- python使用Flask框架获取用户IP地址的方法,pythonflask
- python执行外部程序的常用方法小结,python执行外部小结
- python通过字典dict判断指定键值是否存在的方法,pytho
- python实现从一组颜色中找出与给定颜色最接近颜色的方
- python实现颜色rgb和hex相互转换的函数,pythonhex
- python通过colorama模块在控制台输出彩色文字的方法,
- python在windows命令行下输出彩色文字的方法,
评论关闭