python获得url的顶级域名,pythonurl顶级域名,如下代码topHostP
python获得url的顶级域名,pythonurl顶级域名,如下代码topHostP
如下代码topHostPostfix是顶级域名的后缀,get_top_host函数会根据这些后缀组合一个正则表达式来解析顶级域名:
topHostPostfix = ( '.com','.la','.io', '.co', '.info', '.net', '.org', '.me', '.mobi', '.us', '.biz', '.xxx', '.ca', '.co.jp', '.com.cn', '.net.cn', '.org.cn', '.mx', '.tv', '.ws', '.ag', '.com.ag', '.net.ag', '.org.ag', '.am', '.asia', '.at', '.be', '.com.br', '.net.br', '.bz', '.com.bz', '.net.bz', '.cc', '.com.co', '.net.co', '.nom.co', '.de', '.es', '.com.es', '.nom.es', '.org.es', '.eu', '.fm', '.fr', '.gs', '.in', '.co.in', '.firm.in', '.gen.in', '.ind.in', '.net.in', '.org.in', '.it', '.jobs', '.jp', '.ms', '.com.mx', '.nl', '.nu', '.co.nz', '.net.nz', '.org.nz', '.se', '.tc', '.tk', '.tw', '.com.tw', '.idv.tw', '.org.tw', '.hk', '.co.uk', '.me.uk', '.org.uk', '.vg')def get_top_host(url): parts = urlparse(url) host = parts.netloc extractPattern = r'[^\.]+('+'|'.join([h.replace('.',r'\.') for h in topHostPostfix])+')$' pattern = re.compile(extractPattern,re.IGNORECASE) m = pattern.search(host) return m.group() if m else host
相关内容
- python使用ctypes模块调用windowsapi获取系统版本,ctypeswi
- python解决约瑟夫环问题,python约瑟夫环,100人围成一圈,
- python统计代码行数代码,python统计行数,[Python]代码#实
- 原创Python数代码行数代码,原创python代码行数,如下py
- Python逐块读取大文件行数的代码,python逐行数代码,py
- python二分查找,python二分,python二分查找[P
- python实现的堆排序算法代码,python堆排序算法,def heap
- Python之SMTP 发邮件,pythonsmtp发邮件,这段代码解释了SM
- Python的默认参数详解,python参数详解,文章的主题不要使
- python操作sqlite3数据库完全代码,pythonsqlite3,# Name: pySn
评论关闭