Python 正则中文网页字符串提取问题，python中文网页,<span class=

文章由Byrx.net分享于2019-03-23 04:03:46评论（551）

Python 正则中文网页字符串提取问题，python中文网页,

<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>

如上网页中的字符串，如何用正则提取出美国和澳大利亚。
初学，研究了半天没头绪。。。。

Python 2.7.6 (default, Sep 9 2014, 15:04:36) [GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> html = '制片国家/地区: 美国 / 澳大利亚 '>>> re.findall(r'制片国家/地区:(.*?) ', html)[' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a']>>> re.findall(r'制片国家/地区:(.*?) ', html)[0]' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a'
试一下，这种
In[5]: re.findall(ur'制片国家/地区:(.*?) ', html)Out[5]: [u' \u7f8e\u56fd / \u6fb3\u5927\u5229\u4e9a']

编橙之家文章，

热门文章：

Python 正则中文网页字符串提取问题，python中文网页,<span class=

相关内容

最新python问答

python~HOT