Python 正则中文网页字符串提取问题,python中文网页,<span class=
Python 正则中文网页字符串提取问题,python中文网页,<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>
如上网页中的字符串,如何用正则提取出美国和澳大利亚。
初学,研究了半天没头绪。。。。
Python 2.7.6 (default, Sep 9 2014, 15:04:36) [GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> html = '<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>'>>> re.findall(r'制片国家/地区:</span>(.*?)<br/>', html)[' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a']>>> re.findall(r'制片国家/地区:</span>(.*?)<br/>', html)[0]' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a'
试一下,这种
In[5]: re.findall(ur'制片国家/地区:</span>(.*?)<br/>', html)Out[5]: [u' \u7f8e\u56fd / \u6fb3\u5927\u5229\u4e9a']
编橙之家文章,
初学,研究了半天没头绪。。。。
相关内容
- 请问这个Python程序运行原理是什么,Python程序运行原理
- 需要为遵守PEP8修改自己python代码吗,遵守pep8python代码
- Python利用二分法计算平方根哪里出问题了,python二分法
- 新手请教关于Flask-sqlalchemy、Flask-WTF结合查询的问题,
- Python实现批量生成字符串最佳思路是什么,python思路
- Python2.7遍历包含一个dict的tuple变量应该怎么写,python
- 实现qml+python打包成exe小程序问题,qmlpython,我写了一个
- Python在mac最常用编辑器是哪几款?,pythonmac,我先来Xcod
- Python新手求助Tornado/Cyclone RBAC修饰符编写方法,tornado
- Python实现插入排序算法遇到问题找不到原因,求大神解
评论关闭