python正则表达式怎么匹配这段中文?,,下面这段文字,用xpat
python正则表达式怎么匹配这段中文?,,下面这段文字,用xpat
下面这段文字,用xpath找到后,需要把意大利和西班牙两部分所包含内容分开保存,用正则表达式应该怎么写?
<div class="des"> <p> 意大利:<br /> 1、全称意大利共和国<br /> 2、由南欧的亚平宁半岛及两个位于地中海中的岛屿西西里岛与萨丁岛所组成<br /> 3、国土面积为301333平方公里<br /> <br /> 西班牙:<br /> 1、1492年10月12日独立<br /> 2、是一个位于欧洲西南部的国家<br /> 3、西邻同处于伊比利亚半岛的葡萄牙,北濒比斯开湾,东北部与法国及安道尔接壤,南隔直布罗陀海峡与非洲的摩洛哥相望<br /> </p></div>
我是这样写的,但是总是匹配不出来:
desc =sel.xpath('//div[@class="des"]').extract()[0]item['italy'] = re.search('意大利:(.*?)西班牙',desc,re.S).group(1)item['spain'] = re.search('西班牙:(.*?)</p>',desc,re.S).group(1)
提示信息是:
备注:网页是gbk编码
AttributeError: 'NoneType' object has no attribute 'group'
编橙之家文章,
相关内容
- 如何处理ajax的session一致问题?,处理ajaxsession,我现在
- Windows 下 Pycharm 的正确编码设置?,windowspycharm,在 Pyc
- 微信公众号接入url验证返回"ret":-302,"err_msg":"v
- python菜鸟求助,使用matplotlib 绘制contour等高线图,z为
- 有没有满足如下要求的优先队列推荐,满足如下优先队
- 为什么用 YCM 补全 python 无法补全第三方库?,ycmpytho
- python里面声明多个变量 a = b = c = 1 这样有问题吗,pyt
- flask报了个这样的错是为什么,flask报,AttributeErr
- 为什么常说消息队列不安全,会丢失?,消息队列丢失
- Django数据查询:views查询出来一个list里怎么查询另一个
评论关闭