python lxml处理如何使用？，pythonlxml,例如：没<

文章由Byrx.net分享于2019-03-23 04:03:44评论（34）

python lxml处理如何使用？，pythonlxml,例如：
没<

例如：
没aa没aa没aa没
就是在p标签里可能会出现同样的em标签，而且数量不定，那我怎么获取p的内容，包括em里的内容。
例如第二个p获取输出是‘没aa没aa’
或者获取到p节点之后，怎么把里面的内容转换为字符串
lxml.html的.text_content()方法，可以获取当前节点和所有子节点的文本内容。
今天偶然学到处理这个问题的方法，特意翻出来这个问题回答。题主你可以看一下xpath的轴，比如你要取得第二个标签的“没aa没aa”，实际是取得它全部后代节点的文本内容，可以使用
element_dom.xpath("//p[2]//descendant::text()")来取得，拿到的结果是一个这样['没', 'aa', '没', 'aa']的list,然后自己手动拼接成字符串就可以了，比如"".join(list)。同理，如果你需要进行其他操作，也可以使用类似的方法。
换bs4，string和text之间的异同就在这里。

编橙之家文章，

今日最新热门文章：

学习后端选择Python怎么样，学习后端选择Py

python这段代码怎么写才合适才更pythonic一些？

Python requests获取网页标题源码出现乱码如何改

python爬虫爬取的钢页直接生成Excel文件还是存

Mac上python3.5的pycharm开发环境配置问题求解答

Python简化代码,判断是否包含指定字符串的代

相关内容

学习后端选择Python怎么样，学习后端选择Python,我后端基
python这段代码怎么写才合适才更pythonic一些？，pythonp
Python requests获取网页标题源码出现乱码如何改，python
python爬虫爬取的钢页直接生成Excel文件还是存入Mysql更好
Mac上python3.5的pycharm开发环境配置问题求解答，python3.
Python简化代码,判断是否包含指定字符串的代码简化方法
Python与android应用实现实时消息推送的方法是?，pythona
python utf-8编码被识别为gb2312求解决方法，pythonutf-8,# c
Python备份离线静态站点方法是什么?，python离线,有时候
写一个php框架怎么做到？，php框架做到,删了吧我只是

推荐教程：python教程 python问答 python源码实例 python开发工具 python框架

python lxml处理如何使用？，pythonlxml,例如：<p>没<em><

python lxml处理如何使用？，pythonlxml,例如：
没<

相关内容

最新python问答

python~HOT