python获取网页中位置不固定的信息应该怎么做,python获取,只获取广东这条信息,但是
python获取网页中位置不固定的信息应该怎么做,python获取,只获取广东这条信息,但是
只获取广东这条信息,但是第二行在其他页面中可能就变成第三行了,求问怎么获取
<td class="op_trust_tdRight">广东</td>
<table width="100%;"> <tr> <td class="op_trust_tdLeft">执行法院:</td> <td class="op_trust_tdRight">福田区人民法院</td> </tr> <tr> <td class="op_trust_tdLeft">省份:</td> <td class="op_trust_tdRight">广东</td> </tr> <tr> <td class="op_trust_tdLeft">案号:</td> <td class="op_trust_tdRight">(2011)深福法执字第01854号</td> </tr>
var table=document.getElementsByTagName("table");
var targetVal=table[0].rows[1].cells[1];
一个法子就是找到省份那个单元格,然后再提取相邻单元格的数据。我是用pyquery来解析html的,如果写过前端jquery的话应该会很熟悉。
from pyquery import PyQuery as pqt='''<table width="100%;"> <tr> <td class="op_trust_tdLeft">执行法院:</td> <td class="op_trust_tdRight">福田区人民法院</td> </tr> <tr> <td class="op_trust_tdLeft">省份:</td> <td class="op_trust_tdRight">广东</td> </tr> <tr> <td class="op_trust_tdLeft">案号:</td> <td class="op_trust_tdRight">(2011)深福法执字第01854号</td> </tr>'''p=pq(t)print(p.find('.op_trust_tdLeft').filter(lambda i,this: pq(this).text() == '省份:').parent().find('.op_trust_tdRight').text())
编橙之家文章,
相关内容
- Python编程模型的一些小疑问,python编程模型,面向对象、
- Python乱码问题又来了,访问繁体字网站出乱码怎么破?r
- Python什么方法可以快速简洁的将两个队列变成字典,
- Python requests可以模拟登录需要身份信息的网站吗,pyt
- python语言里函数作用域unBoundError错误问题请教,python
- Python多线程读取文件进程读取到内容不全如何破,pyt
- Python有支持url发送指令控制服务器的方法吗,pythonurl
- 想使用redis和gevent完成实时消息系统求思路,redisgeven
- 要用python获取MySQL连接器如何写,pythonmysql,从MySQL官网上
- cookbook书中关于装饰器的源码里,这个参数是怎么传递的
评论关闭