python获取网页中位置不固定的信息应该怎么做,python获取,只获取广东这条信息,但是


只获取广东这条信息,但是第二行在其他页面中可能就变成第三行了,求问怎么获取
<td class="op_trust_tdRight">广东</td>

<table width="100%;">                        <tr>                <td class="op_trust_tdLeft">执行法院:</td>                <td class="op_trust_tdRight">福田区人民法院</td>            </tr>            <tr>                <td class="op_trust_tdLeft">省份:</td>                <td class="op_trust_tdRight">广东</td>            </tr>            <tr>                <td class="op_trust_tdLeft">案号:</td>                <td class="op_trust_tdRight">(2011)深福法执字第01854号</td>            </tr>           

var table=document.getElementsByTagName("table");
var targetVal=table[0].rows[1].cells[1];

一个法子就是找到省份那个单元格,然后再提取相邻单元格的数据。我是用pyquery来解析html的,如果写过前端jquery的话应该会很熟悉。

from pyquery import PyQuery as pqt='''<table width="100%;">                        <tr>                <td class="op_trust_tdLeft">执行法院:</td>                <td class="op_trust_tdRight">福田区人民法院</td>            </tr>            <tr>                <td class="op_trust_tdLeft">省份:</td>                <td class="op_trust_tdRight">广东</td>            </tr>            <tr>                <td class="op_trust_tdLeft">案号:</td>                <td class="op_trust_tdRight">(2011)深福法执字第01854号</td>            </tr>'''p=pq(t)print(p.find('.op_trust_tdLeft').filter(lambda i,this: pq(this).text() == '省份:').parent().find('.op_trust_tdRight').text())

编橙之家文章,

评论关闭