JS是学习python爬虫必要了解的知识点吗,python爬虫,额,是这样的,因为有时候
JS是学习python爬虫必要了解的知识点吗,python爬虫,额,是这样的,因为有时候
额,是这样的,因为有时候抓取某些网址的数据,需要登陆,所以,这段时间我在弄python模拟登陆网址的问题,但是我发现,有些网址,在python提交的post数据中,有些事js计算出来的,看不懂js那就没办法了把?
举一个例子把.这两天我在为 IP地址查询 - 站长工具 写程序,内容是用python抓取这ip查询网址的查询结果,使用query string的程序我已经写出来了,但是当我想要用python发送post的方法来获取数据时我发现,点击页面中的"查询"后浏览器没有post,那么这个我输入的ip地址是怎么发送到服务器并返回呢?这应该就用到js了吧?(我只是猜测)
最近我的学习已经卡顿了,因为我发现好像不懂js就难以继续学习,学习js并不是一个问题,主要是因为我学python不久,我不知道这时候分出时间来学js是不是一个明智的选择.
对于上面那个ip查询的网址,今晚我刚刚分析过js代码,但是实在弄不懂输入的ip地址是怎么返回给服务器的,,,,,,,,,,,,,,,,,,,,,
大家给点建议吧..............python
写爬虫,很多时候是要了解页面上 JS 的,所以 JS 是需要了解的,好在这东西很好上手,不需要精通,了解一下就好了。
如果页面的有些部分是通过js生成的,需要用引擎把他解析出来。如果js里面用了ajax取数据的话,会更慢。
不需要,因为python不能解析js,懂js也没用。你只需要在chrome里面看一下你需要的数据是通过请求哪个网址返回的就行了。
如果只是为了玩爬虫,可能你只需要了解一下js,重点了解下ajax就可以了。因为很多页面是ajax请求加载的。
编橙之家文章,
相关内容
- 求指导django中one-to-many和foreign key的应用及用途,djang
- Python什么方法可以将XML转换为JSON格式,pythonjson,由于老
- Python mysql数据牗executemany指定写入表报错,pythonexecute
- python3一当前函数调用另一个函数中的数据怎么实现,
- python import模块导入ImportError: No module named A路径应该没问
- 请问python 中cx_oracle使用where col in (:1)的方式的时候,是
- Flask Web开发实例3-10怎么样来实现?,flask3-10,Windows环境
- Python方法获得系统CPU频率及内存占用情况,python内存占
- Python七牛可以成功上传却不能正常访问文件如何解决,
- 使用python统计目标词在文件中出频度的实现方法,pyt
评论关闭