Web Scraping(网页抓取)基本原理,


本文主要介绍 Web Scraping 的基本原理,基于Python语言,大白话,面向可爱的小白(^-^)。


易混淆的名称:

很多时候,大家会把,在网上获取Data的代码,统称为“爬虫”,
但实际上,所谓的“爬虫”,并不是特别准确,因为“爬虫”也是分种的,

常见的“爬虫”有两种:

而,这篇文章,主要讲解的是第二种“爬虫”(Web Scraper)的原理。

Web Scraping 是什么?

简单的说 Web Scraping,(在本文里)就是指,用Python代码,从肉眼可见的网页上,抓取数据。

为什么需要 Web Scraping?

因为,重复工作太多,自己做,可能会累死!

代码的适用实例有哪些?

Web Scraping 的基本原理:

  • 然后,我们要了解,使用Python,如何实现它,实现原理基本就四个步骤:

  • 篇尾总结:

    这篇文章,重点在于讲解实现的思路和过程,
    所以,并非详尽,也并没有给出实际的代码,
    但是,这个思路,几乎是网页抓取的通用套路。

    就写到这里吧,想起什么再更新,
    要是有写的不到位的地方,还请包涵!



    相关内容

      暂无相关文章

    评论关闭