精通Python网络爬虫:核心技术、框架与项目实战.2.3 用户爬虫的那些事儿

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

精通Python网络爬虫:核心技术、框架与项目实战.2.3 用户爬虫的那些事儿

华章计算机 2017-05-02 17:28:00 浏览1704
展开阅读全文

2.3 用户爬虫的那些事儿


用户爬虫是网络爬虫中的一种类型。所谓用户爬虫,指的是专门用来爬取互联网中用户数据的一种爬虫。由于互联网中的用户数据信息,相对来说是比较敏感的数据信息,所以,用户爬虫的利用价值也相对较高。

利用用户爬虫可以做大量的事情,接下来我们一起来看一下利用用户爬虫所做的一些有趣的事情吧。

2015年,有知乎网友对知乎的用户数据进行了爬取,然后进行对应的数据分析,便得到了知乎上大量的潜在数据,比如:

知乎上注册用户的男女比例:男生占例多于60%。

知乎上注册用户的地区:北京的人口占据比重最大,多于30%。

知乎上注册用户从事的行业:从事互联网行业的用户占据比重最大,同样多于30%。

除此之外,只要我们细心发掘,还可以挖掘出更多的潜在数据,而要分析这些数据,则必须要获取到这些用户数据,此时,我们可以使用网络爬虫技术轻松爬取到这些有用

网友评论

登录后评论
0/500
评论