pyppeteer最为核心类Page的接口方法(下)

  1. 云栖社区>
  2. python技术进阶>
  3. 博客>
  4. 正文

pyppeteer最为核心类Page的接口方法(下)

python之战 2019-04-29 09:50:48 浏览621
展开阅读全文

重要:因为同步公号的文章格式很难保证,所以后面文章选择性在其他平台同步,欢迎移步公众号(Python之战),每日更新原汁原味!

在上一篇《pyppeteer最为核心类Page的接口方法》讲了大部分pyppeteer的Page类的接口,与selenium相比增强了与页面js的交互功能,同时增加了设备的伪装和模拟能力,一方是因为pyppeteer库是源于puppeteer,而puppeteer是Google提供了一个js库,本身和js的交互性强,所以在页面交互上更深入。

也正是因为更深的js交互,所以可以任意修改任何网站在源码中的爬虫检测方式,并且毫不费劲,关于淘宝登陆有一种实现方式是使用中间代理修改检测的js文件,使用pyppeteer之后就不用这么麻烦,可以直接将js代码写入网站加载的js文件中。

继续Page类的剩下一下方法:

协程方法

网友评论

登录后评论
0/500
评论
python之战
+ 关注
所属云栖号: python技术进阶