疏重于堵 如何应对网络爬虫流量很重要

简介:

网络爬虫(也被叫做网页蜘蛛、网络机器人)是一种能够“自动化浏览网络”的程序,它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以供搜索引擎做进一步处理(分检整理下载的页面),而使得用户能更快的检索到他们需要的信息。

疏重于堵 如何应对网络爬虫流量很重要

  企业Web流量中有高达60%可能是由网络爬虫产生的

现在,国际CDN企业Akamai发现,在企业Web流量中有高达60%可能是由网络爬虫产生的,而这些爬虫则是由用户或其他程序控制,并可能模拟人类的Web访问行为。几乎所有在线业务都可能受到各种类型的爬虫流量的影响。这可能包括抓取内容或价格信息的爬虫、用欺骗手段增加广告收入的自动“点击”爬虫、购买限量供应商品及服务而使合法客户无法正常购买的“交易”爬虫等。

为了阻止上述情况,企业往往会采取爬虫检测或防御解决方案来实现Web流量的自动发现及拦截,防止网络爬虫流量影响到企业网站的正常访问与响应,进而对业务和IT产生一定的负面影响。

当然,有时爬虫活动也可能会对企业业务产生有益的影响,但对站点性能的影响则不然。因此,企业机构需要一种新的方式,这种方式不仅要能够识别所遇到的爬虫活动类型,而且要能够提供多种超越简单拦截的、妥善应对不同类型爬虫流量的最有效的技术。

对此,爬虫管理器技术方案就显得相当重要了,Akamai云安全解决方案高级副总裁兼总经理Stuart Scholly表示,面对Web上充斥着爬虫,目前企业普遍面临两个选择,要么拦截要么默默忍受。但是很遗憾,这两种选择都不理想。而Bot Manager(爬虫管理器)将改变这种局面,该方案将给予企业客户能力和灵活性,使其可以根据业务目标,部署成功的爬虫管理策略。

疏重于堵 如何应对网络爬虫流量很重要

  企业如何应对网络爬虫流量变得相当重要

与仅能实现Web流量自动发现及拦截的传统爬虫检测或防御解决方案不同,Bot Manager方案旨在为在Web上开展业务的公司提供支持,使他们在处理爬虫时能够采用更新、更全面的策略。通过帮助用户更好地识别并了解哪些类型的爬虫流量进入他们的站点,以及提供超越简单拦截的多样化策略,Bot Manager能够帮助客户采取最恰当的措施,更好地控制爬虫流量对业务和IT产生的正面或负面影响。

从许多方面来看,当企业进行在线销售时,爬虫活动是一种“经营成本”,直到现在,也没有一种好的方法来帮助企业深入了解爬虫流量,并在此基础上做出真正明智的决策。而在部署了Bot Manager后,来自互联网零售商、美国汽车零部件有限公司(U.S Auto Parts Network,Inc.)的IT总监William Avellan则表示,他们已获得了足够的信息,使其能够解决长久以来面对的所有爬虫问题,包括内容窃取、价格信息爬取,甚至能够识别托管这些爬虫的IP传输运营商等等。由此可见,面对不可避免的网络爬虫,如何进行更为有效、更高级别的管理,对于企业业务来说,才是一条真正的“疏通之道”。

本文转自d1net(转载)

相关文章
|
5月前
|
Kubernetes 容器
k8s学习-CKS真题-网络策略拒绝流量
k8s学习-CKS真题-网络策略拒绝流量
37 0
|
6月前
|
网络协议 Java 关系型数据库
微信支撑10亿用户背后核心技术:亿级流量Java并发与网络编程实战
大家可能不知道,支撑微信10亿用户之后,最基础也是最核心的技术是什么?那就是网络编程。 越是大型互联网通讯项目,越是对网络编程的落地要求越高。落地,意味着对实战的要求更高。
|
10月前
|
机器学习/深度学习 算法
MATLB|基于小波神经网络的短时交通流量时间序列预测
MATLB|基于小波神经网络的短时交通流量时间序列预测
|
10月前
|
Kubernetes Shell iOS开发
Istio 网络:深入了解流量和架构
像 Istio 这样的服务网格项目为我们的架构引入了许多功能和优势,包括更安全地管理集群微服务之间的流量、服务发现、请求路由以及服务之间的可靠通信。
163 0
|
12月前
|
监控 网络协议 安全
科来网络全流量安全分析设备的使用
科来网络全流量安全分析设备的使用
|
运维 安全 BI
工控CTF_纵横网络靶场_简单流量分析
工控CTF_纵横网络靶场_简单流量分析
工控CTF_纵横网络靶场_简单流量分析
|
监控 Shell 应用服务中间件
网络分析shell脚本(实时流量+连接统计)
网络分析shell脚本(实时流量+连接统计)
229 0
网络分析shell脚本(实时流量+连接统计)
|
弹性计算 运维 安全
云上网络-管理公网流量- EIP/BAT /共享宽带 | 学习笔记
快速学习云上网络-管理公网流量- EIP/BAT /共享宽带
340 0
云上网络-管理公网流量- EIP/BAT /共享宽带 | 学习笔记
|
Kubernetes 负载均衡 网络协议
k8s网络诊断之我的流量去哪了
某客户反馈,生产业务的应用在做滚动更新时大量502报错,同时生产业务中pod设置了prestop来优雅下线(延迟关闭),但是在滚动更新时依然会有502的问题,由于生产环境流量比较高,决定搭建测试环境模拟复现该问题,实际复现过程中发现,pod切换完成后,客户端访问svc关联的SLB,应用会超时一段时间或者qps下降为0
1842 1
|
监控 C++ Windows
Windows网络通信流量和网速监控设计(二)
Windows网络通信流量和网速监控设计(二)
225 0
Windows网络通信流量和网速监控设计(二)