避免被频繁的警报折腾死的七种方法

简介:

随着公司成长,需要的工具越来越多,而随工具的增加,警报和流程中断也就越来越多。很快,每套系统和工具发出的警报,听起来就像是一场喧嚣的酒会,大家都在谈论各自不同的话题。因此,安全和运维团队正在逐渐丧失对警报的敏感度,甚至系统标出真正异常的活动,也有可能因警报疲劳而被无视掉。

你需要的,是唱诗班一样和谐悦耳的警报,一切协调运作,只有真正的事件出现才会发出高音。那么,要怎么达到这种境界呢?Threat Stack 工程副总裁克里斯·杰维斯,以及VictorOps,提供了避免警报疲劳的七种方法。

1. 让所有警报都具备上下文环境和可操作性

筛选无上下文无意义的警报来确定行动进程是十分疲惫的。有效警报需要具备两个关键特性:

  • 上下文:来自匹配整个系统的数据点以描绘出完整视图,包括运行手册、图表、日志、注释,以及解决问题有关的任何其他细节。
  • 源细节:指向问题源头和系统内受影响的任何其他区域,以便能从根源解决问题。

2. 减少冗余警报

很明显,不停接到同一个问题的警报无疑是毫无效率的,尤其是在问题甚至都不称之为问题的时候。这是导致警报疲劳的最大因素之一。无论是常规工程工作出发的警报,还是第三方App引起的不必要警报,都无关紧要:这些实例全都会导致警报疲劳。精确调整每个工具的报警协议,可以减少和合并警报。甚至更好的是,将所有安全功能整合到单一平台,可以统一警报配置和产生。

3. 为警报指定单一源或时间线

每个工具都发送自己的警报(多半直接发送到你的邮箱),让连点成线发现真正的问题变得十分困难——即便真的在邮件堆中对这些警报投以关注。不能依赖邮件警报作为单一的真相来源。采用Slack之类开放式通信频道无缝衔接警报,提供团队范围的可见性,允许开放讨论以解决问题的做法,要好得多。

无缝衔接安全功能(威胁情报、漏洞管理、亚马逊云追踪服务CloudTrail等等)到单一平台,同样可以统一整合安全警报。

4. 调整异常检测阈值

受日常忙碌所累,很多团队都忘了定期精调基准线。这导致了更多的无用警报,让警报疲劳进一步恶化。解决掉最大的噪音警报是个不错的开始,但更好的解决方案,是使用能随时间从系统基线中学习的工具,可随公司扩张自行调整,让安全团队无需手动调整。

5. 确保警报发给正确的人/团队

随着团队成长突然出现的另一个问题,是确保团队每一个人都能收到相应的警报以做出动作。作为持续改进过程的一部分,应让每个团队成员来决定自己收到警报的方式、频率和主题。

6. 定制个人通知/寻呼

工程师和运维人员被深夜呼叫来处理根本不严重的警报已经司空见惯。这不仅仅会让团队疲惫,甚至会让他们不再相信日间警报!所以,应确保只有高严重性警报会触发“深夜呼叫”。其他所有警报可以等第二天一早来处理。

7. 定期审查和调整

上述6条建议不应只是一次性的工作;你得定期重审以确保系统正常运行。下面几个问题,是在事后分析和定期团队会议上应该向团队提出的:

  • 警报信噪比调整全队皆知了吗?
  • 警报精调是持续改进过程中的一部分吗?
  • 团队被授权自行安排工作优先级和处理警报疲劳相关因素了吗?
  • 上报流程是明智有效的吗?
  • 能集成更多的数据到警报中以提供合适的上下文来决策吗?


作者:nana

来源:51CTO

相关文章
|
1月前
|
弹性计算 安全 机器人
定时提醒再也不用担心忘记啦
好记性不如烂笔头,烂笔头不如靠谱的自动化~~~正在寻找自动化流程编排工具或定时任务工具的朋友们赶紧看过来,为你介绍一款简单配置即可实现自动化定时提醒的平台阿里云计算巢AppFLow。
163 0
|
前端开发 PHP 容器
快速定位无用路由 妈妈再也不用担心人工排雷了
快速定位无用路由 妈妈再也不用担心人工排雷了
81 0
快速定位无用路由 妈妈再也不用担心人工排雷了
|
SQL 运维 监控
一个诡异的MySQL查询超时问题,居然隐藏着存在了两年的BUG
一个诡异的MySQL查询超时问题,居然隐藏着存在了两年的BUG
165 0
|
芯片
程序人生 - 手上总有静电该怎么处理?
程序人生 - 手上总有静电该怎么处理?
110 0
程序人生 - 手上总有静电该怎么处理?
|
Web App开发 Java
小玩意 - Chrome插件——GreenChrome(GC)失效如何解决?
小玩意 - Chrome插件——GreenChrome(GC)失效如何解决?
298 0
|
程序员
能让程序员瞬间崩溃的五个瞬间,共鸣的同学请举手!
在我们的眼里,程序员好像是无所不能的,那么复杂的App和那些游戏都是他们做出来的,这让我们很难相信还有什么是他做不出来的。不过,就是我们每天眼里看着很厉害的程序员,每天都要面临的就是头疼,头疼,头好疼,特别是我接下来要说的几件事情,几乎是所有程序员都会把头抓秃的事     那么这五件事情究竟是什么事呢? 写着代码停电,代码没有保存 如果有一天突然代码写到一半,眼看就快要完工了,突然一下就断电,代码没保存。
1303 0
|
存储 SQL Web App开发
你们的系统真的安全吗?你们系统是不是也有这种诡异的情况呢?
这个文章来源灵感是公司的项目在安全检查的时候,发现了很多 SQL 注入的一些问题还有一些 XSS 攻击问题,SQL 注入我们都是比较了解的,那么什么是 XSS 攻击呢?测试反馈给我的时候我是一脸懵逼呀,现在我们就来说一下什么是 XSS 攻击,以及我们怎么防止它的出现。
|
安全 搜索推荐 数据安全/隐私保护
网站被挂马实用怎么解决的办法之一
 最近单位网站在百度搜索点击打开都是黄色的,而直接输入网址反而没问题,在百度搜索中被提示为网站被黑的可能,很多客户搜索我们网站都进入了黄色网站,给公司的形象造成了很大的影响,作为公司的网站技术人员,以前也算是搞了5年的老站长了,什么事没惊着,从头开始分析网站被黑的原因。
1517 0
|
安全
放假期间网站被挂马的解决办法
青岛峰会期间本来想给自己放几天假的,因为网站的挂马给泡汤了,打开网站首页,使用浏览器的源代码功能,发现自己网站的首页多了很多木马代码,于是我连接FTP查看网站首页的代码中发现了这个挂马代码,下面我把代码贴出来 :
1708 0
|
安全 搜索推荐 数据安全/隐私保护
网站被挂马实用如何解决的办法
最近单位网站在百度搜索点击打开都是黄色的,而直接输入网址反而没问题,在百度搜索中被提示为网站被黑的可能,很多客户搜索我们网站都进入了黄色网站,给公司的形象造成了很大的影响,作为公司的网站技术人员,以前也算是搞了5年的老站长了,什么事没惊着,从头开始分析网站被黑的原因。
1734 0

热门文章

最新文章