【云栖号案例 | 教育与科研机构】比邻东方上云 从零开始完成压测和监控高可用体系建设

  1. 云栖社区>
  2. 云栖号资讯>
  3. 博客>
  4. 正文

【云栖号案例 | 教育与科研机构】比邻东方上云 从零开始完成压测和监控高可用体系建设

云栖号案例库 2020-05-06 15:58:55 浏览886

云栖号案例库:【点击查看更多上云案例】
不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策!

公司介绍

新东方教育科技集团,由1993年11月16日成立的北京新东方学校发展壮大而来,目前集团以语言培训为核心,拥有短期培训系统、基础教育系统、文化传播系统、科技产业系统、咨询服务系统等多个发展平台,是一家集教育培训、教育产品研发、教育服务等于一体的大型综合性教育科技集团。新东方教育科技集团于2006年9月7日在美国纽约证券交易所成功上市,成为中国大陆首家海外上市的教育培训机构。

比邻东方是新东方旗下独资在线外教直播公司,根据新东方23年教学体系反馈,与国际资深教材编写团队共同打造国际小学课程体系,为5~12岁中国学生量身定做国际小学3人在线外教课程。

为了响应教育部保障防控疫情期间学生“停课不停学”的号召,2020年2月,新东方快速整合集团内外优质教师资源和课程资源,面向新东方所有中小学学员推出免费的全年级全学科同步线上课程及心理课程,面向中小学生家长推出免费的家庭教育线上课程,为社会提供更多样的公益性优质学习资源,助力学生及家长在延长的假期里共同进步和成长。

业务痛点

  • 新东方青少外教直播品牌比邻东方,2月10日晚8点开始在线选课及促销活动,预计在活动期间会有严重的流量压力。
  • 除流量压力外,还需要保证活动期间主流程的可用性及系统的稳定性。
  • 比邻东方尚未使用阿里云高可用系产品,在突发流量面前可能会遇到性能瓶颈,无法及时感知前端响应数据和应用运行数据。

解决方案

比邻东方大型线上公益课程的选课和促销活动之前选用了阿里云ARMS产品,阿里云技术团队从活动准备到活动结束期间,协助比邻东方进行了全方面的技术方案准备和性能压测,在此期间预测并处理了多个潜在问题,最终帮助比邻东方顺利完成活动。

  • 活动倒计时32小时
    比邻东方与阿里云技术团队联系,提出产品需求。技术团队协助开通ARMS产品,并确认压测方案,配置限流降级页面,安装产品探针,进行业务接口性能摸高。确认比邻东方已有系统的最高吞吐能力和整体应用响应时间。
  • 活动倒计时12小时
    帮助比邻东方进行多次压测,过程中修复了多个关键性能瓶颈,确认了限流降级的接口和阈值。同时系统吞吐能力与接口相应效率有了数倍提升。
  • 活动开始5分钟
    活动过程中,流量比预估更迅猛。通过ARMS定位关键瓶颈,迅速通过AHAS降级该请求,保证了比邻东方活动主流程的可用性及系统的稳定性。
  • 活动顺利结束

上云价值

两天内,我们帮助比邻东方从零开始完成了压测和监控高可用的体系建设,赢得了比邻东方的信任,在在线教育高速增长的今天,提升了阿里云在新东方客户的黏性。再次证明了AHAS+PTS+ARMS是非常低门槛,对于任何有短时高并发场景的客户十分行之有效的一个解决方案。

  • 压测保障:通过PTS压测确认系统基线能吞吐多少,通过ARMS监控和诊断压测过程中的性能瓶颈,并在上线时通过AHAS配置限流阈值保障系统稳定。
  • 护航限流:为避免突发高并发流量影响客户业务,通过ARMS实时监控活动流量变化,通过AHAS对突发流量和意外场景进行实时限流降级,保证系统的整体稳定性。

相关产品

  • 性能测试 PTS

PTS(Performance Testing Service)是面向所有技术背景人员的云化测试工具。有别于传统工具的繁复,PTS以互联网化的交互,提供性能测试、API调试和监测等多种能力。自研和适配开源的功能都可以轻松模拟任意体量的用户访问业务的场景,任务随时发起,免去繁琐的搭建和维护成本。更是紧密结合监控、流控等兄弟产品提供一站式高可用能力,高效检验和管理业务性能。
更多关于性能测试 PTS的介绍,参见性能测试 PTS产品详情页

  • 应用实时监控服务 ARMS

应用实时监控服务 (Application Real-Time Monitoring Service,简称ARMS)是一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,涵盖了浏览器、小程序、APP、分布式应用和容器环境等性能管理,能帮助您实现全栈式的性能监控和端到端的全链路追踪诊断, 让应用运维从未如此轻松高效。
更多关于应用实时监控服务 ARMS的介绍,参见应用实时监控服务 ARMS产品详情页

  • 应用高可用服务 AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的云工具产品,提供应用架构自动探测,故障注入式高可用能力评测和一键流控降级等功能,可以快速低成本的提升应用可用性。
更多关于应用高可用服务的介绍,参见应用高可用服务产品详情页

【云栖号在线课堂】每天都有产品技术专家分享!
在线课堂地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK