【云栖号案例 | 教育与科研机构】得到APP上云 全链路压测让业务爆发更稳着陆

  1. 云栖社区>
  2. 云栖号资讯>
  3. 博客>
  4. 正文

【云栖号案例 | 教育与科研机构】得到APP上云 全链路压测让业务爆发更稳着陆

云栖号案例库 2020-04-20 16:50:53 浏览526
展开阅读全文

云栖号案例库:【点击查看更多上云案例】
不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策!

新冠肺炎的疫情突如其来,各个行业都在忙着为“抗疫”做些力所能及的事情。作为知识服务行业领头兵的得到也不例外。

得到是阿里云的合作伙伴。作为一家知识服务公司,得到APP的抗疫工作,春节前就开始了。

1月24日晚,得到APP、深圳卫视和爱奇艺联合出品的《2020知识春晚》。首次推出没有歌舞娱乐,没有工作人员以外的现场观众,只有素人独立演讲,面向全球同步直播长达10小时的新形式。得到APP创始人罗振宇在演播厅向观众示范如何正确戴口罩,还邀请了北京大学第三医院危重医学科医生薄世宁,向大家演示正确的洗手方式。2020知识春晚创下了爱奇艺知识分享类直播内容的最高成绩。

紧接着,关于疫情的各种消息满天飞,得到不仅免费提供专业、一手的相关医学知识,更早早开始把重点放在“怎么办”上,用知识和方法助力抗疫。邀请旗下老师,浙江大学生命科学研究院教授王立铭制作发布了《巡山报告-2019新型冠状病毒的来龙去脉》,对当下的相关论文和网络上的各类信息进行梳理研读,目前报告综合阅读量超过79万;邀请北医三院ICU医生薄世宁制作了“病毒性肺炎为什么难治? ICU医生告诉你怎么办?”,得到自有渠道综合浏览量超140万;同时得到还迅速与人民卫生出版社、天津出版传媒集团等多家出版社合作,在1月27日将最新出版的疫情防护电子书免费提供给用户下载阅读,用科学有效的解读缓解了大家的紧张恐慌情绪。

“抗疫”内容之外,防护隔离期间,得到还为用户们准备了优质内容的免费大包。1月29日开始,得到APP也上线了包括《2020知识春晚·知识清单》、《罗辑思维》(7季)等总时长共677小时的免费节目专区,同时将包含2000本书的“每天听本书”为期两个月向公众免费开放,供大家自用和转发给隔空惦记的亲友。截止目前,线上领取人数已达40万人。2月3日到2月12日,得到发起十日谈讲座直播,邀请十位得到系老师在家远程直播,为大家免费分享知识、见解和常识,3万多人同时在线;得到APP的联合创始人脱不花还发起了一起读《人的全景》的活动,几千人云读书分享读书感受……

image

从罗辑思维到得到APP 唯有稳定才能抓住每一次蜕变

“和你一起终身学习,这里是罗辑思维”这是得到App创始人罗振宇在得到App上的免费专栏《罗辑思维》的开头。

从一个人的《罗辑思维》,到汇聚名家的得到App知识分享平台,罗振宇的坚持一直没有变。他和他的团队开启了为大众提供付费知识服务的热潮,也创造了一种新的商业模式。

得到App在2016年正式上线,在团队3年积累的基础上,上线后用户量快速进入了井喷期,成立短短一年多后,得到无论营收、用户量增长量、影响力上都完成了从罗辑思维后的完美蜕变。

机遇的来临往往伴随着挑战。行业内有个常识,业务的知名度越高,其背后技术团队承受的压力就越大。一旦出现技术问题,就有可能被放大,尤其是屏幕对面是对知识服务体验要求颇高的用户群体。

得到App每一次高质量的内容产出都有爆发的可能。保障服务的可用性和稳定性是技术团队面临的首要任务。用户在高铁、地铁和公交车等场所利用碎片时间进行学习,在早晚高峰甚至凌晨、深夜都有可能打开App,这就需要得到App提供7*24的稳定高性能的服务和体验。得到团队把这个任务交给了阿里云。

得到团队从创立之初就形成了云原生架构,从基础设施到业务应用布局上云,从发布会支撑到全站安全。得到在云上获得了资源的极致弹性调用,ECS确保在一分钟内创建出1000+云服务器。2017年之后,容器技术的普及,阿里云的容器、存储团队研发的DADI加速器可以在10秒内启动近60000个容器,使得应用交付和运维敏捷性大幅提升。

阿里云的得到技术服务团队协助得到完成了云原生架构升级,“核心业务全部实现容器化部署和微服务改造”,支撑在当时用户井喷期一次又一次让流量和业务稳稳着陆。同时整合阿里云提供的服务治理、容器存储、负载均衡、日志管理和业务监控等,极大的简化了运维工作,从容应对业务高峰同时也达到了很好的性价比。

这几天十日谈的直播课,阿里云也全程提供直播护航,包括方案建议、技术支持、应急响应,提高终端用户的使用体验;保证问题能够秒级响应,给不同地区的用户带来了流畅的收看体验。

面对流量洪峰 全链路压测让业务爆发更稳着陆

这次疫情,让所有的在线教育和在线办公平台都经历了一次巨大的实时压测。作为知识服务行业的先行者,得到App在前几年就经历过这些,在历年的跨年演讲和此次的知识春晚的前期准备工作中和阿里云一起积累了非常成熟的应对经验。

时间回到2017年中,得到App第二次知识发布会在深圳卫视和多个视频网站播出,带来的流量是平日高峰值的10倍左右,而作为年度知识盛宴的「时间的朋友」跨年演讲,流量无疑更大。

image

历届“时间的朋友”跨年演讲都吸引了大量现场和线上观众观看及互动,随着演讲过程中罗振宇不断抛出新观点、新认知和新活动,海量用户也随之产生庞大的访问请求,“这是典型的高并发、脉冲流量的场景”,需要得到App能够稳定流畅地将请求正确处理完成,使用户获得最好的使用体验。”

image

在应对重大营销活动上,经历过“地球上最大规模的秒杀活动”双十一的阿里云有绝对的发言权。而在历年备战双11的利器中,全链路压测是应战业务大促不可缺少的关键技术,在此次「时间的朋友」备战中应用得淋漓尽致。

全链路压测考验团队的核心之一是对真实业务场景的深入了解,团队需要找到不同业务场景下的临界峰值,计算出每个业务应用的数量值,由点及线、由线及面从而获得整体情况。这就要求阿里云的架构师和技术同学必须沉到这场千万人瞩目的直播中去。“当时我们和他们的团队近身作战3个月,几乎是天天在一起了”。

200个全链路压测接口,囊括了其得到App和其独立电商平台的所有核心业务。在不到三个月的时间内,一共进行了大大小小愈七百次的单链路压测、十六轮完整形态全链路压测,压测所耗费的资源相当于一百多万用户一同测试两个多小时。压测结果是几乎所有主要后端服务的系统架构都被优化改造。

命运和时间一样,都眷顾有准备的人。

阿里云高可用体系解决方案通过全链路压测规划跨年期间的系统容量,准确预测基准吞吐量和扩容缩容策略,测试到各种特定场景下的集群处理瓶颈,让业务团队对业务承载能力充满信心,顺利完成了跨年活动。在全面护航的背后,得到团队和阿里云也找到了背靠背作战的感觉。

image

为了保证跨年演讲工作的技术投入具备最佳性价比,得到技术团队大量使用阿里云弹性计算、弹性带宽、容器服务、数据库服务、日志服务等产品技术。在“时间的朋友”跨年演讲活动期间,根据压测的结果准备的基准资源、以及动态的弹性资源,帮助整体IT系统达到了非常高的性价比。

同时根据以往双十一大考的实践经验,阿里云技术服务团队全程参与到“时间的朋友”跨年演讲活动中,协助用户建立了基础业务监控大盘;在压测时给出优化建议并在突发情况下给予全力支持,包括异常情况预演、准备应急作战预案,甚至梳理了应对危机的话术和现场运营商可能会限流的问题的应对方案。目前,全链路压测已经成为保障得到所有业务稳定性的核心基础设施之一,对其日常的性能提升都起到了至关重要的作用。

5年的发展下来,得到APP的注册用户已经超3000多万,从最初的免费音频到现在的专栏课程、电子书、讲座直播、线下的得到大学,得到的内容和运营形式越来越丰富。未来,得到还希望通过新的技术手段,实现用户智能学习和个性化推荐。

现在,罗辑思维全站运行在阿里云上。随着业务需求不断增大,团队使用了ECS、CDN、OSS、多款云数据库、日志服务、负载均衡、容器服务、全链路压测PTS、Web应用防火墙、媒体转码、数据可视化等30多款产品。作为一开始就全面上云的公司,得到的底层技术支撑由阿里云负责,技术团队则专注于产品研发的创新和客户价值的提升,加快了整个研发进程。

你用心关注用户,我用专业支持你。

文:李双宏、崔昊 阿里云研究中心

logo

【云栖号在线课堂】每天都有产品技术专家分享!
在线课堂地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

网友评论

登录后评论
0/500
评论
云栖号案例库
+ 关注
所属团队号: 云栖号资讯