看不见的战斗——阿里云护航世界杯直播容灾实践

简介: 1978年,中国人开始在电视机上看到世界杯, 中央电视台对阿根廷队参加的半决赛以及阿根廷和荷兰的决赛进行了录播。1982年世界杯,宋世雄坐在一家香港宾馆的小电视前进行解说,然后央视再把香港这家电视台提供的画面转到自己的频道上,这就完成了中央电视台对世界杯足球赛的第一次现场直播。

1978年,中国人开始在电视机上看到世界杯, 中央电视台对阿根廷队参加的半决赛以及阿根廷和荷兰的决赛进行了录播。1982年世界杯,宋世雄坐在一家香港宾馆的小电视前进行解说,然后央视再把香港这家电视台提供的画面转到自己的频道上,这就完成了中央电视台对世界杯足球赛的第一次现场直播。

40年后,作为历史上首家拿下世界杯直播权的主流视频平台,这次优酷直接祭出了新玩法,采取央视解说、粤语解说、优酷专属专业解说以及跨界明星等四路四种风格的解说,满足不同用户的需求。

image

当然,世界杯只是一个缩影。互联网直播相比于电视直播和其他媒体形式,用户对于观感体验的要求更高,也给各大直播平台和提供直播服务的云计算厂商带来了更多技术挑战。

相对于电视信号的同轴电缆传输,在互联网上(无线)传输有很多不确定因素。信号的稳定性、生产速度、跨地域传输效率、灾备系统等等,都是需要关注的关键性指标。

面对世界杯这一流量空前的大规模直播活动,和多路解说、超高清画质等用户丰富交互的流畅保障需求,CDN的支撑对优酷来说尤为重要。优酷的兄弟团队、国内视频服务体量最大的云计算公司阿里云派出了视频云团队,该团队曾支持天猫双十一、春晚直播等大型项目,护航经验丰富。

护航项目组负责人之一,阿里云CDN产品架构师团队喻义表示:在世界杯开始之前,团队就开始思考,直播中信号源出现故障怎么办,运营商网络出现故障怎么办以及其它意外等,项目组设想了各种可能出现的问题,并给出周密的预案。

第一,多信号源异地备份

世界杯比赛的信号源是直播的根本,信号的稳定性直接影响所有直播用户的观看体验,所以必须做多信号源的备份,阿里云采取了以下方案:

1、采用多信号源异地备份,单一地区的环境问题、网络问题、设备问题导致的故障,不会影响整体业务
2、同源信号多路复合,同来源的内容,通过多源同时拉取,智能检测判断,合并成一路高质量、高可用的复合流,降低网络因素或者单台源站导致的不稳定和质量下降
3、异源信号智能检测,自动切换。对于不同来源的信号智能检测信号质量,切换到优质信号源。

_1

第二,生产链路灾备

直播内容生产链路也至关重要,在面对如此重要,如此大规模比赛,需要从技术架构上确保万无一失。

1、组件分布式,从直播信号的上行、转码、切片、流媒体服务,任何一个环节都是多路备份,任何单台设备故障,都是秒级切换,秒级恢复。
2、网络主备,所有组件的接入网络都是多线、多出口,不会因为单一运营商,单一网络产品的故障,导致服务不可用。
3、异地容灾,在多个中心同时部署备份,极端情况下,就算整个华东中心的生产环境异常,在1分钟内,可以把业务切到华北中心,快速恢复,保证信号的正常分发。

第三,分发网络灾备

播放端(用户)从就近的L1节点完成播放,L1节点一般就是本地覆盖的边缘节点,如果机房内有这路视频流,就直接返回,如果没有,就从L2节点拉流,如果L2不命中,最终会去直播中心寻找这路流。这其中,任何的链路都会存在抖动状况,CDN会通过自动切换调度来保证稳定性。
在L2节点,会做多区域、多运营商的二级节点备份,保障任何单一地区、运营商的故障不会影响整体服务。

_2

为了确保客户业务的容灾稳定性,阿里视频云针对客户业务场景设计涵盖视频生产、视频处理、视频分发的全链路高可用高并发的方案,并在开赛前2天配合优酷和CNTV完成了多次全链路的压测和容灾演练,为整个世界杯期间的运行稳定打好基础。这中间可以看到阿里云在双11、春晚积累下来的经验,很好的赋能并输出到了另外一个更大的战场中。

除了优酷外,阿里云还支撑了CNTV、CCTV5客户端,为全网70%的世界杯直播流量提供服务。要想保障这样重大的赛事,背后的整个平台的运维保障工作就是一个没有硝烟的战场。谈到这里,喻义不禁感慨:“优酷最晚拿到直播权,这个时候距离世界杯开幕只有2周的时间。阿里云需要在这2周的时间之内,完成整个运营商资源、云化资源储备和调度、整个CDN的容灾和灾备、视频处理中心的容灾和灾备。这对我们的供应链体系和组织协同都是非常大的挑战。然而比赛到了今天,我们都圆满地完成了护航任务,成功应对了一次又一次的流量攀升。”

image

对很多阿里云工程师来说,这都是一届独特的世界杯。从小组赛到淘汰赛,伴随着每场直播的顺利进行,球迷对于高清流畅的反馈,充分验证预案是成功的。世界杯护航结束后,会有更多的挑战,等待着阿里云CDN团队来迎战,一切未完待续。

目录
相关文章
|
1月前
|
SQL 分布式计算 关系型数据库
阿里云E-MapReduce Trino专属集群外连引擎及权限控制踩坑实践
本文以云厂商售后技术支持的角度,从客户的需求出发,对于阿里云EMR-Trino集群的选型,外连多引擎的场景、Ldap以及Kerberos鉴权等问题进行了简要的实践和记录,模拟客户已有的业务场景,满足客户需求的同时对过程中的问题点进行解决、记录和分析,包括但不限于Mysql、ODPS、Hive connector的配置,Hive、Delta及Hudi等不同表格式读取的兼容,aws s3、阿里云 oss协议访问异常的解决等。
|
2月前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
3月前
|
安全 机器人 数据安全/隐私保护
基于钉钉的阿里云管理实践(四)之续费充值
在阿里云资源的运营过程中,及时续费和充值是保障服务不中断的关键行动。借助钉钉及其集成的阿里云管理功能,用户可以方便地接收到续费通知,并完成充值过程。本教程将为您详细介绍从收到续费提醒信息到完成充值的全过程。
100 2
|
2月前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
700 0
|
3月前
|
人工智能 算法 开发工具
Mixtral 8X7B MoE模型在阿里云PAI平台的微调部署实践
Mixtral 8x7B 是Mixtral AI最新发布的大语言模型,是当前最为先进的开源大语言模型之一。阿里云人工智能平台PAI,提供了对于 Mixtral 8x7B 模型的全面支持,开发者和企业用户可以基于 PAI-快速开始轻松完成Mixtral 8x7B 模型的微调和部署。
|
21天前
|
SQL 存储 API
阿里云实时计算Flink的产品化思考与实践【下】
本文整理自阿里云高级产品专家黄鹏程和阿里云技术专家陈婧敏在 FFA 2023 平台建设专场中的分享。
110235 10
阿里云实时计算Flink的产品化思考与实践【下】
|
3月前
|
弹性计算 运维 监控
基于钉钉的阿里云管理实践(三)之运维管控
随着移动互联网的发展,使用移动设备进行云资源管理变得越来越普及。钉钉作为一款企业沟通和协作工具,其集成的阿里云控制台小程序让用户能够在移动端进行便捷的云资源管理操作。本教程将为您介绍如何在钉钉的阿里云控制台小程序内访问并操作阿里云资源。
114 1
|
28天前
|
弹性计算 网络协议 关系型数据库
网络技术基础阿里云实验——企业级云上网络构建实践
实验地址:<https://developer.aliyun.com/adc/scenario/65e54c7876324bbe9e1fb18665719179> 本文档指导在阿里云上构建跨地域的网络环境,涉及杭州和北京两个地域。任务包括创建VPC、交换机、ECS实例,配置VPC对等连接,以及设置安全组和网络ACL规则以实现特定服务间的互访。例如,允许北京的研发服务器ECS-DEV访问杭州的文件服务器ECS-FS的SSH服务,ECS-FS访问ECS-WEB01的SSH服务,ECS-WEB01访问ECS-DB01的MySQL服务,并确保ECS-WEB03对外提供HTTP服务。
|
1月前
|
云安全 人工智能 安全
|
1月前
|
弹性计算 算法 应用服务中间件
倚天使用|Nginx性能高27%,性价比1.5倍,基于阿里云倚天ECS的Web server实践
倚天710构建的ECS产品,基于云原生独立物理核、大cache,结合CIPU新架构,倚天ECS在Nginx场景下,具备强大的性能优势。相对典型x86,Http长连接场景性能收益27%,开启gzip压缩时性能收益达到74%。 同时阿里云G8y实例售价比G7实例低23%,是Web Server最佳选择。

热门文章

最新文章