亚太CDN峰会,阿里云王海华解读云+端+AI的短视频最佳实践

简介: 4月11-12日,2018亚太CDN峰会在北京隆重召开,在11日下午的短视频论坛中,阿里云高级技术专家王海华进行了《短视频最佳实践:云+端+AI》的主题演讲,分享了短视频的生命周期关键点和阿里云技术解决方案。

4月11-12日,2018亚太CDN峰会在北京隆重召开,在11日下午的短视频论坛中,阿里云高级技术专家王海华进行了《短视频最佳实践:云+端+AI》的主题演讲,分享了短视频的生命周期关键点和阿里云技术解决方案。以下全文为演讲内容。

每个人都将成名十五秒钟

短视频已经走进我们的生活,离我们越来越近。在1968年美国的艺术家 安迪•沃霍尔 就曾经预言:“在未来,每个人都将成名十五分钟。”在短视频如此火爆的当下,我想这句话可以改成“在现在,每个人都将成名十五秒钟。”可能这个修改有一些断章取义的嫌疑,但这句话恰到好处的表示了短视频的精彩之处,短小精悍、易于传播、内容蓬勃。

image

我们来看几组短视频行业的数据,来自36Kr研究院的数据显示,2017年9月份短视频用户总时长渗透率为4.1%,位于细分行业名列第五,但同步增长率达到311.3%,这是用户层面的数据,同时在资本市场,我们看到一组来自易观的数据,2017年第三季度短视频市场投融资事件24起,估算吸金超8亿元。

前面讲到的都是整个短视频市场利好的信息,其实短视频有多火我相信在座各位的敏锐度很高。那么问题来了,如何利用自己对所在行业理解的优势,快速推出属于自己的短视频应用呢?接下去的分享就可以解答大家的疑惑。我将为大家分享一下阿里云视频云是如何来思考和用技术方案来解决这个问题的。

移动短视频生命周期

image

不管你是在自己已有的应用里面提供短视频能力,还是从零开始完成一款短视频应用的开发,我们从一个短视频生命周期上去看,他大概存在以下几个关键的环节。

  1. 移动端上的视频采集,编辑,生成一个mp4文件;
  2. 视频上传到服务器上进行文件存储和Meta信息存储;
  3. 媒体文件(包括图片和视频)都需要在服务端进一步的处理,才能够让用户得到更加好的体验,在图片时代,我们为了让用户能更快访问图片在不同的场景我们会对图片进行压缩裁剪,同样在视频时代我们也有这样的需求,应对不同的网络环境,不同的设备用户都应该有自己更好的体验,这个时候就需要对视频做出压缩,缩放,裁剪等处理,一方面用户能有更快更流畅的体验,另一方面APP开发者也能够在流量上节省更多的成本;对于海量的内容我们如何能够更加容易和方便的管理,传统的就是通过对视频的标题,描述,类别,tag进行检索和管理。现在我们可以通过更多的人工智能相关的技术对视频内容进行理解来完善和补充视频的Tag信息;
  4. 拿到海量视频的时候我们需要让用户能够更快更流畅访问到我们的视频,必不可少的一个环节就是对视频进行分发;
  5. 用户需要看到视频最重要的还是需要一个功能完善,性能优异的稳定播放器;

阿里云短视频技术实现方案

下面就从短视频的生命周期每一阶段分别来介绍阿里云的技术实现方案。

视频生产阶段

在采集和特效编辑阶段,阿里云短视频SDK经过几年的发展,拥有的能力包括实时美颜、混音、滤镜、变速、图片视频混剪、字幕、MV效果等等,后面结合AI、AR技术、人脸贴纸等更多玩法,让短视频SDK在端上能够做出更具个性化的视频。同时,这些能力可以和垂直的电商、教育、社交、传媒等各个场景结合,实现业务融合。

image

其实大家在选择短视频SDK的时候,首先关注到的是功能丰富性,往往会忽略掉的是稳定性和开放性。对于短视频这个用户直接接触的功能来说,稳定性十分重要的,阿里云短视频SDK经过了集团对外的上千客户验证,相对比较可靠。关于开放性,一部分是UI交互层的源代码的开放,我们会给到客户非常完整的产品级别的DEMO,可以简单快速集成,同时,客户也可以根据自己的业务场景做定制化的交互开发;另一个部分是短视频的玩法特别多,每个行业和APP都在时刻变化,我们的SDK能做到尽量开放,提供标准化的文档和接口,让客户可以更好更快的接入第三方。这两个特性,我建议在座的各位在选择短视频SDK的时候可以去关注一下。

一个完整短视频的应用或服务,不仅仅需要短视频SDK,它是一个全链路的过程。生命周期上看包括采集、上传和云端处理等等。

在视频上传阶段,上传SDK提供了分片断点上传、CDN加速上传等能力,在移动状态下,在比较边缘的情况下也可以提高上传速度和成功率。

image

内容上传到云端后,有人认为下一步就是传输了,但是现在阿里云会做的更多,为客户提供了对视频媒资的管理服务。包括对多媒体媒体文件管理、Meta信息管理、数据服务等。

讲到这里,其实整个视频生产部分已经结束了。下面我们将介绍下短视频的云端处理和播放器观看的相关技术。

视频处理和播放阶段

大家在看视频的时候,经常会抱怨几个问题:

  • 打开速度怎么这么慢?
  • 为什么这个视频看着看着就卡了?
  • 我这个视频为什么糊?
  • 移动网络看到底费不费流量?

总结提来一句话:我希望我的视频看起来又流畅,又清晰,又省流量。这个看起来是个相互矛盾的问题,但是很多时候用户要的就是这个。所以,我们短视频研发人员也要格外关注这几个问题,因为这是来自于用户的声音。

为此,阿里云视频云团队推出了“窄带高清”技术,从人眼的模型出发,在节省码率的同时也能提供更加清晰的观看体验,从线上测试结果上看,同等视频质量下最高节省20-40%带宽。这个对于用户、对于开发者来说,都是极好的事情。

当然我们也有其他的选择方案,在保证画质前提下调整视频码率、提高压缩率、减小文件体积,以节省存储和流量,使播放更流畅这个指导思想之下,我们整个点播服务做了以下两种处理。不同客户对于视频转码的能力需求是不同的,我们根据不同的场景预制了不同的转码模板,通过勾选就可以实现转码。如果客户的链路有特殊需求,我们也提供了自定义来适应多变的业务场景,这样可以非常灵活的配置清晰度,码率,输出格式等信息。

image

前面我们解决了省流量和清晰度的问题,那么流畅观还需要强大的CDN资源来做支撑的,阿里云的CDN覆盖了全球70多个国家,拥有1300多个节点,总体的容量达到了90Tb,而我们的点播服务是与阿里云CDN进行无缝的衔接,保证我们的视频无论何时何地都能够流畅地播放。

image

同时,针对短视频这个场景在CDN上做了很多的优化,除了更加精准的调度以外,针对短视频的场景我们在TCP协议栈和缓存性能方面都做了很多的尝试,比如说协议栈上有更加激进的拥塞避免算法;缓存上采用了3级缓存,优化了淘汰算法提升了命中率等等一系列的优化,所有的这些都为为了我们视频能够更加流畅被播放。

播放器是接近用户最近的端,简单来说,客户使用了我们的播放器,就基本可以具备与优酷相当的播放能力。刚刚前面提到的用户几个抱怨中,有一个是为什么这么慢,针对这个场景问题,我们在播放器全面支持QUIC协议,基于更多的CDN资源强大的调度,使得我们的秒开成功率达到98%;

短视频循环播放是不可避免的应用场景,我们可以做到边播边缓存,做到收尾无缝衔接,第二次播放不需要耗费用户流量。在视频安全层面,也通过云和端的结合,实现了加密传输和播放,接入也只需要服务端的配置,无需更多的开发成本。

image

讲到这里,用程序员的话来说,其实整个短视频的开发流程已经能够跑通了。

短视频运营阶段

那当短视频的功能上线后,更多的是需要运营。在运营这个环节中,我们会碰到很多问题,首先,海量数据到达服务器后的内容审核和监管,阿里云视频AI可以快速识别出黄色、暴恐、涉政、垃圾广告、无意义视频等数据,提升人肉审核效率和精准度。

其次一个运营面临的问题是短视频的重复,视频指纹可以产生唯一的“指纹”来代表视频文件,在库中进行视频查找。应用场景包括视频查重、版权保护、原创内容保护、广告分成等。

另外,用户在创作短视频的时候,给到平台方的信息是非常少的。所以如果我们平台方想要对视频内容进行结构化理解,基于视频AI能力就可以实现。从各种维度去识别视频内容,包括人物、语音、文字、场景等,更方便去检索视频内容,根据用户特性去进行个性化推荐。

image

提升视频的点击率也是平台方和内容创业者关注的问题。通过视频AI来生成智能视频封面,摘取最精彩片段生成封面图、GIF、视频片段,展示在FEED流中,可以提升用户视觉体验,带来更多流量。

最后,平台方有的时候需要针对活动来快速生成视频合辑,传统的搜索、下载、剪辑、上传三个步骤下来,是十分耗时和繁琐的。这里我们提供了一个云剪辑的功能,所有的操作都在云端完成,实现对视频拼接、专场、字幕、打标等功能,结合素材共享、多人协同、极速分发,智能处理,更快的将视频生产并传输到用户面前。

image

前面做的所有事情,包括AI的引入,我们最终想看到的就是短视频分发后的数据提升。所以我们将云和端的数据整合,为用户提供了清晰直观的数据报表,让用户更好的了解业务情况。后面我们也会陆续开放大家更加关心的:首屏时间,播放成功率等数据。

想要进一步了解短视频产品,可以登录产品详情页:

https://promotion.aliyun.com/ntms/act/shortvideo.html

体验DEMO和客户咨询请扫描二维码:

image

点击参与聚能聊话题——【趋势探讨】2018年,视频行业新革命指向何方?参与互动,回复你的看法,阿里云代金券和充值话费等你来拿!

阿里云视频云讲师团亮相亚太CDN峰会,点击查看其他演讲摘要:

阿里云朱照远:AI打开新视界 8K时代已来!

基于PCDN技术的无延时直播方案

阿里云黄海宇:窄带高清2.0——让直播更惊艳的魔术

目录
打赏
0
0
0
0
1322
分享
相关文章
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
在新加坡 ElasticON 2025 的 Elastic 合作伙伴峰会上,阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024!
更低成本、更高效、更安全!阿里云与钉钉联合推出协同办公AI解决方案
阿里云与钉钉携手推出了全新的“钉钉·AI Stack一体机”,以“低成本、高安全、零门槛”为核心,为用户提供基于钉钉,从模型部署到全员落地的AI解决方案,开启智能化办公的“一键加速”。
小鹏汽车选用阿里云PolarDB,开启AI大模型训练新时代
PolarDB-PG云原生分布式数据库不仅提供了无限的扩展能力,还借助丰富的PostgreSQL生态系统,统一了后台技术栈,极大地简化了运维工作。这种强大的组合不仅提高了系统的稳定性和性能,还为小鹏汽车大模型训练的数据管理带来了前所未有的灵活性和效率。
阿里云操作系统控制台评测:国产AI+运维 一站式运维管理平台
本文详细评测了阿里云操作系统控制台,作为一款集运维管理、智能助手和系统诊断于一体的工具,它为企业提供了高效管理云资源的解决方案。文章涵盖登录与服务开通、系统管理与实例纳管、组件管理与扩展功能、系统诊断与问题排查以及实时热点分析与性能优化等内容。通过实际操作展示,该平台显著提升了运维效率,并借助AI智能助手简化了复杂操作。建议进一步完善组件库并增强第三方兼容性,以满足更多高级运维需求。
59 0
AI运动:阿里体育端智能最佳实践
过去一年,阿里体育技术团队在端智能方面不断探索,特别在运动健康场景下实现了实践落地和业务赋能,这就是AI运动项目。AI运动项目践行运动数字化的理念,为运动人口的上翻提供了重要支撑,迈出了阿里体育端智能运动领域的第一步,为用户带来了更加有趣的新颖玩法。上线以来,项目受到了广泛关注。
AI运动:阿里体育端智能最佳实践
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
本文介绍了如何使用阿里云提供的DeepSeek-R1大模型解决方案,通过Chatbox和Dify平台调用百炼API,实现稳定且高效的模型应用。首先,文章详细描述了如何通过Chatbox配置API并开始对话,适合普通用户快速上手。接着,深入探讨了使用Dify部署AI应用的过程,包括选购云服务器、安装Dify、配置对接DeepSeek-R1模型及创建工作流,展示了更复杂场景下的应用潜力。最后,对比了Chatbox与Dify的输出效果,证明Dify能提供更详尽、精准的回复。总结指出,阿里云的解决方案不仅操作简便,还为专业用户提供了强大的功能支持,极大提升了用户体验和应用效率。
1149 19
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
【AI落地应用实战】大模型加速器2.0:基于 ChatDoc + TextIn ParseX+ACGE的RAG知识库问答系统
本文探讨了私有知识库问答系统的难点及解决方案,重点分析了企业知识管理中的痛点,如信息孤岛、知识传承依赖个人经验等问题。同时,介绍了IntFinQ这款知识管理工具的核心特点和实践体验,包括智能问答、深度概括与多维数据分析等功能。文章还详细描述了IntFinQ的本地化部署过程,展示了其从文档解析到知识应用的完整技术闭环,特别是自研TextIn ParseX引擎和ACGE模型的优势。最后总结了该工具对企业和开发者的价值,强调其在提升知识管理效率方面的潜力。
AI程序员:通义灵码 2.0应用VScode前端开发深度体验
AI程序员:通义灵码 2.0应用VScode前端开发深度体验,在软件开发领域,人工智能技术的融入正深刻改变着程序员的工作方式。通义灵码 2.0 作为一款先进的 AI 编程助手,与广受欢迎的代码编辑器 Visual Studio Code(VScode)相结合,为前端开发带来了全新的可能性。本文将详细分享通义灵码 2.0 在 VScode 前端开发环境中的深度使用体验。
157 2

热门文章

最新文章

相关产品

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等