揭秘优酷认知实验室

简介: 这里汇聚优酷各路大神,包括多媒体内容检索、多模态视频内容理解、视频智能生产、可交互视频等诸多技术。

雷锋网(公众号:雷锋网) AI 科技评论按,北京时间 5 月 15 日,阿里巴巴集团发布 2019 财年第四季度财报及 2019 财年业绩,可以看到,优酷的日均用户群在 2019 财年和 2019 年 3 月期间,增长率同比增长约 88% 和 50%。

作为一家大型视频分享网站,2006 年,优酷正式上线,发展至今,经历与土豆合并,被阿里收购等一系列里程碑事记,现已覆盖 5.8 亿多屏终端、日播放量 11.8 亿,形成了一条从内容生产、制作、宣传、发布、播放的文化娱乐全产业链。而在内容的采、制、宣、发、播过程中,有一个团队占据了极其重要的地位,那就是优酷认知实验室。

「年轻」的实验室,不「年轻」的阵容

从年龄来看,这一实验室还很「年轻」——去年下半年才刚刚成立。但它展示给外界的更多是不「年轻」的一面。认知实验室在组建之初,立足阿里集团达摩院,众所周知,达摩院在音视频领域皆有雄厚的算法资源和技术底蕴。

认知实验室的团队负责人王晓博博士,曾先后在百度、搜狗商务搜索部门从事广告算法策略研发工作,在加入阿里推荐部门之后,组建了猜你喜欢算法团队,短短三年内,带领团队将猜你喜欢商品推荐打造为手机淘宝第一大导购场景。

而认知实验室资深算法专家任海兵则在计算机视觉领域有 20 多年的研究经验,历任 CVPR、ICCV、ECCV 等多个国际顶级学术会议审稿人,曾带领团队获得 FRGC 人脸识别竞争第一名和 DAVISOSVOS 视频物体分割竞赛第四名。

此外,这一团队还有一位深耕应用的老兵。优酷鱼脑平台的负责人蔡龙军,硕士毕业后曾在多家国内外知名企业工作,主导研发了开源深度学习平台 DeepDriver。鱼脑是他在阿里期间主导研发的大数据内容生命周期三维立体分析平台,这一平台能利用 AI 和大数据分析,为内容采制、运营、营销等产业全链条进行赋能。据悉。鱼脑平台在优酷投入使用已经有两年之久,在一些大剧的演员选择、内容创作上,都有参与。

TB1Sc3ZXEGF3KVjSZFvXXb_nXXa.png

定位于产研结合,致力五大研究方向

据王晓博介绍,认知实验室旨在将产和研进行紧密衔接,同时致力于科技和艺术的深度结合。

谈及成立认知实验室的契机,王晓博表示,在他转入优酷算法中心之初,这里的搜索引擎主要还是文字单模态的检索。随着用户群体持续增长,优酷的视频量以指数趋势增加 ,有些 UPGC 上传的视频,标题和描述无法反映相关信息,甚至出现不少标题党,进而导致视频检索结果的不相关。他们希望能把单个文字模态变成支持文字、图像、语音、视频等多个模态,基于这一考虑,他们设置了多媒体内容分析理解、多模态搜索推荐这样一些方向。随着方向的增多,以及在工程和可落地性上的考量,他们从优酷算法中心挑选了一部分在方向相关且能力突出的算法工程师,同时又吸纳了一些业界大牛,进而组建了这样一支高水平的多媒体认知算法团队。

基于这样的信条,实验室目前有以下研究方向:

第一,计算机视觉。

第二,内容智能评估。

第三,视频结构分析与内容智能生成。

第四,视频质量。

第五,交互式视频,例如 AR、VR 等。

毋庸置疑,几乎所有跟视频相关的实验室都会涉及到计算机视觉研究,这也是最基础性的研究。内容智能评估在优酷则承担守门员角色,把不合适的内容挡在门外,并对影剧综的采买提供大数据视角专业化的分析。内容生成立足研究、致力于产业,观影质量和视频内容质量把控旨在为用户带来更好的体验,交互式视频则是未来的发展方向。

内容评估与内容生成

「举个例子,很多时候,一部电影上映了,你觉得很好看的内容,却只是叫好不叫座;有的内容你觉得拍的一般,但是它却卖出了很高的票房;有些视频,从质量上评级,也许只是 B 级剧,但内容有很强的运营属性,可能把一个 B 级剧、A 级剧运营到 S 级、甚至是 S+级别。在这一过程中,会出现哪些不确定性,这些不确定性该如何去建模,包括大家认为比较好的电影或电视剧,主要是由哪些要素构成的,如何从剧本期,甚至是更早的时期,就发掘出更好的内容,这些都是内容智能评估所需要做的事情。」王晓博如是描述。

至于视频结构分析和内容智能生成,王晓博对雷锋网表示,这项工作意义重大。他举了这样一个例子,如果想制作一条过去百年来航母的合集视频,工作量巨大,你需要去找原始的视频素材,去制作。如果把现有的视频资源拆解到元素集,这将会大大降低工作难度。

他同时提到电视台的视频,「电视台拥有大量传统视频资源,但直到现在,很多视频资源其实只是『躺』在那里,被理解和使用的单位只是视频本身,将这些视频理解得更加深入,精确到元素集具有重大的价值。」

他进一步提到,过去大家在搜索的时候,很多时候只是搜节目名,搜电视剧具体某一集的并不多。但实际上,好的电影、电视剧,能够激起人内心的情感共鸣,产生情感共鸣之后,大家自然而然会想要分享。其实单纯去分享那一段视频还不足以表达情感,这个时候,就涉及到视频的拆解,将内容精确到细节。

TB1eQU0XBOD3KVjSZFFXXcn9pXa.png

而谈到内容智能生成,他拿美国视频网站巨头 Netflix 举例。在 Netflix 上,一部电影,他们会找专业的制作公司制作 30 张到 40 张海报,在分发这部剧的时候,由于同一部剧对不同人的吸引点不一样,有人可能是因为喜欢这部剧里的某一个明星,也有的人是因为剧里的某一个情节,也有人可能是因为服饰。在这里,通过这样个性化地将海报分发到不同的受众群体,能够提升播放转化率。

实际上,优酷的现状更难。「很多时候,虽然花钱买了一部剧,但是也通常只能拿到 4-6 张海报,而且各家视频网站都有大量的存量剧,竞争激烈。这时候如果为了一些存量剧、电影等去生产海报,设计资源也较为昂贵,性价比较低。」他强调,内容智能生产中的个性化生成海报就可以改变这种情况。

此外,有些年轻人非常喜欢看一些用原音加上快慢变速的鬼畜类视频,在这里最大的问题也还是产量低,因为生成这类视频需要有很高的剪辑制作技术。这里也是内容智能生成技术可以大展身手的空间。

体验进一步提升

在内容评估与内容生成的基础之上,又延伸出对视频质量,以及利用 AR、VR 等技术提升用户体验的研究。

优酷认知实验室将视频质量分成两部分。第一部分是视频的内容质量,视频内容质量还可以再分为两部分,一是指涉黄、涉恐、涉暴等红线以下的视频,这种视频是绝对不能在平台上传播的。在内容质量审查阶段,除了筛选出红线视频,还要将视频进行分级,诸如什么样的视频能够在频道推荐,什么样的视频能够在首页推荐。

第二部分是视频的观看体验。观看视频时,有许多不同的屏幕,例如电视、手机、iPad,这些设备型号各异,屏幕尺寸各不相同,显示技术也不一样,观看环境存在差异。在这些不同场景下,同一部视频应该表现出什么样的观影质量,这一领域也是认知实验室的一个新兴研究领域。王晓博表示,包括 YouTube、Facebook,Netflix、HBO 在内,近年来也都成立了关于视频质量的相关实验室,究其目的,都是为了在不同设备和场景环境下提供最佳的观影体验。

Nexflix 最近推出了交互式视频观影体验,虽然观众反馈一般,但在王晓博看来,这是一次非常有意义的探索。「结合 AR 和 VR,交互式视频是实验室重点探索的一个方向,也是行业内比较看好的方向。视频的创新能创造未来新的体验。」

在体育赛事中,这种技术可以带来非常好的交互式体验。目前,优酷在手机上可以做到六自由度的视频观影体验,当在手机上点击暂停,这时可以旋转画面角度,还可以增加辅助标签,进行进一步说明。「目前 VR 视频的观影体验,就像是坐在某 VIP 座位上的一个高位截瘫观众,而六自由度的视频,则可以让你满场随便溜达,就像有翅膀一样,能够瞬移。」

TB1PGQ0XA5E3KVjSZFCXXbuzXXa.gif

王晓博进一步对雷锋网举例,例如在看足球比赛的时候,作为伪球迷,很多时候对主持人讲解的专业术语一知半解。这时候,如果机器能够通过一些增强现实的交互方式自动标注和解释,例如越位,通过产生一些辅助标线,把场景显示出来,这时候会显著增强绝大多数伪球迷的看球体验。

TB1bUZYXvWG3KVjSZPcXXbkbXXa.png

总结

从视频内容制作到分发的每一个阶段,技术都有着非常大的发挥空间,这也是认知实验室发力的方向。可以看到,认知实验室希望能够打造一套视频全生命周期一站式解决方案,以技术赋能视频行业上下游,同时积极探索行业新赛道,实现技术与艺术的结合。

而在王晓博看来,技术也并不是全部,科技与艺术结合,分享智慧快乐与感动,这点更为重要。「文娱板块旨在传播和分享更多的快乐,而来做这件事情的同学,自己快乐了,才能在做技术的同时,将快乐更好地分享给更多的同学。」期待认知实验室接下来带来更多有意思的工作,为观众传递更多的快乐。

号外:优酷视频增强和超分辨率挑战赛正式上线,初赛报名将于6月18日截止,欢迎大家踊跃报名参赛。

大赛官网如下:https://vsre2019.youku.com

目录
相关文章
|
11月前
|
自然语言处理 达摩院
达摩院智能对话技术升级:更人类,更温暖-阿里云智能客服,构建企业服务数字化之路-展望未来
达摩院智能对话技术升级:更人类,更温暖-阿里云智能客服,构建企业服务数字化之路-
118 0
|
11月前
|
存储 人工智能 自然语言处理
|
机器学习/深度学习 新零售 人工智能
AI创意赛火热,赛事能成BAT强化AI优势的新动能?
全球人工智能人才开始逐渐进入量产模式。
AI创意赛火热,赛事能成BAT强化AI优势的新动能?
|
Web App开发 人工智能 算法
万象图谱!RTE创新大赛!声网RTE2021再推实时互联网技术盛宴
10 月 22-23 日,以「万象频道」为主题的第七届声网 RTE2021 实时互联网大会在北京举行。
187 0
万象图谱!RTE创新大赛!声网RTE2021再推实时互联网技术盛宴
|
机器学习/深度学习 编解码 达摩院
阿里达摩院研究员叶琰老师:音视频技术标准-行业全景与阿里创新
由淘系技术PMO&技术战略发展团队主办,定期邀请业界大咖、高校学者、行业内外资深专家,聚集最懂商业与技术的人,分享为业务创造真正价值的最佳实践。希望不断链接技术创新与商业价值,把握互联网商业技术的前进方向。 本期【BBTime-阿里音视频技术解析】我们很荣幸邀请到了阿里达摩院研究员叶琰老师,为大家讲解《音视频技术标准:行业全景与阿里创新》以下为演讲内容实录,希望能给大家带来帮助。
阿里达摩院研究员叶琰老师:音视频技术标准-行业全景与阿里创新
|
人工智能 自然语言处理 分布式计算
您身边的AI管家-58到家人工智能实践
本文详述了58到家业务上的难点和挑战,包括在智能营销、到店分流和登记、多元匹配、销售、业务与社会安全等方面,以及他们是如何通过阿里云大数据平台去应对家庭服务行业在互联网化过程当中的痛点和挑战。
5285 0
您身边的AI管家-58到家人工智能实践
|
人工智能 编解码 达摩院
淘宝直播在冲刺最复杂的人工智能技术!
上周,主播林珊珊测试了一下淘宝直播团队依据他个人形象打造的虚拟主播,也就是林珊珊下播以后,让虚拟主播上场,粉丝在直播间可以跟虚拟主播互动,虚拟主播则实时介绍商品,回答消费者提问。
36681 0
淘宝直播在冲刺最复杂的人工智能技术!
|
人工智能 数据挖掘 程序员
阿里洞察:疫情后 人工智能还香吗? 25页PPT讲透人工智能行业发展现状
近期,阿里云研究中心与埃森哲一起合作撰写的《人工智能红利渗透与爆发》白皮书隆重发布,我们节选了其中的部分观点第一时间放出,欢迎关注。
7753 0
阿里洞察:疫情后 人工智能还香吗? 25页PPT讲透人工智能行业发展现状
|
机器学习/深度学习 人工智能 运维
5G邂逅AI,一场发生在运营商体系内的智能化“浪漫”
“新基建”体系的明确,又一次把5G和AI两种技术紧密摆在了一起。