李青源:高清体验和带宽节省,瞄准方向深耕

简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82156761 ...
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82156761

640?wx_fmt=jpeg


在LiveVideoStackCon 2018前夕,金山云资深产品专家李青源接受了LiveVideoStack的采访。他聊到了金山云在“视频+AI”和“编解码”方向的探索,致力于为终端观众提供更高清的视觉体验,为B端客户最大化的节省传输成本。


文 / 李青源

策划 / LiveVideoStack


LiveVideoStack:李青源你好,能否向LiveVideoStack的读者介绍下自己,以及目前主要的工作以及关注的技术方向?


李青源:大家好,我是李青源,和LiveVideoStack多数技术大牛们的背景稍稍不同,我是一位“产品经理”。从2010年开始一直在做平台和商业产品相关,现在金山云担任资深产品专家,主要负责视频云产品, 包含“视频+AI”新方向探索以及编解码KSC265的产品化应用。


视频的高清化、智能化是大势所趋,我们团队会重点去关注,如何将“编码”、“AI”、“传输”三者有机的结合在一起,为终端观众提供更高清的视觉体验,为B端客户最大化的节省传输成本,在这个方向上会持续的投入和研究。


LiveVideoStack:AI在多媒体领域有许多应用实现?这是为什么呢?


李青源:简单来看,AI意味着计算机变的更智能、更聪明,从海量数据中学习然后应用在一个细分领域成为“专家”。而多媒体领域,“媒体即数据”,多媒体天然就是海量数据的土壤。因此我认为,这是两者碰撞在一起可以产生更大能量的本质原因。


我们也看到了行业许多已落地的应用,“智能审核”、“智能编辑”等大幅解决了效率问题,“语音识别”、“画质增强”等提供了更好的服务和用户体验...不多列举了,AI在多媒体领域的应用前景广阔。


LiveVideoStack:您看好AI在多媒体生态中的哪些环节的应用,比如前处理、编码、网络算法、后处理等?


李青源:除了算法本身外我们很关注目标客户场景、研发投入产出比、落地可行性等,因此在不同情况下有不一样的侧重点。我们不会自己“闭门造车”,更多是跟着头部客户的诉求和场景在走,所以回头来看投入最多的是AI前处理方面。


举个例子,为了提升视频主观画质,编码中的感知编码技术非常多,宏块级、帧级都有覆盖,而这些技术往往还与码率控制缠绕在一起,进而导致尝试一个新的算法在研发过程中容易牵一发而动全身。而AI前处理有很大的探索空间,所受到的束缚也更少,还可以应用于不同编码标准。有时我们在AI前处理投入相对少的资源,便能实现超出预期的效果。


LiveVideoStack:能否介绍下金山在视频编解码、窄带高清、图像增强等方面的探索?


李青源:产品演进的过程中,我们不断在思考视频行业的痛点,作为云计算厂商,哪些是我们擅长的,有选择的去深耕。后来我们聚焦到行业的一个“矛盾点”上:“终端观众对高清体验的不断追求"与“视频厂商不断攀升的带宽成本压力”与“移动运营商网络更新换代缓慢”,他们三者之间的矛盾代表了这个行业的一大痛点,也是我们擅长的、要解决的关键问题。


KSC265编解码是金山云的优势能力,相比开源的X265在相同速度下性能有较大优势。同时,我们还在产品上经过的细致的打磨和市场验证,可以说是业内最完善的全链路、全终端支持H.265的产品解决方案。


KIE画质增强是我们在图像AI方向的探索,通过超分辨率、图像细节修复等技术,让画质变的更清晰。现在已经成功应用于小米MIUI的最新版本。并且它的应用场景非常非常广泛,可以是硬件终端,如手机,相机;也可以是各类手机APP、移动浏览器等,这个点让我们感到很兴奋。


在视频高清方面,我们比较关注人眼感受的研究,除了常见的感知编码、Per-title、ROI 等技术外,我们更关心光影变化与色彩、图像细节感知、恰可失真码率决策等,实现“欺骗”人眼来达到画质的提升以及带宽的节省。比如,我们发现人眼对光影变化极其敏感,但是人眼本身有消除灯光频闪的功能,因此我们对摄像头拍摄视频中的光影进行建模,过滤掉人眼察觉不到的频闪导致反射光的变化达到码率节省。集智高清,是我们即将推出的一款重点产品,后续有机会可以针对性详细交流。


LiveVideoStack:在对接头条、虎牙、熊猫等接入KSC265的过程中,遇到了哪些挑战?是如何完善、改进的?


李青源:挑战很大,收获也颇多,我们不仅仅要关注KSC265的编解码性能提升,同时要花更多精力去完善产品的易用性,终端兼容性等,这些点同样重要。关于这块,我会在LiveVideoStackCon 2018 和大家去分享KSC265应用过程中的心路历程。


LiveVideoStack:最后一个问题,能否剧透下在LiveVideoStackCon 2018上将要分享的话题。


李青源:我在LiveVideoStackCon 2018分享的主题是“KSC265的全链路解决方案和应用”,更多会从产品的角度去讲述,我们做了哪些事情,这些产品上的迭代给客户带来了哪些应用价值!技术塑造视界,产品创造价值,缺一不可。


640?wx_fmt=jpeg

相关文章
|
芯片 算法 异构计算
如何打破边缘端芯片算力有限的困局?阿里 AILabs 这么做!
在自研硬件上,和芯片厂商深度合作针对中低端芯片做出了特例优化,落地了手势识别、宠物检测和笔尖检测等业务。
2996 0
|
4月前
|
搜索推荐 图形学
实时云渲染技术下的虚拟汽车展厅 为什么越来越受青睐?
实时云渲染技术下的虚拟汽车展厅 为什么越来越受青睐?
|
编解码 视频直播 网络性能优化
|
新零售 弹性计算 人工智能
十分钟生成影视级室内设计效果,红星美凯龙设计云如何升级传统家居行业
依托于阿里云强大的弹性云上GPU算力,红星美凯龙可以为客户提供快速的、高质量的渲染,实现秒级的门店快速设计。
133213 13
十分钟生成影视级室内设计效果,红星美凯龙设计云如何升级传统家居行业
|
编解码 缓存 算法
Ali266首次商用落地,助力优酷码率最高节省40%
已知的业界首个H.266/VVC标准的编码器商用落地项目
876 0
Ali266首次商用落地,助力优酷码率最高节省40%
|
并行计算 安全 调度
提速360倍!助力南方电网实现“仿真自由”
近日,为满足新型电力系统建设和运行面临的海量仿真需求,南方电网电力调度控制中心率先将电力仿真软件上云。在基于与阿里云共建的南网调度云平台上,仿真计算提速360倍,有效解决了传统硬件上电力仿真软件“跑不动”的问题,进一步保障电网安全稳定运行。
504 0
提速360倍!助力南方电网实现“仿真自由”
|
云安全 Web App开发 运维
冬奥有洛神,互动0距离 | 阿里云网络全球加速,让观众身临其境,让运动员不再孤
2月14日,自由式滑雪女子坡面障碍技巧资格赛,中国选手谷爱凌凭借第二轮得到的79.38分,排名第3,晋级决赛,全国观众在云端为她送上助威。在此前进行的自由式滑雪女子大跳台比赛中,谷爱凌已获得一枚金牌。
253 0
冬奥有洛神,互动0距离 | 阿里云网络全球加速,让观众身临其境,让运动员不再孤
|
编解码 5G UED
5G成标配 像素之争到了极限 下半年手机厂商拼什么?
5G成标配 像素之争到了极限 下半年手机厂商拼什么?
125 0
5G成标配 像素之争到了极限 下半年手机厂商拼什么?