王豪:HW265到“HW266”

简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82929609 ...
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82929609

640?wx_fmt=jpeg


每年的MSU的视频压缩评比报告都是多媒体的热点话题之一,在MSU 2018评比中,华为HW265在多项测试中排名第一。LiveVideoStack采访了华为媒体技术院视频编码团队负责人王豪,在参赛之前,HW265已经在多领域商用。未来华为将投入到VVC的研发,并看好AV1的下一代AV2。


文 / 王豪

策划 / LiveVideoStack


LiveVideoStack:王豪你好,向LiveVideoStack的读者介绍下自己,以及您(或您团队)目前负责工作和感兴趣的技术方向。


王豪:我毕业于华中科技大学,2011年加入华为,现任媒体技术院视频编码团队负责人,一直从事流媒体、视频编解码、质量评价等领域的研究和开发工作。团队目前关注于泛娱乐视频领域的视频技术,包括视频编码/处理,视频传输和视频分析,目的就是能为用户提供极致的视频体验。


LiveVideoStack:能否介绍下华为媒体技术院?


王豪:中央媒体技术院隶属于2012实验室,是华为公司媒体技术创新和工程能力中心,对媒体领域产品技术竞争力负责。面对客户、产业和公司未来业务的挑战和机遇,持续聚焦媒体领域的技术研究、创新和突破,确保公司媒体产品核心竞争力持续领先,支撑华为公司长期商业成功。


LiveVideoStack:MSU发布2018年视频压缩评比报告中,华为Codec在YUV-SSIM得分排名第一。这个成绩很了不起,能简单总结下这次华为Codec的成绩吗?


王豪:这里自夸一下,HW265在MSU 2018编码器评比中,SSIM和VMAF总成绩均排名第一,尤其SSIM的三个测试场景(极致压缩,通用编码,快速编码)均为单项第一,压缩率平均优于友商7%,在互联网常用的快速编码场景测试中,HW265压缩率(BDBR)优于友商12%。


LiveVideoStack:随软MSU每年的评测已是业界顶级,但也有不少吐槽。比如测试场景已经跟不上实际业务,视频数据集少等。您认为这项评测还有那些改进的地方?


王豪:先说下MSU评测的参数,评价码率范围:1mbsp~12Mbps,不考虑码率波动,在素材选择方面,根据时空域复杂度,选择不同复杂度区间的视频,同时人工考虑素材场景,尽量包含不同类型的素材,编码速度考虑三个不同档位,速度为1fps,25fps,60fps。


我觉得谈合理性,取决于其评比的出发点,我理解MSU编码器评比的出发点就是尽可能的评价编码器的通用编码能力,因为大家知道不同视频应用场景,设定码率,码控波动,场景复杂度,编码速度都不同,例如IPTV整体码率偏高,但码率波动小,OTT点播码率低,但允许的波动大。


所以MSU在评测中,在以上几方面从场景覆盖和评测的简易方面进行均衡,个人觉得目前MSU评测配置挺合理的。


如果改进的话,MSU素材方面一直选取高质量素材,后续可以考虑增加一些质量一般的UGC视频。


LiveVideoStack:聊聊华为Codec的前生今世吧,他有哪些特点?未来还有那些改进计划?


王豪:HW265开发于2013年HEVC标准刚出的时候,以HM为基准,我们做了大量的重构、优化,最终于2014年定稿,那时主要给国内外运营商使用,包括IPTV、离线转码等场景。从2016年开始,支撑华为视频、华为公有云的点播与直播商用。


我觉得HW265最大的特点是通用性好,我们在编码器内核方面做了很多优化,尤其在快速算法方面进行了深度开发和优化,保证编码内核的通用竞争力。


同时以HW265内核为基础,我们进行感知编码研发——“高清低码”,将场景优化,质量评价,视频处理与编码器结合,为用户提供极致的视频体验。


关于改进,后续我们将引入更多基于数据驱动的算法,例如结合深度学习,强化学习等来提升编码速度和质量,同时也会针对超高清以及VR/HDR进行编码工具优化。


LiveVideoStack:华为Codec在哪里平台或产品上部署?


王豪:我们主要聚焦泛娱乐视频场景,HW265从2014年开始已经在华为运营商业务(无线,核心网),华为视频, 华为公有云,welink直播(华为内部APP)等平台商用,已经过全面商用考验。


LiveVideoStack:是否评估过AV1?未来是否有可能提供AV1的方案?您怎么看待未来Codec的市场格局?


王豪:我们内部对AV1和HEVC的参考软件进行评测和分析,从压缩效率讲,AV1稍优于HEVC,基本上属于同一代,但AV1的参考软件复杂度是HEVC的40~50倍,优化难度比较高。


团队暂时没有计划提供AV1方案,个人觉得AV1来的有点晚,因为VVC 预计2020年进行发布,团队明年会投入VVC的优化。由于HEVC的专利纷争,我觉得VVC的专利政策肯定会相对温和,更适宜产业使用,个人反而对AV2更加期待。


未来的Codec市场格局是群雄割据场景,之前AVC一统江湖的时代已经一去不复返了,后续主要看各家的终端话语权,个人从竞争力方面还是看好VVC。



640?wx_fmt=jpeg

相关文章
|
存储 调度 数据库
STM32--DMA
STM32--DMA
|
8月前
|
存储 内存技术
USB的VID,PID
USB的VID,PID
128 0
|
18天前
|
监控 安全 网络安全
什么是HW,企业如何进行HW保障?
护网行动是一种积极、有效的网络安全防护措施,它通过实战化的演练来提升网络安全防护能力,确保网络系统的安全和稳定。
21 0
|
Serverless
ChIP-seq 分析:Differential Peaks(15)
ChIP-seq 分析:Differential Peaks(15)
222 0
|
7月前
|
移动开发 C语言 芯片
RT-Thread PIN设备学习笔记
RT-Thread PIN设备学习笔记
86 0
|
7月前
|
传感器 IDE Linux
RT-Thread ADC设备学习笔记
RT-Thread ADC设备学习笔记
68 0
|
8月前
|
调度 C++
NR HARQ (四)dynamic codebook
上篇提到type-1 HARQ-ACK codebook,即semi-static codebook,UE要为每个PDSCH候选位置生成反馈,也会包含实际没有下行传输的PDSCH,再加上配置CBG的场景,HARQ-ACK 码本中包含的无用信息会更多,开销确实很大。因而,Type-2 HARQ-ACK 码本即dynamic 码本就出现了,目前看实网中一般都用的dynamic 码本,还没有见过semi-static 码本,长话短说,下面就看下相关内容。
|
芯片
stm32-HAL使用stop模式后DMA初始化的问题
stm32-HAL使用stop模式后DMA初始化的问题
188 1
stm32-HAL使用stop模式后DMA初始化的问题
|
传感器 开发工具
hi3559_imx334_sensor修改配置1080P60
先说一下我的需求:让hi3559上支持驱动Mp60/4MP60 的imx334 海思把一些可能用到的驱动文件开放让我们修改,这样我们确实是可以做一些自己的适配 本文从csdn同步过来的
449 0
hi3559_imx334_sensor修改配置1080P60
LPC17XX之UART1
LPC17XX之UART1
168 0
LPC17XX之UART1