从信息熵到Codec

简介: 多媒体与通信是个即传统有新潮的领域,在这几天的Google I/O、微软Bulid大会上,AI让数字助理让个人生活和会议变得更加轻松有趣,这背后有不少多媒体技术默默的贡献。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


多媒体与通信是个即传统有新潮的领域,在这几天的Google I/O、微软Bulid大会上,AI让数字助理让个人生活和会议变得更加轻松有趣,这背后有不少多媒体技术默默的贡献。


文 / Ant


过去几个月,我常常思考一个问题——多媒体(通信)技术到底解决什么问题?交付什么样的服务呢?目前得到的答案是:


以更低的成本,呈现更身临其境的视听感受。


“成本”和“身临其境”形成了一对矛盾,这就对多媒体(通信)技术提出了挑战。从贝尔发明电话,到即将到来的5G网络,人类都在想方设法在有限的网络条件下传输更多的数据。换句话说,需要尽可能的压缩数据,但不同的数据集压缩的比例并不一样。比如,电影中一段纯色的蓝天的视频,压缩后和一张蓝天的图片大小差不多,甚至更小。这是由于数据中的冗余信息非常大造成的,而信息中的非冗余信息就是信息熵:


Shannon 在 1948 年发表的论文“通信的数学理论( A Mathematical Theory of Communication )”中, Shannon 指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息量称为“信息熵”。


Codec的价值就是尽可能找到视频中的冗余信息,并将其压缩。当然,Codec还可以有损压缩,找到画质和比特率的平衡点。如今,全球最顶尖的科学家仍然在为之奋斗。关于数据压缩的极限与信息熵的关系,可参考阮一峰的blog:


http://www.ruanyifeng.com/blog/2014/09/information-entropy.html


Google I/O和微软Bulid上,展示了大量的AI赋能的产品与服务,人工智能的时代已经到来,而且还刚刚开始。相比而言,Codec这样略显枯燥无趣的技术并没有基于足够的关注。


比如,YouTube通过优化策略提升用户体验的同时节省了14%带宽 Facebook使用AV1让编码效率比x264、VP9提升了30%,这些收益往往不易察觉,但却真实可观。


在今天凌晨的Google I/O大会上,Zoe Liu在“Build awesome media experiences on the web”专题中,代表Google面向全球开发者介绍了AV1的背景技术以及应用前景。AV1是AOM联盟推出的第一个Codec。AV1开源并且免专利费,是开放、共享的互联网精神下的产物。


在5月19-20日在上海举行的WebRTCon 2018大会上,Zoe Liu将在“WebRTC与Codec”专题向国内的开发者分享AV1的最新进展与技术探索。此外,北京大学教授王荣刚、Google软件工程师姜健、英特尔实时通信客户端架构师邱建林、Aupera傲睿智存 CTO周正宁将分别分享国产Codec AVS2的最新演进、VP9的SVC优化,H.264的硬件编码优化,FPGA加速WebRTC服务端和转码。在主题演讲环节,上海交通大学图像通信与网络工程研究所副所长宋利会分享学术界在Codec优化的最新思路与尝试,他会介绍AI、区块链和大数据赋能的Codec。


了解更多WebRTCon 2018议题信息,点击【阅读原文】移步大会官网。

相关文章
|
1月前
减小PAPR——DFT扩频
减小PAPR——DFT扩频
26 1
|
18天前
R语言中的马尔科夫机制转换(Markov regime switching)模型
R语言中的马尔科夫机制转换(Markov regime switching)模型
15 0
|
2月前
|
机器学习/深度学习 自然语言处理 机器人
编码器-解码器(Encoder-Decoder)结构
编码器-解码器(Encoder-Decoder)结构
185 5
|
9月前
|
机器学习/深度学习 自然语言处理 算法
【Transformer系列(1)】encoder(编码器)和decoder(解码器)
【Transformer系列(1)】encoder(编码器)和decoder(解码器)
1231 0
【Transformer系列(1)】encoder(编码器)和decoder(解码器)
|
8月前
|
存储 算法 计算机视觉
维特比解码(Viterbi Decoding
维特比解码(Viterbi Decoding)是一种用于解码卷积编码(Convolutional Coding)的算法,由 Andrew Viterbi 在 1968 年提出。卷积编码是一种前向纠错编码技术,用于提高数据传输的可靠性。在卷积编码中,数据被组织成一定大小的块,并用一个纠错码附加到数据块中。在接收端,维特比解码算法根据接收到的编码数据,通过比较不同可能的解码路径的权重,来找到最有可能的解码路径,从而实现对数据的解码。
370 4
|
11月前
|
机器学习/深度学习 编解码 算法
PCA线性降维 与 自编码器(Auto-Encoder )
本分分享了关于学习参考多篇博客PCA降维算法,自编码神经网络算法的原理后总结的个人理解,以供参考学习
531 0
|
12月前
|
机器学习/深度学习 算法
为什么要对数值类型特征做归一化?
为什么要对数值类型特征做归一化?
|
12月前
|
并行计算
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(二)
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(二)
96 0
|
12月前
|
监控 自动驾驶 数据可视化
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(一)
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(一)
126 0
|
12月前
|
机器学习/深度学习 编解码 算法
即插即用 | DCT-Mask用离散余弦变换Mask提升实例分割性能(文末获取论文)
即插即用 | DCT-Mask用离散余弦变换Mask提升实例分割性能(文末获取论文)
345 0