音视频技术开发周刊 65期

  1. 云栖社区>
  2. 博客>
  3. 正文

音视频技术开发周刊 65期

livevideostack 2018-09-04 07:39:48 浏览552
展开阅读全文
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82392657

640?wx_fmt=jpeg


音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第65期内容,祝您阅读愉快。


架构


51Talk音视频技术实践和独特挑战

本文来自51Talk技术总监陈靖在LiveVideoStackCon 2018热身分享,并由LiveVideoStack整理而成。陈靖回顾了51Talk音视频技术的演进路线,从最早的QQ、Skype到接入第三方SDK,最后实现大部分功能自研,每个阶段都是根据业务需求、研发力量、资金投入等各种条件下的最优选择。未来,51Talk还会继续投入自研,完善功能。


李青源:高清体验和带宽节省,瞄准方向深耕

在LiveVideoStackCon 2018前夕,金山云资深产品专家李青源接受了LiveVideoStack的采访。他聊到了金山云在“视频+AI”和“编解码”方向的探索,致力于为终端观众提供更高清的视觉体验,为B端客户最大化的节省传输成本。


基于WebRTC和Janus的多人视频会议系统开发 - 发布媒体流到Janus服务器

本文详细介绍了基于WebRTC和Janus的多人视频会议系统开发中如何发布媒体流到Janus服务器。


七牛云徐晶:低延迟互动时代看好WebRTC和SRT

在 LiveVideoStackCon 2018 前夕,七牛云教育行业解决方案高级专家徐晶接受了 LiveVideoStack 的采访,聊到了流媒体的技术发展与技术栈迭代。在当今的低延迟的互动时代,WebRTC、SRT 等技术得到了快速发展。


无需GPU,只用OpenCV和Python实现图像和视频的风格迁移

本文中作者Adrian Rosebrock将教你如何用OpenCV、Python和深度学习技术对图像和实时视频进行神经风格迁移。


AI时代的全链路监控,阿里工程师怎么做?

全链路监控从业务的视角出发,监控整个业务流程的健康状况,无需多个系统切换,直观看到全局和上下游,方便快速发现、定位问题。今天,我们一起来看看阿里基础设施技术团队在这方面的实践经验。


WebRTC+libwebsockets+Janus的秒开实践

Janus作为SFU,使用WebSocket协议与客户端通信。客户端在挑选开源库时其实没有太多选择,C层主要是libwebsockets库,这个也是Janus使用的库,还有Boost的Beast库。


音频/视频技术


Introduction to Digital Filters(数字滤波器简介)

数字滤波器由数字乘法器、加法器和延时单元组成的一种算法或装置。数字滤波器的功能是对输入离散信号的数字代码进行运算处理,以达到改变信号频谱的目的。本文简单介绍了数字滤波器理论,分析,设计和应用。


抛开Flash,自己开发实现C++ RTMP直播流播放器

RTMP是以Flash为客户端播放器的直播协议,主要应用在B/S形式的场景中。本文介绍使用C++开发实现了RTMP直播流协议的播放器,结合RTMP直播采集端,可以将RTMP协议完全扩展到C/S形式的应用场景中。


实时音视频SDK功能介绍

音视频SDK可以嵌入App,Web应用及各种智能硬件中,帮助企业快速实现音视频功能,极大提高效率,让企业可以集中时间在业务上。即构实时音视频SDK经过多年开发积累,已广泛应用在各种领域和应用场景中。


基于RTMP数据传输协议的实时流媒体技术研究

本文来自论文《基于 RTMP 协议的流媒体技术的原理与应用》,文中研究了基于 Flash 平台的流媒体系统中使用的 RTMP 协议的原理和应用,并对网络上实时流媒体的各种传输方式的优缺点进行了分析。


编解码


Android使用FFmpeg+OpenGL ES来解码播放视频(一)

本文主介绍使用FFmpeg解码视频然后用OpenGL ES来渲染。实现思路:1.首先通过JNI将视频地址传给C层;2.使用FFmpeg解码视频获取到YUV数据;3.将YUV数据通过回调的方式传到Java层;4.使用OpenGL ES渲染YUV数据; 


使用FFmpeg 提取MKV文件中的字幕

MKV封装格式是万能封装格式,可以封装几乎所有的视频和音频编码格式。可以包含多个视频流、音频流和字幕流。本文将介绍使用FFmpeg 解码视频文件,提去字幕内容并保存。这里仅提取ASS格式的字幕文件。


使用MediaCodec和RTMP做直播推流

目前开源的项目或市面上的Android直播客户端主要是用ffmpeg来实现推流的。本文将介绍使用Android原生的视频编码类MediaCodec实现直播推流。


熵编码:CABAC的上下文环境

在CABAC编码中,对每一个符号(即经过二值化的语法元素中的每一个bit值),都会经过一个构建模型阶段,即为该符号分配一个概率分布模型。在随后的编码阶段,算术编码器内核会根据这个概率模型进行编码,生成输出的二进制比特流。


AI智能


深度学习中的Normalization模型

BN 是深度学习进展中里程碑式的工作之一,无论是希望深入了解深度学习,还是在实践中解决实际问题,BN 及一系列改进 Normalization 工作都是绕不开的重要环节。


时序异常检测算法概览

Statsbot CTO Pavel Tiunov简要介绍了最流行的时序异常检测算法,并讨论了它们的优点和缺点。


清华&商汤开源超高精度边缘感知人脸对齐算法

人脸对齐是找到人脸位置之后,再找出人脸特征点的位置,比如鼻子左侧,鼻孔下侧,瞳孔位置,上嘴唇下侧等等点的位置。可以理解成面部特征点定位或者人脸五官定位。这项技术的应用很广泛,比如自动人脸识别,表情识别以及人脸动画自动合成等。


DenseNet详解

作为CVPR2017年的Best Paper,DenseNet脱离了加深网络层数(ResNet)和加宽网络结构(Inception)来提升网络性能的定式思维,从特征的角度考虑,通过特征重用和旁路(Bypass)设置,既大幅度减少了网络的参数量,又在一定程度上缓解了gradient vanishing问题的产生。


一文看懂深度学习新王者「AutoML」:是什么、怎么用、未来如何发展?

AutoML和神经架构搜索(NAS),是深度学习领域的新一代王者。这些方法能快糙猛地搞定机器学习任务,简单有效,高度符合当代科技公司核心价值观。


图像


干货——图像分类(上)

干货——图像分类(下)

图像分类,顾名思义,是一个输入图像,输出对该图像内容分类的描述的问题。它是计算机视觉的核心,实际应用广泛。图像分类的传统方法是特征描述及检测,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况非常复杂,传统的分类方法不堪重负。


HDR关键技术:色度学,颜色空间及转换

本文中,我们将首先介绍人眼与色度学相关的生理特征以及人类对颜色的识别方式,然后介绍颜色空间的概念,最后再回到HDR,介绍与HDR相关的颜色标准。


HDR关键技术:质量评价技术(续)

在上一篇HDR质量评价帖中,我们列举了业内常见的HDR质量评估算法,然而不同算法有不同的应用领域。本文将结合重要的HDR技术,进一步描述HDR质量评价技术。本文评价对象将包括色调映射技术,逆色调映射技术,视频压缩与编码技术。

网友评论

登录后评论
0/500
评论
livevideostack
+ 关注