深度摄像头已过基础期未来将掀起3D浪潮-阿里云开发者社区

深度摄像头已过基础期未来将掀起3D浪潮

2017-07-11 1718

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

众多前沿领域的应用将越来越依赖深度摄像头，就好像VR、机器人、安防等为了得到更精准的体验，这也是为什么国际巨头都在布局于此的原因。深度摄像头(又称3D传感器)从视觉数据获取的角度提升机器感知能力。由于其具有一定的技术门槛，国内外涉足此研发的比较少。集中在国外有苹果、微软、谷歌、INTEL、Oculus、SONY，国内奥比中光、华捷艾米，图漾，乐行天下等。目前，深度摄像头已经渡过技术基础期，方向明确了，将进入3-5年的成长期，未来将掀起3D传感器的浪潮。

　　别被2D的背景虚化给骗了

3维视觉相比于2维视觉，多了一个维度，可以实现更加正确的物体分割，合适精度的三维测量，三维数据的模型重建以及智能视觉识别和分析。上海图漾信息科技有限公司徐韬解析，2维图像在复杂场景下由于缺少深度的信息无法正确分割物体。

一个例子是，以前荣耀出过一款双摄像头的手机，但并非用来做深度，仅是两个不同摄像头的集合，然后进行图像优化，效果是要把背景虚化，但这个其实是假的。它只是把背景模糊了一下，靠猜测背景和人是不一样的物体，这个和深度没有关系，也就是说还只是通过2D处理实现背景虚化，并非真正的3D。而目前智能视觉识别和分析大部分也仍用2D来做。

用3D做出的分割，去除背景和多物体分割都更精准。现在许多创业公司会利用微软kinect进行现场3D建模。同时利用3D图像进行面部识别的准确度更高。以上种种可以看出，3D视觉的确拥有巨大的优势。

3D传感器市场格局

之所以3D视觉还没有普及，因其技术不成熟且供应商仅少数几家企业。徐韬说，3D图像是在2D图像的基础上通过颜色渲染每一个点来代表不同的深度，深度图相对传统的平面图还有很大的提高空间。此外，由于多了一维，其数据处理却不只多一个数量级。在人工智能方面，如果用三维做分析，算法与计算量会有显著的增长，这就需要有新的处理方法来应对，在目前大部分还在用二维图形做处理的情形下，这也是一个挑战。

深度摄像头的三种主要技术方法和代表公司分别为：一是单目结构光，代表公司有苹果(收购最大的结构光技术公司PrimeSense)、微软Kinect-1、英特尔RealSense、GoogleProjectTango等，目前可见的其他创业公司几乎都沿用此技术路线。二是双目可见光，代表公司LeapMotion。三是飞行时间法(TOF)，代表公司微软Kinect-2。

在国内，单目结构光供应商有奥比中光科技、华捷艾米软件，双目结构光方案有图漾科技，TOF方案的有乐行天下科技。此外，有两家上市公司也开始了内部研发项目。

不过，徐韬表示图漾的3D传感器技术更像是单目结构光和双目可见光两种技术的结合，可获得更高的图像质量，并且应用场景更广，同时知识产权更加干净。

“在光线不好的情况下，传统的单路结构光会有很大的问题，无法识别或者失效。而我们的产品可靠性更高，这一点在行业应用中占有优势。因为许多特定的行业对产品的可靠性要求非常高，有些竞品在多设备情况下存在互相干扰无法协同，而我们在多设备条件下能够协高工作。”徐韬说道。

最早是一些以色列的创业公司进行深度摄像头的研发，现在这些公司几乎都被科技界巨头收购。比如苹果收购PrineSense，这家公司是深度摄像头的民用化先锋。收购后，不再对外供货。微软使用PrineSense技术做出了Kinect一代，Kinect-2采用内部开发技术，趋于封闭生态。谷歌则不会成为一项产品或技术的供应商，而在于推动应用开发。同样Intel力推Realsense方案需搭配X86芯片使用。可以说巨头的深度摄像头都有为己所用的形态。徐韬认为，这种现状留给了深度摄像头创新型公司更大的市场空间，尤其在行业应用方面。

有望取代激光雷达引发机器人及VR内容应用革命

深度摄像头最知名的消费级应用是体感摄像头，如微软XBOX游戏机的体感摄像头Kinect。微软的HOLOLENSE也大量采用了深度摄像头。深度摄像头最热的领域是机器人，自动驾驶，AR/VR，智能安防，智能家居，消费娱乐等，它们对深度摄像头有着非常巨大的需求。

例如VR配备手势识别和动作识别时用视觉做更多的捕捉，而AR对深度摄像头的需求更大，因为要感知环境，与真实环境融合。联想TANGO手机用深度摄像头做AR应用，据悉已在小批量发货，主打行业应用。

未来，可以利用深度摄像头直接生成内容，无需其他处理或用电脑生成。这充分解决了现在缺少优质VR内容的短板，将带来民众直接拍摄的VR内容的激增。

智能安防领域，通过智能摄像头分析人的行为是否在有潜在危害，在金融行业颇有用途，但对算法要求非常高，到目前为止，还没有非常好的产品出现。

另外，用来做视觉导航在目前大热的领域包括机器人、无人机以及其他移动的场景，这是消费刚需。徐韬认为，现在机器人用激光雷达进行视觉导航，存在价格昂贵，信息缺失的问题。因为它只是在面上作扫描，获得的信息并不完整，导航作用有限。深度摄像头做视觉导航，被普遍认为是行业的发展方向。据介绍，目前已经有具备一定技术研发能力的机器人公司开始用图漾的3D传感器做视觉导航。

机器人的导航主要有无线定位、激光雷达、视觉导航、惯性导航以及超声波等方式。随着3D传感器的发展，视觉导航有望成为最主流的方式。“我认为视觉导航是终结且最好的解决方法，但目前深度摄像头还不成熟，因此激光雷达还有一定的空间，一旦3D传感器技术成熟，那么激光雷达在机器人导航领域可能被秒杀。”

再看看各方的动作，Intel正在推动深度摄像头在电脑中的普及，Google正在尝试深度摄像头与平板的结合。此外手机公司对深度摄像头小型化开始关注，创业公司则投入在硬件与移动设备的结合，利用深度测量能力的应用开发的创新。

深度摄像头是技术门槛非常高的行业，徐韬表示图漾在掌握自有技术的同时，定位在专业的深度摄像头供应商，针对不同行业推出不同版本，提供完整的技术支持做定制化方案。由于具备了一定的优势，也受到了资本市场的认可。随着巨头的积极布局以及技术的逐渐成熟，还有3-5年的技术爆发期，目前是一个很好的时间窗口。

本文转自d1net（转载）