深度摄像头已过基础期 未来将掀起3D浪潮

简介:

众多前沿领域的应用将越来越依赖深度摄像头,就好像VR、机器人、安防等为了得到更精准的体验,这也是为什么国际巨头都在布局于此的原因。深度摄像头(又称3D传感器)从视觉数据获取的角度提升机器感知能力。由于其具有一定的技术门槛,国内外涉足此研发的比较少。集中在国外有苹果、微软、谷歌、INTEL、Oculus、SONY,国内奥比中光、华捷艾米,图漾,乐行天下等。目前,深度摄像头已经渡过技术基础期,方向明确了,将进入3-5年的成长期,未来将掀起3D传感器的浪潮。

  别被2D的背景虚化给骗了

3维视觉相比于2维视觉,多了一个维度,可以实现更加正确的物体分割,合适精度的三维测量,三维数据的模型重建以及智能视觉识别和分析。上海图漾信息科技有限公司徐韬解析,2维图像在复杂场景下由于缺少深度的信息无法正确分割物体。

一个例子是,以前荣耀出过一款双摄像头的手机,但并非用来做深度,仅是两个不同摄像头的集合,然后进行图像优化,效果是要把背景虚化,但这个其实是假的。它只是把背景模糊了一下,靠猜测背景和人是不一样的物体,这个和深度没有关系,也就是说还只是通过2D处理实现背景虚化,并非真正的3D。而目前智能视觉识别和分析大部分也仍用2D来做。

用3D做出的分割,去除背景和多物体分割都更精准。现在许多创业公司会利用微软kinect进行现场3D建模。同时利用3D图像进行面部识别的准确度更高。以上种种可以看出,3D视觉的确拥有巨大的优势。

3D传感器市场格局

之所以3D视觉还没有普及,因其技术不成熟且供应商仅少数几家企业。徐韬说,3D图像是在2D图像的基础上通过颜色渲染每一个点来代表不同的深度,深度图相对传统的平面图还有很大的提高空间。此外,由于多了一维,其数据处理却不只多一个数量级。在人工智能方面,如果用三维做分析,算法与计算量会有显著的增长,这就需要有新的处理方法来应对,在目前大部分还在用二维图形做处理的情形下,这也是一个挑战。

深度摄像头的三种主要技术方法和代表公司分别为:一是单目结构光,代表公司有苹果(收购最大的结构光技术公司PrimeSense)、微软Kinect-1、英特尔RealSense、GoogleProjectTango等,目前可见的其他创业公司几乎都沿用此技术路线。二是双目可见光,代表公司LeapMotion。三是飞行时间法(TOF),代表公司微软Kinect-2。

在国内,单目结构光供应商有奥比中光科技、华捷艾米软件,双目结构光方案有图漾科技,TOF方案的有乐行天下科技。此外,有两家上市公司也开始了内部研发项目。

不过,徐韬表示图漾的3D传感器技术更像是单目结构光和双目可见光两种技术的结合,可获得更高的图像质量,并且应用场景更广,同时知识产权更加干净。

“在光线不好的情况下,传统的单路结构光会有很大的问题,无法识别或者失效。而我们的产品可靠性更高,这一点在行业应用中占有优势。因为许多特定的行业对产品的可靠性要求非常高,有些竞品在多设备情况下存在互相干扰无法协同,而我们在多设备条件下能够协高工作。”徐韬说道。

最早是一些以色列的创业公司进行深度摄像头的研发,现在这些公司几乎都被科技界巨头收购。比如苹果收购PrineSense,这家公司是深度摄像头的民用化先锋。收购后,不再对外供货。微软使用PrineSense技术做出了Kinect一代,Kinect-2采用内部开发技术,趋于封闭生态。谷歌则不会成为一项产品或技术的供应商,而在于推动应用开发。同样Intel力推Realsense方案需搭配X86芯片使用。可以说巨头的深度摄像头都有为己所用的形态。徐韬认为,这种现状留给了深度摄像头创新型公司更大的市场空间,尤其在行业应用方面。

有望取代激光雷达引发机器人及VR内容应用革命

深度摄像头最知名的消费级应用是体感摄像头,如微软XBOX游戏机的体感摄像头Kinect。微软的HOLOLENSE也大量采用了深度摄像头。深度摄像头最热的领域是机器人,自动驾驶,AR/VR,智能安防,智能家居,消费娱乐等,它们对深度摄像头有着非常巨大的需求。

例如VR配备手势识别和动作识别时用视觉做更多的捕捉,而AR对深度摄像头的需求更大,因为要感知环境,与真实环境融合。联想TANGO手机用深度摄像头做AR应用,据悉已在小批量发货,主打行业应用。

未来,可以利用深度摄像头直接生成内容,无需其他处理或用电脑生成。这充分解决了现在缺少优质VR内容的短板,将带来民众直接拍摄的VR内容的激增。

智能安防领域,通过智能摄像头分析人的行为是否在有潜在危害,在金融行业颇有用途,但对算法要求非常高,到目前为止,还没有非常好的产品出现。

另外,用来做视觉导航在目前大热的领域包括机器人、无人机以及其他移动的场景,这是消费刚需。徐韬认为,现在机器人用激光雷达进行视觉导航,存在价格昂贵,信息缺失的问题。因为它只是在面上作扫描,获得的信息并不完整,导航作用有限。深度摄像头做视觉导航,被普遍认为是行业的发展方向。据介绍,目前已经有具备一定技术研发能力的机器人公司开始用图漾的3D传感器做视觉导航。

机器人的导航主要有无线定位、激光雷达、视觉导航、惯性导航以及超声波等方式。随着3D传感器的发展,视觉导航有望成为最主流的方式。“我认为视觉导航是终结且最好的解决方法,但目前深度摄像头还不成熟,因此激光雷达还有一定的空间,一旦3D传感器技术成熟,那么激光雷达在机器人导航领域可能被秒杀。”

再看看各方的动作,Intel正在推动深度摄像头在电脑中的普及,Google正在尝试深度摄像头与平板的结合。此外手机公司对深度摄像头小型化开始关注,创业公司则投入在硬件与移动设备的结合,利用深度测量能力的应用开发的创新。

深度摄像头是技术门槛非常高的行业,徐韬表示图漾在掌握自有技术的同时,定位在专业的深度摄像头供应商,针对不同行业推出不同版本,提供完整的技术支持做定制化方案。由于具备了一定的优势,也受到了资本市场的认可。随着巨头的积极布局以及技术的逐渐成熟,还有3-5年的技术爆发期,目前是一个很好的时间窗口。

本文转自d1net(转载)

相关文章
|
1月前
|
人工智能 算法 搜索推荐
慧鲤携手联发科技亮相MWC,端侧LoRA融合技术助力手机大模型技能扩充
慧鲤携手联发科技亮相MWC,端侧LoRA融合技术助力手机大模型技能扩充
|
3月前
|
人工智能
探路AIGC,SaaS迎来了重估时刻?
【1月更文挑战第17天】探路AIGC,SaaS迎来了重估时刻?
22 2
探路AIGC,SaaS迎来了重估时刻?
|
11月前
|
机器学习/深度学习 人工智能 算法
忆海原识发布类脑计算平台,下一代AI突破口到来!(2)
忆海原识发布类脑计算平台,下一代AI突破口到来!
110 0
|
11月前
|
机器学习/深度学习 人工智能 编解码
忆海原识发布类脑计算平台,下一代AI突破口到来!(1)
忆海原识发布类脑计算平台,下一代AI突破口到来!
116 0
|
11月前
|
人工智能 供应链 物联网
AI大模型来袭,智能家居迎新拐点?
AI大模型来袭,智能家居迎新拐点?
171 0
|
机器学习/深度学习 人工智能 自动驾驶
忆海原识发布类脑计算平台,下一代AI突破口到来!
近日,在 2022 WAIC AI 开发者日上,忆海原识创始人兼 CEO 任化龙发表主题演讲《类脑计算的发展与关键技术》。演讲中,他夯实细致地介绍了类脑智能的特点以及与传统技术的对比,以及忆海原识自主研发的 Ocean 类脑计算平台。
385 0
忆海原识发布类脑计算平台,下一代AI突破口到来!
|
机器学习/深度学习 人工智能 达摩院
从AI解决风光电并网难题到硅光芯片,达摩院发布2022十大科技趋势!
从AI解决风光电并网难题到硅光芯片,达摩院发布2022十大科技趋势!
182 0
从AI解决风光电并网难题到硅光芯片,达摩院发布2022十大科技趋势!
|
人工智能 算法 JavaScript
AI面试催生韩国新型补习班:200元一小时,面对摄像头练习用眼睛微笑
「微笑不要靠嘴唇,要从眼睛里透出来」,在 200 元一小时的补习班里,韩国培训老师这样传授面对「AI 面试官」的诀窍。对于那些待业已久的韩国年轻人来说,只要能通过大公司的 AI 面试,支付昂贵的补习费用根本算不上什么。
152 0
AI面试催生韩国新型补习班:200元一小时,面对摄像头练习用眼睛微笑
|
存储 人工智能 运维
【云栖号案例 | 物联网&人工智能】超越软件上云 讲述每天1亿公里行驶背后的大生意
随着车联网的快速发展,传统服务器扩容速度跟不上、维护成本高。上云后统一平台、汇聚数据、数据变现,计算的弹性扩展以及数据的弹性存储实现平台化。
【云栖号案例 | 物联网&人工智能】超越软件上云 讲述每天1亿公里行驶背后的大生意
|
机器学习/深度学习 人工智能 运维
「新基建」下大火的工业智能,问题依旧很多
当我们在讨论「机器换人」,到底怎么实现?