《中国人工智能学会通讯》——11.12 三维目标检测识别

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.12节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.12 三维目标检测识别

目标识别一直是计算机视觉及模式识别领域的研究热点,其目的在于从场景中鉴别出感兴趣目标并获得其位姿信息。针对遮挡和背景干扰下的目标识别问题,本文提出了一种基于模型库的层次化三维目标识别算法[2] 。该算法共包括模型表示、候选模型生成、变换假设生成,以及验证和分割四个主要模块,其流程如图 6 所示。离线训练时,首先为感兴趣的三维目标构建一个模型库,并对每一个模型进行关键点检测和 RoPS 特征描述子提取。对于输入场景点云,同样进行关键点检测及 RoPS 特征提取,进而将场景点云特征与所有模型特征进行匹配以得到场景中潜在目标的候选模型。接着通过对场景与模型间的匹配对应点对计算二者之间的刚性变换关系,并对所有可能的变换关系进行聚类得到变换关系的假设及其置信度。对每一个候选模型,利用潜在变换假设及 ICP 算法将其与场景点云进行精配准以计算二者之间的重合度,若重合度超过预设的阈值则检测识别出该目标并得到目标的精确姿态。否则继续对下一个候选模型及变换假设进行验证,直到所有模型及假设均经过验证为止。image
采用四个公共数据集对所提三维目标识别算法进行测试。图 7 给出了 UWA 数据集上两个场景的示例及其识别结果,从图 7 中可知,除了图 (d) 中的 T-Rex 之外,其他目标均得到正确识别,且其姿态亦得到了精确估计。图 7(d) 中 T-Rex 目标未能image
正确识别的原因在于过度遮挡。在 UWA 数据集上不同目标遮挡率下的识别率结果如图 8 所示,可见本文算法性能超越了所有现有算法。当目标遮挡率在 0~80% 之间时,本算法可获得 100% 的识别率。即使目标遮挡率达到 85% 时,该算法依然可获得93.1% 的识别率。当目标遮挡率在 0~84% 之间时,本算法的平均识别率为 98.8%。此外,本文算法在实验中未出现任何虚警。因此,本文算法可有效地从存在遮挡、背景干扰和数据分辨率变化的复杂场景中识别出模型库中的目标。image

相关文章
|
3月前
|
机器学习/深度学习 人工智能 监控
人工智能中的目标检测
人工智能中的目标检测
53 1
|
4月前
|
机器学习/深度学习 人工智能 PyTorch
《人工智能专栏》专栏介绍 & 专栏目录 & Python与Python | 机器学习 | 深度学习 | 目标检测 | YOLOv5及其改进 | YOLOv8及其改进 | 关键知识点 | 各种工具教程
《人工智能专栏》专栏介绍 & 专栏目录 & Python与Python | 机器学习 | 深度学习 | 目标检测 | YOLOv5及其改进 | YOLOv8及其改进 | 关键知识点 | 各种工具教程
105 1
|
2月前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗影像识别中的应用与挑战
【2月更文挑战第5天】 传统医疗影像识别依赖于医生肉眼观察和经验判断,但这种方法存在着主观性和误判的风险。随着人工智能技术的发展,医疗影像识别逐渐引入了深度学习、卷积神经网络等技术,为医生提供了更精准的诊断工具。本文将探讨人工智能在医疗影像识别中的应用现状、技术挑战和未来发展方向,旨在展示人工智能在医疗领域中的巨大潜力和影响。
|
3月前
|
人工智能 Shell 开发工具
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
190 1
|
3月前
|
机器学习/深度学习 人工智能 算法
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
45 2
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
|
7月前
|
人工智能 安全 JavaScript
零基础入门Serverless:基于函数计算快速搭建基于人工智能的目标检测系统
本场景介绍如何使用阿里云函数计算服务命令行工具快速搭建一个基于人工智能的目标检测系统。
235 0
|
11月前
|
机器学习/深度学习 编解码 人工智能
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
108 0
|
人工智能 自然语言处理 API
调用百度api实现人工智能文本语义识别
调用百度api实现人工智能文本语义识别
134 0
调用百度api实现人工智能文本语义识别
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
462 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
机器学习/深度学习 算法 前端开发
人工智能,神经网络,图像识别,目标检测
该库采用C及C++ 语言编写,可以在windows,linux,macOSX系统上面运行。该库的所有代码都经过优化,计算效率很高 它的一个目标是提供友好的机器视觉接口函数,从而使得复杂的机器视觉产品可以加速面世。该库包含了横跨工业产品检测、医学图像处理、安防、用户界面、摄像头标定、三维成像、机器视觉等领域的超过500个接口函数。
197 0
人工智能,神经网络,图像识别,目标检测