NEC与东京工业大学联合开发“多模图像融合技术”,以AI技术大幅提高恶劣条件下视觉识别度

简介:

NEC与日本国立大学法人京工大学工学院奥富正敏教授、田中正行特定副教授的研究团队(以下京工大学)共同开“多模(注1像融合技”,通AI将一般的可像与成像相机拍的非可行自高效合成,且提高了像拍摄时视觉识别度。

在需要瞬时视觉识别的各个域中利用此,即便在劣条件下也可以实现正确判断。例如,夜浓雾劣天气条件下也可以正常行的控;即便迎面行的刺眼的灯及黑暗造成视觉死角也可以使用的自动驾驶支持;不可以监测建筑表面的裂可以监测其内部异常的基础设施点等。

以往想要合成不同种类像需要行复的手合成作。而此技术则将各种采集的像通AI高效合成,无需手工操作。并且充分利用可像和非可像各自的优势,即便是以往人眼以看清的景也可以高的视觉识别度。

NEC京工大学今后也将继续过产学合作形式共同研支撑各社会基础设施安心安全运理以及AI相关技

【背景】

近年来,在感器的不断升及成本持下降的背景下,将成像及可捕捉物体内部构造的X太赫兹波毫米波等非可头应用到夜浓雾劣天气、逆光、遮蔽等不利条件下的控及断的情况越来越普及。但是些非可比可的分辨率和画都要低,视觉识别起来很困,因此需要将可与之配合在一起使用,通过对比双方的监视断。因此,想要快速精准地判断象物体的状况是比的。解决课题,最好的法就是将两种像合成一个像,但是去的合成法需要精通境的自手动调整,从各自独的像中抽取出适于合成的部分,一注意防止度曝光和曝光不足以及噪点增强破坏像等问题,一边进行复像合成作。另外,在非可光中包含的用于判断异常及危物的特征很可能因合成造成失,也是一个重要课题

NEC京工大学通家的变换技能的AI,将可与非可像自高效合,提高象物状况的视觉识别度,共同开了即便在境下也可以快速判断是否存在异常或危物的“多模像融合技”。

2017-06-14-4692cdbb39-5b24-4443-ba75-052

1:本技术适用例(2)

【新技点】

AI从多个像中选择视觉识别度高的像,并在强非可光中包含的小特征的同时进像合成,从而实现打破以往局限性的高度视觉识别。

AI会根据成像、太赫兹种类、境特征(亮度、光线方向、有无障碍物)等不同条件,对图像内各部分的视觉识别度的高低价,从而从各个像中自抽取出最适宜的部分。

此外,AI理非可,会针对异常及危物的小特征行解析,行适当的强弱整以避免因度曝光及曝光不足而破坏像,从而自生成以往无法实现的高视觉识别度的多模(可-非可光)融合像。

(注1) Multimodal(多模)

多种模式、形。本文中提到的多模是指可像和线摄等非可像。

(2) 获新研进项目(ImPACTTough Robotics Challenge关于境模拟设备可并使用。





本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
目录
相关文章
|
25天前
|
机器学习/深度学习 人工智能 运维
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(二)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
58 1
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(一)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
65 1
|
16小时前
|
人工智能 决策智能
【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制
【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制
|
1天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
5天前
|
机器学习/深度学习 人工智能 算法
未来AI技术的发展与应用前景
随着人工智能(AI)技术的迅速发展,其在各个领域的应用前景备受关注。本文将探讨未来AI技术的发展趋势,以及其在医疗、交通、教育等领域的潜在应用,展望AI技术对未来社会的影响和改变。
12 1
|
5天前
|
人工智能 前端开发 Java
Java语言开发的AI智慧导诊系统源码springboot+redis 3D互联网智导诊系统源码
智慧导诊解决盲目就诊问题,减轻分诊工作压力。降低挂错号比例,优化就诊流程,有效提高线上线下医疗机构接诊效率。可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。
45 10
|
6天前
|
人工智能
【强大的cursor_不懂就问AI工具做开发的AI助手技巧分享——一定要去试试!!!】
【强大的cursor_不懂就问AI工具做开发的AI助手技巧分享——一定要去试试!!!】
|
10天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
20 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
11天前
|
人工智能 数据可视化 大数据
从埃森哲《技术展望2024》看AI拐点下的数字化趋势
从埃森哲《技术展望2024》看AI拐点下的数字化趋势
15 0
|
12天前
|
机器学习/深度学习 数据采集 人工智能