多目标跟踪突破:上交大&中兴 MOT Challenge 测评获第一

简介:

多目标跟踪是视频分析及监控领域中的基本问题之一,在视频目标分析、场景剖析、行为事件理解、交通管理及安全防控等应用中,多目标跟踪都是必须解决的关键课题。与单目标跟踪仅针对指定的单个目标框进行跟踪不同,多目标跟踪致力于对视频中的所有感兴趣目标进行自动提取,并通过时域关联,得到其运动轨迹信息。因此,多目标跟踪更适合处理包含大量目标的复杂场景。


640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

图1:多目标跟踪致力于对视频中的所有感兴趣目标进行自动提取,并通过时域关联,得到其运动轨迹信息,因此更适合处理含有大量目标的复杂场景

   

然而,由于多目标在场景中的运动往往存在大量的相互遮挡与交互,给目标提取及关联带来了大量的干扰,因此多目标跟踪仍然面临巨大的困难和挑战。现有的研究大多只专注于改进多目标跟踪过程中的某一环节,缺少对多个环节的联合建模,因此,跟踪效果仍然有较大的局限性。此外,现有的大多数多目标跟踪方法复杂性较高,难以实现有效的实时处理。


近日,上海交通大学林巍峣副教授团队和中兴通讯的合作工作在多目标跟踪领域取得突破,在保证实时处理的情况下,大幅提升了跟踪效果,并在 MOT Challenge 测评中取得第一。


MOT Challenge 是国际多目标跟踪领域最权威的测评平台,由阿德莱德大学、苏黎世联邦理工学院以及达姆施塔特工业大学联合创办,旨在评测多行人对象在复杂场景下进行同时检测及跟踪的算法性能,迄今为止参加测评的机构多达 60 多支,包括海康威视、商汤科技、NEC 北美研究院、斯坦福大学、马克斯普朗克研究所、纽约州立大学、苏黎世联邦理工学院、悉尼大学、伦敦玛丽皇后大学等世界知名高校和研究所。


640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

图2:上海交通大学和中兴通讯合作团队获得 MOT 16 Challenge 测评第一名。

   

MOT Challenge 主要包含 MOT 15, MOT 16,MOT 17 三个测评集。其中,MOT 17 主要测评多目标跟踪模块的性能,而 MOT 15 和 16 两个测评集允许对目标检测、特征提取及跟踪等多模块的综合效果进行测评,因此更有实战性和挑战性。本次,上海交通大学和中兴通讯参加的 MOT 16 Challenge 测评,包含 7 段视角、场景、及长度各异的复杂视频,不少视频含有高密集目标及显著遮挡,检测和跟踪的难度非常大。


上海交通大学和中兴通讯的联合研究团队设计出了一种基于超平面匹配的一体化多目标检测与跟踪算法。该方法将多目标跟踪过程中的目标检测、特征提取、关联跟踪等模块有机地融入一个整体的框架进行联合建模,并通过各模块间的信息反馈,有效地去除了跟踪过程中的噪声和干扰。同时,为了进一步有效建模多目标之间的相互关系,该方法进一步引入超平面来建模各个目标局部轨迹片段间的时空关系,并通过超平面匹配实现高精度的多目标跟踪。


与现有多目标跟踪算法普遍运行速度较慢不同,该算法采用了卷积信息共用技术对算法进行加速,仅利用一次卷积操作,就可实现目标检测、特征提取、及超平面构建等多个操作,可以实现实时的检测与跟踪。联合团队在中兴通讯人工智能平台 uSmartAI 上进行了测试验证,多目标跟踪的处理速度达到 20 帧/秒以上。此外,该方法在 MOT Challenge 上测评的跟踪准确度(Multiple Object Tracking Accuracy)达到了 71.3%,排名第一。

    

本次上海交通大学和中兴通讯联合研究团队在多目标跟踪方法上的突破,对于推动多目标分析的理论研究和实际应用,具有重要的意义。相关技术已用于中兴通讯的部分产品中,相关论文的技术细节,也将在稍后发表。


文章转自新智元公众号,原文链接

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
华人学生团队获国际神经网络验证大赛佳绩:总分第一,五大单项第一
由来自卡内基梅隆大学、美国东北大学、哥伦比亚大学、加州大学洛杉矶分校的成员共同开发的工具α,β-CROWN 获得了第二届国际神经网络验证大赛总分第一,以及 5 个单项第一!其中该团队的学生作者均为华人。
284 0
华人学生团队获国际神经网络验证大赛佳绩:总分第一,五大单项第一
|
8月前
全都结束了?LK-99只是铁磁材料,不是超导体,北大等更多研究论文公布
全都结束了?LK-99只是铁磁材料,不是超导体,北大等更多研究论文公布
328 0
|
10月前
|
机器学习/深度学习 编解码 人工智能
基于扩散模型的音频驱动说话人生成,云从&上交数字人研究入选ICASSP 2023
基于扩散模型的音频驱动说话人生成,云从&上交数字人研究入选ICASSP 2023
145 0
|
10月前
|
算法 数据处理 网络安全
【Sword系列】第七届全国残疾人职业技能大赛样题-网络安全-word弱口令4
Base64是一种编码算法,它能将二进制数据转换为可打印ASCII字符的字符串形式。它最常用的应用场景是在信息传输过程中,因为它可以确保数据在不同操作系统和网络环境中的互通性。
72 0
【Sword系列】第七届全国残疾人职业技能大赛样题-网络安全-word弱口令4
|
10月前
|
存储 算法 安全
【Sword系列】第七届全国残疾人职业技能大赛样题-网络安全-word弱口令3
MD5是一种消息摘要算法,也称为哈希算法,它可以将任意长度的消息数据生成一个固定长度的摘要码(一般是128位),用于保证数据完整性和防篡改。MD5算法是由美国计算机专家罗纳德·李维斯特(Ronald L. Rivest)设计开发的。
61 0
 【Sword系列】第七届全国残疾人职业技能大赛样题-网络安全-word弱口令3
|
11月前
|
算法 机器人 数据建模
中国学者开发看护机器人仿真环境,还做了真人实验,获IROS 2022最佳论文之一
中国学者开发看护机器人仿真环境,还做了真人实验,获IROS 2022最佳论文之一
100 0
|
11月前
|
机器学习/深度学习 数据可视化 数据挖掘
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
147 0
|
11月前
|
机器学习/深度学习 算法 计算机视觉
让换脸无所遁形!南洋理工发布全球首个DeepFake篡改序列检测还原数据集|ECCV 2022
让换脸无所遁形!南洋理工发布全球首个DeepFake篡改序列检测还原数据集|ECCV 2022
|
机器人 计算机视觉
首次机器人抓取云竞赛引国际学界广泛关注和参与
近日,阿里巴巴达摩院人工智能实验室与University of South Florida等国外著名研究机构共同举办了世界首次机器人抓取云竞赛:OCRTOC竞赛。OCRTOC竞赛聚焦于机器人抓取能力以及桌面物品整理的应用场景,旨在成为机器人抓取技术领域的ImageNet。OCRTOC竞赛获得了国际电气电子工程师协会两大技术委员会的大力支持,并成为国际机器人顶会IROS2020的正式官方赛事,吸引了全球顶尖学府的关注!
342 0
首次机器人抓取云竞赛引国际学界广泛关注和参与
|
机器学习/深度学习 安全 区块链
隐私计算顶级赛事,摩斯夺两项第一
近日,2021年iDASH国际隐私计算竞赛正式公布比赛结果,来自蚂蚁集团的蚂蚁链摩斯团队斩获同态加密、联邦学习两项第一。
161 0
隐私计算顶级赛事,摩斯夺两项第一