国科大本科生连续在CVPR,AAAI发文,系统提出三维模型库变形分析方法

简介: 日前,中国科学院大学计算机与控制学院首届本科生谈清扬同学,以第一作者身份撰写的论文再次发表在CVPR 2018上。此前,新智元报道过国科大本科生谈清扬同学在AAAI 2018上以第一作者身份发表论文。本科生以第一作者的身份连续在国际顶会上发表论文并对一类问题进行系统的研究十分难得。

近年来,深度学习技术在语音识别和图像处理领等领域取得了突出的成果,然而在三维几何处理领域的突破相对较少。其中一个本质的困难在于在三维几何处理领域缺乏像二维图像一样规则的定义域和特征。中科院计算所的高林等人长期从事三维几何处理的研究工作,相继提出了两种适于深度学习的三维模型特征[1][2]。基于这些特征,谈清扬同学与高林博士等人经过联合攻关,系统的提出了三维模型的变形分析方法。三维模型的变形可以分为全局变形和局部变形。以人体三维模型的变形为例,人的身高、体重的变化引起的变形是全局的;人的肢体动作的变化引起的变形是局部的。这两种类型的变形反映了三维模型的主要变形模式。针对全局变形,他们结合RIMD特征[1]与变分自编码器提出了一个新型的网络(MeshVAE)对三维模型的全局变形进行分析;针对局部变形,他们通过使用稀疏性描述变形的局部性,在卷积网络上定义稀疏性来对三维模型的局部变形进行分析。这些工作分别发表在CVPR 2018与AAAI 2018上。

得益于“中国科学院大学生创新实践训练计划”,国科大的优秀本科生可以进入各个研究所进行实习,谈清扬同学就是在该计划(基于RGBD相机的人体运动捕获,项目负责人是夏时洪研究员与高林副研究员)的支持下进入中科院计算所进行客座研究。 基于研究所在领域内领先的研究基础和研究所内专家的指导,谈清扬同学针对当前深度学习的热点和难点问题开展研究。具体而言,对三维模型变形分析问题开展了系统的研究,并取得了一系列的研究成果。这对于本科生来言非常难得,也体现了国科大“高水平的科学研究中培养高质量人才”的本科生培养体制成效显著。

论文:基于变分自编码器的网格变形分析

008aff9aa9f94bd8c98901fcd08251bacdb2e861

摘要

随着三维模型库规模的飞速发展,如何对三维模型进行分析成为重要的研究课题。在本文中,我们使用深度神经网络对三维模型的变形数据库进行分析。这些数据库包含了大尺度与非线性的三维模型变形。我们的首次提出了一种基于变分自编码器的网络结构对三维模型变形数据库进行分析,探索其本质的变形隐空间。该网络易于训练,并且需要的训练模型较少。此外,我们将该模型进行了推广,使得通过对先验分布进行调整来得到反映模型主要变形的特征。大量实验结果表明,我们的方法可以学习到变形模型库的本质的分布并能在其他应用中生成具有竞争力的结果,其中包括三维模型生成,三维模型插值,三维模型数据库嵌入和浏览。基于该网络,在这些应用中我们的方法都优于经典的方法。

a5873de8f39bbf23a5f86217875438825cbfd136

上图中显示了基于本文的方法可以生成高质量的三维模型。第一样显示了基于MeshVAE随机生成的高质量的三维模型。第二行显示了基于 Conditional MeshVAE生成的高质量的三维模型,给定性别女和BMI指数29.8可以生成满足这些指标的高质量的三维模型。

b2e5268a21a400f774af860dde3036ffa65645cf

上图显示了基于本文的方法可以生成高质量的三维模型插值的结果。 第一行是是使用RIMD特征[1]直接线性插值的结果,第二行是经典的数据驱动的模型插值方法的结果[3], 第三行是本文的结果。可以看出在对具有大尺度变形的模型进行插值时,上面两行的结果有自交或者不自然的结果出现,而本文的方法的结果是自然合理的。

60a6483a2baaa5f3d929108fd0bc108b70e1bc92

上图显示了基于本文的方法可以有效的对三维模型库进行低维嵌入与可视化。该数据库中包含了具有不同的动作以及形态的三维人体模型。使用本文中的方法可以获得一个维度中获得超过一维的变形模式。当使用二维进行可视化时,本文中的方法可以有效的将模型根据不同的形态区别开来,并且使得具有相同动作的模型距离的比较近,并且没有大量的空白并浪费空间。而已有的方法,如PCA,NPE,t-SNE, 存在浪费可视化空间,以及不能对模型进行有效区分的缺点。

Reference:

[1] Lin Gao, Yu-Kun Lai, Dun Liang, Shu-Yu Chen, Shihong Xia. Efficient and Flexible Deformation Representation for Data-Driven Surface Modeling. ACM Transactions on Graphics. 2016, 35(5), 158:1--158:17

[2] Lin Gao, Yu-Kun Lai, Jie Yang, Ling-Xiao Zhang, Leif Kobbelt, Shihong Xia. Sparse Data Driven Mesh Deformation. 2017, arXiv:1709.01250

[3] Lin Gao, Shu-Yu Chen, Yu-Kun Lai, Shihong Xia. Data-Driven Shape Interpolation and Morphing Editing. Computer Graphics Forum, 2017, 36(8), 19-31


原文发布时间为:2018-04-2

本文作者:闻菲

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:国科大本科生连续在CVPR,AAAI发文,系统提出三维模型库变形分析方法

相关文章
|
4月前
|
编解码 JavaScript 定位技术
基于Pix4Dmapper的三维模型重建应用——空间分析选址
基于Pix4Dmapper的三维模型重建应用——空间分析选址
|
人工智能
国科大本科生以第一作者身份发表AAAI论文,用神经网络分析三维模型
江山代有才人出,此前新智元报道过22岁复旦学生赢得世界深度学习竞赛冠军,日前,中国科学院大学计算机与控制学院首届本科生谈清扬同学,以第一作者身份撰写的论文被 AAAI 2018接受。本科生以一作身份在国际顶会发表论文十分难得。
2466 0
|
1月前
|
存储 编解码 安全
带三维重建和还原的PACS源码 医学影像PACS系统源码
带三维重建和还原的PACS源码 医学影像PACS系统源码 PACS及影像存取与传输系统”( Picture Archiving and Communication System),为以实现医学影像数字化存储、诊断为核心任务,从医学影像设备(如CT、CR、DR、MR、DSA、RF等)获取影像,集中存储、综合管理医学影像及病人相关信息,建立数字化工作流程。系统可实现检查预约、病人信息登记、计算机阅片、电子报告书写、胶片打印、数据备份等一系列满足影像科室日常工作的功能,并且由于影像数字化存储,用户可利用影像处理与测量技术辅助诊断、方便快捷地查找资料或利用网络将资料传输至临床科室,还可与医院HIS、L
|
4月前
|
存储 数据采集 固态存储
带三维重建和还原功能的医学影像管理系统(pacs)源码
带三维重建和还原功能的医学影像管理系统(pacs)源码
53 0
|
4月前
|
存储 数据采集 编解码
【PACS】医学影像管理系统源码带三维重建后处理技术
【PACS】医学影像管理系统源码带三维重建后处理技术
51 0
|
4月前
|
C++
【C++医学影像PACS】CT检查中的三维重建是什么检查?
【C++医学影像PACS】CT检查中的三维重建是什么检查?
61 0
|
2月前
|
数据采集 存储 数据可视化
医院影像PACS系统三维重建技术(获取数据、预处理、重建)
开放式体系结构,完全符合DICOM3.0标准,提供HL7标准接口,可实现与提供相应标准接口的HIS系统以及其他医学信息系统间的数据通信。
26 3
|
3月前
|
存储 编解码 监控
【C++】医学影像PACS三维重建后处理系统源码
系统完全符合国际标准的DICOM3.0标准
28 2
|
4月前
|
存储
医院PACS系统全套源码 强大的三维重建功能
对非DICOM影像,如超声、病理、心电图等进行了集成,做到了可以同时处理DICOM标准图像和非DICOM图像。
23 1
|
9月前
|
存储 数据库 数据安全/隐私保护
基于C++开发,支持三维重建,多平面重建技术的医学影像PACS系统源码
支持非DICOM标准的影像设备的图像采集和处理。 3)支持各种扫描仪、数码相机等影像输入设备。 4)支持各大主流厂商的CT、MR、DSA、ECT、US、数字胃肠、内镜等影像设备; 5)支持所有的DICOM相机,支持各大厂家的激光相机。 6)系统完全支持HL7接口和ICD—10编码,可与HIS系统无缝连接。 7)提供全院级、科室级工作站以及远程会诊工作站,三维重建,多平面重建。
基于C++开发,支持三维重建,多平面重建技术的医学影像PACS系统源码