周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

简介: 2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄。


q1

2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄。

大数据文摘经周博磊授权,发布这篇文章,看看大神眼中的大神是什么样?

其实从他发Dark Channel那篇论文开始,我就挺关注他的研究工作。那时候还是前Deep Learning时代的计算机视觉,一切都还不怎么work,还流行着LDA和各种graphical models。他那几篇low-level vision的论文读完就让人有眼前一亮的感觉,很多时候论文的立意都是从现象出发,然后追溯到背后的本质,然后再提出了一个朴实有效的解决问题的办法。虽然我自己不做low-level vision,但这些论文读完让我有 “啊哈” 的欣喜感觉,受到挺大的启发。这种从现象和问题出发追溯本质的思想,给他后面更加优秀和广为人知的工作埋下了重要的伏笔。

后来恺明从中大(CUHK)博士毕业在MSRA当研究员的时候就开始领队打ImageNet比赛了,做image classification的问题。从low-level vision到high-level vision,对于一般研究者,本来是个挺大的转变。但这恰好赶上了deep learning的浪潮,如何训练更好的分类神经网络本身是个非常empirical的研究问题。神经网络太复杂了,很难有什么理论指导,所以这玩意更像一个现象。

这样,恺明之前的从现象到本质的研究方式让他发现了神经网络中很多的问题所在,并提出了一些很有效的解决办法。比如说从防治gradient vanishing问题, 导出了Parametric ReLU,以及进一步提出后来封神的ResNet。再比如针对在object detection里如何更有效地利用CNN feature map, 提出了Spatial Pyramid Networks,到后来Fast RCNN, 跟Ross一起的Faster RCNN, 以及现在获奖的Mask RCNN。你可以很清楚地看出这些优秀研究工作的连贯性。在一个研究问题上死磕5,6年,在现在这个乱花迷人眼的时代非常难得。而且这image classification and object detection是计算机视觉的核心问题,恺明能解决得如此漂亮,真是由衷佩服,对这个领域推动也是巨大的(连AlphaGo Zero都用了residual block,可以想象Resnet是如何应用到计算机视觉的研究和产品线中去的)。当然,恺明的这些研究工作有很多顶级优秀的Collaborator参与,比如说他MSRA的孙老大(现Face++),两位顶尖实习生Xiangyu Zhang, Shaoqing Ren,以及FAIR的顶尖高手Ross和Pitor等等,这里就不展开了。

恺明去年夏末的时候才从MSRA到美国来加入Facebook AI Research,一年不到就搞出了MaskRCNN这个黑武器。MaskRCNN是semantic segmentation和object detection的一个结合,成为了instance segmentation的利器。Facebook内部工程线上面都广泛部署了Resnet和MaskRCNN,想必对公司贡献是非常大的。三周前我刚去FB总部参加了一个workshop,跟他聊了些近况和新的研究方向。你们的恺明大神还是依旧战斗在coding最前线的,哈哈,我是不会透露他正在蕴酿下一个什么大招的,大家期待就是了。

最后,大家可以再留意一下ICCV'17最后一天(也就是这周末)的Workshop COCO + Places 2017 。我参与举办了这次joint challenge,比赛项目是object detection, keypoint detection, scene parsing, instance segmentation等等。一个看点是,Kaiming和Ross所在的FAIR团队如何对垒中国的一些视觉公司如Face++和SenseTime等等,比赛结果会在当天揭晓。结果挺有意思,也值得大家思考。
原文发布时间为:2017-10-26
本文作者:周博磊
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

目录
打赏
0
0
0
0
73530
分享
相关文章
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
深度生成模型可以在高分辨率下进行逼真的图像合成。但对于许多应用来说,这还不够:内容创作还需要可控。虽然最近有几项工作研究了如何分解数据中的潜在变化因素,但它们大多在二维中操作,忽略了我们的世界是三维的。
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
Hinton最新研究:神经网络的未来是前向-前向算法|NeurIPS 2022特邀演讲(2)
Hinton最新研究:神经网络的未来是前向-前向算法|NeurIPS 2022特邀演讲
122 0
MMTracking 食用指南 | 视频目标检测(附AAAI2021论文解读)
VID 旨在检测视频中每一帧出现的物体。 与目标检测相比, VID 允许来自一个视频里的多帧作为输入,但输出形式与目标检测一致。 与多目标跟踪相比, VID 不要求对不同帧中的同一目标进行关联,只需检测出目标即可。
1024 0
MMTracking 食用指南 | 视频目标检测(附AAAI2021论文解读)
CVPR 2020华人一作包揽最佳论文、最佳学生论文,中国作者占39%,清华高居第一
机器之心编辑部 在刚刚开幕的 CVPR 2020 上,最佳论文、最佳学生论文等奖项悉数公布,来自牛津大学的吴尚哲等人获得了最佳论文奖,本科毕业于上海交通大学、现为西蒙弗雷泽大学博士一年级学生 Zhiqin Chen 等人获得最佳学生论文。
279 0
CVPR 2020华人一作包揽最佳论文、最佳学生论文,中国作者占39%,清华高居第一
华人问鼎CVPR!最佳论文、最佳学生论文一作均为华人,近四成作者来自中国,清华为最高产机构
华人问鼎CVPR!最佳论文、最佳学生论文一作均为华人,近四成作者来自中国,清华为最高产机构
407 0
CIKM'2017 最佳论文鉴赏
今年的Best Paper Award由清华大学的李国良老师团队获得,论文题为:Hike: A Hybrid Human-Machine Method for Entity Alignment in Large-Scale Knowledge Bases《一种基于人机协作的大型知识图谱对齐方法》. 因为是Best Paper,本篇分享单独对该文章做细致解读。
4150 0