【CVPR 2018热文】MIT提出“透明设计”网络,揭开视觉黑盒

  1. 云栖社区>
  2. 新智元>
  3. 博客>
  4. 正文

【CVPR 2018热文】MIT提出“透明设计”网络,揭开视觉黑盒

技术小能手 2018-03-19 15:41:00 浏览4225
展开阅读全文

根据看到的图像来回答问题,需要在图像识别和分类的基础上再进一步,形成对图中物体彼此关系的推理和理解,是机器完成复杂任务所需的一项基本能力,也是视觉研究人员目前正在努力攻克的问题。

最近,在视觉推理任务中,模块化的网络展现出了很高的性能,但它们在可解释性方面还多有欠缺。为了解决这个问题,MIT和普朗克航空系统公司的研究人员合作,围绕视觉注意力机制,提出了一组视觉推理原语(primitives),组合起来后得到的模型,能够以明确可解释的方式,执行复杂的视觉推理任务,在视觉理解数据集CLEVR上达到了99.1%的准确率

他们将这种设计模型的方法称之为“透明设计”(Transparency-by-Design,TbD),使用这种方法设计出的网络则称为“透明设计网络”(TbD-nets)。

347b32c43f7f8e0f2531aa1f81710259cdbc28c9

CLEVR视觉问答任务示意:新提出的透明设计网络(Tb


网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属团队号: 新智元