刷剧不忘学习:用Faster R-CNN定位并识别辛普森一家中多个人物

  1. 云栖社区>
  2. 量子位>
  3. 博客>
  4. 正文

刷剧不忘学习:用Faster R-CNN定位并识别辛普森一家中多个人物

行者武松 2018-01-16 15:21:00 浏览766
展开阅读全文
本文来自AI新媒体量子位(QbitAI)

Alexandre Attia是《辛普森一家》的狂热粉丝,在之前他已经写了一篇用卷积神经网络来识别20个辛普森人物的教程。给定一个人物图片后,该模型能返回该图片的所属类别,识别效果相当好,F1分值可达96%。

量子位翻译过这篇教程:刷剧不忘学CNN:TF+Keras识别辛普森一家人物 | 教程+代码+数据集

相关数据集已经在Kaggle上开源,但是该CNN模型每次只能识别单个人物,且不能指出该人物的图片位置。

作者不满足于只构建了一个简单的分类器,所以在本文中,作者创建了一个能检测和分类图片中每个人物的新模型,该模型将比之前的模型复杂得多,并且能为每个人物绘制对应的边框。

接下来让我们跟着他的文章来了解下该如何建立一个具有定位加识别功能的网络模型。

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

一开始,我考虑使用滑动窗口的方法来分类图片中的多个人

网友评论

登录后评论
0/500
评论
行者武松
+ 关注
所属云栖号: 量子位