手把手教你用TensorFlow实现看图说话 | 教程+代码

  1. 云栖社区>
  2. 量子位>
  3. 博客>
  4. 正文

手把手教你用TensorFlow实现看图说话 | 教程+代码

行者武松 2018-01-09 13:38:00 浏览1611
展开阅读全文
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


看图说话这种技能,我们人类在幼儿园时就掌握了,机器们前赴后继学了这么多年,也终于可以对图像进行最简单的描述。

O’reilly出版社和TensorFlow团队联合发布了一份教程,详细介绍了如何在Google的Show and Tell模型基础上,用Flickr30k数据集来训练一个图像描述生成器。模型的创建、训练和测试都基于TensorFlow。

如果你一时想不起O’reilly是什么,量子位很愿意帮你回忆:

640?wx_fmt=png&wxfrom=5&wx_lazy=1

好了,看教程:

准备工作

  • 装好TensorFlow;
  • 安装pandas、opencv2、Jupyter库;
  • 下载Flicker30k数据集的图像嵌入和图像描述

在教程对应的GitHub代码介绍( https://github.com/mlberkeley/oreilly-captions )里,有库、


网友评论

登录后评论
0/500
评论
行者武松
+ 关注
所属云栖号: 量子位