IBM Watson 视觉识别新高度,采用 GPUs 分布式网络看懂图片内涵

简介:

过去十年,人们前所未有地创造出大量视觉内容——从社交媒体到娱乐和制造业,甚至到那些远离日常生活的绕地球卫星。随着近期认知科技的进步,比如大规模的深层学习和基于语义层面的可视化建模,我们开始加速提高我们洞悉大数据的能力,此前雷锋网(公众号:雷锋网)也做过很多报道。但是追求更高水平的数据细节,对于科学家而言仍然是一个挑战。

雷锋网消息,IBM 近日迈出了重要一步,对 Watson 视觉识别图像分类器( Watson Visual Recognition)的处理能力进行了更新,它能让用户理解图像或者是视频中的内容。这一系统内置数万视觉标签,使其常用词汇量比之前的模式大2.5倍。内置词汇量的扩大,使其识别特殊视觉概念的能力大大提高。

新植入的视觉标签涵盖了很多种类的视觉概念,其中包括物体、人、地点、活动、场景以及其它一些关于细致特点类型的词汇,比如特定的颜色。

每一类词汇的涉及深度都有所增加,也增加了很多特定的视觉描述词汇。这使得新植入的分类器能够对典型图片进行更加精确详细地分类。同时,它也以分类等级为基础,对图片增加了一般性描述——比如知道马是一种动物。

IBM Watson 视觉识别新高度,采用 GPUs 分布式网络看懂图片内涵

该服务也能通过识别细小差别来对图片进行详细描述。比如图片显示“人们在愉快地就餐”,那么它能够识别出,该场景不只是在餐馆吃饭,而是能根据视觉形象更加详细地描述出这是在啤酒园里。比如图片显示这是 GAIR 全球人工智能与机器人峰会的会场,机器也能识别出背景图上的雷锋网 Logo。

视觉识别能达到这么精确的水平,是因为它现在能够平均为每个图像至少贴上九个描述性标签——之前平均只有两到三个。

IBM 机器视觉负责人 Matthew Hill 表示:“我们之所以能取得这么大的进步,是因为我们用各种各样的摄影镜头获得的大量图片进行了实验,并且采用了图形处理器(GPUs)的分布式网络。 Watson 将所有这些信息都融合到具有数万标签的卷积神经网络。我们也研发出新的推论方法:利用语义推理优化该服务对图片的描述,使其更加特殊、突出、准确。”

当然,有些企业有自己的自定义数据,他们想为这些数据创造自己的分类器。 Watson 视觉识别也有自定义开发和分类的特点。当需要该服务需要为某一领域学习一套新的图像标签时(像产品组合),开发者可以进行快速开发,通过提供示例图片植入新的自定义模型。然后,应用程序可以利用自定义模型,结合最基本的服务,用一般描述词汇和特定领域的描述词汇对图片进行描述。自定义分类器也可以通过加入新的示例图片来进行升级。

Hill 表示,视觉识别的发展是 IBM 持续提高 Watson 认知领域能力的重要一步。它是基于世界范围内对视觉理解的不断研发。视觉理解取得了一系列突破性进展,包括利用图像分析改善对皮肤癌患者的治疗,改进图像自动生成字幕技术以及突破人工智能和创造性的限制,制作世界上第一步认知电影预告片等。

如果想了解更多信息,你可以点击这里,获得更多关于视觉识别服务的信息。雷锋网也将对这一研究做后续关注。

via IBM


本文作者:维文•罗杰


本文转自雷锋网禁止二次转载,原文链接

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
12天前
|
机器学习/深度学习 算法 计算机视觉
卷积神经网络中的卷积层,如何提取图片的特征?
卷积神经网络中的卷积层,如何提取图片的特征?
22 0
|
1月前
|
SQL 机器学习/深度学习 分布式计算
Spark【基础知识 01】【简介】(部分图片来源于网络)
【2月更文挑战第12天】Spark【基础知识 01】【简介】(部分图片来源于网络)
26 2
|
1月前
|
消息中间件 存储 缓存
Kafka【基础知识 01】消息队列介绍+Kafka架构及核心概念(图片来源于网络)
【2月更文挑战第20天】Kafka【基础知识 01】消息队列介绍+Kafka架构及核心概念(图片来源于网络)
81 2
|
4月前
|
并行计算 TensorFlow 算法框架/工具
TensorFlow识别GPU难道就这么难吗?还是我的GPU有问题?
TensorFlow识别GPU难道就这么难吗?还是我的GPU有问题?
91 0
|
4月前
|
TensorFlow 算法框架/工具 异构计算
Windows部署TensorFlow后识别GPU失败,原因是啥?
Windows部署TensorFlow后识别GPU失败,原因是啥?
48 0
|
6月前
|
数据采集 数据安全/隐私保护
Haskell网络编程:从数据采集到图片分析
爬虫技术在当今信息时代中发挥着关键作用,用于从互联网上获取数据并进行分析。本文将介绍如何使用Haskell进行网络编程,从数据采集到图片分析,为你提供一个清晰的指南。
Haskell网络编程:从数据采集到图片分析
|
5天前
|
分布式计算 资源调度 Hadoop
Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】(图片来源于网络)(hadoop fs + hadoop dfs + hdfs dfs 使用举例)
【4月更文挑战第5天】Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)Hadoop【基础知识 04】【HDFS常用shell命令】(hadoop fs + hadoop dfs + hdfs dfs 使用举例)
31 9
|
6天前
|
分布式计算 资源调度 Hadoop
Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)
【4月更文挑战第4天】Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)
19 4
|
1月前
|
存储 测试技术 C++
P2P网络下分布式文件共享场景的测试
P2P网络下分布式文件共享场景的测试
32 6
|
1月前
|
消息中间件 存储 缓存
Kafka【基础知识 02】集群+副本机制+数据请求+物理存储+数据存储设计(图片来源于网络)
【2月更文挑战第20天】Kafka【基础知识 02】集群+副本机制+数据请求+物理存储+数据存储设计(图片来源于网络)
28 1

热门文章

最新文章