蓝色巨人的人工智能发展史:沃森为名,数据为实

简介:

对于IBM的“认知”AI雄心,Jeopardy问答竞赛仅仅是个开端。

一位数据专家在如今的企业领域确立了自己的名号,同时亦引发了广泛关注。他拥有着闪电般敏捷的思维与极强的学习能力,会说八种语言,并在多个方向上具备深入理解。他拥有着一套堪称典范的工作思路,阅读速度极快,同时拥有着他人所无法企及的洞穴能力。就个人而言,他是一位全方位的发展的通才,甚至能够提供相当靠谱的约会建议。

这位大牛到底是何方神圣?沃森,IBM的沃森。

作为继承IBM公司首次CEO的重要开发成果,沃森于2007年正式诞生,不过当时其仅属于IBM研究部门开发的问答系统中的组成部分之一,而这套系统的终极目标则是参加美国电视问答节目“Jeopardy”。然而自2011年成功战胜各位人类选手之后,沃森的功能已经得到显著扩展。回顾当初,沃森还仅仅拥有单一核心能力,即以自然语言回答由人类提出的问题; 但如今,沃森已经能够跨越语言、语音、视觉及数据分析等范畴提供数十项服务。

沃森目前使用总计约50项技术,其中包括机器学习、深度学习、神经网络、自然语言处理、计算机视觉、语音识别与情绪分析等多项人工智能相关技术。不过在IBM公司看来,沃森并不仅仅是一套AI解决方案——事实上,蓝色巨人更倾向于使用“认知”这一术语对其进行描述。不同于必须以编程方式执行任务的现有计算机,沃森正努力以人类的方式理解这个世界——包括通过感官、学习与经验,IBM方面解释称。

“当我们提到‘认知’时,我们所指的是其能够学习、理解、溯源并互动,”IBM公司沃森平台主管Steve Abrams表示。“沃森能够利用人员、数据或其它系统实现以上几项目标。”

凭借着每秒超过8000万页内容的读取能力,沃森系统能够分析极为庞大的数据规模——荐包括非结构化数据——且整个处理过程包括理解自然语言、利用证据建立假设并随着分析推进而不断学习。

很多人会将沃森想象成一个巨大的“大脑”,其身处IBM公司研究设施核心之内,但实际情况却并非如此。

“将沃森称为一台认知计算机其实并不准确,或者说是种过分简单化的理解方式,”Endpoint Technologies公司首席分析师Roger Kay表示。“其真正的能力在于组织特定领域的资源,并通过自然语言接口保证相关信息可直接服务于人类。”

其中“认知”的部分在于,沃森能够“利用自身知识经由AI与机器学习算法为用户的问题找到潜在答案,”Kay进一步补充称。“IBM公司目前的成果在于打造出一套巨大的引擎,专门用于实现此类分析; 此外,其还提供了一种相当简单的使用规程,并为最终用户准备了非常直观的人类使用界面。”

时至今日,沃森已经可以被视为一套云工具,他指出:“这是一项由IBM运行的强大功能,且可通过网络进行访问。”

2014年,IBM公司建立起专门的沃森事业部,其全球总部位于纽约市,主要负责这项技术的推广与商业化工作。第二年,也就是2015年,位于波士顿的医疗部门与位于德国的物联网总部亦相继建立。目前,沃森已经可通过云端以及约30种应用编程接口(简称API)供合作伙伴及开发人员使用。来自世界各地超过29个行业、跨越36个国家的成百上千IBM客户与合作伙伴如今正积极以沃森为基础建立活跃项目,IBM公司指出。

沃森开发者社区目前拥有来自17个行业及学科的超过550名开发人员,其中超过100位已经开始打造商用型“认知”应用程序、产品与服务。便于超过100万开发者在IBM的Bluemix平台之上使用沃森开发者云,并借此实现新型业务构思的实验、测试与部署。IBM公司已经投入了1亿美元风险投资用于支持这一社区。

OmniEarth是一家环境分析企业,其最近与IBM公司建立起合作伙伴关系,旨在利用沃森的视觉识别服务对航空及卫星图像中的物理特征进行解读与分类,进而立足于这部分分析结论解决加利福尼亚州目前面临的干旱问题。

“从根本层面讲,我们正在观测能够掌握的户外耗水量情况,预测一块土地可能需要多少水资源才能保持健康状态,”OmniEarth公司首席数据科学家Shay Strong解释称。

根据Strong的介绍,以往对航空照片及卫星图像进行识别——包括整理特定地段中的游泳池及其它相关景观特征——需要花费大量时间并要求操作者具备相当程度的专业知识。

如今,OmniEarth公司利用一系列机器学习算法执行这项任务——一部分为自主开发,也有一部分为沃森所提供。(大家可以点击此处自行测试沃森的视觉API; 亦可点击此处了解OmniEarth公司所使用的技术。) 其中涉及大量数据——单是洛杉矶一地的数据就接近1 TB,Strong指出——但机器学习能够显著加快这一处理流程。OmniEarth公司如今能够将图像处理速度提升至原先水平的40倍,例如原本需要数个小时才能完成的15万张图片,现在12分钟左右即可处理完毕。

“沃森为我们带来了难以置信的出色效率表现,”Strong指出。

沃森还能够更好地进行规划与预算处理。举例来说,原本福尔索姆市与东湾市水域的水资源需求通过使用全州平均值进行估算,但如今OmniEarth基于AI的分析结论使其能够更为准确地提供预测。再有,沃森还在帮助各地区公共事业机构及圣安娜流域项目局等组织调整其工作计划,从而更好地引导当地居民控制自身用水量。

Macy公司最近亦成为沃森的用户。今年夏季,这家零售巨头推出了一项基于沃森的网络服务,旨在帮助客户在购物时浏览其商店页面。通过由IBM公司合作伙伴Satisfi提供的网络服务,Macy允许客户以自然语言输入内容提出各家店面内的产品分类、服务与设施等问题,而后获取对应答案。Macy公司目前正在美国本土的10家店面内试点使用这款新工具。

“我们还列出了一份长长的潜在用途清单,”这家零售商数字化媒体部门副总裁Serena Potter表示。“我们的最终目标在于实现更多其它认知服务。”

沃森目前的其它使用方式还包括“Olli”自动驾驶车辆,医疗卫生类项目以及Deep Thunder——一款专门面向企业的超级本地天气预报工具,源自IBM公司对The Weather Company的收购。

在实现这些成果的过程当中,IBM公司制定了一项核心目标,即尽可能帮助合作伙伴与开发人员免受AI相关复杂数学难题的影响。“我们认为这类问题对于开发人员而言相当不友好,毕竟大多数人并不属于机器学习技术专家,”Abrams解释称。

举例来说,沃森的自然语言分类器旨在理解人类的陈述意图,并且能够立足于特定目标进行训练。其中一项实例在于以酒店前台的立场回答问题,事实上基于沃森的“Connie”机器人已经于今年早些时候开始在希尔顿酒店进行试点推广。“沃森能够理解‘你们几点开始清理不再续房的客人’,即将其与‘客人应该几点退房’联系起来。”Abrams解释道。

然而IBM公司并非以通用方式提供这项功能。相反,IBM公司要求开发人员上传一份列有其希望沃森掌握的人类话语表格。在此之后,IBM方面将在幕后工作,即有针对性地训练智能模型。

“我们利用世界一流的机器学习技术打造出这套分类器,但我不希望其具体使用给开发人员带来困扰,”Abrams指出。“就我的立场而言,沃森其实是一整套服务集合,用于帮助开发人员构建适合自身需求的认知系统。展望未来,IBM公司将致力于推动沃森的科学技术进步,同时简化并扩展各类相关服务,”他进一步补充称。

IBM公司无疑在沃森与认知计算身上押下了重注,且其目前已经不再将其视为一类前沿性技术,而是作为自身业务的核心组成部分。

“当数字化革命全面来临时,各个行业都将拥有自己的优步、自己的特斯拉,那么大家要如何让自己在市场上独树一帜?”IBM公司主席、总裁兼CEO罗睿兰在最近的一次采访中强调称。“答案显然是认知,认知才是区分您所在企业的关键。”

就目前来看,这样的偏重应该能够得到很好的回报。根据Allied Market Research公司的预期,认知计算市场预计将在2020年产生高达137亿美元的营收。

当然,IBM公司并不是这一领域当中惟一的一家参与厂商。

“沃森所使用的各项技术正在被其它企业所复制,”Endpoint公司的Kay解释称。不过“着眼于全部AI/机器学习工具,沃森的成熟度最大且历史最为悠久。”

Abrams则表示,“我们的目标在于让认知成为计算领域的一项主要规范,并使得沃森成为其中一套最为重要的平台。”


本文作者:核子可乐

来源:51CTO

相关文章
|
3月前
|
人工智能 自然语言处理 语音技术
人工智能语音数据的多样性
人工智能语音数据的多样性
24 2
|
3月前
|
人工智能 算法 语音技术
人工智能语音数据
人工智能语音数据
55 5
|
3月前
|
机器学习/深度学习 传感器 人工智能
人工智能图像数据
人工智能图像数据
38 3
|
4月前
|
机器学习/深度学习 人工智能 算法
人工智能中数据组合采样、特征层、算法层的讲解(图文详解)
人工智能中数据组合采样、特征层、算法层的讲解(图文详解)
61 0
|
3月前
|
传感器 人工智能 自然语言处理
人工智能数据
人工智能数据
37 1
|
11天前
|
机器学习/深度学习 数据采集 人工智能
|
15天前
|
人工智能 分布式计算 Kubernetes
人工智能,应该如何测试?(三)数据构造与性能测试篇
本文探讨了人工智能场景中的性能测试,区别于传统互联网测试,其复杂性更高。主要关注点包括两类AI产品——业务类和平台类,后者涉及AI全生命周期,测试难度更大。测试重点是模型训练的性能,特别是数据模拟。需要构造大量结构化数据,如不同规模、分布、分片和特征规模的数据,以评估算法效率。此外,还涉及模拟设备规模(如视频流)和节点规模(边缘计算),以测试在大规模负载下的系统性能。文中提到了使用工具如Spark、ffmpeg、流媒体服务器和Kubernetes(K8S)的扩展项目,如Kubemark,来模拟大规模环境。最后,文章介绍了使用Golang进行异步IO操作以构建海量小文件,优化IO性能。
31 0
|
1月前
|
数据采集 机器学习/深度学习 人工智能
用人工智能和missForest构建完美预测模型,数据插补轻松驾驭
用人工智能和missForest构建完美预测模型,数据插补轻松驾驭
60 1
|
1月前
|
人工智能 算法 开发工具
预测五大数据和人工智能趋势
预测五大数据和人工智能趋势
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史
【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史

热门文章

最新文章