对话IBM Project Debater顶尖科学家,揭秘首个能与人类辩论的AI系统

简介:

4cc7572b419571cab6efbc5be482c51946027682

IBM海法研究院Project Debater 首席研究员Noam Slonim博士(左)、Project Debater 全球经理Ranit Aharonov博士(右)

还记得Project Debater吗?IBM今年推出的首个能与人类辩论的AI系统。

今年6月,Project Debater参加了在旧金山举行的与人类辩论高手PK的公开辩论赛。在没有提前获知辩题的情况下,Project Debater依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。智能进化论曾做过详细报道,《AI首次实现与人类辩论,IBM Project Debater真正想突破的是什么?》

9月7日,进化君视频采访了Project Debater团队的几位科学家,包括来自以色列IBM海法研究院的Project Debater首席研究员Noam Slonim博士、Project Debater团队经理Ranit Aharonov博士,以及IBM AI Tech副总裁Aya Soffer博士。

IBM为什么要研究会辩论的AI?Project Debater遇到的难题是什么?创新在哪里?下一步将如何发展?关于外界关注的这些问题,几位科学家用通俗易懂的表达做了详尽解释。

5ad0667d43697e1e717ac05dc22c61903da79dc5

IBM为什么要教机器辩论?

当Watson 2011年在《危险边缘》(Jeopardy!)益智问答中击败人类选手后,IBM的AI研究人员便开始寻找下一个具备重大挑战的研究领域。科学家们希望,新的方向既要与人类实际生活相关,在难度上又要超越AI此前能够解决的挑战。

虽然公开辩论不是一个常见的场景,但辩论的能力却是人们制定决策的关键,不管在日常生活还是工作中。被誉为批判性思维(Critical Thinking)圣经之作的《学会提问》一书中指出,无论总统还是普通人,都要面临一个问题,那就是当别人告诉你要做A,要做B,甚至A和B 是相反的意见时,我们需要运用批判性思维,在这些不同的意见中做出独立的明智的决策判断。

Aya Soffer博士介绍,“真实世界中,我们并不需要像《危险边缘》那样完成很多琐碎的知识问答,而是要回答真正重要的问题,并做出真正重要的决策。决策的重要性决定了我们确定要把辩论功能作为AI的下一个重大挑战去做相关研究。”

此外,辩论还是一个开放式的挑战,这与之前AI所解决的挑战都不同。此前,不论益智问答还是下围棋、玩电脑游戏,这些活动都有明确的衡量输赢的标准。辩论则像在真实世界中做商业决策一样,没有清晰的以绝对的分数高低衡量输赢的简单标准。

由此,Project Debater的应用主要集中在两个领域,第一是有研究、分析、收集信息需要的人士。如金融分析师、律师、记者、科学家等。他们需要就某一个主题寻找相关信息,并且以相关的方式去组织这些信息,了解其利与弊。

第二个是需要做决策的领域,比如企业董事会成员和高级管理人员。往往他们要做决策是自己尚未充分了解的内容,面临非常多的信息。Project Debater可以帮助他们迅速了解一个问题的正反两面,做出更好的基于证据、基于关键信息的决策。

Project Debater团队经理Ranit Aharonov博士表示,“由AI辅助去解决大多数不是非对即错、非赢即输的问题,将是AI将来发展的一个方向。”而辩论本身不是为了输赢,而是为了获得更多的决策角度。

“基于循证、基于证据的决策,这是非常大的待开发的AI领域,所以可以通过辩论去实现这一个领域的落地。”Aya Soffer博士强调。虽然有着广泛的应用场景,科学家们也表示,目前Project Debater还处在研究初级阶段,没有商业应用的计划。但是,Project Debater具备的自然语言理解相关的能力,会进入到Watson产品为更多企业服务。

ded20db0821693434ee0fa9af78ff71f0f004cec

IBM海法研究院Project Debater 首席研究员Noam Slonim博士(右)、Project Debater 全球经理Ranit Aharonov(左)接受视频采访

Debater是如何应对即兴、不可预测的辩论内容的?

在6月份旧金山的公开辩论赛中,Project Debater事先没有拿到任何辩题。和人类选手一样,拿到辩题后只有30分钟的准备时间。在这期间,Project Debater需要首先分析辩题,然后扫描拥有3 亿多个可靠信息来源的庞大语料库,通过算法找出与辩题相关性最高的观点性内容,同时减少重复信息,最终形成有说服力的论点和支撑论据。

这一过程中,Project Debater主要依靠三大能力:一,数据驱动的演讲稿撰写和表达,即从大量语料库中寻找素材并撰写结构良好的演讲内容;二、听力理解,能够识别长段连续口语中隐含的重要概念和观点,这与只需要听懂一句话的语音助手完全不同;三、模拟人类困境(dilema),针对性地提出有原则的论点。

在自由辩论环节,Project Debater很难预测对方会怎样说。那么,它是如何实时应对完全即兴的、不可预期的辩论内容,并做出针对性的反驳的?这可以说训练Project Debater辩论时最大的挑战。

Noam Slonim博士详细解释了Project Debater如何应对这一挑战:通过构建知识图谱,针对不同论证中的共同点建模,形成辩驳的能力。

“举个例子,比如说涉及到是否要禁止人体器官贸易,是否要禁止酒精贸易。人们可以自然而然地推断出,如果禁止相关交易,将导致黑市蓬勃发展的风险。模拟这一场景,可以为Project Debater建模,当遇到类似有关禁止类型的辩题时,Project Debater就可以依据模拟好的知识图谱,等待着与黑市相关话题的出现,然后去寻找与黑市相关的论证就可以了。”

但是事情没有这么简单。比如美国最近讨论比较多的热门话题,是否禁止在公共场合母乳喂养。同样是禁止相关内容,但跟黑市一点关系都没有。

“所以我们需要在这些方面不断去建模、扩大语料库,包括人类丰富的语言中各种细微和微妙的地方。这样Project Debater在已经建模的知识图谱中,才能够更加精准地为自己导航,找到支持自己论点的内容。”Noam Slonim博士强调。

Project Debater的学习模式

学会辩论的Project Debater是否会像Alpha Go那样能够自动学习,越来越聪明?

科学家们解释说,Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型,其典型特点就是在没有人为指导的情况下,通过不断的“试错”获得反馈来提升任务性能。但反馈需要明确的衡量标准,比如会导致游戏赢还是输。

但是Project Debater的辩论场景是开放式、不是非赢即输的,人们对于辩论陈述的好坏评价是非常主观的判断。进化君理解,Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络(DNN)和弱监督都要用到有标签的数据去培训机器做出正确的回答。

据介绍,除了人工标签,研究人员还教会Project Debater通过关键词判别标签,比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达,这就判定为属于陈述内容。科学家开发了多种工具和方法,以弱监督方式训练DNN,以获得训练需要的大量人工标记的高质量数据。

此外,Project Debater是否会向人类中的一级辩手中学习?

Ranit Aharonov博士表示,“在涉及到通过建模去模拟人类困境的时候我们听取顶级辩手的意见,参考他们是如何应对在同样一个话题下不同观点的冲突。”

f8a9da8a73bddc3383e6b1e970e987319e360b71

Project Debater的构成要素与潜在应用(来源:IBM海法研究院)

Project Debater的下一步,让人工智能更像人

作为项目的首席研究员,Noam Slonim博士加入IBM已经11年了,自2012年至今都专注于Project Debater的研究。虽然Debater团队成员已经在各种高质量科学会议上发表了30多篇作品,并开创了计算辩论(Computational Argumentation)这一全新领域,但Noam Slonim博士认为Project Debater处在早期的阶段,有长足发展空间。“有太多有趣的问题等着我们去发掘。就计算辩论本身而言就有太多有趣的问题。”

Noam Slonim博士认为,在亚里士多德提出的辩论三元素(logos逻辑、pathos情感、ethos可信)中,目前的AI研究还需要超越logos(逻辑)阶段。

Project Debater的最终目标也许并不是让机器像人一样自由辩论或者比人辩论得更好,而是促进AI在语言理解领域的研究。语言理解一直都AI领域的重点,也是IBM在AI研究方面关注的重点。科学家们认为,目前所有企业在这个方面的研究还远远不够。

“Project Debater下一步是怎么样的,就是要让人工智能更像人。我们希望AI下一步的发展是从比较窄的例子上学习,扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。不是仅仅是再学习的能力,而是自己去推理的能力。”Aya Soffer博士表示。


原文发布时间为:2018-09-25

本文作者:进化君

本文来自云栖社区合作伙伴“趣味科技v”,了解相关信息可以关注“趣味科技v”。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 监控
AI算法分析,智慧城管AI智能识别系统源码
AI视频分析技术应用于智慧城管系统,通过监控摄像头实时识别违法行为,如违规摆摊、垃圾、违章停车等,实现非现场执法和预警。算法平台检测街面秩序(出店、游商、机动车、占道)和市容环境(垃圾、晾晒、垃圾桶、路面不洁、漂浮物、乱堆物料),助力及时处理问题,提升城市管理效率。
AI算法分析,智慧城管AI智能识别系统源码
|
1月前
|
人工智能 搜索推荐 机器人
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
【2月更文挑战第24天】Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
28 2
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
|
5天前
|
人工智能 前端开发 Java
Java语言开发的AI智慧导诊系统源码springboot+redis 3D互联网智导诊系统源码
智慧导诊解决盲目就诊问题,减轻分诊工作压力。降低挂错号比例,优化就诊流程,有效提高线上线下医疗机构接诊效率。可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。
38 10
|
16天前
|
机器学习/深度学习 人工智能 运维
构建未来:AI驱动的自适应网络安全防御系统
【4月更文挑战第7天】 在数字时代的浪潮中,网络安全已成为维系信息完整性、保障用户隐私和确保商业连续性的关键。传统的安全防御策略,受限于其静态性质和对新型威胁的响应迟缓,已难以满足日益增长的安全需求。本文将探讨如何利用人工智能(AI)技术打造一个自适应的网络安全防御系统,该系统能够实时分析网络流量,自动识别并响应未知威胁,从而提供更为强大和灵活的保护机制。通过深入剖析AI算法的核心原理及其在网络安全中的应用,我们将展望一个由AI赋能的、更加智能和安全的网络环境。
28 0
|
1月前
|
人工智能 算法 搜索推荐
构建未来:AI在持续学习系统中的创新应用
【2月更文挑战第30天】 本文聚焦于人工智能(AI)技术在持续学习系统(CLS)中的前沿应用,探讨了AI如何促进个体和组织的知识演进与技能提升。通过分析自适应学习算法、数据驱动的个性化推荐以及智能辅助决策支持等关键技术,揭示了AI在推动终身学习和知识管理领域的创新潜力。文章还考察了这些技术在实际部署中面临的挑战,包括数据隐私保护、算法透明度和系统集成问题,并提出了相应的解决策略。
23 3
|
1月前
|
机器学习/深度学习 存储 人工智能
构建未来:AI在持续学习系统中的创新应用
【2月更文挑战第29天】 在人工智能的不断进步中,一个引人注目的领域是持续学习系统(Continuous Learning Systems, CLS)。这类系统旨在模拟人类学习过程,允许AI模型在不断接收新信息的同时,保持并增强其先前的知识。本文将探讨AI在持续学习领域的最新技术进展,分析其对现有教育模式、工业应用及个人发展的深远影响,同时提出当前面临的主要挑战和潜在的解决方案。
19 1
|
1月前
|
机器学习/深度学习 人工智能 算法
构建未来:AI驱动的自适应网络安全防御系统
【2月更文挑战第27天】 在数字化进程加速的背景下,网络安全威胁日益增长,传统的安全防御机制逐渐显得力不从心。本文提出一种基于人工智能技术的自适应网络安全防御系统架构,旨在通过实时分析网络行为和自动调整防御策略来应对复杂多变的网络攻击。该系统利用机器学习算法对异常行为进行检测与分类,并结合深度学习技术实现攻击模式的预测和响应策略的动态优化。文章详细阐述了系统的设计理念、关键技术以及预期效能,展望了AI技术在网络安全领域应用的未来趋势。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
构建未来:AI驱动的自适应网络安全防御系统
【2月更文挑战第26天】 在数字化时代,网络安全已成为维护信息完整性、确保业务连续性的关键。随着攻击手段的不断进化,传统的安全防御措施已不足以应对日益复杂的威胁。本文将探讨人工智能(AI)如何革新网络安全领域,构建一个自适应的防御系统。通过分析当前网络威胁的演变趋势,结合AI技术的实时数据分析、模式识别和自我学习能力,提出一种智能化的安全框架。该框架能够动态调整安全策略,预防未知攻击,并减少误报,从而为网络环境提供更加坚固的保护。
|
1月前
|
机器学习/深度学习 存储 人工智能
构建未来:AI在持续学习系统中的应用
【2月更文挑战第24天】 随着人工智能技术的飞速发展,持续学习系统(Continuous Learning Systems, CLS)已成为AI研究的前沿领域。这类系统旨在模拟人类学习过程,实现机器学习模型在学习新任务时不遗忘旧知识的能力。本文将深入探讨AI在构建持续学习系统中的关键技术和挑战,包括知识蒸馏、正则化策略、记忆增强网络等方法。通过这些技术,AI能够逐步建立起类似人类的学习曲线,为未来的自适应和普适性学习铺平道路。
|
1月前
|
存储 人工智能 自然语言处理
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据Gartner报告,到2025 年60%的B2B 销售组织将从基于经验和直觉的销售转变为数据驱动的销售,将销售流程、销售数据、销售分析合并形成一致的运营实践。
402 0
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统