找回密码

揭秘IBM AI辩手:AlphaGo之后新的里程碑?

发达的AI,应该不仅从大数据,还能从小数据,甚至未来能把概念进行学以致用的应用。“我们希望AI进一步发展这个能力,从比较窄的具体例子中学习,而后扩展到比较宽泛的领域。

2018年6月的一天,在IBM公司旧金山办公室内,一场人机辩论大赛如期举行。

辩论赛的主角叫做“Project Debater”,这是由IBM位于以色列的海法研究院为主的科学家们历经六年研发的能进行复杂辩论的AI系统。辩论另一方是以色列国家辩论冠军Noa Ovadia和以色列国际辩论协会主席 Dan Zafrir。

Debater与两位人类辩手进行了两场辩论,辩题分别是“我们是否应该资助太空探索”、“我们是否要增加远程医疗的使用”。两场辩论分别有三个固定环节:4分钟陈述自己论点,4分钟反驳对方论点,2分钟总结陈词。现场观众通过投票支持各方观点,决出胜者。

意料之中的事情还是发生了,机器辩手Debater在主题为“是否应该增加使用远程医疗”的辩论中最终扭转了更多的现场观众最初观点,赢得了辩论。

近日,网易智能有幸对Debater团队几位主要研发者进行了采访,详细了解了Debater的研发过程、主要技术能力,以及未来应用前景。

1

计算辩论的崛起

其实,这早已经不是人类第一次被机器战胜。

早在1997年,IBM研发的超级计算机深蓝(Deep Blue)在国际象棋比赛中击败了世界冠军加里.卡斯帕罗夫(Gary Kasparov)。

2011年,IBM人工智能系统Watson在益智游戏节目《危险边缘》(Jeopardy!)中击败了两位最优秀的人类冠军。

2015年,DeepMind研发的AlphaGo击败了人类围棋冠军李世石,第一次在围棋上赢得了冠军。紧接着在2016年,DeepMind又打败了更强大的中国围棋冠军选手柯洁,再一次证明了AI的实力。

近两年,人机大战持续火热,不管是德州扑克大战中的人工智能“冷扑大师”(Libratus)赚的盆满钵满,还是OpenAI研发的AI系统在Dota游戏争霸赛击败人类冠军,AI在游戏领域的已经玩到了极致。然而,辩论不是简单的非黑即白的博弈。

IBM把Project Debater称为人工智能的又一个里程碑。IBM研究院海法研究院AI Tech副总裁Aya Soffer表示,辩论是一个开放式的挑战,这与之前AI所解决的挑战是不同的。之前的挑战会有一些具体的衡量工具,比如说去判断是赢是输,传统的技术可以直接帮助制定相应的衡量工具,并且判断输赢。而在辩论中是没有办法做这样的打分,在辩论中就像在实际中做商业决策一样,没有清晰的以分数高低衡量输赢的简单标准。这就对机器的语言文字理解能力和决策能力要求非常高。

IBM为什么要研发一台有辩论功能的计算机?Aya Soffer解释说,IBM会不断地去寻找在AI领域的重大挑战是什么?“我们是以寻找到的重大挑战来引领下一个计算机功能的选择。”Aya Soffer认为,在真实的世界中,我们并不是需要回答很多琐碎的问题,而是要回答真正重要的问题做出真正重要的决策。信息是海量的,但是找到那些能助力我们做出正确决策的信息是难的。因此,决策的重要性决定了我们确定要把辩论功能作为AI的下一个重大挑战去做相关的研究,并且能够使得我们的AI发展让它拥有辩论的用途和功能。

IBM研究院海法实验室AI Tech副总裁Aya Soffer

在辩论现场,虽然机器在很多方面都表现地不太自然和磕绊,但AI辩手传递信息量的丰富度则优于人类,这场史无前例的事件也让业内注意到计算机如何学习并应对非结构化的人类决策世界。

据悉,目前有50多个不同的研究团体都是在做计算辅助辩论方面的研究。但是自2014年以来,IBM已经组织了第五次辩论数据挖掘研讨会,Debater团队成员在各种高质量科学会议上发表了他们取得的技术进步,目前已在各个研究领域发表了30多篇作品。计算辩论(Computational Argumentation)正在迅速崛起。

2

演讲、听力理解、模拟困境

Debater首席研究员Noam Slonim博士在采访中回顾了辩论过程。

拿到辩题后,Debater首先会分析单个辩论问题,然后扫描庞大的语料库文档,通过算法找出与辩题相关性最高的观点性内容,同时通过算法减少重复信息。在此基础上,Debater会挑选出最有说服力、最具多样性和支持最完善的论点,并对这些论点进行编排,从而形成一段完整且有说服力的叙述。

也就是说,辩论虽然是实时辩论,但是机器辩手和人类辩手在拿到选题后都会有30分钟的准备时间。30分钟之内,Debater会通过自己的算法,在自己的语料库中去进行搜索,形成有利于自己方面论点的论证。

既然辩论过程是完全即兴,Project Debater如何应对完全即兴、无法预期的情况?Noam表示,这要靠知识图谱去模拟人类的困境,形成辩驳的能力。比如说涉及到是否要禁止器官的贩运、器官贸易,是否要禁止酒精的贸易。类似于这种类型的辩题,我们可以自然而然期待如果禁止了器官交易、酒精交易,有一种风险是会有黑市的蓬勃发展。理论上来讲,Project Debater的系统可以理解与这种类型相关的一些辩论,但凡是针对这种类型的观点进行辩论,后续就会有可能出现与黑市相关的问题,于是可以在模拟好中的图谱等待着与黑市相关话题的出现。但辩论并不总是这样,比如美国最近讨论比较多的是否要禁止在公共场合母乳喂养,但这跟黑市一点都没有关系,所以我们依然是在这个方面不断地去建模、扩大语料库,包括人类丰富的语言中各种细微和微妙的地方。“这样Project Debater在已经建模的知识图谱中,才能够更加精准地为自己导航,找到与支持自己论点相关的观点。”Noam说到。

那么,Debater的论点是怎么形成的?Noam表示,对于给定的主题,Project Debater的系统会在巨大的知识库内进行搜索,寻找最相关的观点和证据,然后在其中选择最吸引人、最多样化、支持度最高的论点,然后把这些构建成一个完整的观点加以叙述。与关键词搜索不同,Debater能对话题即时产生更深理解,并基于它的搜索结果等构建自己的观点。

强大的语料库是Debater展开辩论的基础。据悉,训练Debater的语料库拥有3亿多个可靠信息来源,包含2011年以来全球商业、法律、学术和政府机构等领域的专业人士所使用的主流报纸和杂志中的文章,以及维基百科中的内容。

IBM研究院团队为Debater的系统赋予了三大核心能力:

第一,驱动的演讲稿撰写与表达。Debater第一次证实了,计算机能够理解大量语料库,若给定一个有争议的主题的简短描述,它能够撰写结构良好的演讲内容,并清晰且有针对性地表达出来,甚至还会适时地展现幽默风趣。

第二,实时听力理解。当对方辩手开始讲的时候,Project Debater要能听长达4分钟的内容,对方人类辩手在讲的过程中语速可能是快的,情感可能是充满激情的,同时还会有一些道德性、伦理性的问题,Project Debater要能够识别人类辩手口述的长篇大论中隐含的重要概念及观点主张,能够识别长段连续口语中隐含的重要概念观点。

第三,模拟人类困境。通过独特的知识表达方式来模拟人类争议和困境,使系统能够根据需要提出有原则的论点。研发团队总结了人类专家辩手的一些共同性,对他进行模拟、建模,并且把这个注入到系统中去,就形成了一个知识图谱给到Project Debater来用。所以一旦开始去进行辩论的时候,Project Debater就可以在已经形成的图谱中去做自己的向导和索引,找到可以支撑他的证据。

3

商业价值与AI未来发展

Debater全球经理Ranit Aharonov阐述了如何将Project Debater应用到商业中。

关于商业运用,Debater仅仅预示着一个开始,目前主要有两大类用途。

第一类是应用在有研究、分析的领域,比如帮助金融分析师找出金融事实,用以支持或反对金融分析师所思考的金融投资选择;帮助律师寻找相关案件和主张,或借助Project Debater模拟法庭辩论来分析优势和劣势;帮助记者或学生找出更多信息以改进报告和论文。

第二类是决策领域的应用,比如帮助企业高层分析优劣势,提供基于事实、没有人为偏见的观点。或者通过Debater拓宽思路,在关键决策中纳入他们可能没有考虑到的新观点。“不管是信息的收集、研究分析还是做决策,总的来讲,Debater最终的目的是支持基于循证的决策,而不是基于直觉的决策。”

Ranit同时表示,Project Debater相关的项目和技术依然在进行进一步深耕之中,其商业应用仅仅是一个预设。“现在商业化为时尚早,也没有具体的计划。”

Noam表示,Debater虽然已经研发了六年,但目前仍然是在不断再开发、再开发过程中,在工程、算法上依然有很多的挑战。比如,目前的Debater只能参与一对一辩论,无法跟大规模选手辩论。。

Debater是否真正理解对方辩手的话?当网易智能把这个问题抛出的时候,Ranit笑着回答说,这是一个哲学高度的问题,因为这涉及到我们如何去理解AI的理解能力。“从结果上来看,当我们就是否要为太空探索来提供资助提出辩论的时候,AI也能听,也能回应,也能形成自己的观点去辩论,它所展示的是理解了对方讲的话的理解能力。但是如果当我们说理解是指人类之间的理解,比如我理解你、你理解我的这种理解、内心的理解,意识到对方和心理过程的理解,AI目前是没有这个理解能力的。”

在谈到Debater所代表的AI的未来发展方向,Aya Soffer向网易智能表达,希望让人工智能更像人。人之所以能够从小数据中学习,就是因为人可以去理解概念,并且在概念的基础上学以致用到新的领域,这种开放域的应用能力是非常强的。发达的AI,应该不仅从大数据,还能从小数据,甚至未来能把概念进行学以致用的应用。“我们希望AI进一步发展这个能力,从比较窄的具体例子中学习,而后扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。”Aya说到。

重要提醒:文章部分内容及图片来源于网络,我们尊重作者版权,若有疑问可与我们联系。侵权及不实信息举报邮箱至:aiskr@aiskr.com

相关推荐