自从AlphaGo击败李世石,人工智能(AI)的概念再次进入大众视野,2016年也实至名归地被誉为人工智能新元年。之后的一年多来,人工智能的浪潮一浪高过一浪,一个又一个引人瞩目的成果得到了工业界和学术界的广泛关注。有人欢呼人工智能可能会创建美好的未来,也有人预测人工智能会对人类构成极大的威胁。人工智能进入一个新时代的同时也带来了很多泡沫,这已经是不争的事实。从事人工智能的研究者不得不思考,如何才能刺穿泡沫,促进人工智能的健康发展,避免短暂繁荣后再度陷入低谷的窘境。
人工智能的期待与现实
AlphaGo的成功震惊了世界。时隔一年,冷扑大师又在德州扑克人机大战中战胜了久负盛名的龙之队。AlphaGo的成就展现了深度强化学习模型的威力,而冷扑大师却采用了完全不同的技术,使得人们对人工智能算法和模型的能力更加刮目相看。但这些人工智能技术只是在一个专项任务上取得了成功,在这些任务上,人工智能相比人类具有较大的优势。但通用意义(general-purpose)上的人工智能还非常遥远。
既然通用意义的人工智能还很遥远,那么当下对于人工智能我们能够期待什么?看看世界级大师怎么说。国际人工智能大会IJCAI 2015年优秀研究奖(Award for Research Excellence)获得者,哈佛大学芭芭拉·格罗斯(Barbara J. Grosz)教授在2016年IJCAI大会上作了“从图灵测试到智能合作伙伴”(From the Turing Test to Smart Partner)的获奖报告。她在报告中说,如果图灵先生现在还健在,关于人工智能他可能会说:“Agents and people work together on nontrivial task, extended in time, in an uncertain, dynamic environment。”她的报告主题很明确:人工智能将是人类的伙伴,而不是取代人类。另一方面,通用人工智能是我们的理想,但更多的时候人工智能系统都是以特定任务为目标,在特定领域内进行优化的。这也是我们近期应该有的期待。
那么现实是怎样的呢?今天的人工智能发展现状与趋势很难确切地说是处在春天、夏天还是秋天。但是可以肯定地说不是冬天,而且,全人类都不想它再次进入冬天。如果我们将人工智能最新技术落地,让大众感受到生活上的改变,让人们真正体验人工智能的“智慧”,那么人工智能将进入金色的秋天;如果我们不做落地的实事,或者做得不够好,研究果实落地腐烂,被人摈弃,那么人工智能就将面临冬天了。我们认为,这类和产业结合,产生社会效应和生产价值的,给人类生活带来实质性变化的工作是人工智能最后一公里的工作。例如,现在的各种服务机器人只能回答一些指定类型的简单问题,离真正的“智能”还很远,我们期待的是问答/对话机器人能够真正渗透到各行各业的信息服务系统中,能够大幅减少机械重复的人力(80~90%),产生明显的社会效益和经济效益,改善用户体验,提高人们的办公与生活效率,甚至改善人类管理与生活模式, 让用户真正地称为“智能”。
2016年IJCAI优秀研究奖获得者,加州大学伯克利分校迈克尔·乔丹(Michael I. Jordan)教授的获奖报告“对机器学习的过去、现在和未来的几点思考”(Some Thoughts on Machine Learning Past, Present and Future)的主要内容之一,是“人工智能研究与系统研究”(AI research meets systems research)。报告中强调,人类不是孤立的,孤独的人将会丧失很多能力。同样,机器人也不能是孤岛,应该是智能体组成的智能系统。最重要的是协同,人机协同,机器与机器协同。单个智能设备的表现是有限的,只有将一系列智能设备进行无缝融合,才能展现更有力的智能,将个体智能发挥到极致。例如,现在到处可见的可穿戴设备,用户可以用这些设备获取各种数据,得到各种曲线。但是单独的一条曲线又能说明多少问题呢?只有在基于个人信息的基础上将多种数据进行有机的融合,给出综合性意见和建议,并且落地到医院等医疗机构,构成闭环,才能够真正地达到服务人类健康管理的目的。只有这样,才能够使人们对其产生依懒。同样,机器与机器之间也需要协同,两个人合作能够做的事情比一个人能做的要多得多。这样简单的道理在机器人上实现,并且做到无缝合作,还需要很大的努力。
可交互系统:人工智能进入生活的入口
简单地分,人工智能可以由三个阶段构成:感知、认知、自主。
首先,自主智能是我们的最终理想,全人类投身人工智能领域的研究者都在为此而努力。如果达到了自主智能,我们或许真的要考虑如何制约人工智能技术,避免毁灭人类的事件发生。
其次,随着互联网、移动互联网等产业的发展,产生了海量的大数据,加上GPU等计算机硬件技术的突破性发展,深度学习技术脱颖而出,给人工智能带来了一系列革命性的进展。尤其在感知智能方面,很多技术已经相当成熟,并成功地应用到相关产业中,取得了很好的效果。例如,语音识别技术已经深入到以手机为代表的各种移动互联网设备,以新型人机交互方式在改变着人类使用机器的理念,为新一代人机交互方式的发展奠定了基础,提供了良好的平台。视频图像处理的突破也是有目共睹。目前,已经有报道称机器能够从图片中分辨1000多种类型的实体,人脸识别、姿态识别、人体跟踪等技术也都很成功地应用到各种识别、监控场景,包括自动通关、社会安保、刷脸支付,等等。相比较而言,触觉方面的进展进入大众视线的机会要少一些,但是,真正的智能机器人对触觉的依赖,以及对关节控制的依赖,绝不低于对视觉、听觉的依赖。人工皮肤等一系列传感器也发展到了新的阶段,能够很好地感知机器人所触摸到的物质的各种特质,完成更多灵巧的操作。因此可以说,在感知智能方面的技术已经相对成型,进入到应用阶段了。
众所周知,人工智能从感知智能到认知智能就是要让机器人能够理解,能够思考,能够交流。这是目前人工智能研究的中心环节。从学术研究的角度,图灵测试某种意义上就是以问答的形式定义的。因此,人工智能是从问答开始的。从技术应用的角度,对话是人机交互最方便的一种形式,因此是智能人机协同的入口。
人机交互系统可以分为三种类型:问答、对话、可交互系统。问答系统最单纯,就是一问一答,理解了问题,知道什么就说什么;对话系统是有问有答,包含上下文逻辑,可以从反问中获得答复或决策所需内容,填补原有用户输入需求中的信息缺失,最后达到预期的目标;可交互系统是更加复杂的对话系统,它不仅仅包含对话,还包含对系统一些行为的规划与控制。例如,我们协助企业做的未来厨房系统,就是希望帮助人们摆脱在厨房中辛苦劳累的感觉,让厨房里的时光也能够很轻松愉快。
那么,在厨房里,机器可以帮你做什么呢?主人要请客,它可以帮你确定菜单。此时,机器人会综合考虑所有相关因素,包括家里有几个人,平时都吃什么,访客人数、年龄、性别、有无特殊要求或疾病禁忌,用餐时间(中午或晚上),家里现有的食材,可消耗的珍藏物品等等。机器人经过分析这一切相关条件,组合优化后推荐出一个菜单,然后,再和主人进行细节的交流、修改、确认。之后可以直接连接电商采购补充食材等物品,同时安排制作的流程,给出操作细节。当天操作时,还可以根据菜谱非常贴心地指导你烹饪。这就是一个互动系统,整个事件在机器人的协助下进行规划和实施。
现在,诸如此类的任务遍布各行各业,类似的事情机器可以做,而且可以做得比较好了。但是,更自由一些的、融入更大范围信息的个人助理的工作还有不少差距。能否做到类似私人助理,帮助用户规划假期,规划出行等等,还是值得探讨的。
2011年在北京召开的SIGIR大会上有一个问答系统的workshop,会议结束时,组委会成员一起畅想未来的人工智能可以做什么。大家假设有一个叫Mary的小女孩,她有2个小时的空闲,人工智能能帮她做什么,会用到哪些信息?结果发现,涵盖的信息面非常广,包括年龄、性别、爱好、时间、地点、天气、季节等一系列属性信息;还有与Mary相关的社交网络的信息,包括,周边有Mary的朋友吗?是否推荐Mary加入他们?当然还有Mary生活的历史信息,例如,附近有没有Mary喜欢看的电影刚好上映,而且必须是她还没有看过的;如果时间间隔合适的话,是不是可以推荐她去健身。诸如此类,各种因素全面考虑之后,人工智能机器人能否给出一个组合优化后的最佳推荐方案?时间已经过去了6年,像这样全方位打通信息链条的个人助理的工作,还没有哪个系统能够完成,更不用说是否能够达到预期的效果。因此,可交互系统也好,个人助理也罢,还有很大的发展空间,有待大家去努力。
希望当我们年老的时候,有一个机器人小精灵,能够陪伴在我们身边,帮我们叫个外卖,给儿女拨个电话,当身体不适时可以跟小区健康中心的护士咨询一下该怎么办;闲下来的时候帮忙选部电视剧或电影,或者将我们拉入老友的八卦群里,听听故事,等等。总之,有人陪伴总是好事。
随着人工智能技术的发展,人工智能终将成为人类的好伙伴。可交互系统可以提供一种自然、便捷和融洽的方式,使得人类和机器伙伴进行协同和共融。虽然从技术发展的角度还有很长的道路要走,但我们坚信这一天总会到来。 ■
所有评论仅代表网友意见