得益于大数据和深度学习技术的快速发展,人工智能(Artificial Intelligence, AI)热潮最近两年再度涌起。2016年初,谷歌的AlphaGo以4:1战胜围棋世界冠军韩国九段棋手李世石;2016年底至2017年初,AlphaGo的进阶版本Master在中国某围棋网站上对战中外高手,获得60连胜;紧接着,人工智能系统Libratus在长达20天的鏖战中打败4名世界顶级德州扑克玩家。一年时间里,人工智能在顶级智力博弈游戏中连续完胜人类,标志着人工智能技术达到了新高峰,也让刚刚过去的2016年成为了不折不扣的“人工智能年”。
人工智能的“创造力”
媒体和大众又一次惊呼,人工智能将要取代人类。人工智能不仅已经在一些耳熟能详的常规体力或脑力工作上开始逐渐取代人类,甚至在一些高级脑力活动中,比如诗歌、绘画、作曲等创作领域,也有了一些突破性进展。我们时常会从媒体中获悉,人工智能能写出越来越像模像样的诗歌,模仿大师画出带有鲜明艺术风格的画作,或“创造”出足以以假乱真的经典曲风的新曲子。所有这些以往被人类自以为是妙不可言、触摸灵魂和高级情感的、不可被认知只可被意会的艺术领域,好像也开始被冷冰冰的人工智能侵袭。
作为清醒的人工智能研究者和业界从业者,应当清楚当前阶段的人工智能距离“强人工智能”尚远。当前所取得的成就,大多属于在有明确规则和目标标准的人类特定活动领域中,是人工智能的理性计算能力自然扩张的结果。以深度学习为前沿代表的机器学习技术,相对于人类具有明显的计算优势。在笔者看来,人工智能在艺术创造领域上的惊喜进展,更多是基于深度学习技术的“深度模仿”,而非真正意义上的创造力。但这并不妨碍我们提出一个大胆的设想:我们能不能创造出具有真正创造力的人工智能?
乐观的人工智能研究者认为,神经网络研发者可以完全不懂相关领域,单单依靠深度学习技术以及不断增长的领域海量数据,就能在人类各个活动场域中攻城拔寨,创造力也不例外。笔者则认为,深刻理解人类创造力的内在认知机制,对于创造有创造力的人工智能至关重要。符号主义取向的基于逻辑的特定领域知识表达,在人工智能研究中仍然具有重要价值,尤其在解析人类创造力这种非常复杂的问题上;起码可以与联结主义取向的基于概率和统计的深度学习技术彼此借鉴、取长补短,更快速高效地推动该领域的发展。
心理学如何定义创造力?
创造力是一个复杂和较难界定的概念。根据最近心理学家之间形成的一个新共识,创造力被定义为对问题或情境反应的一种新颖但恰当的解决方式。而结果和过程是创造力的两个紧密相关的层面。
作为结果,创造力需要体现为一个最终产品。而且这一产品必须被认为是新颖和有用的。新颖性是创造力的主要标准,它也经常被认为是最有特色和最重要的特征。但是,创造力只有新颖性是不够的,一些令人难以置信的新颖的和非常规的想法是完全不现实的,大多被认为是伪创造性的,或者是准创造性的。
与新颖性相比,有用性通常被视为创造力的次要特征。它是创造力的必要条件,而非充分条件。有用性要求产品能够提供一些功能,这种功能适应性的标准不是毫无价值的。一个创造性产品,必须获得社会认可。除了新颖性之外,有用性应该是衡量所有创造性产品的主要标准。
人类创造力诞生的进化认知基础
地球上存在许多物种,然而只有人类拥有典型意义上的意识和创造力,并由此改变了我们所生活的这个星球。人类大脑与猿类大脑在解剖结构上并无大异,但究竟是什么使我们进化得如此具有创意?进化取向中尽管存在诸多环节和不同侧重面上的解释,比如直立行走、保存火种、食用熟食、大脑新皮层的发展等,但创造力认知基础的条件解释,更有可能给人工智能创造力研究带来直接启发。
无论进化是渐进发生的还是突然涌现的,人们都相信,旧石器时代中期是人类历史上一个前所未有的创造力时期。是什么样的认知基础条件促使人类创造力的诞生呢?
首先是语言语法的出现。人类的交流在这一时期开始从手势形式过渡到声音形式。虽然由于考古证据模糊,我们可能永远不知道语言确切是从什么时候开始的,但大多数学者认为,早期的智人甚至尼安德特人可能就已经开始使用原始语言。语法出现在旧石器时代中期,使语言变得通用。它不仅增强了与他人交流的能力,将想法由一个人传播给另一个人,还能在创造物上进行合作,从而加速了文化意义上的创新。
第二是符号推理的诞生。符号的使用为人类生活增光添色,有了符号,我们可以理解人或事物的角色,推断它们的潜在抽象意义。
第三是认知流畅性。现代思维的创造性源于认知流畅性,它使之前在功能上彼此孤立的大脑模块与自然、历史、技术、社会过程和语言发生联结。因此,随着脑容量的提高和神经元数量的增加,大脑可更多地认知微观特征,更加细节化地对认知信息进行编码。
第四是情境聚焦。人们普遍认为,现代思维兼具发散和聚合两种思维。散焦注意、激活记忆的广泛区域网络有利于发散性思维,它使模糊的(但可能相关的)信息发生作用。注意力集中有利于聚合性思维。而当个人处于困境并且进展不顺时,散焦注意力使个人能够进入更加发散的思维模式中,工作记忆扩大至更加外围的相关情况信息范围。然后,一直持续到一个潜在的解决方案出现,这时候注意力继而变得更加集中,思维变得更加聚合。
因此,一系列的情境聚焦使得人类能够调整思维方式适应新情境,或针对不同的思想以新的方式结合它们,通过聚合思维来整理这些奇怪的新组合。以这种方式,一种思维模式的果实为另一种模式提供养分,最终形成一个更加精细的世界内部模型。
最后,人类实现了内隐与外显思维间的转换。人类不仅能在既定认知领域之间水平地移动,而且能在内隐和外显思维模式之间垂直地移动。内隐和外显在认知图式上大致相当于发散和聚合思维模式。外显认知等同于诸如规划、推理和假设之类的高级能力,内隐认知与自动检测我们环境中的复杂规律、偶然情况的能力相关联。内隐认知对于构建我们的感知和行为起着重要的作用,它被认为是与创新想法建立广泛链接的桥梁,并被看作是人性的根本面之一。促成这些思维模式转换的因素可能是人类大脑前额叶皮层的扩张。伴随着扩张,相关执行功能和工作记忆容量增加。增强的工作记忆使人们可以更好地控制注意力焦点,以便在存在干扰的情形下保持任务目标。
以上是人类诞生创造力时的进化认知基础,值得人工智能研究者关注。但只了解这些对充分解析人类的创造力之谜还是不够的。探索现代人进行创造性思考时,哪些认知过程具体参与以及如何运作显得尤为重要。
创造力过程中的认知机制
作为一个思维过程,创造力需要搜索、选择新的想法和方案,去解决开放性的问题。简单讲,创造性思维过程通常包括发散性思维和聚合性思维两大认知过程。发散性思维的特点是自动的、直觉的、扩散的和启发式的,通常在想法的产生阶段出现。聚合性思维则不同,它是逻辑性的和控制性的,通常在想法的提炼、实施和测试阶段出现。客观地讲,创造力过程的认知心理学研究更侧重探析发散性思维范畴内的具体机制,对聚合性思维关注不多。下面介绍两种发挥核心作用的发散性认知机制,以及两个著名的创造力认知过程模型。
概念组合
概念组合,即先前分离的想法、概念或其他形式在心理上合并的过程。在科学、技术、艺术、音乐、文学或其他创造性领域中,组合被看作是创造性的激发物,并且在创造性成就的历史记录中经常被提及。组合的元素可以是词语、概念、视觉形式和其他简单元素,或者在更抽象层面上,可以是假设的科学结构、音乐风格、艺术风格等。组合不仅仅是被合并元素的总和,即使是一个简单的组合,如“宠物鸟”,也许就包括一种新兴的属性。组合可以产生或者涌现出任意一个组成要素缺乏或低凸显的特质。例如,“宠物鸟”可能有一个新特征,即“说话”,但会说话通常不会被认为是宠物或鸟的特征。另外,同时抱有或整合两个相反的观点,被称为雅努斯思维的认知过程,也是概念组合创新的一种典型形式,它在达·芬奇的绘画、莫扎特的交响乐和爱因斯坦的科学推理中都有所体现。
新颖的想法或解决方案通常通过结合既有的但之前并不关联的知识来创建。不相关或不同的知识和想法可以来自不同的头脑,即群体成员的集思广益,也可来自同一个人。需要特别指出的是,单个个体可以通过整合自身不同的社会身份来产生创造性想法或解决方案,即心理拼装。心理拼装可看作是由社会认同机制贡献的概念组合方式。当个体整合那些经常被认为是独立的或冲突的社会身份时(例如家庭和工作身份、性别和专业身份),便可促进心理拼装。因为每个社会身份都与不同的特定社会、专业或文化背景下的经验及具体知识有关。个人通过利用他们已经拥有的但之前不关联的想法,创造新的解决方案。
类比推理
另一个与创造力有特殊联系并经过了实证检验的重要认知机制是类比推理。它是指将结构化知识从熟悉的领域,应用或投射到新颖的或不太熟悉的领域中。人类在创造性成就的历史记录中常常提到类比,例子也有很多。例如,卢瑟福(Rutherford)使用太阳系作为氢原子的结构原型,罗宾斯(Robbins)等人改编了莎士比亚的《罗密欧与朱丽叶》,将其与20世纪50年代纽约的“西区故事”联系起来。类比是促发创造力的关键因素之一,并被列为创造力认知过程中的重要组成部分。良好的类比在非常深刻的水平上连接熟悉和新颖的领域(结构类比),而不仅仅是在表面上(外形类比)。与概念组合一样,类比存在多种表现形式以及可供类比的多种目标。最显著的目的包括应用来自一个领域的知识来帮助理解或发展另一个领域的想法,还包括用一种简洁、可理解的方式向他人传递一个新想法或新观念。
生成探索模型
生成探索模型是一个关于创造力认知的总体描述框架。这一模型将新颖、有用想法的产生,归因于候选想法生成过程和基于此扩展的探索过程之间的相互作用。该模型不是将创造性过程看作单一的实体,而是识别出一组基本的认知子过程,它们以各种方式组合,影响创造性成果的产生。
已被识别的生成子过程包括检索各种类型的信息,例如特定类别范例、一般知识、图像、源类比等,以及概念和意象的关联和组合。这些认知子过程被认为用于产生候选想法,这些想法有时被称为前创造形态,它们不一定是当前问题的完美的创造性解决方案,而是代表可以促进或抑制创造性成果诞生的可能切入点。该模型假设人们可以使用属性判据,例如明显的新颖性和美学吸引力,来确定哪些前创造形态应该保留并进一步加工。接下来,通过特定的探索过程开发候选想法的创造潜力,期间可通过修改、详细阐明、考察影响、评估局限或其他方式改造候选想法。
生成探索模型的一个重要特征是,它描述了创造力基本认知过程的本质以及如何在知识结构上产生想法的特征。例如,创造性认知不仅仅依赖于更为全局化的认知特性描述,比如发散性思维,而是试图详述产生多样结果的基本子过程。 面对一项发散性认知任务,个体会在大脑中罗列各种可能的候选想法,所列想法可从大范围基本认知过程实践中导出,包括情境检索、心理图像、特征分析、抽象或类比,以及许多其他可能的途径。在更具体的层面上,创造力认知试图确认这些子过程中的操作细节。
最小阻力路径模型
在生成探索模型之外,认知取向的创造力过程描述上,研究者还关注特殊信息和一般信息的检索问题。最小阻力路径模型是一个组织框架,用于在不同抽象层次或一般性层面上,描述人类个体如何在既有知识框架中检索信息。该模型指出,当人们为特定领域开发新想法时,主要趋势是从该领域获取具体的基准水平样本作为起点,然后将许多存储的实例属性投影到正在形成的新想法中。例如,在设计新运动时,主要倾向是检索已有的特定运动,例如棒球和足球,在此之上对新运动进行模式化。
最小阻力路径模型与联结主义创造观类似,并且在很大程度上与其观点相一致,因为它表明在某种情况下某些项目比其他项目更容易被想到,但是侧重点有所不同。首先,它特别关注类别的内部结构,即类别与各成员之间(例如水果和苹果之间)的分级关系,而不是典型的联合的主体类型的关联(例如针和线)、相对(热和冷)或词法-短语(蓝奶酪);第二,最小阻力路径模型更关注个体规范模式,而不是关联层次上的个体差异;第三,最小阻力路径模型的重点是使用代表性来预测一个人在创意生成任务中依赖于给定参照样本的可能性,而不是坚持更具原创性的想法。创新无疑会受到长期访问的已知领域实例以及新近呈现的较易访问实例的约束。不同的线索提示会导致检索出不同的实例及其性质,然后投射到新颖实体上。
“被冷落”的聚合性思维
人类的创造性活动涉及发散性思维和聚合性思维。但我们也注意到,创造力的认知心理学研究更多关注发散性思维,而不是聚合性思维;更多关注新颖性,而非有用性。也有学者认为,过分强调发散性思维,而不考虑聚合性思维,可能会导致各种各样的问题。例如,个体可能从事鲁莽或盲目的创造,由此可能带来灾难性后果,因为他们缺乏对创造力有效性的考量。
发散性思维需要跳出“箱子”思考,而不道德的行为有时就是创造力的一个意想不到的副产品:太过具有创造性反而可能会违反规则,甚至违反法律。所以,人们也需要使用聚合性思维来评估和判断他们的创造性想法是否适当。
尽管发散性思维可能比聚合性思维得到了更多关注,但是许多学者都认为二者对创造力都是至关重要的。例如,有学者肯定聚合思维在促进创造力中的作用,认为创造力需要发散性思维来产生新的想法,也需要聚合性思维来评估新思想的新颖性和创造性。其他的一些创造力认知过程模型也会强调聚合性思维。例如坎贝尔(Campbell)和西蒙顿(Simonton)认为,人们不仅参与认知变化去创造新的想法,而且也选择性地保留有用的或有效的想法,来消除不太有用的想法。
正如前人所言,“创造力不是个人的属性,而是社会制度对个人的判断。” 而考察有用性的一个主要困难是,这是一个相对难以捉摸和主观的概念。为了有用性或适当性,创造力必须在某一个时刻满足一群人。
小结:基于人类创造力认知原则的AI研发新取向
笔者介绍了认知心理学在人类创造力上的一些关键认识与进展,可能会为人工智能创造力的开发提供一些参考。在心理学诸多研究取向中,认知心理学是与计算机科学最为靠近的取向,与之存在天然联结。认知心理学的兴起直接来自人类大脑认知过程的“计算机隐喻”,并随着认知心理学研究的深化和拓展,不断反哺计算机科学。更为重要的是,认知心理学由于其认识论基础和研究范式上的特点,是最容易被计算机系统编码和计算的心理学知识领域。即使如人类情绪情感这样看起来与理性计算背道而驰的研究对象,来自计算机领域的情感计算研究者们,在诸多情绪心理学经典理论中,也尤为钟情“情绪评价理论”这一带有浓厚理性认知决定论色彩的心理学理论成果。例如,著名的OCC模型1就完全脱胎于计算机学家和心理学家的成功合作。
因此,笔者相信认知心理学对人类创造力的内涵界定和特征刻画,对创造力的进化认知解释,对创造力过程中的认知关键要素特征的解析,将最易于被计算机领域的学者消化吸收,用以理解人类创造力的核心认知本质,并融入到人工智能创造力研发的工作中去,有望携手开创出基于人类创造力认知原则的人工智能研究新取向。 ■
脚注:
1 奥托尼(Ortony)、克罗尔(Clore)和柯林斯(Collins)于1988年提出的一种认知情感评价模型。
所有评论仅代表网友意见