人工智能的现状:局部有精彩,整体很无奈
对照“人类智能”的概念和规律,可以更好地认识人工智能研究的现状,也可以更好地找到解决这些问题、实现突破和创新的办法。
迄今,人工智能存在三种不同的研究路径:1943年发端的模拟人类大脑皮层生物神经网络结构的人工神经网络研究(称为结构主义研究路径)(McCulloch and Pitts, 2021; Rosenblatt, 1958; Hopfield, 1982; Rumelhart and McClelland, 1986),1956年兴起的模拟人类逻辑思维功能的物理符号系统/专家系统研究(称为功能主义研究路径)(Newell, 1980; Turing, 1963; Newell and Simon, 1963; Nilsson, 1982),1990年加盟的模拟智能生物行为的感知动作系统研究(称为行为主义研究路径)(Brooks, 1991; 1990),形成了人工智能研究的三个学术信仰各异故一直分道扬镳的学派。
到目前为止,三大学派各自都取得了不少精彩的局部进展。其中,结构主义的人工神经网络研究取得的典型成果,包括:比人类识别得更为精准的模式识别(人脸识别、语音识别、图像识别等)系统,具有很强学习能力的各种深层神经
网络学习系统Deep Learning,自然语言处理的GPT系列等。功能主义的专家系统研究取得的典型成果,包括:战胜国际象棋世界冠军卡斯帕罗夫的Deep Blue系统,击败两位全美问题抢答冠军的Watson系统,击败李世石和柯洁等61位国际围棋顶尖高手的基于深度学习的AlphaGo系统等。行为主义的感知动作系统研究取得的典型成果,包括:自然语言人机对话的机器人Sophia,能在复杂环境中奔跑行进和跳跃翻滚的波斯顿Dynamic机器人系列,能够主持文娱晚会、在医院陪护照料病人的服务机器人等。
这些精彩的人工智能进展,加上一些人工智能科幻小说和科幻电影的渲染,使人们对人工智能取得的进展大为讶异,甚至感到惊骇和恐惧,认为人工智能机器的能力实在太厉害了,似乎很快就要达到超越人类能力的“奇点”并开始淘汰人类了。然而从全局的情况看,人工智能的研究其实面临着十分严峻的挑战和非常深刻的危机。具体的表现如下。
第一,由于人工智能三大学派“各自为战”互不相容,因此,它们的所有进展都是个案性、局部性和碎片性的应用,难以移植,缺乏通用性,就连一些人们甚感惊叹的效果表现也只是自然语言(图形图像也可以被理解为一种自然语言)处理领域的专用系统,而不是通用系统,更遑论统一的理论了。显然,这对人工智能的普遍应用和可持续发展十分不利。
第二,由于坚持应用“分而治之”和“纯粹形式化”的研究方法,完全阉割了信息、知识和智能的内涵(它们的价值因素和内容因素),使得人工智能系统的智能成为了一种“空心的智能”“纯形式的智能”,而非真正意义上的可以被理解的智能。它们的结果不可解释,因而也不可信赖。正是因为存在这种缺陷,人们戏称“人工智能不智能”。
第三,更为严重的问题是,长期以来,人工智能研究形成了三大学派“各自为战”的格局,无法形成合力,使人工智能的整体理论研究始终没有取得明显的进展,而且这一状况至今没能得到解决。虽然在20世纪与21世纪之交出现了一批试图建立通用人工智能理论的巨著(Nilsson,2006;罗素、诺维格,2006),但都没有取得预期的成功。事实上,“整体被肢解,内涵被阉割”成为了世界人工智能研究所遭受的最大伤痛。
因此,总的来说,人工智能研究的现状是:局部有精彩,整体很无奈。
系统学原理表明:有机系统的整体不等于它所有的部分之简单和,或者说,所有部分的简单和,不可能构成相应的有机整体。显然,整体的作用也远远大于各个部分作用之和。这就表明,如果继续沿着三大学派“各自为战”的研究路径走下去,那么,无论它们将来各自取得怎样丰富多彩的个案性、局部性、浅层性应用成果,都不可能指望通过这些成果的“简单和”就使“局部精彩”转化为“整体精彩”,换言之,不可能指望通过这些成果的“简单和”实现人工智能基础理论的重大突破。
至此,不能不对ChatGPT和GPT-4的表现略加评述。许多人都对GPT系列作出了非常正面的评价,认为沿着这个方向发展下去,具有自主意识而且全面超越人类能力的通用人工智能出现就指日可待。更有甚者,有些人开始宣称:GPT系列已经通过了图灵测试,人类要接受这些“有意识”“有生命”的强大的“新物种”,要学会与它们共处。
这是莫大的误解。如上所说,无论是GPT系列,还是其他人工智能系统,它们所利用的信息全都是形式化的“空心信息”。直觉告诉我们,没有价值没有内容的纯形式化的信息是无法理解的(除非这些信息是已知的旧信息)。然而,人工智能系统又不能不去理解它们,于是只能采取“统计方法”。他们设想,只要拥有足够大(统计方法要求必须满足样本的遍历性)的同类样本,利用超高速的计算机就可以在这个超大样本库里搜索到与当前面对的“问话样本(关键词组)”最相关(统计相关性最大)的样本作为“答案”。因此,GPT系列必须拥有超大规模的预训练样本库,必须拥有超高速的计算系统,才能及时找到与“问话(关键词组)”统计相关性最大的“答案”,才能使问话者感到系统的回答是足够合理的,系统是有智能的。
问题就在这里发生了:就算GPT系统找到了与“问话(关键词组)”统计相关性最大的“答案”,丝毫也不表示系统就“理解了答案”,因为它只是按照统计相关性的大小来挑选“答案”,并不真正理解这个答案是什么意思。这在某种程度上就像人们训练鹦鹉说话的情形。主人训练鹦鹉:当有客人进来的时候就高喊“欢迎光临”。这种预训练是可以成功的:当鹦鹉看到客人(在形态上与家人不同的人)进来的时候,它就会高声喊出:“欢迎光临!”但这并不能说鹦鹉理解它喊出的是什么意思。
所以,GPT系统能够与人们交谈,而且有问必答,对答如流,但其实它并不知道其中含义。即GPT系统只具有统计相关性的计算能力,而没有对概念的理解能力,当然也就没有解释能力,因此,它不可信赖。
有人争辩说:GPT系统通过了图灵测试,难道还不能证明它有智能吗?是的,通过了图灵测试也不见得真有智能。其实,图灵测试本身存在许多问题。只看表面的效果,不问过程的实质,是图灵测试的最大问题之一。因此,除了在游戏类领域之外,在那些需要对结果“较真儿”的大部分实际领域,图灵测试方法不可应用。
由于现有人工智能的研究坚持了“纯形式化”的方法,阉割了信息、知识、智能的内涵,因此走上了“通过统计方法来实现认知”的道路。然而,“统计方法”本身却不是一个高明的认知方法,不是一种高等的认知途径,因为这种认知方法和道路不可能达到“理解”的目的。而“理解”则是“智能”的必要前提。
实际上,人类实现认知的方式主要有三大类型,依次是:(1)婴幼儿时期的“强记认知”方式;(2)青少年时期的“从众认知”方式;(3)成年人时期的“理解认知”方式。它们代表了人类认知方式的进步与成长历程。
具体来说,“强记认知”也称为“盲从认知”,这是婴幼儿时期的认知方式,也是人类的最初级认知方式。婴幼儿的活动范围局限于家庭,父母长者天然地成为婴幼儿认知的绝对权威。因此,父母长者说什么,他们就记住什么,基本上是死记硬背,几乎没有理解的成分。强记是一种最初级的认知方式,但是,对一张白纸般的婴幼儿来说却是一种不可或缺的认知方式。计算机的灌输,就是“强记认知”的技术版。
“从众认知”是青少年时期的认知方式,相较于“强记认知”进了一步。青少年的活动范围突破了家庭限制,走进了社会和学校,“公众(包括媒体、书本、教师等社会知识传播主体)”成为了青少年认知的权威。因此,它的准则是“多者为真”:只要是多数人认可的,即使自己不理解也会被认可、被接受。统计技术,就是“从众认知”方式的学术版。统计,对于处理随机事件来说是一个科学的方法;可是作为一种认知方式却只算是一种“二流”的方式。
显然,最高级的认知方式是理解认知:无论什么问题,只有自己理解了,才会被接受,才会被认可。在这里,所谓“理解”了某个事物,就是既懂得了这个事物的外部“形态”,尤其懂得了这个事物对于自己所追求的“目标”而言究竟是有利还是有害、利害几何,因而懂得这个事物的内涵。所以,在理解的基础上去做决策,决策会更明智合理、有智能水平。这是成年人特别是接受了高等教育的成年人的自主认知方式。
由此可见,现有人工智能理论和系统的认知方式只是基于形式信息和形式知识的“从众认知”,也就是统计认知,它们“认可”的结论“很可能是对的(但也可能是错的)”,但却没有“理解”的保障:统计的结果“最好”,不等于现实的“最好”。这就是为什么人们总在不断追究和质疑现有人工智能的“理解能力”、“可解释性”和“可信赖性”的原因。
对照前文分析的“人类智能”的基本概念和基本原理可以看到,当今“局部有精彩,整体很无奈”的人工智能研究现状与“人类智能”的原型榜样之间确实存在巨大的差异。于是,人们便不能不严肃地思考:为什么人工智能的研究存在这么严重的问题?这些问题的根源是什么?人工智能基础理论的重大突破与创新,究竟路在何方?
人工智能现状的根源:学科范式“张冠李戴”
作为学科的源头而且影响学科全局的学科研究范式(科学观和方法论)在人工智能的研究中发生了偏差。在《科学革命的结构》一书中,库恩把“范式”主要理解为世界观和行为方式(库恩,1980)。在科学研究领域,世界观就是科学观,行为方式就是科学研究的方法论。科学观在宏观上阐明“这个学科的本质是什么”;方法论在宏观上阐明“应当怎样研究这个学科”。于是,作为科学观和方法论有机整体的范式,就在宏观上规范了这个学科应当遵循的研究方式。
尽管库恩也曾经把“范式”解释为模式、模型、典范、范例、案例等,同时,“范式”这一词语也常常被用来表达更为具体的“工作方式”,如实验的范式、计算的范式、编程的范式等,但是更为严谨的理解告诉我们,学科“范式”更为准确的理解应当是“学科的科学观和方法论的统称”。这是因为,具体的模式、模型、典范、范例、案例,具体的编程范式、计算范式、实验范式等,只能描述和表征一些具体的局部的工作程式,它们都不足以成为“学科是否要革命”的最高判据,只有学科的科学观和方法论才具备这种表征能力。
事实上,科学研究的活动存在井然有序的层次体系,从低到高依次是:(1)研究的具体问题、与问题相关的数据、研究问题所需要的目的要求等属于“研究的原始资源层次”;(2)开展研究活动所需要的编程语言、算法工具、算力工具、测量工具、记录工具等属于“研究的工具层次”;(3)支持研究活动的学科理论、分析方法、研究模型等属于“研究的理论层次”;(4)在全局上和整体上引领和规范研究活动的科学观和方法论属于“研究的指导思想层次”。
可见,一个学科的科学观和方法论是指导、引领和规范这个学科的整体研究活动的最高力量,是“看不见”然而又时时刻刻、实实在在发挥着指导作用的“指挥棒”。因此,只有科学观和方法论才能成为“学科是否要发生革命”的关键判据。
这样,就可以用一个表达式来定义学科的范式:
P=Int(V,M)
其中,P代表学科的范式,V代表与学科性质相符的科学观,M代表学科应当遵循的方法论,Int代表科学观与方法论的整体作用。
为了
追根寻源查明造成人工智能现状的根本原因,最重要的是要站在学科研究的制高点——“范式”的高度上深入考察学科发展的情况,以便从中找到问题的根源,并从根源上解决问题。这是一切原创性科学研究所不能回避的原则。
表1用直观清晰的列表方式,描述了学科的“范式”在学科的科学研究活动(包括学科的自下而上摸索和自上而下建构)体系中所处的地位和作用。
表1说明,学科的发展一般都要经历前后相继的两个基本阶段,即首先是自下而上摸索范式的初级阶段,接着是自上而下贯彻范式有序建构的高级阶段。这两个阶段是辩证统一的,既不可或缺,也不可颠倒。
初级阶段的任务是要摸索:(1)这个学科的本质是什么;(2)应当怎样来研究和发展这个学科。显然,前者就是关于这个学科的科学观,后者就是研究这个学科所需要遵循的方法论。如上所述,科学观和方法论的统称就是范式。可见,初级阶段的任务就是要明确学科的范式,也就是明确学科的定义。而一旦明确了学科的定义,就具备了必要的条件可以转入学科研究与发展的高级阶段,即学科的有序建构阶段。
需要特别指出的是,自下而上的摸索阶段是最为困难的工作阶段,需要经过特别漫长的试探、摸索、失败、停顿、反思、再摸索、局部成功、局部的检验、盲人摸象式的争论、逐步总结等痛苦的过程,因此往往经历很长(大约是世纪级)的时间。
高级阶段的任务是要自上而下地完成:(1)根据自下而上摸索总结出来的范式(学科的定义)来落实学科的定位(建立学科框架,包括构筑学科全局模型和确立学科研究路径);(2)基于学科的定义和定位确立学科的精确定格(阐明学科的规格,包括学科内涵结构的规格和学科数理基础的规格);(3)根据学科的定义、定位和定格,实现学科内容的完整定论(形成学科的理论,包括学科的基本概念和基本原理),完成学科理论的整体建构。
可见,学科的建构就是要由宏观的定义(范式),到整体的定位(框架),再到精准的定格(规格),最后到内容的定论(理论),一步一步地走向具体、走向落实。于是,作为学科宏观定义的范式,是整个学科研究与发展的源头和根本,影响着整个学科建构的全程。
由此可以作出明确的判断:造成人工智能理论现状的根本原因,必定是作为学科的源头而且影响学科全局的学科研究范式(科学观和方法论)发生了偏差,而不会仅仅是某些中低层次(如资源层次、工具层次、理论层次)的缺陷。总之,“整体很无奈”的根源必定在范式,这就是结论。
人工智能研究所实际遵循的范式,并不是信息学科的范式,而是传统物质学科的范式。人工智能是开放、复杂、高级的信息系统,是信息科学的高级篇章。表2所列出的信息技术演进历史有力地证实了这个判断。
信息学科的定义也支持了这个判断。这个定义指出:信息学科的研究对象是信息及其生态过程,研究内容是信息的性质及其信息生态规律,研究方法是信息生态方法论,研究目标是扩展“作为人类全部信息功能有机整体”的智能功能。
可见,扩展信息获取、信息传递、信息处理、信息执行等信息功能以及这些信息的复合功能只是信息科学的初等研究目标;扩展人类的智能功能才是信息科学的长远研究目标。
按照学科范式的定义,具有不同研究对象的各个学科大类,都应当拥有自己的科学观和方法论,遵循自己的研究范式。既然人工智能是信息学科的高级篇章,人工智能学科的研究与发展就应当遵循信息学科的范式。
然而一个令人惊讶的发现却是(钟义信,2021a):数十年来,人工智能研究所实际遵循的范式,并不是信息学科的范式,而是传统物质学科的范式(见表3)。
表3说明,现行人工智能的研究范式犯了“张冠李戴”的大忌:它实际所遵循的科学观基本是“物质学科范式的科学观”,而它所遵循的方法论是完全的“物质学科范式的机械还原方法论”。