就像大雨中的沙漠,整个智能机器人领域在经历了三十年的干旱之后开始发芽了。用什么来浇灌种子?它们长得多快?会长成什么样子呢?
计算能力和思维的关系就像火车机车和火车的关系。如果机车太小,火车不会行驶。机车只有恰当地与道路相配,才能有效发挥其作用。18世纪,机车工程师清楚速度、拉力、机车大小、传输比之间的关系,毫无疑问,这与马车运载有所不同。
两个世纪后,在机器人领域中出现了类似情况。第一代机器人像机车一样大、一样昂贵。我们应理解20世纪60年代研究者的想法,他们认为,合适的程序既然可以拖动庞然大物,同样可以拉动其他种类的智力负载。唉,三十年间的实践证明,当时那些直觉的偏差是多么大。
计算机喀嚓响着就完成了怪异的计算工作。而我们的大脑在完成“35*237=8295”这样的运算时,影像、声音、感情交织在一起。同样,拖拉机轰鸣着,喷着烟,带着犁地工具沿马路慢行,一点也不快。计算机在运算方面超过人类,这与自行车速度比拖拉机快是一样的道理。自行车在路面上有优势,若要用自行车犁地的话,只有庞大的自行车怪物才能和拖拉机匹敌。同样,也只有庞大的高性能计算机才有可能在脑力活动方面与人相比,如认知、情感和社交等。让我们尽力去定量化这些“怪物”吧。
大脑、眼睛和机器
我们根据类比和推断得出,计算机与人类的差距是很大的。三十年的计算机视觉的历程表明,1 MIPS的机器能从实时图像中提取简单的特征量───在杂色背景里跟踪白线或白点。10 MIPS的机器能跟随复杂的灰度区,巡航导弹、灵巧炸弹和早期的自驾驶大蓬车证实了这点。100 MIPS的机器恰好能追踪路面上不可预测的特征量,Navlab在长距离的行程证实了这点。1000 MIPS的机器完全能识别三维空间中带纹理的粗糙物体,某些中分辨率的立体视觉程序解释了这个问题,也包括我的程序。几个“垃圾箱挖掘”程序认为,10000 MIPS的机器能从杂乱中找到三维物体,并且高分辨率的立体视觉程序用10 MIPS的机器在1小时内演示了这一点。随着计算机速度和内存的增大,数据量问题逐渐不再是问题。
除了纯粹的运算规模,也得考虑其他因素。对1 MIPS的机器,最适用的程序是能有效处理检测数据的手工程序。 100 MIPS的机器能权衡输入数据,有很多算法参数待定,采用学习算法要比程序员调节效果好。随着计算机速度和机器人程序的提高,各种学习算法将会越发重要。在20世纪80年代行将结束之际,由于10 MIPS的计算机的普及,性能良好的字符视觉阅读(OCR)程序崭露头脚,它能阅读大部分的印刷体。程序根据手工建造的“特征检测器”来判断字符各部分形状,程序中只有很少量的学习过程。计算机的速度超过100 MIPS时,出现了可训练的OCR程序,能从样例中学习异常字体,最新程序能对整个集合进行学习。邮电局用计算机对信件分类时的手写体识别,其研制方法类似于此。这个算法模型也适用于语音识别。20世纪60年代拉伊.雷迪(Raj Reddy)在斯坦福就开始了语音研究,在他的指引下,卡内基.梅隆大学在连续语音的计算机转录方面取得了领先地位。刚开始,程序使用手工建立的音素识别器,但随着计算机性能的增强,这部分任务就由自动学习程序来完成。1992年,雷迪的课题组在10 MIPS工作站上研制出程序斯芬克司-II,此工作站带有100 MIPS专用信号处理电路。该系统的单词识别器由马尔可夫链的统计结构编码,而识别器由自动学习过程决定。这个过程能对几百小时的话音数据进行处理,而数据来自卡内基.梅隆大学数以千计的志愿者。如今,有一些使用的语音控制和口述系统的个人电脑在出售,的确有用户冒险用喉舌代替手。
计算机的更多性能需要达到人类的水平,但到底能有多少呢?如果我们能将神经系统容量与计算能力对比的话,人和动物的大脑也许会有暗示。脊椎动物眼睛视网膜的结构和功能,是最好理解的神经系统之一。幸运的是,机器人视觉已使用了类似视网膜的操作,所以能提供给我们粗略的转换因子。
视网膜位于眼球后部,是一个透明的、纸一样薄的神经组织,眼球作为透镜将外部影像投影在它上面。它通过光学神经细胞以及百万条纤维与大脑深处的各部分相连。它的位置较浅,与大脑其它部分现比,不论研究人还是动物,它都是最方便的大脑部分。人的视网膜大约1厘米长,半毫米厚。视网膜上大约有一亿个神经元,大体分五类。感光细胞把信息传给大跨度的水平细胞和窄小的双极性细胞,它们是由无长突的神经细胞相连,最后是神经中枢细胞,它的支出纤维捆在一起,形成视觉神经。视网膜上有上百万个神经中枢细胞,每个细胞的轴突都携带外部映像中特定部位的信息,不但能反映出因时空变化而引起光强度的变化,同时还进行上百万个边缘检测和移动检测。从整体上讲,视网膜似乎每秒能处理十幅图像。
机器人视觉程序想要聪相应图像中得到一个边缘检测或移动检测数据的话,需执行100条计算机指令。一百万次检测则对应执行一亿条指令,1000MIPS的机器1秒能重复十次上述过程,基本上可与人的视网膜相比,新型高端个人计算机刚好能达到这个性能。
1500立方厘米的人脑大小是视网膜的十万倍,这说明大约一亿MISP的计算机可达到人类水平。下国际象棋的计算机就支持这个换算标准。1997年,“深蓝”击败世界冠军卡斯帕罗夫,对弈中机器使用的专用芯片的计算能力相当于300万MIPS(参照图3.4)。这大约是人类潜能的3%。人类最优秀的棋手卡斯帕罗夫,也许只能用他脑力的3%来解决国际象棋这种奇特的思维问题。这样讲是合乎情理的,所以“深蓝”与卡斯帕罗夫的国际象棋技艺几乎相当,这个例子支持上述基于视网膜的推断。
1998年,出现了最强大的实验型超级计算机,它由成千上万个最新微处理器组成,耗资几千万美元。它已经非常接近人的脑力了,但它不可能朝那方面发展。因为当上百万的人能从事某项工作时,费用并不昂贵,为什么要花费两千万美元去研制一个人类的代用品呢?这样的机器在科学计算中需要,大部分作为没有廉价替代物的物理仿真模型。人工智能的研究正期待着这些成果的普及。
如果一亿MIPS的机器能完成人类大脑一千亿个神经元的工作,那么一个神经元就约与1/1000 MIPS等价,也就就是每秒完成1000条指令,这说明一个真实神经元每秒能产生1000个时序精确的脉冲。模拟单个真实神经元的程序可能是不够的。我们根据模拟几千个神经元合成体的功能,来评价程序有效性。几乎所有的神经系统都要包含这种规模的合成体。
昆虫和其它无脊椎动物的神经系统内部似乎先天就有连接,每个神经元有它自己特定的连接和功能。因为昆虫上亿位的基因组完全可以规定几十万个神经元的连接状态。就人类而言,有一千亿个神经元,几十亿位的基因组对每个神经元连接编码是不够的。人类大脑似乎大部分是由有规则的结构组成的,获得某些技能后,大脑相应的神经元就被修剪一新了,这和普通大理石被凿成不同雕塑是一个道理。类似地,当机器人程序只占用几十万字节存储空间时,它还是精确的手工程序。如今已增大到几千万字节,大部分内容是从样例中学到的。实际上,机器人学习和动物学习是可以复制的。例如,文本和语音识别程序是经年累月辛苦训练而得来的,但用户复制的软件“天生”就功能健全。工厂中的大型机器人或者是体积和价格比机器人处理器大几千倍的超级计算机,在人监督下会处理大的训练集,得到有关背景的有效程序和数组,然后被大量机器人个体中适度的处理器复制。
程序的实现不但取决于机器的速度,而且还受内存的制约。令人惊奇的是,在计算机发展史中,内存和速度比是非常恒定的。最早的电子计算机有几千字节的内存容量,每秒可进行几千次运算。1980年前后推出的计算机,有百万字节的内存,每秒运算上百次。1990年出现的超级计算机也符合这个比例关系。我们将内存容量除以速度定义为“时间常数”,粗略表示计算机扫描内存一次需要的时间。1兆字节/1 MIPS表示的结果是1秒。若机器的内存不能满足速度要求,这是新机器典型的情况,似乎运算速度很快,但会不必要地局限于小程序。若机器内存相对速度过剩,可以说它的商业可行性到了尽头,虽能运算大程序,但出奇的慢。例如,最初出现的Macintosh这两项指标是1/2 MIPS和1/8兆字节,当时它被认为是很快的机器。“fat Mac”机型是1/2 MIPS和1/2兆字节,在可接受的速度下能运行大一些的程序,但是1/2 MIPS和1兆字节的Mac+就有些慢。1/2 MIPS和4兆的Mac机型速度慢得让人难以接受,很快就被具有同样外设、处理器快十倍的机器所取代。已优化配置的用户不免要问:“下次机器升级最好是处理器快些呢?不是内存大些呢?”
神经系统能记忆的最好凭证是连接神经元的突触上存放有信息。分子调节使神经元突触处于区别明显的状态,更不用说一字节的值。人类大脑一亿兆突触与一亿兆字节等价。先前已得出一亿MIPS能模仿人的功能这一结论,在这里做比较的话,前面所述的兆字节/MIPS的原则似乎在神经系统中也成立!交互的机器好象是神经系统的外延,遵从同样的时间常数。与其用机器与外界交互,不如让不同速度/存储比的人来完成。在实际中,视听处理器和高性能飞行器等的控制器需要反就迅速,所以每兆字节相应很多MIPS。自动数据库和时变的安全摄像等问题涉及到慢速机器,每个MIPS会对应很多兆字节。同样地,飞虫似乎比人类反应快好几倍,MIPS的相对量要大一些。动物的情况也是这样,细胞间靠电化学和酶的方式传递信号。尽管植物细胞与动物神经元有本质的区别,一些植物细胞间似乎也能通讯。有一天,我们可能发现植物能记忆许多信息,但处理缓慢。(如何解释红杉在2000年的生命中抵御进化很快的害虫,而蚊子在几十年间就可克服DDT呢?)
根据以上所述,100 MIPS的机器人,例如前一章提到的Navlab,和拥有10万个神经元的家蝇具有同样的智力。下面就以些为标准来评估各种实体。
自行车赛
我们估计,现在最大的超级计算机几乎具有模仿人类的能力。未来十年中,其后继者的能力会有更大的增强。然而,人类不可能浪费几千万美元制造一个机器去做任何人都能做的事,除非机器可以解决没人能处理的物理和数学中的关键问题。只有当机器完成工作的费用比人类做同样工作的花费低时,才有经济意义,也就是当它们的“大脑”费用降低到1000美元左右的时候。这一天何时会到来呢?
整个20世纪中,计算费用下跌的速度很快。二战前,稳步发展的机械计算器,将手工计算的速度提高了一千倍。二战中出现的电子计算机更加大了这一步伐。从1940年到1980年,在耗费不变的情况下,计算能力提高了一百万倍。晶体管代替了电子管,集成电路代替了晶体管,集成的部件不断变小,集成数量越来越多。20世纪80年代,微型计算机进入消费市场,工业越发多样化并具有竞争力。强有力的、便宜的计算机工作站,使不断增加的设计步骤变得自动化。新一代计算机市场化周期不断缩短,从20世纪80年代初期的两年缩短到不到9个月。计算机和通讯业已成为全球最大的产业。
二战后,计算机容量每两年翻一番。但进入20世纪80年代,每18个月计算机性能就要翻倍,20世纪90年代后期似乎缩短为12个月。 
图3.1 MIPS和兆字节 图中的实体是按相应计算机的计算能力和存储容量来评价的,这里的计算机是能模仿这些实体行为的最小通用计算机。坐标轴都是对数坐标,纵坐标每多一格代表运算能力增长一千倍,横坐标每单元则表示内存容量扩大一千倍。通用计算机用“*”标明,能模仿图中在它位置上的其他实体。一亿MIPS的计算机不但能被编程得像人一样思考,而且还能模仿其他同样规模的机器。但是人类不能模拟一亿MIPS的计算机,人类的计算能力要低于百万分这一MIPS。“深蓝”的专用芯片在下国际象棋时,与三百万MIPS的计算机相当,可是它的通用能力中有一千MIPS。图中大部分非计算机实体根本不能以通用方式行使其功能。通用性的实现是需要代价的。一个通用机器需要十倍或十倍以上的资源来完成一项专用任务。如果任务改变,通用机器可以被重新编程,而专用机器就得被淘汰。 
图3.2 计算能力超指数增长 图中显示了从1900年到目前,计算机产业中每1000美元等价的MIPS。二战前,机械和机电计算器性能稳步提高。1900年到1940年间,机器速度比手工计算快一千倍。二战中,电子计算机的出现加快了这个步伐。二战后,从1940年到1980年,计算速度增长了一百万倍。此后的步伐更大,在下世纪中期前可能会出现象人一样的机器人。图中纵坐标是对数坐标,一个大单位标识计算能力增长一千倍。指数增长在图中表现为一条直线,向上弯曲表示速度比指数增长还要快。可以看出,20世纪90年代的竞争更为激烈,性能落后的机器很快就被排挤掉。
以目前的发展速度,类似人的机器人所需要的计算机将在21世纪20年代出现。今后三十年能维持住目前的发展势头吗?至少现在还没有减弱的趋势。如果会有所不同,那就是更短的发展周期会来临。但从事半导体工业的人经常发表些值得深思的文章,详细的预测计算机几十年的迅猛发展期即将结束。实现高级计算的关键是微型化,因为小部件的惯性小,在同等能量下运行更快,在给定空间中能集成更多内容。首先,有位移的部件会消失,从机械计算器的齿轮到机电运算机器的小触点,再到电子计算机的电子束。接下来是转换支持结构变小,从拇指大的电子管到苍蝇般大的晶体管,再到集成电路上逐渐消失的小点。在印刷电路前,集成电路是通过照相而被制成的。理想模式被投射到硅片上,精细的化学过程使外露区域增加需要的东西,去除掉不要的物质。
20世纪70年代中期,已有十五年历史、正处在青春期的集成电路遇到了一次危机。这时技术上可以集成上万个元件,完全能满足整个计算机的要求,最细小的地方只有3微米。此时,某些有经验的工程技术人员写了许多文章,预言这方面的发展已快到尽头了。因为3微米几乎和刻芯片的光波的长度相当。组成微小部件的原子数量越来越少,以至于统计分布都无法提供其具体范围。信号电子也存在同样问题。间隙的不断减少使原子在晶体中行进得很慢,导致电路的退化。绝缘导线间的交互作用会破坏掉信号。芯片很快产生大量需散发的热量,并且需要很多合适的外部连接。在制作中,对于尺寸很小的内存单元,辐射干扰带来的影响越来越大。
这些问题已被彻底解决。集成芯片不但在持续发展,而且在加速前进。制作集成电路的短波长的光被替代,制作中使用了更精确方法来嵌入混杂成份。集成电路的电压在减小,采用了更好的绝缘体、屏蔽方法、散热手段,电路上出现了更有效的晶体管、更密的管腿模式和不辐射的包装材料。如果有钱来刺激的话,总会有办法。事实上,方法在实验室里早有了。因为工程师们当时还没注意这些,他们正在完善已有的技术。当根本问题出现,他们才感到忧虑。当需求的呼声很高时,巨大研究成果会转变为现实的生产。
这些年中,我们目睹了许多问题的出现,紧接着会寻找到相应的解决办法以及革新手段。如今,这一领域中令人忧虑的问题似乎又达到顶峰。1996年,发表在科学类杂志和全球性报刊上的一些文章都担心在十年内,电子技术的发展会结束。因为生产新集成电路的设备的费用接近十亿美元。从20世纪70年代开始,集成晶体管在逐渐减小,以致电子会从“隧道”中跑出来。集成线路变得越来越密,将排挤元器件,信号传输相应变慢,电路发热量不断增加。
这些文章没有涉及到市场因素,如果要求产品便宜且生产量少的话,能生产出相同集成电路的价格便宜的设备便占优势。因为工业如此之大,竞争如此激烈,生产规模成了必要因素。在降低费用大战中的胜利,能带来自由市场的成功,而不会是信号处理方面的问题。更何况,文章中都没提到,实验室中的备用新技术时刻准备着介入到竞争中。
传统晶体管电路依赖于大量电子的流动,当规模很小时,会引起状态波动。但采用单电子晶体管和量子设备可以解决这项难题,它们的工作原理是量子波干涉。这些新设备越小,工作得就越好。干涉图式很适用目前的电路规模,它只用很小能量就可将电子从一边撞到另一边,从而完成操作。因此,这些电路可以在温度很低的环境下工作。这种方法能集成到0.01微米,量子交换在室温下就能进行。因为电子穿过的是小量子团,而不像以前那样使大量的电子通过有电阻的物质,所以,它的密集度要比如今的电路高出一千倍,或许速度也会快一千倍,能耗也要少许多。量子干涉逻辑也许会用交换链路来代替许多导线。将来的芯片制造机定能制造出这些集成芯片的。当时机来临时,很多研究方案会得到重视,工业领域会使之完善。
更多的可能性正在酝酿之中。已证明,交换和存储单元可以由一个分子构成,电路密集度可提高十亿倍。“量子计算机”有能力取代其他计算工具,并不是单独信号以波状方式工作,而是整个计算机以此方式工作。量子计算机也包含内存单元,它们的内容能经过一系列逻辑运算后被修改。传统计算机内存单元的状态是0或1,量子计算机与此不同,内存单元是0和1的量子重叠。机器的整个存储状态是所有可能组合的重叠。计算机运算中,重叠的每一部分单独进行逻辑操作。就像有相当多的计算机都起始于内存中的不同状态,同时对同一问题求解。当计算结束后,检查内存单元,计算结果是所有可能性的波状干涉。这种计算方法目的是使应该得到的结果更为突出。在前些年,当量子算法出现后,处理加密、解密问题要比传统计算机快得多。小型量子计算机的单个原子或光子状态用三或四个“量子位”存储,但是在外部没有争夺它们的重叠组合之前,它们只能进行简短计算。应用核磁共振的计算机前途更光明,这项技术已在医院的扫描仪中用到。量子位编码成自旋的原子核,在外部无线电和磁场轻微推动下,和相邻原子核形成磁交互。重的原子核被电子云扩散轨道束缚,几小时或更长时间内维持它们的量子一致性。具有一千或更多量子位的量子计算机处理的问题已远远超出传统计算机所想象的范围。
分子和量子计算机迟早会成为主流的,但在它们没出现的情况下,仿人机器人都有可能被研制出。来自生产芯片的半导体工业的研究明确表明,现有技术还可以向前发展至少十年,集成特性能低于0.1微米,可以实现几百亿位的存储芯片,多处理器芯片的速度超过10万MIPS。这段发展期快结束时,集成电路中会融合数量越来越多的量子干扰部件。随着这些微小组件制作技术的完善,它们会占领芯片领域,计算机向前迈进的步幅会更大。2030年前,家用计算机速度能达到一亿MIPS,可与人脑媲美。
在讲述了硬件的发展之后,下一章会展示出智能机器人软件的进展。机器人进化阶段与我们人类大脑进化大体类似,只是机器人进化速度比人类快了一千万倍,大约四十年就达到了象人类一样的智能。
希望在几十年间就研制出全智能机器的想法似乎太草率了。因为计算机已经历了半个世纪的发展,但还没有达到昆虫的水平。确实如此,许多长期从事人工智能的研究人员认为,这个历程需要几个世纪的时间。但有很好的理由可以解释为什么接下来的五十年要比已过去的五十年发展迅猛。
一个原因是计算机工业的巨大增长和激烈竞争。另一个不被重视的原因是,智能机器在这五十年中的发展并不是稳步的,可以说仅仅发展了三十年!虽然通用计算机性能从1960年到1990年增长十万倍,但这三十年中,运行人工智能程序的计算机几乎没有超过1 MIPS。
20世纪50年代,人工智能的先驱们认为计算机是思维的机车,如果用合适的程序加以开发,它们会在高层智能领域超过人类。经过一番努力,计算机确实给国防、商业等领域带来了巨大利益。也正因如此,国家和私人的投资力度一直都很大。例如,曾经有一项大的计划用以开发自动将科研文献和文学作品从俄文翻译成英文的机器。这段时间中,世界上只有少数的几个人工智能中心拥有当时最大的机器。最常用的还是IBM-074,可提供不到1 MIPS的计算能力。
到了1960年,效果不太好的推理和翻译程序使人们对前景产生了怀疑。但在1957年,苏联意想不到地发射了第一颗人造卫星,这多少改变了人们的一些看法。人工智能或许不如期望的那样,但也毕竟有些成功的闪光点。美国害怕苏联在技术上再次给以打击,也就资助了这个领域。所使用的不再是超级计算机,而是花费几百万美元的中等规模的机器。在20世纪60年代,这个价钱可得到近1 MIPS的成熟机器,如数字设备公司的PDP-1和PDP-6。
随着越南战争的结束,与军队有关的科研资助急剧减少,前景似乎更黯淡。人工智能领域被迫勒紧腰带,申请些不对口的基金,或与工业界签定合同。主要的研究中心仍在继续研究,但老化的设备使它们显得破旧不堪。几乎整个20世纪70年代,对人工智能研究领域来说,使用不到1 MIPS的PDP-10都是奢望。因为斯坦福人工智能实验室对数字设备公司的产品研制曾有贡献,20世纪70年代后期,该公司赠给斯坦福人工智能实验室一台1.5 MIPS的KL-10。
20世纪80年代初期,尽管投入力度有所加大,但因研究单位的数量增多了,所以每个单位用以购买计算机的经费还是不足。许多单位购买了数字设备公司的新型Vax计算机,价格为10万美元,速度是1 MIPS。20世纪80年代中期,出现了个人计算机工作站。个体研究者们为此狂欢,因为他们可以避免机器分时带来的延迟。Sun-3是典型的工作站,速度为1 MIPS,价格大约是一万美元。
1990年,这一领域使用的计算机终于跨过了1 MIPS,主要是需求所致,但也有部分是使用习惯的原因,人们认为机器的性能确实应该有所提高。1990年,价格一千美元的1 MIPS机器只用于低端个人电脑。从那时起,人工智能的春天来临了,用于人工智能和机器人的计算机的性能每年都要翻倍,1994年达到30 MIPS,1998年达到500 MIPS。多年来,一直被认为是贫瘠的种子突然发芽了!机器竟然能进行文字识别和语音识别,甚至还可以翻译。自动车辆可以在公路上行驶,机器人能够在火星上探路。1996年,一个成为“EQP”的定理证明程序在阿尔贡国家实验室的50 MIPS计算机上运行五星期,发现了赫伯特.鲁宾斯(Herbert Robbins)10猜测的布尔代数的一个证据,而数学家对此研究已有60年了。给人留下更深印象的是,难以量化的音乐作曲程序EMI,它是大卫.科普(David Cope)正在主持研究的项目。EMI从其它作曲家的作品中吸取基本模式,制作出具有这些作曲家风格的乐曲───也就是,EMI向作曲家学习作曲。近年来,EMI的古典作品已经赢得观众,被认为已超过了大部分的人类作曲家。这些仍只是人工智能的春天,而夏季正是我们所迫切期待的。
酝酿中的比赛
人工智能的一些应用领域已散发出夏天的热浪。这些应用领域包括卫星图象的模式分析、石油勘察等,它们需要使用大型计算机,而且都属高级机密。计算机下国际象棋是人们关注的一个焦点,获胜者可以得到上百万美元的奖金。从1960年开始,IBM、Control Data、Cray、Intel都先后从事过这项工作。图3.3中显示了人工智能主流研究状况。各公司都开发运行高水平国际象棋程序的超级计算机,或者是具有同等性能的专用机器,以便在角逐中获胜。1958年,IBM研制出第一个下跳棋的程序,由阿瑟.塞缪尔(Arthur Samuel)开发,而亚历克斯.伯恩斯坦(Alex Bernstein)开发出第一个完整的国际象棋程序。这些程序是在当时最大、也是最后一代的晶体管计算机IBM-704上运行的。伯恩斯坦的程序在对弈中非常凶残,而塞缪尔的程序能自动学习盘面得分参数,击败了肯塔基州跳棋冠军罗伯特.尼利(Robert Nealey).1994年开始,由乔纳森.谢弗(Jonathan Schaeffer)编写的程序奇努克(Chinook)就不断地战胜着人类跳棋冠军。只因跳棋并不极具魅力,所以这些成果的影响力并不大。
相反,国际象棋世界冠军卡斯帕罗夫和IBM的深蓝在1996年和1997年的历史性大战,是永远不会被人们忘记的。深蓝是十年前卡内基.梅隆大学的学生研制的“深思”(Deep Thought)的升级版本。深思依赖于一些专用芯片,每个都如20世纪70年代AT&T贝尔实验室的肯.汤普森(Ken Thompson)研制的贝尔国际象棋计算机一样。贝尔机如棋盘一样,上面有电路,并且运行起来的导线很像移动的棋子。在每次电子闪动的瞬间,都能估出位置,找到合理的步骤。1997年的深蓝有256个这样的芯片,32个处理器的多超级计算机管理,一秒能遍历两亿个棋面位置。在没有任何协助的通用计算机上运行它的软件的话,平均每遍历一个位置要执行16000条指令。当且仅当深蓝在下国际象棋时,它的性能相当于300万MIPS,大约是人类智能的3%,或者相当于一只小猴子。
在1996年的比赛中,深蓝先胜了第一场。但卡斯帕罗夫很快发现了它的弱点,平了两场后,深蓝输掉了接下来的三场。
1997年,卡斯帕罗夫遇到了升级后的机器。那年2月,卡斯帕罗夫在西班牙再次赢得了国际象棋特级大师赛的桂冠,巩固了他的头号排名,使他的国际象棋等级分超过2800,已到了无人能及的地步。此间的几个月,他为与计算机的对弈做了准备。卡斯帕罗夫艰难地取得了与深蓝的第一场胜利,但是第二天他就输掉了一场。紧接着三场残酷的平局,最后的决胜场次中,处于劣势的卡斯帕罗夫有明显的情绪波动,导致提前投子退场而输掉比赛。1997年与深蓝的比赛是卡斯帕罗夫与机器对弈中的第一次失利。
这种比赛之所以引人注目是有很多原因的。在两次比赛中,卡斯帕罗夫好几次认为机器出现了智能。在第二次比赛中,他担心幕后有人在操纵深蓝!
博比.费希尔(Bobby Fischer)是20世纪70年代美国的象棋巨人,他的每一步都能走出最佳招数,就像是在与上帝对弈。而卡斯帕罗夫则声称,他在比赛中能试探出对方的思路,能直觉感到对方的洞察力和利用对方的缺点。由于普通计算机不加区别地、有限地向前推理,并且缺乏长斯战略,所以在与计算机下棋时,他认为是可预测的。但是,深蓝使他感到很吃惊,他看到了“不同的智能”。
在智能环节上,计算机似乎不仅超过人类的最好棋手,而且在超越机器自身。谁能比卡斯帕罗夫更具有棋局上的判断力呢?前面已提到,EQP给出鲁宾斯猜测的一个证据,数学家对它的创造力和智能有很深的印象。音乐鉴赏家对一些EMI的作品也有同样的感觉。在这些例子中,智能思维表现在机器的行为上,而不是存在于它的组成中。
深蓝的研制小组宣称并没有赋给它“智能”,只是给予了大型数据库,与其他国际特级大师建议相一致的评判和深化体系,每一轮向前预测十四步半。与早些时候的下棋程序不同,深蓝没被设计得像人类思维一样,没形成抽象策略然后尽快前后搜索了解对手的定式。 
图3.3 冻结期 从1960年到1990年,人工智能研究机构的数量增多而经费减少,所以此领域单位计算机投资费用在下降。暗淡的局面抑制着发展,在此期间,个体研究机构的计算机几乎一直是1 MIPS,低于昆虫的能力,1990年陷入最低谷。此后,计算机性能每年都要翻倍,到1998年已达到几百MIPS。图中所示计算机下棋是一个例外,由不断升高的骑士可得出此结论。其原因是,这一挑战性问题吸引了许多计算机公司、天才程序员和机器设计者。另外,在一些非公众竞争行业中也有例外情形,例如石油勘探、高投入保证它们用的是最大型计算机。
深蓝的研制者知道它在量化方面比其他下棋机具有优越性,但缺乏理解力,不具备卡斯帕罗夫的那种对棋局微妙变化的领悟力。我想这种对立面会在将来表现得越发明显。清楚高级机器人机械结构的工程师们,将会是最后承认机器人有真正思维的人。就机器人的内部结构来看,不论设计多么复杂,它都无可争议的是根据机械原理工作的机器。当被作为一个整体从外部来看待时,它们会给人留下智能的感觉。人的大脑也是这样的,当我们进行生动的对话时,我们的大脑在神经医学工作者的显微镜下也并不会展现出任何智能。
洪水泛滥
计算机是一种通用的机器,它们的潜能始终会超过任务需求范围。另一方面,人类的生存潜能是巨大的,而在与生存无关的事情上则能力相对较弱。用“人类能力地势”来表示的话,最低地形处标着“算术”和“机械记忆”等,而“定理证明”和“下棋技能”可以看成地势稍高的小丘,山顶就代表着“灵活移动”、“手眼协调”和“社会交往”。人类生活在山顶上,需费很大精力才能到达其他地方,只有少数人能在低地形上行动。
高级计算机的性能就像缓慢上升的洪水一样。半个世纪前,洪水淹没了较低地形,代替人类进行计算和文书记录,此时仍有大片的干地。现在,洪水已到脚下,人类的前哨正在思考着撤退。我们当然在山顶上还感到很安全,以目前的速度,山顶也会在接下来的半个世纪里被吞没。第五章建议人类建造舰船,进行航海生活,从而避免洪水的吞噬。现在,我们只能从低地形处的人员那儿了解洪水是什么样子。
汪洋世界
擅长下棋和定理证明的人指出,机器已有智能迹象。为什么十年前计算机占领人类的算术和机械记忆领域时,我们没有得到同样的传闻呢?实际上,那时我们已经得到了。计算能力相当于数千数学家的计算机,被欢呼为“巨型大脑”。在此鼓舞下,出现了第一代人工智能的研究。毕竟,机器与动物是有差距的,还需要人类智能,需要高度的集成和多年的训练。但是,人类重新夺取那些不可思议的东西已相当困难。一个原因是,已经证实了计算机在其他方面是麻木的。另一原因是,人类在某些方面也并不擅长。我们人类很费力地从事记录和算术工作,只能看明白冗长计算中的很少几步,看不到整个计算结果。如深蓝的研制者,我们只能通过对内部过程的了解,才能分析到外部的微妙变化。在模拟天气的重复数学计算中,并不会体现出具体的暴风雨。从电影动画计算过程中,并不能看到恐龙褶皱的皮肤。我们很少称之为智能,“人造现实”可能要比人工智能更能体现出深邃的含意。第七章中将详述这些。
人类在进行定理证明、音乐作曲和下棋时,心理是复杂和隐蔽的,是机械解释所不可及的。人们能够很自然地从事这些,用心灵语言描述,运用策略、理解力、创造性、情感等抽象的东西。当机器能惊人地同时有意义地完成上述工作时,同样做的也是心灵解释。当然,它的背后有许多程序编制者,他们主要以机械解释方式来完成程序。但即便如此,程序运行时在内存中写入的太多、太复杂内容,也是他们无法控制的。
随着洪水到达人口更多的高地,机器就能完成更多人类所能做的事情。机器思维的范围在不断扩张。当淹没到山顶时,机器就能完成人类所能完成的任何工作。那时,机器思维将不言而喻。 
图3.4 苦恼到狂喜 在四十年间,计算机下棋的能力从很低水平发展到人类的最高水平。它融合了许多好的思路,从大量可能性中提炼所需,积累了有关开局、结局以及位置得分调整的评判经验,尤其在试探步骤的数量上增加了千万倍。当下棋机器的专用处理能力达到人类脑力的3%时,就具有人类冠军的水平了。可以认为,卡斯帕罗夫用他脑力的3%来进行国际象棋比赛,其他人则不大可能。这个事例支持基于视网膜的推断方法。未来几十年中,通用计算机的能力会超过深蓝的专用能力,机器会在更普通的技能上开始与人类匹敌。
图灵在半个世纪前预计到了这种情况的出现。
图灵检验
曼彻斯特大学是第一个可行的常规数字计算机的诞生地。1949年,迈克尔.波拉尼(Michael Polanyi)在那里就“思维和计算机器”主持了一个研讨会。来自英国各地的感兴趣的哲学家、生物学家、物理学家参与了这一激烈讨论,这预示了余下的半个世纪关于思维机器的辩论。焦点人物就是艾伦.图灵───曼彻斯特计算机的构想者,二战中机密的译码机也是他的杰作,而对思维机械化这个问题他已经考虑了二十年。在哲学杂志《思维》1950年的一期上,图灵就机器智能的反对观点进行了反击,也就是现在著名的文章“机械计算化和智能”。
在文章中图灵注意到,对于“机器能思考吗?”这个问题的精确解答而言,“思维”和“机械”这些术语显得太模糊了。人造的、类似人体的生物能算机器吗?解决困难的数学问题能算作思维吗?他建议采用不太模糊的问题。一个人通过电传打字机与另一个人或被专门编程的数字计算机对话,在一段时间的自由对话之后,此人无法判断电传打字机另一头的是机器还是人,那么,另一头的机器就可被认为是个智能思考者。图灵猜想,到2000年对内存为十亿字节的计算机编程后,人类无法在五分钟分出它是人还是机器。1998年,这个预测还是可望实现的。此时,十亿字节磁盘存储量的计算机到处都是,许多计算机已有十亿字节的内存。似乎几十年后,当计算机性能高出图灵所设想的性能一千倍以上时,他的预测就会成为现实。
尽管图灵带给我们如何切入问题的思路,但他并不能对“机器能思考”这个问题给出不可争议的论据。相反,却有如下九类持相反观点的文章:
1. 神学上的反对───-思考是灵魂的功能。机器没有灵魂,2. 于是机器不3. 能思考。 4. 逃避现实式的反对───-思考的机器不5. 可能存在,6. 因为后果太恐怖了。 7. 数学上的反对───-机械推理有某些可证明的限制,8. 人类的思维可能并不9. 受此限制。 10. 意识领域的反对───-机器没有内心体验,11. 不12. 能对它们的表达、行动、内部活动赋以含义。 13. 无各种能力说法的反对───-机器永远不14. 会和蔼、快乐、有道德、能感知、有创造力,15. 等等。 16. 类似洛夫莱斯小姐(lady Lovelace)的反对───-计算机只能做那些我们编程要求它做的。 17. 来自神经系统连续性的反对───-神经元对不同18. 的任意小信号响应,而19. 计算机则在固定规模的步骤下工作。 20. 非正式行为的反对───-不21. 可能详细指22. 导机器如何支做人所遇到的每种可能情况。 23. 超感观证据的反对───-人类有时能感觉到远方或未来的信息,24. 计算机决策过程则无法得到。
自1950年起,计算机的性能和数量飞速地增长,对智能机器的追求已成为学术界和商业界的一个主要事业。与此同时,公众就机械化思维的争论使它越来越广为人知。尽管已取得了一些根本性的进展,但争论双方都没有取得决定性的胜利,辩论仍在旧框架内进行。也许会像图灵所预计的那样,当机器的对话、书写、理解、社交能力普及以后,这种局面会有所改变。也许在血和肉消失之后,这个争论仍将在机器人中继续。下面就谈谈这些问题和图灵的观点。
1.神学上的反对
尽管图灵是打破旧习的无神论者,他也无法摆脱英国国教及其核心教义───-人由上帝所造,具有无比的优越性和不朽灵魂。一个世纪前,达尔文的进化论就曾激怒了英国社会上层,而倍受嘲弄,因为达尔文认为人是一种动物。图灵则暗示人是叮当响的机器。当有人称此想法“恐怖”时,立即就得到了受过教育的英国听众的普遍认可,不难想象人们是如何评判的。为什么会这样呢?因为在进化成人类之前,我们的生存依赖于部落群体,具有保护部落完整性的本能。宗教是建立在这个本能基础上的文化大厦,它具有超常特权以保证部落的传统代代相传。
科学寻找现象的客观解释,它不依赖于人的感情、部落价值和传统。多变的科学过程经常会破坏作为社会保护者的宗教的地位,否认原有的宗教信条,另立引人恐慌的新信条。尽管已证实科学有使社会混乱的潜能,它还是会逐步占领并替代宗教继承的信条,因为它所带来的物资利益,远远超过平静的社会秩序和思维下所得到的。图灵指出,教会几个世纪的反对也并没有推翻伽利略的结论───-地球不是宇宙的中心,而是宇宙中一颗运动的普通星体。也许他还提到过达尔文的进化论,其中有一系列的关于我们祖先如何进化的连锁证据,比神创造人的神奇故事更有说服力。不同宗教说法间的矛盾以及错误的解释,使图灵放弃宗教信仰。为了论证,他想如果神并没有赋予机器灵魂的能力会出现什么呢?五十年后的今天,宗教的反对变得苍白无力,而对这些问题的探索又那样的有趣。
宗教对灵魂进行润色,但灵魂的概念源于对意识即谁在我们身体内部的主观感受。机械论的观点认为,人类意识仅仅来源于大脑和身体的物质事件,似乎直接与古代的观点对立,即不认为生命和意识是非物质的精神。这种对立或许只是观察问题的视角不同。即便是最坚定的唯物主义者,都不会把神经细胞的化学过程当作思维和情感,而宁愿把大规模的脑力活动看成是抽象的精神事件。我们的思维得出这些理解,思维纺织了这些抽象!
“数字”是一种普通的抽象。拨算盘珠并不意味着创造数字,清理算盘也不是消灭数字。其他表示、思维和逻辑推断中也会有数字。再想深一点,算盘乃至整个物质世界就是一个大的、分享的抽象概念,与思维、数字这样的独立的小抽象概念相联系。按这个思路下去,我们完全可以相信,不仅仅是数字,思维和灵魂这样的抽象也独立于它们在物质世界中的临时代表物而存在。与清理算盘不意味着数字的消灭一样,身体的死亡并不意味着灵魂的消亡,或灵魂的过去和未来的消失。身体的死亡也不会彻底抹掉意识和感觉,因为它们都是有抽象概念的特性。只是意识领域和物质世界完美的相关被破坏掉。
机器如何获得灵魂呢?当我们排列算盘珠来表示某一数字时,我们就赋予算盘这一数字。同样,我们把机器人的行为解释为表达灵魂的行动时,我们或许能将意识授予机器人。在与人类的交往中,机器的行为越像人类,就越容易赋予其这一属性。并不是每个人都同意这一点。社会伦理学家将机器人的行为只看作是对人类行为的拙劣模仿,因为机器在产生、成长过程中缺乏适度的外部联系,比如机器也许一出来就具有成人的智力,而不经历出生和孩童时代。功能机械师也许反对机器人内部构造代表了思维和情感,假如机器人由巨大的查表程序控制,而表中已预先安排了对每种可能输入的反应,那么能认为它具有思维和情感吗?神学者甚至一些宇宙学家也许要从更高的权威那里得到授权,而大部分的人经过一段怀疑后,对待机器人会像对待一个有智能的人一样,根据其面部表情来判断,而不考虑那看不见的内部构成,因为这是最有效的方式。友善的人遇到机器人时,会打声招呼“今天感觉好吗?”,得到回答会是“遭透了,今天我左侧所有的二极管都很疼”或是“很好,我对此项任务充满热情”。当机器作为一个人而被广泛接受时,我们也许可以说“神”将灵魂赋予了机器。
2.逃避现实式的反对
图灵看到,一些反对机器智能的观点来源于对人类那至高无上的地位将被取代而产生的恐惧感。对此,他没有反驳,只安慰道“这些也许是灵魂的轮回”。为什么无神论者也认可转世呢?我认为图灵暗地里抬高了“将人类思维移植到其他硬件中”的可能性,如把大脑的基本功能转到计算机程序中,将身体机能转到机器人的硬件中。这种移植也许允许人类超越其生物极限,并加入机器的快速进化之中。
我的第一本书《智力儿童》中多次谈到这些内容。或许就像我们的祖先遇到威胁一样,智能机器会激起我们本能的恐惧和愤怒,如一个部落接近另一个部落的领土时,竞争者争夺社会地位时,掠夺者拐骗走小孩时,我们都会产生类似的感觉。但是,有思维的机器绝对不属于上面的这些情况,它们完全是一种新的生命。说行为而言,它们对人的模仿超过了其他东西。它们被传授着人类的技能。将来,它们将拥有人类的价值观,如反社会的机器人软件销量会很低,这样大部分机器人的行为是得体的。我们对机器人应有什么样的感情呢?是我们把它们带到这个世界中,是我们传授给它们生存之道,它们与我们这么相象,并将在我们离去后接管这个世界。尽管对它们来讲,一个好的品行需要细心的培养,但我想我们还是应该把它们当作我们的小孩,是希望而非威胁。到时候,它们会超越我们,有它们自己的目标,当然也会犯些错误,走它们自己的路,它们和我们相处也许是很美好的记忆,但毕竟这没有脱离小孩的成长范畴。
3.数学上的反对
有大脑的生物按详尽的时间顺序来想象可能的未来。人类却放弃了细节和时间,通过抽象思维在可能性网络中寻找捷径。起初,不依靠其他工具的推理为我们那少量的、短暂的、不可靠的短期记忆所限制,只有当亚里士多德和后来的一些思想家将此过程在纸上表达出来时,这种推理才被大大提高。冗长而精确的推理链将明显而简单的假设变成奇妙而怪异的定理,正如欧几里得的几何书中所表现的那样,这给推理赋予了神秘的色彩。当笛卡儿演示如何通过图表完成几何问题时,当后来的数学家用少量的简单公理解决算术问题时,当其他数学家用数学逻辑包容一切思考时,推理的奥妙得到了进一步的加深。1900年,大卫.希尔伯特(Dvaid Hilbert)提出一个程序,以井然有序的“机械”方式用有关集合的若干公理,系统化所有的数学问题,希望最终能将每条真理推导出来。
1931年,库特.哥德尔(Kurt Gёdel)得到了如何把算术陈述编码成一个巨大数字的方法,这样被解释成仅关于数字的描述的数学定理就可以被看作是在讨论其自身。以此为基础,他建立了一个精确的算术陈述,意思是“这个陈述不能从算术公理中推导出”。如果算术没有任何隐含的矛盾,也即不能称之为说谎者,哥德尔的这个命题一定不能推出。如果推不出该命题的话,那么它的内容就是正确的!哥德尔以此推翻了希尔伯特的论断。
20世纪20年代,还是个年轻人的图灵吸收了希尔伯特机械化数学的想法,将一条长带子分成许多单元,每个单元包含有限符号集中的一个符号,进而设想机器可在这样的带子上进行简单的纸笔计算。由一些简单规则控制的“头”,从一个单元移到另一个单元,擦掉并写上新符号。每条规则都必须指出,当遇到不同符号时,在它的位置定上什么符号,“头”将朝哪个方向移动,是否要停,或者下面要遵守哪条规则。图灵证明,所有正式的数学操作都可以由这个简单的装置完成,此装置被称为图灵机。更重要的是,图灵造出了规则集,使图灵机上带子的内容被解释为其他的规则集,也称为程序。这使得通用图灵机可以模仿其他机器甚至它自身。与哥德尔类似,图灵指出通用图灵机不能解决自相关问题,但局外者有时可以解决。
现代计算机就是图灵机。存储程序和数据的内存,相当于图灵机中的带子。因为通用机器能被哥德尔问题难住,而人类能解答此问题。所以数学上持反对观点的人认为,通用机器比人类低级。对“人类没有这样限制”的假设前提,图灵提出了自己的看法。比如,我们或许会问诚实而有思想的罗杰.彭罗斯(Roger Penrose),“罗杰会如实地给这个问题一个否定的回答吗?”罗杰意识到,如果他回答“是”的话,正确答案将是“不”,而他的回答“不”将会引起“是”的正确答案,所以他不能正确地回答这个问题。很明显,对我们而言正确的答案是“不”!我们能够提供正确答案,但它却难住了罗杰,于是就得出我们就高于罗杰的结论,这和数学反对中所论述的人类高于机器的方式一样。
很明显,这是毫无意义的胜利。不论罗杰还是机器都可以用同样的问题击败我们。任何人或物,如果能对自身论述进行思考,并且限于只讲真实情况,都是易受攻击的。事实上,如果人们撒谎、开玩笑、反驳自身的话,也就相当于丧失了回答哥德尔式问题的资格。数学反对的前提是,机器是严格而一致的逻辑推理者,不能耍花招。当一些定理证明程序希望能达到如此的准确度时,大量的“专家系统”和机器人控制程序承担着近似知识和对立的证据,它们能引起误差并能容忍误差。一些程序还有能力使自己跳出引起矛盾的循环。
数学上的反对也许认为,在近似的推理程序后面都有一个严格而具有决定论性质的计算机,而它却易引出悖论。这点也许与现存的推理程序无关,因为它们太笨了!哥德尔悖论需要的被推理事物应能够表达推理过程本身,不能充分表达的系统被排除在外。例如,欧几里得的点、线、长度、角度的范围太有限,不能对几何逻辑编码,于是与算术不一样,几何是没有哥德尔命题的。可能现有的近似推理程序包括的时间、存储、功能太有限,而不能考虑机器语言对内部的描述,所以它们也在所谈问题之外。对于以神经元机器为基础的推理程序,复杂的限制同样会使其免受哥德尔悖论的攻击。但是,也许一个有关神经元的哥德尔命题能用文字表达。也许世界上最深的洞察、最有趣的幻想、最无规则的旋律、最可笑的笑话或是最邪恶的诅咒将会困扰人的思维,并陷入哥德尔式圈套。
正如睡美人被一个吻惊醒一样,外部干扰中断了人类的梦想曲。哥德尔推理系统和图灵机,是不间断地沿着严格的轨迹前进的理想模型。这条轨迹由微小的初始定义铺设,难怪存在这么多限制。相反,人类、机器人甚至是进行图灵对话测试的程序,幸运地拥有了无穷尽的外部信息流,使它们在这条轨道上不断探索前进。
通用图灵机能模仿其他任意的计算机。在计算开始时,图灵机的带子由初始程序及数据的有限串所设置,其他位置全空。当运行时,带子上能填任意多的符号,也许会无穷尽地进行下去。最初有限串的设置可被当作一个整数,带子的最终状态也可被看成一个数字,但数字的位数是无限的,所以它将被当作实数。一个初始状态可能会导致带子上最终被写成0.33333333…,另一个初始状态或许导致3.141592653589793…每个十进位的分数都能这样产生吗?一个世纪前,康托尔(Georg Cantor)证明无穷的十进位分数不能以任何有限长的整数表示,这震惊了数学界。但是,图灵机却将每个初始设置的“整数”转变成最终的“无限分数”。只有很小的一部分能够这样表示,其他绝大多数是“不可计算的”。不可计算的数字像不可证明的定理一样,是任何有限、闭合的推论系统的基本障碍。
然而,计算机提供的真正随机设备,可以在带子的连续单元中写入无尽的随机数字流,这样就产生出不可计算的数字。还可以得到用其他方法得不到的随机“公理”,只要没有证明与其他公理不致的话,它就是“可信的”。随机信息解开了哥德尔式牢笼。物质世界甚至有更好的资源,因为它不仅提供了无穷的新鲜信息,而且给出了前进方向。达尔文进化论依赖于环境随机的扰乱基因,依赖于去劣存优的环境选择。同样,学习依靠外部世界的多样性和一致性。这些塑造了我们的身体和思维,现在又在塑造着我们的机器。
物质世界不但有无穷的外部输入,而且包含了人类和机器的内部组成。合理的思维是神经元化学或电路开关的抽象,但化学和电子学是跳动的场和粒子的抽象。这些跳动的物质定理也能由数学公理描述,所以也易导致哥德尔悖论。从我们精神过程的物质描述来看,它很有可能来自无解的哥德尔命题和图灵问题,尽管将我们精神运作分解成基本数学物理过程异常的困难,但一定存在交物质事件对应于逻辑命题的映射,能把实际无解的行为解释为精明的哥德尔命题!百万年来的残酷经历表明,动物和人易受影响的程度,正如机器在这种数学攻击面前的脆弱程度一样。
4.意识领域的反对
宗教思想家信奉灵魂能将人和机器分开,但是最世俗的东西也能引起主观经验。曼彻斯特的神经外科医师杰弗里.杰弗逊爵士(Geoffrey Jefferson)是这个领域的先驱。他在1949年关于“机械人的思维”的演讲中用到了下面的语句:
直到机器因为具有思维和情感而能写诗和作曲,而不是无目的组合符号时,我们才认为机器和大脑等价,也就是不仅做而且知道已做了。没有机械装置能在它成功时感受到快乐,阀门熔化时感到伤心,被恭维时感到兴奋,犯错误时感到悲惨,被异性所吸引,得不到所要的东西时会生气或伤心。
图灵注意到,尽管我们每个人都知道我们会被想法和情感所促动,但关于其他人我们却没有直接证据。也许世界上的所有其他人都读台词的演员,电影的投射,仅仅是光和声的模式。这种哲学立场被称为唯我主义,但它只有少数的追随者。当别人描述的动机和情感与我们自己的类似时,我们通常相信他们。图灵设想,具有智能的未来机器能告诉我们其感受以及行动的原因,因而也可被当作有意识的存在物。
下一章将会介绍能够表达内部感情的“通用机器人”的进化。第一代通用机器人会有动力知觉反射功能,第二代则增加了条件学习机制,第三代含有建模手段,第四代中出现了通用推理模块。反射功能赋予了基本的自然竞争力。内部的肯定和否定条件模块是个性表现的核心。在条件系统对可能结果的判断基础上,自然事件和社会事件的建模体系提供了远见和共鸣。推理模块从建模方案中得到抽象、概括和评论。
机器人的社会心理模型依据它所接触的人、机器人或动物的意图和情感而得到的。比如,机器人锁门阻挡了人合理出入,这件事将会被反向加深。因为建模块指出被阻挡的人可能不高兴,激发了“人类不高兴”的条件模块。当问到为什么把希望被锁在外面“。当问到为什么会这样想时,机器人将心理模块作用于自身,引起对不高兴的人的反向反应,回答道“我不喜欢做让罗杰不高兴的事”。
即使是简单的机器人,也是在对外界的看法的基础上而行动的,如道路是否畅通,需要的物体是否在某处,机械手是否抓到了物体。正确的看法产生明智的行为,不正确的看法将导致诸如撞墙或抓空气这样的古怪行动。第三、四代机器人的社会模式用看法来表示意图和情感。当用这些模型分析自身的行为时,机器人产生出关于自身感觉的看法,以描述自己的行为,例如“我绕过装卸码头,因为我怕遇到暗礁”。它有真正的情感吗?它仅仅相信它有吗?或是它仅仅表现得相信它有真正的情感?或许我们可能问自己同样的问题。在第七章中我信为,情感、信仰和思想都是对物质世界的任意解释。一个可接受的解释是,机器人只是一个没有思维的机械装置,信仰和情感,并以此来说明它本身具备这方面的能力。图灵认为,第二种解释将被大多数人自然应用到能适当交际的机器人身上,而不考虑它内部是如何实现的。
5.无各种能力说法的反对
“图灵教授,我承认机器可以做你提到的所有事情,但是它不具备以下能力或完成不了以下任务,如和蔼、机智、漂亮、友好、进取、幽默、有创造力、去伪存真、犯错、陷入情网、享受草莓冰淇淋、勾引、吸取经验、用词妥当、受自己思维的控制、拥有与人一样多的行为、做的确新鲜的事情。”从现存的数以千计的机器来看,对图灵推测的概括非常简单和丑陋,且应用面窄、不灵活、可预测。
1950年以前,如果直接描述机器人能胜任某些任务的话,可能会引起怀疑,毕竟差别太大了。五十年后,计算机已普及到日常工作和生活中,对于机器性质的直觉概念已发生了根本变化。随着机器学习的速度、存储量以及程序设计和数据库的提高,许多“永不出现的事物”变得极其常见,有一些也即将实现。尽管计算机的复杂性仍远比不上人类,但其发展速度相当快,以致关于机器不胜任的言论越来越少,且越来越信心不足。
6.类似洛夫莱斯小姐的反对
维多利亚女王时代的英国人查尔斯.巴比奇(Charles Babbage)是第一个构想自动数字计算机的人。他的“分析引擎”有机车那么大,包含数以成计的十齿齿轮,由蒸汽引擎提供能量,受针鼓控制,像一个音乐箱子,一系列含有程序的冲压卡决定了它要执行的主要步骤,类似花布织机。这个雄心勃勃的计划引起了拜伦公爵的女儿埃达.洛夫莱斯(Ada Lovelace)的兴趣。1842年,在对机器和程序的详细描述中,洛夫莱斯写道“分析引擎没有任何创造事情的能力,它能完成我们知道如何让它完成的任务。”
20世纪50年代,当对“巨型大脑”的恐惧心理影响到计算机市场时,IBM市场部提出口号“计算机只能做程序所规定的事”。他们做得非常好,以至到60年代这句话已众所周知了。
作为第一个程序员的洛夫莱斯女士很幸运,从来没有可运行的计算机来检验她的程序。现在的程序员都很清楚,几乎每个程序在艰苦的调试之前表现都很混乱,从来没有天生驯服的程序。类似时间分享系统和网络的信息生态系统,行为更倾向于任意,这是由意想不到的交互、输入信息和干扰引起的。
实际上,完好的程序能得到意想不到的结果。数学程序能得到程序员花费许多时间也得不到的结果。下棋程序搜索到可替换的分枝树后,所出的怪招会使程序员甚至国际特级大师感到震惊。手写体识别和语音识别的学习程序,在处理了数以万计的样例后,得到了微妙的统计识别器。程序已由早期的几百条指令发展到如今的几百万条指令。现在的程序员并不见得比巴奇时期和图灵时期的程序员聪明,但他们的工作起点高,用到的抽象概念不断升级,更大范围内容都可让计算机去完成。自学习的功能使机器对外部的不可预测因素有了更强的适应力。那种认为计算机以及由其控制的机器人是人类程序员的工具的错觉该结束了。
7.来自神经系统连续的反对
像离子势、神经传递素浓度、神经系统中的放电计时这样的宏观的物理量都为某种实际目的而连续变化。数字计算机却因其设计而忽略了物质的连续性,用离散的数字代表物理量,更确切地讲,这是在计数而不是在度量。如果精度要求高的话,许多人感到度量比计数更强有力,于是与神经系统相比,计算机存在固有的不足。
信息在数字化传输、存储和处理之前的几十年里,都是通过有线传输、无线传输、磁带存储和“模拟”计算机以连续的方式进行存储和转移。过去学习模拟技术的通讯工程师目前都在掌握数字技术。很少有模拟过程能够重复操作到小数点后第四位,因为它们不断地被微观热运动所干扰。另一方面,当对一个量配置30个转换开关时,数字计算机能有十位的精度。在手工制作机器时代,建造和调整一个大而慢的模拟旋钮要比30个小而快速的数字开关容易得多,今天的集成电路技术使电路元素的重复非常容易。在信号精确度、数学的灵敏性、存储和传输的无错性方面,数字形式比模拟形式具有更大的潜力。数字技术的这些优越性以及快速下跌的价格,确保了这在计算机、通讯、音频和影像等方面的优势。模拟技术在它保持优势的领域内仍然存在,如机器人终端效应器和传感器。
模拟优于数字的天真想法可能来源于人类对算术的不熟练和人类感受位置、尺寸的敏捷性之间的对比。图灵认为用随机小偏移量干扰数字量,数字计算机很容易模仿人类的不精确性,通过图灵检测。
8.非正式行为的反对
“图灵教授。人在其一生中会遇到许多意料不到的情况,并以新的、不可预测的方式来处理。机器中的规则集却无法对所有的可能性都有所准备。因此,人不可能是机器,机器也不会像人一样行为。”图灵发现难反驳这个论证,但他猜想这可能来自模棱两可地使用“规则”这两个字。一方面,存在如“红灯时不要横穿马路”这样的社会规则;另一方面,存在如“物体沿受力方向加速”这样的自然定律。即使是埃米莉.波斯特(Emily Post)也不可能编辑出一个涵盖所有情形的社会规则表,但我们希望自然定理包括在内。
对于任何可预见或不可预见的事件,一个机器必定会以某些方式进行反应。一个已厌倦于简单重复工作的机器人在身处悬崖边时,“向前”的按钮被按下,它会兴奋地跳下并摔得粉身碎骨。当反应机制与复杂的环境杂合在一起时,最有趣的行为会发生在有序和混乱之间。装配一个玩具机器人,使它在遇到左边的碰触时向右行驶,遇到右边的碰触时向左行驶,并可由障碍重新定向,迂回行进。以同样的方式接上光传感器,它会神奇地腾越,躲避障碍并追逐光线。更为复杂的机器人能对大范围的输入有所反应,从简单的反射到精心设计的行动程序。在丰富的背景中,它们的行为和规则自发交织在一起,就像人一样。
9.超感观证据的反对
当科学家把预言者、幻术家、巫师等当作江湖骗子驱逐出去后,如今再看这类说法似乎十分奇怪。但在图灵写的时候,情形则截然不同。1935年,约瑟夫.莱因(Joseph Rhine)在北卡罗来纳州的杜克大学建立了一个“通灵学”实验室,对人类仅仅通过思维来感受、影响远处或将来的事件的能力进行了第一次可控的科学实验。莱因的实验室及它的模仿者,公开了一些有关“超常”能力的证据,所用的方法使相当一部分的科学团体信服。到1950年,对超常能力的研究成了非正式科学讨论中的热门话题,当然包括对智能机器人的讨论。


|