
《机器人》 ROBOT - MERE MACHINE TO TRANSCENDENT MIND [美]汉斯.莫拉维克 著 汉斯.莫拉维克(Hans Moravec),机器人研究领域的权威之一,曾参与世界最大机器人软件的创立工作,现在卡内基-梅隆大学工作。著作有《智力儿童:未来机器人和人类智能》等。
翻译 马小军 时培涛 责任编辑 张晨 静晓英 中文版封面设计 戚永昌
ISBN 7-5323-5918-2 上海科学技术出版社出版 前 言
小时候,我曾试图将无生命的机械装置集成生命体。从这些尝试开始,经过了近五十年的积累,我在1978年的一篇文章中表达了这一想法,并于1988年出版了书作了进一步阐明,这方面的工作在1998年得到了更多的进展。 1978年,我在斯坦福大学人工智能实验室完成了有关移动机器人视觉的论文。我不同意实验创始人约翰.麦卡锡(John McCarthy)的观点,他关心的是计算机推理。在专业领域中,推理程序已超过了人类。约翰认为,现有的计算机只缺乏合适的程序以使其具有完全的智能。而计算机视觉却以另外的方式开拓了我的思路。机器人眼睛的每次扫视将得到上百万个马赛克点。处理每一点要花费计算机数秒时间,寻找扩展模式则要几分钟,而要达到两眼观测完全立体匹配的话,将需要数小时,而人类视觉却能在瞬间处理更多的信息。
在1978年,没有一个机器具有接近人类的感知力、肌肉运动能力或推理技巧。更糟的是,朝这些目标的进取似乎陷入了泥潭。为了抑制流行的悲观情调,我提出了进化的观点:具有像人一样的行为需要当时计算机的能力提高百万倍,也许在短短的十年里将上百万台最新的微处理器相接,运用速成的程序能满足上述要求。当年的科幻杂志Analog引出了这个论点,题目是“当今的计算机,智能机器和我们的未来”。
该文呼吁人们在计算机硬件上投入大量资金。它不合理地认为,只有这样才可能制造出类似人的机器。接下来的文章似乎更具体些,预计二十年内将出现价格为几百万美元的计算机,它们可以具备人类的竞争力。但在人工智能领域中,研究单位所拥有的计算机主机被科研小组所有的微型计算机所取代,不久又被工作站和个人计算机所代替。并且,价格/性能比仍在不断提高,而个人计算机能力也最终降到了最低点。我仔细地重估了以前的数据,并在我1988年出版的《智力儿童:未来机器人和人类智能》中做了具体阐述。书是提到,在未来的四十年中,会出现能设计出类似人类行为的售价为一万美元的个人计算机。
1990年的个人计算机能力超过了1978年的主机能力,先前棘手的问题开始有了解决途径,很快,家庭计算机就能进行印刷字体的识别和语音识别,正在实验中的机器人也能在过道和马路上行走。在比《智力儿童》更坚实的基础上,本书提出,具有类似人类竞争力的售价为千美元的计算机将在四十年内出现。快速增长的计算机能力部分地弥补了比预计略大的困难。 《智力儿童》中的短斯预测都成为现实,只有一个例外。目前仍然没有出现实用的移动机器人来帮我们处理家务事。1988年,几个小公司开发了能够沿预先安排好的路径行驶的保安、清扫和运输机器人,以监测墙壁和昆虫这样的特殊标志。我曾希望这能导致研制出更高级和更市场化的机器人,能感受周围环境,自由行走。唉,可惜第一批机器人吸引不住顾客,这些公司情况也不大妙。现在有了感知机器人,遗憾的是它只在研究背景下才能发挥作用。但是,这次一定会成功!根据第四章对实用机器人的预测,我正在进行一项商业计划,以赋予工厂里现有车辆足够的空间认知力,使其到2000年能在未知的区域中工作;到2005年,设计出小型家庭真空吸尘机器人这样的机器人,以拓展机器人市场;到2010年,实现能力更强的多用途“通用”机器人。其他的机器人方案也正在进行之中───这就是一场竞赛。
第四章提出四代通用机器人,每代跨度十年。第一代有晰蜴般的空间感知力,第二代增加了老鼠般的适应力,第三代有猴子般的想象力,第四你具有类似人的推理能力。这种一致性编排来源于每种动物的大脑原型与稳步增长的计算机能力相匹配。我们的祖先用了三亿年从小的脊索动物(有昆虫般的复杂性,正如现在的机器人)进化到类似晰蜴的动物,再过了一亿五千万年变成了老鼠一样的动物,用了七千万年成为猴子般的动物,最后又花了五千万年进化成人类。我的时间刻度可能对短期而言太粗略了,对长期又太保守了,这正是技术预测中的一个典型的问题。下一本书(约定2008年出版!)将肯定包含一个更正的方案。
在我的主页上,用查询词“hpm98book”可寻找新的进展、评论、资料和彩色插图。下面的网址就能提供有关信息,网址是:http://www.frc.ri.cmu.edu/~hpm/book98/。
汉斯.莫拉维克
目 录
前 言 第一章 逃逸速度 第二章 小心!机器车辆! 第三章 能力和显现 第四章 通用机器人 第五章 机器人时代 第六章 智能时代 第七章 智力之火 注 释 致 谢 索 引
第1章 逃逸速度
人类进步的脚步深深地影响着我们这个世界和人类社会,而只有在人类文明超越了夜与昼、冬与夏、生与死的循环时,人类才意识到这一点1。一旦历史的轨迹记录了普遍性的变化,那么在一个生命时段中就可辨别出这种变化加速的步伐。从能量、信息、速度、距离、温度、种类等几乎所有的量度来看,已发展的世界朝更有力量、更复杂的方向发展的速度超出了以往的任何时代。这一论断至少在近五百年内是正确的,甚至可以说自农业革命和文字出现以后的五千年内,这一论断也几乎是正确的。 这个加速过程中的许多产物,例如书面语言、城市、自动化等,更进一步加速了这个过程。今天,这种步伐超越了人类的适应性极限:技术培训课程往往在其结束之前就已过时了。不过,加速过程仍在进行,因为在人类畏缩不前的地方机器取代了人类。20世纪70年代,照相技术用在集成数十上百个元件的集成电路的制造上,当时这是在塑料薄板上手工设计和绘样的。今天的计算机芯片集成的元器件有上千万个,它们由计算机的设计程序加以设计。一代机器不但可以制造下一代机器,而且能在一年之内完成,而纯粹由人设计平均耗时是三年。 计算机的自加速进化影响着其他的技术领域,计算机工作站和通讯扩展几乎每位设计工程师的工作。波音-777飞机许多部件的设计就是一个很好的例证,它们由不同地方的工程小组并行设计,而每个小组都运用功能强大的三维建模程序。对局部装配设计的检验是通过计算机模拟程序进行的。模拟程序可以用来检测机械、电气、控制、航空动力等大大小小的问题,而远在真正飞机制作之前这些问题就能很容易得到消除。这样,制造一架空前复杂的飞机耗时只需以前的一半。同样,化学家和生物学家只需用几星期进行分子模拟就能完成过去数年的实验室工作。20世纪90年代初,建筑师们用计算机取代了画板和手册,使其商业能力提高了四倍。
正在消逝的真理
“向上抛起的东西总会落下的”,这是早期的重力理论,在日常生活中被证实正确的,一千年来没被怀凝过,直到牛顿发现了新的引力定律证明足够快的卫星可在稳定的轨道上绕地球旋转,而更快的抛体可脱离轨道而运动到无穷远。“擦热的木头会凉下来的”曾被我们的祖先视为自明之理,直到有人用力摩擦超过了木头的燃点,这使木头仅靠自身就变得越来越热。工业社会中,“机器发生故障”可被证实是正确的,随着机器越来越多的设计、诊断、修复自身,机器还会出现突然垮掉的情形。一旦获得“逃逸速度”,具有超过我们所知道的能力的机器,在没有我们帮助的情况下,将变得更有能力,从外界学习。这就像在生物进化和文明进化过程中人类的表现。木头已冒出火苗了。
与上升电梯中的乘客一样,那些沿曲线上升的人也不知道其所处的高度,除非在行进中从窗户里瞥到地面。1930年,澳大利亚的淘金队在被认为无人烟的新几内亚高地深处,遇到了与外界隔绝五万年的人类文明,手持石头长矛的****部落居民,当其茅草村庄旁降落了咆哮着的银白色“巨鸟”时,他们感到万分恐惧,不知所措。在他们眼里,巨鸟里出来的白人是怪人,他们皮肤松驰而且没有明显生殖特征,这些怪人用标有“柯达”字样的黑盒子捕获了他们的灵魂2。 1991年,大卫.库佩纳瓦(Davi Kopenawa)从丛林中走了出来,第一个代表他们部落(亚马逊河的雅诺马马族)讲话,迈出了巨大的一步。雅诺马马族有两万人,是仍停留在石器时代最大的部落。当一些20世纪的传教士、人类学家直到最近的筑路者、淘金者入侵他们的家园时,他们与外部世界已隔绝一万年了。在翻译陪同下,库佩纳瓦带上他仅有的财产,以及送来专门用于旅行的运动衣、牛仔裤、旅游鞋,参观了华盛顿、纽约、匹兹堡。他恳求外界不要干涉他们的部落。在五年内部落外的疾病,尤其是疟疾,已使五分之一的巴西雅诺马马人死亡。
在城市中的见闻使他惊恐万分:人们如蚂蚁般疯狂地涌入像天一般高的建筑里,追求着汽车、金钱、财产,而非亲情与自然。在一个动物园中,他对那些生活在塑料植物、铁笼子、极差的空气中的无精打采的动物,表达了深深的同情。他说:“如果我在你们的城市里生活一个月的话,我会憋死的。这里没有森林。” 库佩纳瓦这点说对了。我们生活其中的这个世界在文化和实物上,都远远不是从生物学的角度适合人类生存的世界。我们形成于近两百万年前的冰川期──一段气候持续变化的时期,每隔上万年冰川就要覆盖大部分土地或从其上退出(目前的温暖期是间冰期)。如些大的变化赐予了生命高度的适应性,生命不会在完全最优条件下存在。人类高度适应性表现在不断进化的大脑和延长的孩童期,以支持着极端的文化可塑性,从各种表达方式的语言到快速传递着的行为:当进入青春期时,我们完全可以成为穿着毛皮的北极猎人,或是身穿长袍的游牧民族,或是无衣遮体的赤道居民。几乎在所有的人类历史上,包括库佩纳瓦的那个部落,文化传统起到直接的支持作用:提供满足基本生活需要的方式。但某些方面,在五千年前的文明史上,生物性和文化性之间的关系发生了根本性的变化。
文化的革命
文化使我们很快地就适应环境的变化,因为它是一种新的进化的媒体。所有的行为规则(memes,出自理查德.道金斯3)代代相传,存在着变异和竞争,正如生物的遗传基因一样,只是变得更快。一种生物特性需要经过几代的选择复制才能在群体中建立起来,但一种文化习俗却能在短短的一代时间里改变数次,并在整个部落中传播。经过数十万年缓慢曲折的文化进程,我们的祖先艰难地获得了一套行为,它们促使产生更多的行为、记忆、物质工具来支持自身,即自加速循环在今天已达到了逃逸速度。除了技能的简单积累,确切地说,什么东西点燃了火种?这是个很有趣的问题。初期的繁荣或被迫向气候适宜地的迁徙,可能导致狩猎和资源的减少,这强迫未来的生存者进入农业时代。最终,在一万年前的近东和中国出现了第一次农业文明。 几百万年来,包括我们祖先在内的灵长类动物一直以部落的形式生存。在灵长类动物中(与犬齿群类似而与牧群动物不同),每个个体只知道群体中的某一个,维持长期的一对一的关系,包括统治、服从、友谊、敌意、债务、嫉妒、密谋等关系,即肥皂剧的方式。复杂的社会化赋予了部落更大的能力。在严峻的环境下,个体们知道在什么情况下该信任谁。但记忆许多个体的诸多将占用大脑的存储空间。罗宾.邓巴(Robin Dunbar)4已发现猴和猿的脑容量和群体大小的紧密线性相关关系,例如短尾猿大约十五个成群,而脑容量大一些的非洲小人猿和大猩猩则三四十只成一群。这种肥皂剧式的连接,可能会驱使灵长类朝大的脑容量方向进化,因为部落群体在竞争食物和领土时,大群体很可能会击败小群体,因些大部落(即个体有大的脑容量)具有优势。邓巴从灵长类自然体与脑容量的比率曲线外推,根据人的脑容量得出人类自然群体应该有两百个左右的个体。事实上,这是独立的、非等级人类群体的最大限度,雅诺马马印第安人村庄、吉普赛人群的数量都证实了这点。现代社会个体间相识的重叠关系网使这个概念变得模糊,但并不会消除从普遍存在事例中取证得到的这种群体数量限制。我妻子参加了许多教会组织,注意到教会中的会员人数接近二百时,就会出现身份混乱的危机。在20世纪70年代,卡内基.梅隆大学计算机系以它的合作、“家庭”气氛而闻名,当时它只有一百人。在20世纪80年代该系人数急剧增长,20世纪90年代计算机学院的人数超过了六百,分若干个系,而不同系的成员相互是陌生的。 一系列的社会发明导致农业文明远远超出了村庄规模。产生出了一些社会角色,如国王、士兵、牧师、商人、税官、农民,从服饰或其他标记可以清楚地辨别他们,而不必去记住几千个人之间的关系这样不可能完成的事。新的方法也带来了新的问题。在村庄里,骗子很容易被发现并受到处罚。但在社区里,骗子们能找到很多机会,能找到许多地方匿名躲藏起来。道德权威、法律制定、警察、犯罪标志等代表着强制制度的出现,可以部分地抑制违反合作的行为。“谁欠了谁什么”之类的问题,在村庄小群体里是个记忆的事情,但在城市出现后就会引发犯罪。为明了此类事情,促使记录体系的发明,包括标记和数字体系,最终出现了文字。新社会职责含有许多不像部落生活那么简单的复杂过程,了解这些是很困难的。当社会进化的步伐进入需要正式培训阶段时,也就出现了教师和学校。 
图1.1 群体生活和硅芯片 经历了上百万年,人类进化到如上图所示的生活环境。文明性进化带来许多如上图右所示的奇异东西,这是生物体进化无法比拟的。众多人设法挤进这些奇怪的新模型中,这是由祖先遗留下的适应性所决定的。如果我们发现这种方式很不舒适,也并不奇怪,也许某些人从来就没有试图使其舒适。 像村庄小部落时代一样,文明时期也竞争资源,并可能从促进革新的公共制度中获益,使人类文明的进化进入更高的层次。对四季变化和天体运转的精确知识促进了农业发展,军用和民用的工程也因专业思考者和建筑者们的参与而变得更好,所以天文学家/占星家、哲学家/魔术师、工程师/艺术家就成为社会的一部分。专业思考者的革新通过越来越有效的书面语,大范围地长期传播,加速着革新自身。这远远快于生物进化,产生出更适合人类居住的幽雅环境、更快的活动和交往途径、更多的被占领土和被控能量。这个世界越发与小群体村庄那种稳定的、游牧的世界不同,人类的行为不断演化,并对人类的适应性提出了更多的要求。
无水之舟
目前,机器全方位地向人的能力逼近,石器时代的生活规律就越发与信息时代的生活不相配。发达国家的工作变得越来越专业化、难以理解,且经常是只有高学历人员才能胜任,而他们必须将一半的工作时间用于继续学习,以掌握必要的非自然技能。社会分工变得越来越复杂化、专业化、远离了我们的禀性,它们需要越来越多的时间进行演练以达到掌握的目的,却很少使内心感到欣慰。技术社会的本质功能并不面对不断增加的人口。就连相当成功的人们也经常发现他们的工作枯燥、不自然、困难、不满意,更像是一场演不完的杂技,而非真正的生活。吃饭、抚养后代这样的原始行为,经常被一些奇怪的新任务所打乱。本能和必要之间的不匹配,使人类在特质空前丰富之中产生了疏远。
按照人类的遗传种族心理的标准,我们目前是病态的、疯狂的。然而在生理上,我们更健康、活得更长了,在每个活动范围内有了更多的选择。虽然对目前的生活不满,可是城市居民几乎没人能够接受石器时代的森木村庄生活。相反,许多第三世界国家正在采纳发达国家的模式来尽快克服其物质问题(大卫.库佩纳瓦现在是全球范围内生态学会议的大会发言人,他的言词可在互联网上得到)。而同时,在都市化的地方出现了效仿部落群体的教堂和其他社会组织,这些组织把村庄规模大小的群体聚集起来,具有共同的经历、确定的神话传说以及一致的行为期望。有些人在竞技体育(很像部落战争)、远足度假甚至后院烧烤中得到放松。类似捕猎巨兽的商业活动缺乏真实的场景、慢慢的接近和满意射击的情形,但周末打一下高尔夫可以弥补不足。随着生活更加快速、多样、地域遍布全球,即使偶尔模仿一下祖先的生活方式也很少找到机会,且难以令人满意。这个世界以越来越快的速度远离我们祖先的模式,扩展着人类生物和组织结构上的适应性。 有些个人和群体想尽力摆脱这个问题。在宾夕法尼亚州有生活在19世纪早期田园式工业化状态中的严紧派(基督教的一派),有过着与世隔绝的部落生活的隐居宗教群体。在20世纪60和70年代,出现了故意效仿原始村庄的反文化乡村公社。工业化社会不断增加的人口、地域的易达性、各领域的竞争力,似乎侵蚀着这些群体,他们不可能限制其成员不用先进的医药、食物、服装、建筑材料、有用的机器,尤其是使人强大却又分心的教育。
目前仍存在着希望世界倒退回去的呼声。他们在人数上远远少于要求食物、住房和文明所带来的舒适的人。非常矛盾的是,随着人类文明进入自维持的成熟期,它却提供了使人类及自然回到过去的仿真手段。
回到未来
由于更多劳工的参与和更高效机器的应用,工业革命时期的生产率猛增。创造出来的财富通过简单的分发以及工会、税收等社会新措施在全社会中广泛分配着。社会财富通过增加的公私消费和休闲时间来体现。近三个世纪以来,工业化国家中的奴童工以及每星期的百来个工时,已经为每星期四十个工时和法定的退休制度所取代。
尽管程度上有所不同,机器最终会承担所有的基本工作,各地方的人都会有可支配的闲置钱财。在工作时间里,人们被单位的怪异事情束缚,在空闲时间里,人们能从事满足人类本能的活动。人类会重新赢得机会,以更自然的方式组织生活。不断变绿的地球很可能正是这个过程的一个结果。社会工业化程度越高、越富有,不断增加的消费就会毁坏森林、增加环境污染等等,直到达到一定的程度。 用可承担的代价营造一个绿色环境,能减少工业化的负面影响,先进技术一方面拓宽了人们自身生活的选择,另一方面也拓宽了对世界的选择。随着人均年收入超过一万五千美元,美洲、欧洲、亚洲的发达国家正在接近这一转折点。通过加速技术革命,先进的机器人将间接地加强这个趋势,如到外层空间工作。它们将直接参与到能量和化工密集工业的分离中,还能改变生产过程。机器人数量的增加会更有效地获得同样的结果,它们可以用微型手指在小刻度范围内不知疲倦地分类和排列。
任何选择都会产生一定后果,人类这样做相当于让出了困难的、不舒适的、未知的、但极其重要的机会。
现今的一些组织、自动化程度极高的公司不仅在日常生产、分配上竞争,而且还在规划、发展、研究上进行着角逐。外层空间会提供空前多的能量、物质、空间、或许还没有税收,具有极大的吸引力。很快地,自动化工业会远离地球。太空工业会持续地发展,它的规模、效率、多样性、智能化等方面会迅速提高。尽管地球范围内的这部分的绝对规模不会减少,但相对份额将不断缩小。在规模越来越大的太空扩张行为中,地球变得越来越不重要。
机器人工业是现有企业为维持它的组织结构、合法的以及有竞争力的体系而产生的。但它们涉足到已扩张的非传统领域,有些不具备人类属性。我们的这种人造后代在活动空间和结构上超过人类,具有类似的思想和行事动机。它们的行为与过去地球上的生存体极不一致。尽管如此,他们的缔造者───人类可能以一些形式被保护起来,也许这些形式对我们来说非常奇怪。人类个性很可能以某些方式融入未来社会活动的主流中,要么被超级智能的主体所保护,要么转化成一种与人类兼容的形式───而这种形式肯定是无人类属性的。 
图1.2 上升,然后下降(美国收入总值和空气污染关系图) 丰富的知识和财富增加了人类的可选择性。个人需求一时会超出社会供给,但最终社会商品会满足要求。20世纪70年代以来,尽管人口在增长和消费在增加,当人均年收入超过15000美元时,美国的环境污染有了显著的改善。
几十亿年前从简单的化学变化向第一代生物体的进化过程,与从人类学习掌握技能向技术文明的转化过程有相似之处。技术文明以及支持它的人类思维第一次微弱地激起根本不同的社会存在新形式,新形式与生命的不同正如生命与化学变化的不同一样。我们称这种新形式为智力(Mind)。与能从过去学习却对将来一无所知的生命不同,智力可在多种选择中选择自己的目标,甚至可以扩大它这种选择的能力。
智力之火
第二章以迫切的心情回顾了机器人技术的现状,后面的章节涵盖了预测和建议。混沌理论说明敏感系统不可预测但易于控制。以此理论模型为基础,如果稳定地促使一些事件朝可预测方向发展的话,未来有时可以预测。通过令人鼓舞的工作,可信的和可能的预测能被轻微激发。当这种预测未实现时,往往是因为忽略了更潜在的可能性,而不是不可得到。 13世纪,罗杰.培根(Roger Baco)设想通过特制鞋实现高速世界游,而不是飞行器。16世纪,达芬奇(Leonardoda Vinci)设计了人力的飞行器,而不是燃烧的引擎动力。19世纪,凡尔纳(Jules Verne)期待着用潜水战舰击败木制战船,而不是电子感应和飞行导航的武装舰队。其后不久,威尔斯(H.G.Wells)预料世界的将来是按达尔文的进化论发展,而不是一些指导性工程。20世纪早期的科幻小说受到齐奥尔科夫斯基(Konstantin Tsiolkovsky)、戈达德(Robert Goddard)、奥伯特(Hermann Oberth)等火箭先驱的理论、发明和推测的影响,其中充满了由人类飞行员操纵的太空飞行器,而不是数字计算机所控制(电话、无线电接收器、计算机,尤其是它们的大量应用足以使当时的预言者感到惊讶)。并没有出现大型的可操纵飞船在大西洋间运送乘客,而是出现了更快、更易操作的、比空气重的航空器。 若不出现大灾害的话,我认为短期内出现智能机器是不可避免的,第三、四章将述及此点。像制造飞机一样,机器智能可直接效仿世界上已存在的东西。智能机器人在技术上每跨出一步,都会有一个近似的进化副本,都可能使它的发明者、制造者,使用者受益。每次进步将会带来智力报酬、竞争优势、财富增加和多种选择,都会使世界适于生活。同时,因为工作更好、更经济,机器人将在基本角色上取代人类。将来可能发生的种种事件并没有使我感到恐慌,因为我认为这些未来机器,即人类的后代“智力儿童”,是以人类的想象力、可能性、潜能形式为基础而建造的。与生物意义上的前一代儿童一样,它将体现人类为了长期发展而创造最好机会的精神。人类给予它们各方面的优势,并且最后从容退出,这对于人类来说是理所当然的。
但人类在逐渐退出之前,可以给自己安排好很舒适的生活。当今时代,子女能够赡养老父母。同样地,能制造出“温顺”的超级智能体,保护和支持人类。这种关系需要精心设计和努力维护。第五章将提供一些这方面的设想。 这种“怪异”的智能体超出了人类的约束范围,它们属于未来。用目前窥视未来的方法───猜测、类比、抽象、推理等来预测,显然是不足的。它们甚至是些超自然的产物。第六章讲的机器人在殖民化的浪潮中进入太空,但是它们将使每件事都转换为纯思考的形式,“智力之火”将遍及万物。第七章所谈到的是,在智力中物质定律将首要位置让给目标、决心、解释等行为准则。
|