预计阅读本页时间:-
15
数字生命,机器的自我繁殖
我看待那个问题不像冯·诺依曼那样从数学角度出发,而是站在工程师的角度去看。这样的观点几乎毫无支撑也许更好,因为说不定有魔鬼在背后为它撑腰。
广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元
康拉德·楚泽,1976年
镜头划过天空,地平线上出现了一座黑色锯齿状的岩石岛。现在,正驶过那座岛的是一艘大型四桅纵帆船。我们靠近之后,看到船上飘扬的新西兰国旗。这艘船名叫“坎特伯雷号”(Canterbury)。它的船长和一群乘客都靠着船舷上的栏杆,目不转睛地望向东方。我们透过他们的望远镜,发现了一片贫瘠的海岸。
以上就是奥尔德斯·赫胥黎(Aldous Huxley)一部鲜为人知的作品《猿与本质》(Ape and Essence)的开头。背景是2108年的洛杉矶,一场核战(2008年)过后,人类失去了高保真自我复制的能力。2108年2月20日,前往北美的“新西兰重新发现探险队”(Rediscovery Expedition)到达了加利福尼亚海岸附近的海峡群岛(Channel Islands)。这个故事以一个电影剧本的形式呈现,符合好莱坞的定位。“新西兰幸存下来,甚至在隔绝中获得了适度的发展。由于世界其他地区都处在危险的放射环境下,一个多世纪以来,新西兰这种与世隔绝的状态一直无法打破。现在辐射的危险已经过去,第一批探险者也就应运而生了,他们由西向东重新发现美洲。”
赫胥黎反乌托邦式的愿景发表于1948年,当时第三次世界大战似乎无可避免,而前景并没有因为冯·诺依曼所说“通过发动一场预防性攻击将最终伤亡人数降至最低”的设想而有所起色。虽然复制遗传信息的确切机制尚未得到确定,电离辐射对代际遗传存在影响却是毫无疑问的。赫胥黎认为,核战争之后,他的祖父托马斯·赫胥黎(Thomas Huxley)所倡导的达尔文进化论将开始松动。
到最后,过于完美的复制可能是一种很大的威胁。达尔文进化论取决于性状并不始终稳定的副本。2108年的洛杉矶社会成为异类,可能不是因为《猿与本质》中的误差灾变论(error catastrophe),而是相反的原因:将基因序列读入计算机,准确复制,并把它们翻译还原为生物体基因序列的能力,全程没有半点错误。由能够为后代指定确切基因的人类来经营洛杉矶,也许比赫胥黎书中2108年“坎特伯雷号”船员所看到的猩猩管理的洛杉矶更加恐怖。
自我繁殖自动机
正如原始自我复制的生命形式选择自我复制的核苷酸共生体作为代际遗传信息的载体,当前生命形式也可能选择将计算机作为它们遗传密码的载体。1979年,尼尔斯·巴里塞利暗示了这一点。他注意到在高度社会化的生物中,大自然呈现出这样一种趋势:“这些生物的社会分化为两大类:一是劳动者,专门开展该社会生存所需的所有任务(繁殖除外);二是遗传信息的携带者,其职责就是繁殖。”巴里塞利指出:“繁殖功能的这种分离在除人类以外的、高度组织化的生物体社会中十分常见(比如,蚂蚁和白蚁的蚁后和雄蚁、蜜蜂的蜂后和雄蜂。在各种细胞中,配子发育形成一个多细胞生物。),从生物学角度来看,这样的社会形式出现得相对较晚。”
计算机从复制能力和计算能力中获得的力量是相当的。发送电子邮件或传送文件,实际上并没有移动任何东西,只是在其他地方创建了一个新的副本。根据定义,图灵机能够精确复制任何可读的序列,包括自身的思想状态以及存储在纸带中的序列。也就是说,图灵机能自我复制。在高等研究院计算机项目启动的同时,这引起了冯·诺依曼的关注。“对于自我复制的机制,我确实想了很多,”1946年11月,他给诺伯特·维纳写信说,“我可以对这个问题做严谨的阐述,就像图灵阐述他的机制一样。”冯·诺依曼设想出一个自我繁殖的公理论,其适用对象涵盖了生物体和机器,他告诉维纳:“我想将详细的细节补充进去,未来两个月内要把这些考虑记录下来。”
这个自我繁殖的数学理论必须以可以直接观察到的事实为依据。“然而,我会基于‘真正的’理解做出可能最严格的解释,”他补充道,“也就是说,像人们理解机器的详细图纸那样,从严格意义上理解生物体。”单个分子是唯一不言自明的部分。“至少要瞄准蛋白质分子电荷分布的完全测定,也就是蛋白质分子几何形状和结构的完整详细的测定,否则就是错误的,”他写信给欧文·朗缪尔,希望争取到这位化学家的帮助,“当然,第一个真正令人兴奋的结构,也是第一个自我复制的结构(植物病毒和噬菌体),还在蛋白质的103以上。”
冯·诺依曼扩展了图灵通用机的能力,“证明存在一个自动机B,其具有这种属性:如果为B提供一份有关任何事物的描述,使用这份描述,自动机B能够生成该描述的两个副本”。1948年9月20日,冯·诺依曼在加利福尼亚州帕萨迪纳市(Pasadena)的一次演讲中概括地介绍了这一理论。直到4年后,富兰克林、沃森和克里克才揭示自然界中这一过程的具体细节。“对于自动机的‘自我繁殖’,图灵的程序只有一个方面过于狭隘,”他解释说,“他的自动机是纯粹的计算机器,输出是一条上面写着0和1的纸带。而我们所需要的是一个输出其他自动机的自动机。”
借助逻辑替代的相同方法,图灵机可以根据指示依次解译高级语言,或者哥德尔能够编码普通运算中的元数学语句。使用这种方法,有可能设计出这样的图灵机:编码指令可以为物理组件而非存储位置寻址,且输出可以被翻译成物理对象,而不仅仅是0和1。“上述方案中的小变化,”冯·诺依曼继续说道,“也让我们可以构建能自我复制且能复制其他自动机的自动机。”冯·诺依曼将这种动机的行为与生物学上具有“典型的基因功能、自我繁殖,以及特定酶的生产或刺激生产”特征的行为做了对比。
冯·诺依曼通过形式逻辑和自我指涉系统(self-referential systems)的角度来审视自我复制和自我繁殖的问题。同时,他将哥德尔和图灵的成果应用到了生物学基础中,尽管他的结论对工作中的生物学家影响不大,正如他的《量子力学的数学基础》(Mathematical Foundations of Quantum Mechanics)对当时物理学家的日常工作作用甚微。他还将图灵判定性问题的不可解性证明应用到了自我复制自动机的领域当中。1949年12月,他总结道:“换句话说,你可以建造这样一个器官:它可以去做可以做到的任何事;但是你无法建造这样的器官:它告诉你是否可以做到这件事。”
“这与类型论和哥德尔的结果是相联系的,”他继续说道,“某物是否归于某一类型的问题属于更高级的逻辑问题。低复杂度物体的特点是:谈论该物体比生产容易,预测其属性比建造容易。但是在形式逻辑的复杂部分中,说出一个物体可以做什么,始终比生产该物体要困难一个数量级。”
自动机能制造出和本身复杂度相当或者更高的后代吗?冯·诺依曼解释说:“低级的‘复杂性’可能是退化性的,即每一个可以制造其他自动机的自动机只能产生较不复杂的自动机。然而,存在一定程度的复杂性,超过这一水平。如果对合成现象进行适当安排,就会发生爆炸性的变化。换句话说,自动机的合成可以通过这样一种方式进行:每个自动机将产生比自身更为复杂、更具潜力的自动机。”
这个猜想直指生命起源的可能或不可能的核心。如果属实,那么一个足够复杂的自我复制系统的存在可能会产生更复杂的系统,而且其概率不小,无论它是生命或是类生命的物体。自我繁殖是一种偶然,只需要发生一次。“概率的操作在这一点上留下了漏洞,”冯·诺依曼解释说,“它们受到自我繁殖的过程影响。”
冯·诺依曼原本计划在离开原子能委员会之后,重新研究自我繁殖的问题。“在他生命走到最后时,他肯定愿意并且会竭尽全力投入到可能的新数学学科的创建中,”乌拉姆说,“那就是自动机和生物体的组合理论。”这个理论必须足够简单,人们可以从数学方面加以理解,但是也要足够复杂,可以应用到现实世界的特例中。冯·诺依曼声称:“我不希望受到这两种异议的严重困扰:(1)每个人都知道自动机能自我复制;(2)每个人都知道它们不能自我复制。”
根据设想,本来可能会创作出一部可以媲美《博弈论与经济行为》的全面著作,发展出一套自我复制自动机的理论,其应用对象包括生物学和技术,以及这两个领域的结合,而合著者是乌拉姆。但是这项工作成了烂尾,再也无法完成。乌拉姆并不是像奥斯卡·摩根斯坦那样拥有自律性的合著者,而到了战后,冯·诺依曼的时间安排甚至变得更加紧张了。最终,相关人员只收集到了不完整的手稿,包括基于1949年冯·诺依曼在伊利诺伊大学所做的5场系列演讲的冗长的引言,经过阿瑟·伯克斯的精心编辑,在冯·诺依曼离世近10年后,以《自复制自动机理论》为书名出版。以下是摘自乌拉姆手稿中前三章留存的轮廓中的一些标题,从中可以一窥他们当时的想法:
1.维纳!
3.图灵!
5.非图灵!
6.布尔代数
7.皮茨-麦卡洛克!
13.乌拉姆!
14.呼吁更强的结果
16.二维和三维晶体类
18.J.B.,H.H.G.!
20.图灵!
23.双线戏法等
24.退化(?)
25.图灵!
我们对生物学中自我繁殖的理解,以及我们在自我复制技术上的发展,所取得的进展几乎和上述理论所指示的完全相同。“维纳!”大概指的是维纳的通信与信息理论(后来克劳德·香农对其做了扩充),因为自我繁殖的问题本质上就是通信的问题,它是通过一个嘈杂的通道,由一代传到下一代。“图灵!”指的是通用图灵机的力量。而“非图灵!”是指那些力量的限制,以及它们如何被有生命和无生命的物体超越。“皮茨-麦卡洛克!”指的是沃尔特·皮茨(Walter Pitts)和沃伦·麦卡洛克1943年发表的成果的力量,就是我们现在所说的神经网络的能力,其中包括图灵普遍性。“J.B.,H.H.G.!”指的是朱利安·毕格罗和赫尔曼·戈德斯坦,他们很少出现相同意见,所以这可能是指一次对通信单元阵列的力量的早期讨论,后来他们就在如何实现“在实践中被干扰”这个问题上出现了分歧。“双线戏法等”是指令人回味的DNA双螺旋结构复制,而“退化(?)”大概指的是任何持久的自我繁殖系统必须依靠错误校正码在每代之间进行转译。“乌拉姆!”大概指的是乌拉姆对图灵完备(Turing-Complete)细胞自动机的能力感兴趣,现在我们周围的许多计算过程都可以证明这一点。“图灵!”出现三次,反映了图灵对于普遍性地证明包括自我繁殖在内的所有理论是多么重要,无论是应用数学、生物学,还是机器。
数字宇宙的演进推动着世界的进化
高等研究院的计算机及其变异体的第一代姐妹机很快就被复制出来,包括华盛顿特区的SEAC、伊利诺伊大学的ILLIAC、阿伯丁的ORDVAC、兰德公司的JOHNNIAC、洛斯阿拉莫斯国家实验室的MANIAC、阿尔贡的AVIDAC、橡树岭的ORACLE、斯德哥尔摩的BESK、哥本哈根的DASK、悉尼的SILLIAC、莫斯科的BESM、慕尼黑的BESM、雷霍沃特(Rehovot)的WEIZAC和IBM 701。“那台普林斯顿机器有很多后代,其中有一些和它们的母机存在很大区别,”1953年3月,威利斯·韦尔报告称,“大约从1949年起,来我们这里参观的工程人员人数一直都相对稳定,他们带走了复制机器所需的设计图纸。”
反过来,冯·诺依曼访问了其他实验室,并自由地和他们交换意见。1951年夏,物理学家默里·盖尔曼(Murray Gell-Mann)在控制系统实验室工作,这个实验室正好位于伊利诺伊大学ILLIAC放置处的正上方。“它用于政府的秘密工作,”大卫·惠勒说,“有的电线掉下来了。”盖尔曼和基思·布吕克纳(Keith Brueckner)受空军赞助者的指派,“可以想象我们有非常糟糕的计算机零件,而我们要用这些零件制造出一台非常可靠的计算机。”做了大量工作之后,他们得以证明,即使使用有51%的概率正确、49%的概率错误的逻辑零件,他们也可以设计出电路,使信号逐步提高。他们试图表明会出现指数级的提高,并且在朝着这个目标靠近。“该项目聘请了各类顾问,包括聘请了约翰·冯·诺依曼一天,”盖尔曼补充道,“冯·诺依曼喜欢一边驾车穿越美国,一边思考问题。因此就在他开车去洛斯阿拉莫斯研究热核武器想法的途中,在厄巴纳市(Urbana)停留了一天,为我们提供咨询和帮助。天知道,他们要给他什么酬劳。”
1951年年末,冯·诺依曼用一篇短小的手稿记下了这些想法,即《不可靠元件构成的可靠组织》,并于1952年1月在加利福尼亚理工学院做了5场系列讲座,后来据此出版了《由不可靠元件构建可靠系统的概率逻辑》一书。在这本书中,他开始以特有的公理化方式制定可靠性理论。“因此,错误不被视为外来误导性意外事件,而是过程中的一个重要组成部分。”他宣布。他感谢基思·布吕克纳和默里·盖尔曼“在这个问题上给了他一些重要的启发”,但是没有提及具体细节。“当时,我一点都不觉得难过,”盖尔曼说,“我想,我的上帝,这位伟人在脚注中提到了我。我出现在脚注中!我很荣幸,我想基思也会这么认为。”
不到10年,高等研究院机器的第二代和第三代就相继问世了。拥有更大存储器的计算机催生出了更多、更复杂的代码,这些代码反过来又催生出比以往更大的计算机。手工焊接底盘让位给印刷电路、集成电路,并最终被由硅晶片组成的微处理器所取代。硅晶片上刻蚀了数以亿计的晶体管,不需要手工加工。1947年,冯·诺依曼用5千字节的随机存取静电存储器存储了原始的数字宇宙,花费约为10万美元,而今天则只需要0.01美分,而且速度是当时的1000倍。
1945年,《经济研究评论》(Review of Economic Studies)刊登了冯·诺依曼的《一个一般经济均衡模型》(Model of General Economic Equilibrium)一文。这篇长达9页的论文在1932年的普林斯顿数学研讨会被传阅,其首次出版(德文版)于1937年。冯·诺依曼在文中阐明了一个经济体的行为。在这个经济体中,商品生产不仅有生产的自然因素,也有彼此的因素。在这种自催化的经济中,平衡和扩张并存于凸集之间的鞍点处。“首先,它与拓扑学的联系可能会非常令人吃惊,”冯·诺依曼指出,“但作者认为,在这种问题中,这是很自然的。”
冯·诺依曼关于“扩大经济模式”的一些假设,即“生产的自然因素(包括劳动力)可以无限量扩大”以及“超出生活必需品的所有收入将被用于再投资”,在当时似乎不切实际;现在自我复制技术正推动着经济增长,冯·诺依曼的假设就显得更加合情合理了。我们用钱来衡量我们的经济,而不是物。另外,我们还没有发展出能够充分解释自我复制机器和自我复制代码的经济模式。
冯·诺依曼前往原子能委员会之后,高等研究院计算小组开始笼统地研究“合成(‘近乎最小’)组合开关电路的问题”,并将“设计数字计算机”的问题当作一种可以自行优化的电路的特例。1956年4月,他们报告称:“这种合成可以由数字计算机执行,特别是设计得足够大的计算机。”他们还总结道:“看来,我们由此展现出一台可以自我复制(即设计)的机器,这个结果似乎与冯·诺依曼的自我复制机器相联系。”他们说的没错。
代码填充着日益增长的数字宇宙,很快就成为图灵完备的,就像1952年乌拉姆和冯·诺依曼设想的那样。作为强大的通用机器,图灵的自动计算机将拥有25千字节,或2×105比特的内存。数字宇宙目前的规模估计为1022比特。填充这个宇宙的图灵机数量是未知的,并且这样的机器越来越多是虚拟机器,它们未必能在任何特定的时间映射到任何特定的物理硬件。在数字宇宙中,它们的存在就是精确定义的实体;但在我们的世界中,它们没有固定的存在。它们的数量增长非常迅速,所以实体机器正在奋力追赶以满足这一需求。实体机器催生出了虚拟机器,虚拟机器反过来产生了对更多实体机器的需求。现在,数字宇宙的演进推动着(而不是阻碍)真实世界的进化。
《自复制自动机理论》是要提出一个宏伟的、统一的理论,这是冯·诺依曼将它留到最后的一个原因。按照设想,这个新理论将适用于生物系统、技术系统,以及这两者之间的所有可想象和不可想象的组合。它也将适用于自动机,无论该自动机置身于物理世界、数字世界,还是两者兼有,并且将超越地球上现有的生命和技术。
从图灵机到通用构造器
冯·诺依曼很少讨论外星生命或外星智慧,地球的生命和智慧就够让人头疼的了。尼尔斯·巴里塞利的思想更加自由。“通过进化过程,用许多被视为生物特征的属性开发生物体的环境条件,不必与当时的地球条件相似,”他根据自己在高等研究院的数值进化实验总结道,“我们有充分的理由相信,任何可以通过互联(或共生)自催化反应产生各种分子的星球,都有可能会看到相同属性的生物形成。”其中一项性能独立于当地的条件,可能是通用机的发展。
跨越长距离,运输结构成本昂贵,而传输序列却价格便宜。根据定义,图灵机是可以被编码成序列的结构,并且已经在局部以光速进行自我传播。特定计算机存在于特定时间和特定位置的概念已经过时了。
如果出于偶然,生命碰巧起源并存活于宇宙中的另外某个地方,也许我们就会有时间去探索生命形式难测的多样性。那些生存历史最长、最适应不断变化的环境的,以及最难跨越星际距离的物种将是最普遍的。采取数字表示的生命形式,对于其生命周期的全部或部分,将能够以光速传播。正如人工智能先驱马文·明斯基(Marvin Minsky)1970年访问苏联的亚美尼亚时所说:“存在一片区域,在其中你可以发送猫的本体而不是猫的照片。”
冯·诺依曼将图灵通用机的概念扩展到了通用构造器:一台机器,它可以执行任何其他机器的描述,包括其自身的描述;反过来,通用构造器可以延伸到一台机器的概念:通过将自身的描述编码成一个自解压的压缩包并发送,在另一个地方复制出副本。数字编码的生物甚至可以在找到宿主环境极低的概率下繁殖,而且成本较低。宿主环境即其发育和生长的环境。数字编码的内核在序列和结构之间转换的能力近似一种普遍存在的共同属性,也许在不同平台上运行的生命和智慧能接近这种水平。即便这种内核被发现数字计算的主机拦截,它也还有机会。如果我们发现这样一个内核,我们会立即加以广泛复制。遍布整个星球的实验室将开始尝试对其进行解码,最终有意或无意地利用当地的资源来编译这个编码序列,就像病毒在宿主细胞内被分配权限。授予数字编码的读/写权限早已包括材料技术、人类思维,并且以渐增的态势扩展到核苷酸合成,以及随之而来的所有生物学本身的详细信息。
宿主行星不仅要建立射电望远镜,积极听取编码序列,而且要在信号到来时,赋予它们计算资源。SETI@home网络现在将约500万台地面计算机连接到不断增长的射电望远镜阵列,提供合计500万亿次的快速傅立叶变换,累计处理时间达200万年。然而,据我们所知,至今还没有出现一个字(或一张图片)。
60多年前,生化生物开始组装数字计算机。现在,数字计算机开始装配生化生物。从远处看,这像一个生命周期的一部分。但是,是哪部分呢?生化生物是数字计算机的幼体阶段,还是数字计算机是生化生物的幼体阶段?
据爱德华·泰勒称,1950年在洛斯阿拉莫斯的一次午餐中,当谈论到外星人话题时,恩里科·费米提出了一个问题:“大家都去哪里了?”50年后,在斯坦福大学胡佛研究所吃午餐时,我问91岁的爱德华·泰勒,费米的问题有何进展。约翰·冯·诺依曼、西奥多·冯·卡门、利奥·西拉德和尤金·维格纳,这些同样来自布达佩斯、泰勒早年的同事全都先他而去。5个匈牙利裔“火星人”,他们让世界迎来了核武器、数字计算机、大部分的航空航天工业,以及基因工程的开端。只有爱德华·泰勒拖着木制假腿,一如《旧约》中的先知,留在了这个世界。
1928年,在慕尼黑的一次电车事故中,他的一条腿被轧断了一大截。现在,他跛行的步态已经变得更加明显,就像他年轻时在匈牙利的记忆变得更加生动,而后来的记忆则开始褪色。他这样说起布达佩斯:“我记得桥梁,美丽的桥梁。”虽然泰勒(与冯·诺依曼、德国火箭先驱沃纳·冯·布劳恩[Wernher von Braun])是斯坦利·库布里克(Stanley Kubrick)的冷战小说《奇爱博士》(Dr.Strangelove)中联合主角的原型,但是对我来说,核武器掌握在泰勒手中比掌握在新一代的核武器专家手中更完全,因为这些专家从未亲眼见过大气试验。
泰勒认为我是来向他询问泰勒-乌拉姆设计方案的相关情况的,他向我提供了一份很长的、记述氢弹起源和引爆热核燃料所需内爆的文稿。“整个内爆的想法,即人们可以得到比正常情况下大很多的密度,源自冯·诺依曼的一次参观,”他告诉我,“我们就此一起向奥本海默提出了建议,他立刻接受了。”将氢弹问题抛到一边,我提到了我对“费米悖论”50年后的地位感兴趣。
“那我问你,”泰勒用他那浓重的匈牙利口音插话道,“你对外星智慧感兴趣吗?显然不感兴趣。如果你感兴趣的话,你想找什么呢?”
“你可以找各种各样的事情,”我回答,“但我认为,不需要寻找可以理解的信号……任何在做有用沟通的文明,任何信息的高效传输都会被编码,所以它不会被我们所理解——它就像噪声。”
“你会去哪里寻找呢?”泰勒问道。
“我不知道……”
“我知道!”
“哪里?”
“球状星团!”泰勒回答,“我们无法与其他智慧生命取得联系,因为它们选择远离我们。在球状星团,来自不同地方的人走到一起要容易得多。如果真的存在星际通信,就必须在球状星团上。”
“好像有点道理,”我表示认同,“我个人的想法是,外星生命可能早就在那里了……我们怎么能确定呢?如果宇宙中存在生命,事实将证明自我传播最成功的生命形式是数字生命;它会采取一种独立于局部化学环境的形式,以电磁信号的形式从一个地方迁移到另一个地方,当它到达的时候,当地只需要存在一个数字世界供它移居即可。数字世界是通用图灵机发现的一种文明。这就是为什么冯·诺依曼和你,还有其他‘火星人’让我们建造所有这些计算机,为这种生命营造一个家园。”
然后,是长时间的停顿。“你看,”泰勒最后说,他把声音压低成刺耳的私语,“我建议,与其艰难地解释这个……不如你写一本关于它的科幻小说。”
“也许已经有人写了。”我说。
“也许,”泰勒回答说,“根本没人在写。”