预计阅读本页时间:-
12
操纵进化,巴里塞利的基因宇宙
造物主能够随心所欲地赋予宇宙各种物质和精神属性,他却唯独受限于逻辑。因此,他虽然能够颁布任何自然法则,却无法违背逻辑,让二乘以二等于五。
广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元
奥拉夫·斯塔普尔顿(Olaf Stapledon),1937年
“上帝不会用宇宙来掷骰子。”阿尔伯特·爱因斯坦曾于1936年对物理学家麦克思·玻恩(Max Born)说。当时,纸牌还未被禁止。“红色的纸牌(红桃和方块)记为+1,黑色的纸牌(黑桃和梅花)记为-1,”1953年3月,尼尔斯·巴里塞利从高等研究院计算机的存储寄存器中随机抽出一些数字,并解释道,“为了防止抽出的纸牌相互关联,我们每一次抽取的纸牌数量都控制在10张以下,并且不再混进余下的纸牌中。”
在真正的创新与奇思怪想之间维持平衡
1912年1月,尼尔斯·奥尔·巴里塞利出生于罗马,他的母亲是挪威人,父亲是意大利人。据杰拉尔德·埃斯特林说,他拥有“最美妙”的口音。他跟着恩里科·费米学习数理物理学。1936年从罗马大学毕业后,他带着妹妹和刚离婚不久的母亲到了挪威。他曾在奥斯陆大学发表关于爱因斯坦相对论的演讲,还出版了大量有关概率论与数理统计的讲义。战争期间,他还写了一篇有关气候变化统计分析的博士论文,并于1946年递交上去。“可是,这篇论文足足有500页,根本没办法印,”他以前的同学托尔·格利克森(Tor Gulliksen)说,“然而,他宁愿不要博士学位,也不同意将其缩减至合适的尺寸!”
巴里塞利是一个不轻易妥协、不墨守成规的人,他甚至对一些公认的道理提出质疑,其中不仅包括达尔文的进化论,还包括从中微子透明度到哥德尔证明之类的问题。“他相信每一个数学上的陈述都有可能被证实或者被推翻。他始终认为哥德尔证明是错误的。”西门·戈尔(Simen Gaure)说。西门·戈尔是他选拔出来的,在选拔的过程中,他要求应聘者从一个样品中找出隐藏的瑕疵。“在他看来,那些能找出瑕疵的人还没被数学教育摧毁,巴里塞利想要建造一部机器,来证实或推翻任何有关算数和射影几何的陈述,”此外,戈尔还说,“他直接拿自己的钱给我们发工资,当时的薪酬已经很不错了,至少对于学生来说已经足够多。”他并没有建成那样一部机器,然而在准备过程中,他开发了一门程序设计语言,叫作“B-数学”(B-mathematics),他就是这样发现了所谓的哥德尔证明中的循环。“我曾问他,‘B-数学’中的‘B’是什么,”戈尔说,“他回答说还没定;可以是‘布尔式的’,也可以是‘巴里塞利’或者其他。”
巴里塞利游走在学术界的边缘,最终挪威政府给他提供了国家奖学金,他也因此得以和他那小小的研究组继续留在奥斯陆大学。“在众多事物中,他对地外生命很感兴趣,”他在华盛顿大学时的研究助手柯克·沃尔夫(Kirke Wolfe)说,“此外,他还喜欢提出一些有关生命和智慧的大众理论。”他认为,问题不在于地外生命是否存在,而在于我们能否找到它们。“我们对于研究宇宙中某种特定类型生命的经验有限,还不足以形成一幅画面,来描述外星球可能存在的生命形式。”1961年,随着美国和苏联的太空计划落成,对于人类是否有望在火星和金星上发现生命痕迹这个问题,他这样写道。
“每一个世纪,科学界都需要一两个巴里塞利这样的人。”当发现巴里塞利小心翼翼地在真正的创新与奇思怪想之间寻找平衡时,戈尔说道。据沃尔夫所说,“他喜欢沉浸在自己的世界里,不管做什么都很专注”。他的身份介于意大利人、挪威人和美国人之间。“对他来说,根源之说并不重要,”沃尔夫说,“哪里有他工作所需要的资源,他就会到哪里去。”此外,沃尔夫将巴里塞利自己作为孤独个体的生活和他对共生起源原理的热爱进行了对比,发现团体成员之间的合作超越了个体性。巴里塞利相信,相比自然选择或随机变化来说,在原本相互竞争的个体之间实现相互合作带来的益处是进化更重要的推动力,而且他把他的数值进化实验作为这种观点的一种论证方式。“根据共生起源理论,”他说,“基因通过合作获得了巨大的发展可能性,并且得到了快速的发展。”
在作为病毒遗传学家的职业生涯中,巴里塞利开发了数学模型,并避免了实验。遗传学家弗兰克·斯塔尔(Frank Stahl)说:“他说问题就在于你做一个实验并得到一个结果之后,无法回过头去看你自己在实验中一步步走来是否每一步都走得正确,因此,你通过实验所得到的结果并不是那么可靠。说不定你在实验中的某一步,拿错了一根吸液管,以致在将某种液体倒入另一种液体的时候,把量搞错了,谁知道呢?”
“即使在每个人都有计算机的情况下,巴里塞利还是坚持使用穿孔卡片,”戈尔说,“他对此给出了两个理由:第一,当你坐在计算机前面,对着屏幕的时候,你进行清晰思考的能力会下降,因为你的注意力被不相关的事物分散了;第二,当你把数据存储在磁性介质上的时候,你无法确定它们会永远保存在那里,事实上,你根本就不知道它们到底被保存在什么地方了。”
唯一一个真正知道如何走向人工智能的人
1947年,巴里塞利在奥斯陆发表了论文《基因的共生假说》(The Hypothesis of the Symbiosis of Genes)之后,在方格纸上进行了一系列的手写数值实验,这形成了他的报告《生物进化的数值模型》(Numerical Models of Evolutionary Organ-isms)的初步草稿。正是因为他撰写了这篇报告,高等研究院才向他伸出了橄榄枝。“他一定是在挪威联系了冯·诺依曼,并提到了他的一些想法,”他的挪威同乡阿特勒·塞尔伯格说,“冯·诺依曼非常乐于接受这些思想。”
“根据基因的共生理论,基因原本是独立的、类似病毒的生物体,它们是通过共生关系形成了更复杂的单位,”他解释道,“任何具备这些必备基础特征的元素都有可能实现类似的进化。”巴里塞利提出要通过能在新计算机的40960位元内存中繁殖、发生突变、关联共生共存的代码串来验证这些理论。1951年12月,他申请了富布赖特(Fulbright)差旅补助“以使用大型计算设备进行数值实验来阐明物种进化第一阶段的情况”,但是,因为他迟迟未获得挪威绿卡,奥斯陆办公室拒绝了他的这一请求。
“巴里塞利在遗传学上所做的工作,让我觉得非常新颖和有趣……这需要大量的数值运算,如果使用比较先进的高速数字计算机来完成这项工作,将是最有利的。”冯·诺依曼写文声援此申请。在拿到挪威政府颁发的研究奖学金后,巴里塞利终于在1953年1月抵达了普林斯顿,并于2月6日成为数学学院该学年剩余时间内的无报酬员工。不过,1954年,他获得了1800美元的生活津贴。
幸运的是,巴里塞利在取得国籍上的延误和计算机推迟完成的时间正好匹配。事实证明,巴里塞利来普林斯顿正是时候。如他所解释的一样,我们的目标是“找到生物数值和生物现象之间的相似之处,或者本质差别”,并且“观察数字有机体的进化是如何通过遗传变异和选择实现的,以及验证是否存在一些微生物能够通过基因置换、获取新的基因或通过其他原始的有性生殖方式加速进化”。从一个角度来说,巴里塞利是在将数字计算的力量赋于进化论之上。从另一个角度来说,他是在将进化论的力量赋于数字计算之上。据朱利安·毕格罗说:“巴里塞利是那个时代唯一一个真正知道如何走向人工智能的人。”
在巴里塞利开始做实验的4个星期后,詹姆斯·沃森和弗朗西斯·克里克宣布他们共同发现了脱氧核糖核酸(DNA)的结构。就在巴里塞利努力通过数值序列的方式编码进化过程的时候,沃森和克里克正努力通过化学序列的方式解码进化过程。沃森和克里克的研究成果公布之后,巴里塞利就一直将DNA序列称为“分子状数字”,着重强调多核苷酸链的数值特征。“通过计算机的数字进行的进化实验和通过核苷酸进行的化学实验之间的差别非常微妙。”他说道。包括克劳德·香农在内的信息理论家已经建立了一个完全符合双螺旋结构的理论框架,而香农为这方面所做的工作就是他在加入高等研究院一年后,于1940年发表的博士论文《代数理论遗传学》(An Algebra for Theoretical Genetics)。
1946年11月,冯·诺依曼曾写信给诺伯特·维纳:“基因可能与病毒和噬菌体非常相像,只是所有有关基因存在的证据都是间接证据,我们不能随心所欲地分离或者繁殖基因。”这也就是暗示人类也许只需要通过仔细观察,就能探寻出自然繁殖的奥秘。随后,由此产生的衍射图样将和较小规模产生的生物分子的X射线进行比较。“真正了解蛋白质化学的最佳机会在于X射线衍射场,”他在海军研究办公室写信给米娜·里斯称,“我无须赘言在此领域内取得突破的意义。”他要求紧急拨款,并追加了一个清单,列出了一些特定物品,这些物品在政府的多余设备里可能会有,而且对这项工作会非常有利。不过,他并没有因此得到什么,而富兰克林、沃森和克里克可能通过提案的形式获得了帮助,从而加快了DNA结构的发现速度。
巴里塞利试图将原始的自我再生实体引进到一个空的宇宙里,而不是将注意力放在那些微观的且高度复杂的自然机制上,因为原始的自我再生实体能够直接观测到。“达尔文的生物进化论认为,进化是由随机遗传变异和选择实现的,但是从一开始这种观点就存在不足,因为事实上,没有恰当的实验可以证明这种进化是可行的,以及解释在受控条件下这种进化会如何进行,”他这样写道,“用快速进化(病毒或细菌)的生物体进行测试存在严重的不足,因为适应或进化的原因恐怕很难明确,而拉马克学说(Lamarckian)或其他看法就很难排除。”我们现在知道,与1953年时相比,更明显的是横向基因转移和其他非新达尔文主义机制更为普遍,特别是在微生物学上。
“如果不用生物体而用实体做实验,我们可以明确地发现,实体只能通过‘突变’和‘选择’进化,”巴里塞利说,“那才是一个能给出确凿证据的、成功的进化实验,当然,如果这个实验的环境因素也受到控制那就更好了。”虽然要在5千字节的世界里进行这种尝试,野心有点大,但是,这可是历史性的1953年。商用客机第一次搭载乘客,太空时代已经拉开序幕,而汽车也开始出现尾翼。新的基本粒子被发现的速度已经不是奥本海默手下那群年轻的理论物理学家能跟得上的。计算机的初始磨合问题正在被解决。威廉姆斯电子管放大器已经添加了双层电磁屏蔽,自我诊断程序已经开始普及,输入/输出得到了完善,从使用纸带切换到了使用穿孔卡片。1953年3月2日至3月6日期间,78%的可用时间内计算机一直在运行;3月9日至3月13日,85%的时间计算机都处于运行状态;而3月16日至3月20日,99%的时间计算机都处于运行状态。
由福斯特和塞尔达·埃文斯监制的热核流体力学代码从2月份开始运行,然后由冯·诺依曼监督在有关球面冲击波的衰减上换成了计算较少的代码。气象学家在白天进行天气试预测,而巴里塞利常在深夜工作。他是少数几位可以不在工程师的监督下运行计算机的科学家之一,而且在他的控制下,机器会有比较长的空闲时间和稀疏的日志条目,直到事情陷入停滞状态时,关于该怪罪谁的争论才出现。
“巴里塞利博士声称是计算机出错了,而代码并没有错误。”1953年4月2日的操作日志记录道。很多时候,工程师们第二天回到办公室的时候,他还在工作。“计算机运行良好,关机!”1953年5月31日凌晨,这是他所记录的最后一条日志条目。“天哪!”抵达办公室的工程师追加道。“这栋楼的空调出了问题,”1956年6月22日深夜,他还在工作并写道,“一个压缩机似乎被卡住了,空气中弥漫着三角带烧焦的味道。”1954年11月的机器日志显示,当月总计有18次从午夜到早上6时轮班时,使用计算机的是巴里塞利。
生物进化与数值研究
巴里塞利的宇宙对外来者来说看似封闭,但是对置身其中的任何一维数值生物来说都是无边无际的。“宇宙循环使用512代,每一个基因需要8个二进制数字,从而让一个地址的5代能够打包成一个40位二进制位的存储位置,”他解释说,“代码的编写要确保各种突变的规范可以在宇宙中的选定区域内使用。每100代中只有5代会在勘探中被记录下来,然后,会对有趣的现象进行更多细节性的调查。”
自然法则是支配“基因”繁殖的“规范”,在计算机的核心运算单元执行一些特定周期后,新一代因质变而出现。这些规则被改写成:“只有在其他不同的基因存在时,基因才可以繁殖,因此需要不同基因之间存在共生关系。”基因相依为命求生存,而合作(或寄生)带来成功。另一套规范用来约束当两个或多个不同的基因在同一个地方相撞时该如何处理,这些规则的特点证明其对宇宙整体的发展具有显著的成效。
巴里塞利在很小的范围内扮演着无所不能的角色。他可以决定自然规律,但奇迹却不在他的掌控范围内。正如他在1953年所解释的,其目的是“保持一个或多个物种在经历造成物种遗传变异和进化的情况时,能存活很多代。但是,我们必须避免在实验开始后,通过改变实验的性质来生成这样的情况”。他的准则让人联想到莱布尼茨的理念,他认为世界在最少的限制下,会优化得尽可能有趣。“让生活有困难,但不要不可能,”巴里塞利建议道,“让生活的困难多种多样而且严重,但不要过于严重;让环境频繁地改变,却不能改变得过于彻底;也不要让整个世界同时天翻地覆。”
自我再生的数值联盟迅速发展。“根据达尔文的进化理论,进化过程需要的条件似乎有了。”巴里塞利称。在几千代里,他观察到了一连串的“生物现象”,包括母系生物体之间的成功杂交,以及在单个基因被随机删除一个位数时,协作自我修复损伤。为了避免对生物和生命的定义存在争论,巴里塞利对共生生物有机体进行了更宽泛的划分,将其定义为任何“自我再生结构,由任何形式的几种自我再生实体共生构建而成”。这个定义足够宽泛到同时囊括生化和数字有机体,而且并未陷入它们是不是(或者曾经是)“活”的这个问题。
数字共生生物有机体进化所需的时间非常短,甚至在还未将其形容清楚之前,它就进化了。“即使是在高速计算机的非常有限的内存空间里,几秒钟之内就可能会有大量的共生生物有机体出现,”巴里塞利称,“观察到所描述的所有生物现象只是一个时间问题。”原始数值有机体很快就被困在了局部最大这一泥潭中,无法在不变成更弱的生物体的情况下只改变一个基因。这就使得进化戛然而止。由于只有至少更换两个基因,才可以从相对最大的合适生物体转换成具有更大活力的生物体,因此,很明显,即使在最简单的宇宙里,基因序列的杂交才是促使进化的原因,而不是由一个位置的随机基因突变造成的。
在没有环境挑战或者天敌的情况下,胚胎宇宙受到寄生虫、自然灾害以及萧条的困扰,而天敌会促使有机体发挥出其进化潜能。“普林斯顿实验持续了5000多代,”巴里塞利称,“在短短几百代里,共生生物有机体的一种单一原始类型就入侵了整个宇宙。经历过这个阶段之后,没有新的碰撞会导致新的突变发生,因此,进化就无从说起了。宇宙已经到了这样一个阶段,即有组织的同质化,这个阶段会一直持续下去。”在某些情况下,最后幸存的有机体会是寄生虫,而当其寄主不在时,它也会因饥饿而死亡。
“同质化问题最终会由宇宙的每个不同部分使用不同的变异规则来解决。”巴里塞利解释称。“1954年,新的实验开始了,”他报告称,“通过将三个宇宙的主要部分的内容进行交换,生物体在不同的环境条件下存活和适应了下来。其中一个宇宙的生活条件特别艰难,在之前的实验中,没有生物体存活下来。”
为了控制在1953年进行最初的实验中大批滋生的寄生虫,巴里塞利修改了转变规则,以防止寄生生物(尤其是单基因寄生虫)每代繁殖超过一次,因此阻止了寄生虫成功打败更为复杂的生物体的漏洞并中断进化。“当被剥夺了繁殖速度更快的优势,最原始的寄生虫难以和进化得更好且结构更完整的物种竞争……而在其他情况下,可能是危险生物的单基因寄生虫,在这一地区发展成为无害的或有益的共生基因。”
内存中的内容进行周期性采样,然后转移到穿孔卡片上,组合成一个阵列,并关联印刷成大张的感光纸蓝图,且跨越时间间隔留下宇宙状态的印记。“我记得他将IBM穿孔卡片摊开在地板上试图进行展示。”杰拉尔德·埃斯特林说道。巴里塞利通过研究这个化石印记,观察到了各种各样的进化现象,包括共生、寄生虫基因被寄主吸收以及杂交基因序列,而杂交基因序列与适应性和竞争力的成功关系重大。“大部分表现出扩张力的新品种都是交叉现象的产物,而非突变的结果。虽然突变(尤其是有害的突变)发生的概率,比实验中进行的、通过交叉实现的遗传变化要大得多。”
尽管开局不错,但是数值变化研究才刚刚开始。“无论如何,物种的进化都无法到达一个可以完全确保不被毁灭,或者像在地球上一样,可以永远进化,成为越来越高级生物体的程度,”1953年8月,巴里塞利报告称,“如果人们想解释像生物体一样复杂的器官和机能的形成,那会存在缺陷。不管我们进行了多少次突变,这都只是一个数字。它们永远不会变成有机体!”
这种缺陷就是基因型(生物体的编码基因序列)和表型(序列中的物理表达式)之间的区别,这可以让达尔文的物竞天择理论能够在基因本身的水平之上进行。在表型层面而不是基因型层面选择指令,进化搜索则更可能导致有意义的序列,就像从字典中选词组成有意义的句子,肯定比选择字组成句子要来得容易,其原因是一样的。
为了实现从基因型到表型的飞跃,巴里塞利总结说:“我们必须给某些基因提供它们也许会管理直至最后使用的材料,最好是对它们的生存很重要的材料。”数字序列可以直接或通过中间语言转换成别的事物。“如果有机会作用于一组棋子或积木之类的物体,共生生物有机体将‘学会’如何操作以增加自身的生存机会,”他解释说,“这种作用于某物的倾向可能对生存很重要,是理解复杂仪器和器官的形成,以及体细胞或非遗传结构的整个身体结构最后形成的关键。”如果数值生物体不再只是实验室的好奇对象——它在实验室引起的人们的好奇心转瞬即逝,那么从基因型到表型的转换就必须出现在我们的宇宙中。
不管你等待多长时间,数字永远不会成为有机体,就像核苷酸永远不会成为蛋白质一样,但是它们可能学会自己编码。一旦基因型和表型之间的转换被启动,进化速度就会加快。当然,不仅是最终有机体的进化,还有遗传语言和转换系统自身的进化。一种成功的解释性语言既容忍模糊性又利用它的优势。“事实上,一种极度压缩的语言在传递的信息超过一定程度的复杂性之后,是完全不适于用来传递信息的,因为你永远无法确定一个文本对或错。”冯·诺依曼在1949年12月给伊利诺伊大学做的5个讲座中的第三个里这样说道,伊利诺伊大学当时正在建造一部MANIAC的复制机。
“我怀疑,一种真正高效、经济的有机体是‘数字’和‘类比’原则的结合,”他在1951年所著的《不可靠元件构成的可靠组织》的初步笔记中写道,“‘类比’程序会丧失精确度,并由此迅速危及意义……因此‘类比’自身大概无法使用‘类比’方法,而‘数字’重新标准化需要不时地插入。”在发现生物体的繁殖是如何通过编码DNA的指令串来协调的前夕,冯·诺依曼强调复杂生物体要在一个嘈杂的、不可预知的环境中生存下来,必须定期采用数字纠错码复制自己的最新副本。
出于互补的原因,数字有机体——无论是核苷酸串或二进制代码串,都会发现将自己定期转换成模拟、非数字的形式是有利的,可以实现对模糊性和引入非致命错误的容许,并能够在纯数字领域收集有形资源为自身存在做补充。“如果每一个错误都需要找出、解释和纠正,那么生物体的复杂性系统就无法存活,哪怕1毫秒,”冯·诺依曼在伊利诺伊大学的第四讲中解释道,“这种理念和‘只要出现第一个错误,就宣称世界末日就在眼前’的理念完全不同。”
代码与基因重组
在后来的一系列实验中,即1959年在纽约大学原子能委员会计算实验室的一台IBM 704计算机上进行的实验,以及1960年在布鲁克海文国家实验室进行的实验中,巴里塞利让数值生物进化到会玩一个简单却重要的游戏,即十六子棋(Tac Tix)——这是皮亚特·海恩(Piet Hein)发明的,在一个6×6棋盘上进行的游戏。游戏表现与繁殖成功与否相关。巴里塞利估计:“在目前的速度下,可能需要10000代(在IBM 704计算机上,约80个机时),才能达到平均游戏品质高于1。”这个等级对人类来说,应该是头几次玩这个游戏的初学者会有的水平。1963年,使用当时世界上最强大的计算机,即曼彻斯特大学的阿特拉斯(Atlas)计算机,很快就实现了这个目标,但却没有进一步的提高。巴里塞利将这一缺陷归咎于“共生生物有机体可以采用的指令数量和机时受到了严格限制”。
与高等研究院所进行的实验相比,这个实验中所采用的有机体纯粹是由基因编码所组成的,而Tac-Tix实验导致“每个共生生物有机体形成了非遗传数字模式特性,这样的数字模式可能会为开发任何类型的结构和器官提供无限的可能性”。数值表型采取的形式,解释为在一个棋盘游戏上的动作,是通过机器指令的有限字母表映射到基因序列,就像DNA中的氨基酸字母表的核苷酸编码序列转换成蛋白质一样。巴里塞利预测:“也许在我们的数字共生生物有机体中,最接近蛋白质分子的会是共生生物有机体游戏战略计划的一个子程序,其指令存储在计算机内存中,并由共生生物有机体组成的数量所决定。”
巴里塞利表示:“因为计算机时间和存储仍是限制因素,所以每个数字共生生物有机体的非遗传模式只有在它们刚刚执行完任务,被需要或者被从内存中删除的时候才会被架构。在生物学上,这相当于遗传物质只有在需要完成一个特定任务(例如,与另一种生物斗争)的时候,才会创建一个身体或躯体结构。而且该目标一旦完成,躯体结构就会迅速瓦解。”
1956年,在高等研究院的最后一段时间里,巴里塞利花了很多时间在T4噬菌体上建模未来10年的基因重组。病毒会捕食细菌,被称为最简单的自我复制的实体之一。“如果有任何生物可以就地球生命的早期演化给出讯息,特别是关于杂交的来源,那么还没有适应与活细胞实现共生关系的病毒就是最理想的选择,”他解释说,“如果我们想了解在生物进化前期细胞阶段的信息,最理想的就是寻找还从来没有成为细胞遗传物质一部分的病毒。”
1961年,他加入了奥古斯特·格斯·德曼(August Gus Doermann)的噬菌体小组,并先后在范德堡大学(Vanderbilt University)和华盛顿大学的公共卫生署(Public Health Service)获得了资金和一台IBM 7094计算机的使用权。“当时,在计算机工作不繁忙的时候,这台IBM 7094会加紧模拟将细菌移植到琼脂板上,可能会发生什么,”柯克·沃尔夫回忆道,“通常上午的时候,巴里塞利会因为计算结果而十分激动,因为它与实验结果的匹配程度是如此高。”他还参观了实验室,观察琼脂板和模型的匹配度,并说道:“你会发现缺口,这里的噬菌体已经耗尽其感染的细菌里的蛋白质,在这个灰色琼脂的背景下会有一些小圆圈,这里的细菌已经完全转化为噬菌体了。”
巴里塞利以及他的学生是合著者,他们得到了丰厚的回报。沃尔夫说:“他最喜欢去Ivar's Acres of Clams餐馆,在它还没有完全自我复制的时候。”巴里塞利不乘坐电梯,而是“跳着”去他们位于4楼的办公室,这让他的年轻助手喘不过气来。他和冯·诺依曼很少认可彼此的工作。1953年11月,冯·诺依曼曾写信给阿瑟·伯克斯称:“我对‘数字生物’的主题还是相当感兴趣的。”但是,在阿瑟·伯克斯编制的冯·诺依曼的《自复制自动机理论》的权威文本中,并未提及巴里塞利,因此“冯·诺依曼知晓巴里塞利的实验”这一事实被直接忽略了。
因为巴里塞利对达尔文的进化论和哥德尔证明都提出了质疑,因此他同时得罪了生物学家和数学家,也被这两个群体所质疑。他在美国和欧洲的计算机设备中游走,只要哪里有他的数值生物成长所需要的内存资源和处理周期,他就会竭尽所用。在西雅图的华盛顿大学,他似乎稳定了下来,并申请了下一阶段数值进化工作所需要的机时补助。1968年,在这次机时补助的申请被拒绝后,他回到了奥斯陆,并建立了自己的研究小组。“我认为他在理解噬菌体和细菌的基因重组方面的贡献,本应得益于他的数学才能,可事实上却没有,”重要评论家之一的弗兰克·斯塔尔说,“他做这个实验其实是想得到能支撑他关于‘40亿年前发生了什么’的观点的有力证据。”
巴里塞利告诫大家,不要试图把生物的太多特性加诸到数值共生生物有机体身上,并告诫大家不要采纳非严谨的事实基础上的推论和解释。虽然数值共生生物有机体和已知的地球生命形式在演化行为上表现出了相似之处,但这并不意味着数值共生生物有机体是活的。“它们是开端,或者某种异常的生命形式?抑或是唯一的模式?”他问道,并接着说,“它们不是模型,而且与其说它们是模型,不如说生物体是模型。它们是一种特定的、已经界定的自复制结构。至于它们是不是活的这一问题,只要‘活的’这一概念没有明确的定义,那么探究共生生物有机体是不是活的,并没有任何意义。”直到现在,“活的”这一概念的意义依然不明确,还是存在模棱两可的地方。
巴里塞利对病毒基因的了解助推了他对计算机的理解,而他对计算的了解助推了他对遗传密码起源的认识。“地球上最早的语言和技术都不是由人类创造的,”他在1986年写道,“它是由原始的RNA分子在近40亿年前创造的。一个会导致类似结果的进化过程有没有可能在计算设备的内存中启动呢?”如果不了解生命起源的原因,谁又能说它不可能再重演呢?
巴里塞利将他的数值进化实验看作“获得尽可能多的关于活的生物体(地球生命形式)遗传语言的起源以及演变方式的相关信息”。复杂的多核苷酸是如何起源的,而这些分子又是如何学会协调氨基酸的收集和蛋白质的结构的?他将遗传密码看作转移核糖核酸分子的原始“收藏家群体”所使用的语言……专注于收集氨基酸和其他可能的分子对象,作为组织收集到的材料的运送手段。他将这种语言和其他“收藏家群体”,例如,社会性昆虫所使用的语言进行了类比,但警告人们不要试图用蚂蚁和蜜蜂的语言来解释遗传密码的起源。
对巴里塞利来说,关于40亿年前发生了什么的线索直到今天仍然很明显。“RNA分子的许多原始属性和功能都保留了下来,非常神奇地没有被现代tRNA、mRNA和rRNA基因分子显著改变,”他解释说,“细胞及其各组件的一个主要功能,显然就是保持与RNA分子起源时相似的内部环境,不管外部环境已经发生了如何剧烈的改变。”
在巴里塞利最初公布“我们已经创建了一种能够复制和经受遗传变异的数字”的同时,一种类似的数字,即指令码,在数字世界扎根并获得了控制权。指令码构成了一种基本的复制字母表,而且其与不同代谢主机之间的增殖关系非常多样化。成功的和无差错的指令码序列适时构成子程序,即所有程序的基础单元,这就像核苷酸的基本字母组成了DNA的字符串,然后被视为氨基酸并装配成蛋白质,最后,经过很多层进化后,变成了细胞。
这些原始代码序列疯狂地复制巴里塞利观察到的所有生物现象,如杂交、共生、寄生,都活动在更大的数字宇宙里。从最初开始运行直到跑出宇宙,以及在玻璃里面最初的实验里,都是未受抑制的。指令码就像保守的多核苷酸,在活细胞内克服一切困难,以维持它们熟悉的环境。从iPhone到互联网,整个数字宇宙从指令码的角度来说,都可以看作企图维持它在1951年、在古老小径末端的40根静电存储管里最初出现时的模样。
指令码聚集演变成“收藏家群体”,让内存分配和其他资源回到集体居所。数字有机体根据其自身执行任务的能力而被复制、助长和奖励:它们进行运算、文字处理、核武器设计,任何形式的金钱都被计算在内。它们让其创造者腰缠万贯,赢得国家实验室的合同以及雷明顿·兰德公司和IBM公司的财富。
它们共同开发了语言的拓展层次,然后影响了计算氛围,就像早期微生物释放的氧气影响到后续生命轨迹一样无孔不入。它们合并到操作系统中成为共计百万行的代码,使我们能够更有效地操作计算机,同时使计算机能够更有效地操纵我们。它们学会了如何划分成数据包,通过网络传输,纠正前进道路上出现的任何错误,并在另一端进行自我重新组装。通过代表人类最看重的事物——音乐、图像、声音、知识、友谊、地位、金钱、美色,它们获得了无限的资源,并形成了在众多单个处理器上运行的、复杂的后生物有机体,其运行方式与基因组在大量细胞上运行的方式相同。
对细胞进行“编程”
1985年,巴里塞利将计算和生物学进行了类比,但他将这种类比以一种另类的方式呈现:“如果人类不是相互传递复制品和复杂的解释,而是形成了传递计算机程序的习惯——由计算机控制的工厂能够根据特定需要建造机器,那么这种习惯和细胞间的通信会是最相近的。”25年后,很多计算机之间的通信不是被动数据,而是主动指令,即根据需要在远程主机上构建特定的机器。
有了我们的合作,自复制数字正在对我们的宇宙情况进行更深入、更广泛的控制,而这也让它们在自己的宇宙里“生活”得更舒适。因为数字计算机开始直接读取和写入DNA,因此它们的宇宙和我们的宇宙之间的壁垒已经被彻底打破。
我们所说的读取基因组,即一次读取300万个碱基对,其实没有人脑可以实现吸收这些未删节的信息。事实上,是计算机在读取基因组,并通过编写可执行的核苷酸序列,然后将之插入到细胞中,开始为蛋白质编码。核苷酸序列和比特序列之间的转换是直接的、双向的,而且是以人类无法理解的语言进行的。
巴里塞利相信智能的设计,但是智能是自下而上的。“尽管生物进化是基于随机突变、杂交和选择,但是它不是一个盲目试错的过程,”他后来回忆数值进化工作时解释道,“组成一个物种的所有个体的遗传物质,由遗传性规则的严格模式组织成一个拥有集体智能的机制,其功能是保证在解决各种新问题时能实现最高速和最高效。从生物世界所取得的成绩来看,那确实是相当聪明的。”
“认为生物进化不涉及智能的概念,应该是所有与之相关的解释中最背离事实的。”1963年,他说道。
当我们让人类或任何其他物种为此事来进行智力测试,如果基于该物种大脑中的任何单个神经元或突触所做的事情不需要智能,就宣称该测试主体是愚蠢的,那么这是不符合常理的。
我们都同意这一事实——当一个人因为无法生存而死亡或者因为不适合再生而停止再生,这个过程是不需要智能参与的。但是,如果将这作为生物进化背后存在智能的反证,那么它可能会成为两种不同智慧意识到彼此存在之前、有可能产生误解的最典型的例子之一。
巴里塞利声称,在纯粹自复制数字的行为里发现了淡淡的智能的痕迹,这就像病毒第一次被生物学家在流体中检测到一样——研究排除了所有其他早期已经发现的自复制形式的物体。他最后的论文发表于1987年,题目为《启动旨在发展能够发展自己的语言和技术的共生生物有机体的数值演化过程的建议》(Sugges-tions for the Starting of Numeric Evolution Processes Intended to Evolve Symbioorgan-isms Capable of Developing a Language and Technology of Their Own)。他将自然和人工智能看成集体现象,而生物学和数值进化一起构成“一个强大的情报机构(或遗传大脑)”。在很多方面,如果就处理问题的能力来说,它可以媲美甚至优于人脑。他对比了计算机代码的进化和基因序列的进化,认为是解释性语言的发展导致这一过程变得更智能、更复杂。“至于到底是否存在和不同的共生生物有机体的遗传大脑进行沟通的方式,比如用它们自己的遗传语言,那就是一个未来需要解决的问题了。”他说。
转换的多层次则区分了当下程序员所用的语言和执行指令所用的机器语言,就像核苷酸编码序列和活细胞对其进行的最终表达之间存在多层次的诠释。相反,存储在DNA中的序列和存储在数字存储器中的序列之间的通信更直接。对于其中任何一种语言与人类语言的相似之处来说,基因的机器语言和计算机的机器语言有更多共同之处。
以计算机为媒介实现基因序列通信的出现,违反了正统的新达尔文主义观点,因为它认为遗传信息是从个人的祖先那里通过继承获得的。然而,水平基因转移一直是陆生生物的事情。病毒在不断将外源DNA序列插入到寄主身上。尽管显然存在着危险,但是大多数细胞都保持了读取从细胞外转移进来的基因序列的能力。该弱点被恶意的病毒所利用,那么为什么要保持这种需要付出如此代价的能力呢?
其中一个原因是为了便于获取新的、有用的基因,否则这些基因将一直是别人的财富。“水平基因转移的力量是如此之大,因此很难理解为什么真核世界会拒绝这样的遗传新颖性和创新性的绝佳来源,”伊利诺伊大学的卡尔·乌斯(Carl Woese)和奈杰尔·格登菲尔德(Nigel Goldenfeld)在距1949年冯·诺依曼解释自复制的讲座60年后,这样说道,“令人兴奋的答案在经过几十年的教条偏见之后绽放出来,那就是它没有被拒绝。现在有确凿的证据证明,水平基因转移出现在真核细胞中,不仅在植物、原生生物和真菌中存在,在动物(包括哺乳动物)身上也有。”
当我们“排序”基因组,我们从零散的部分一点点对它进行重建。生命一直在做这些事情。重要的基因序列的备份副本分布在病毒云里。“微生物根据它们所处的环境,按需求吸收和抛弃基因……因此这造成了质疑,当‘物种’的概念扩展到微生物领域中时,它是否依然有效,”格登菲尔德和乌斯在2007年观察到这一点并指出,“在严重的环境压力面前重建基因组的非凡能力,以及在某些情况下,它们与病毒的集体相互作用,对我们来说可能是至关重要的。”
水平基因转移被耐药病原体所利用。“我们宣布对微生物发动战争,但是我们输了。”格登菲尔德和遗传工程师补充道。但是,到底是谁在利用谁呢?基因组学革命受到我们存储、复制和操纵细胞外遗传信息的能力推动。生物学从一开始就一直在做这件事情。迄今为止,生命通过将病毒云作为备份源和快速交换遗传代码的方法来实现进化。生命对数字世界的适应能力可能比我们想象中的还要好。1966年,巴里塞利观察到:“在某种意义上,文化模式是不需要为了进化从而杀死个体这一遗传形式的解决办法。”我们已经将很多文化传承工作外包给了互联网,而基因遗传工作亦是如此。1950年,图灵表示:“‘优胜劣汰,适者生存’是一个缓慢的、检验出优势的方法。”他还认为:“有了智能的帮助,试验者应该加快这一速度。”
创业遗传学者乔治·丘奇(George Church)近日宣称:“关于生物技术在实验室中的成功,我们可以对这些细胞进行编程,就好像它们是计算机的延伸物。”对此,在野外成功进化了30亿年的生命可能会回答:“我们可以编程这些计算机,就好像它们是细胞的延伸物。”
物种的起源不是进化的起源,而物种的末日也不会是进化的末日。
从夜晚到白天,是第五日来了。