预计阅读本页时间:-
13
制造会思考的机器,人工智能初探
在试图建造这样的机器时,我们不应该心怀不敬,妄想篡夺创造灵魂的力量,我们拥有的至多就是生育小孩的天赋:确切地说,我们在任何情况下都是之意志的工具,为创造的灵魂提供居留之所。
广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元
艾伦·图灵,1950年
数字计算的历史可以分为旧时期和新时期:旧时期的先导们在莱布尼茨的领导下提出了逻辑原理,新时期的先导们由冯·诺依曼领导建造了计算机。艾伦·图灵在当中扮演了承前启后的角色。
图灵,极富洞察力和创新性的“天才”
1936年9月23日,时年24岁的图灵登上了丘纳德白星航运公司(Cunard White Star Line)的“贝伦加利亚号”(Berengaria)前往纽约。他的母亲萨拉(Sara)陪他坐火车,一直送他到船上,一路上提着他的珍宝——装在木箱子里的一个沉重的黄铜六分仪,到南安普敦才和他告别。“在所有笨重的行李中,”她回忆说,“他让我拿着一个老式的六分仪箱子。”
接下来的两年里,图灵将加入约翰·冯·诺依曼在普林斯顿大学法恩楼的团队。冯·诺依曼往返于南安普敦和纽约两地时必选头等舱,而图灵则为自己预订了经济舱。“船上的客舱里有放东西的小空间,很方便。此外,就没什么好担心的了,”9月28日,他向母亲报告,“对于很多人挤在一起、乱糟糟的场面,我很快就不在意了。”
图灵来到普林斯顿的第6天,他的《论可计算数及其在判定问题上的应用》一文的校稿就发来了。这篇35页的论文将引领人们由逻辑走向机器的时代。
1912年6月23日,艾伦·麦席森·图灵出生在伦敦沃灵顿酒店(Warrington Lodge),他的父亲朱利斯·麦席森·图灵(Julius Mathison Turing)曾担任英印政府的公职人员。母亲埃塞尔·萨拉·图灵(Ethel Sara Turing,娘家姓为斯托尼)和乔治·约翰斯通·斯托尼(George Johnstone Stoney)是族亲。1874年,乔治首先为1894年发现的电子命名。他的母亲说:“艾伦在读书识字之前,对图画很感兴趣,这些和数学没有丝毫联系。”她接着说道:“1915年,艾伦三岁时,他的玩具船中的一个木头水手脱落,他就把水手的胳膊和腿种在花园里,并相信它们会生长。”
艾伦的母亲提到,他的这种讨人欢喜的好奇心赋予了幼年时的他“一种非凡的禀赋”,让他赢得了女房东和女佣们的欢心。他从一开始就表现出了异于常人的天赋。她补充道:“1924年的圣诞节,我们从一位法国化学家那里买来坩埚、曲颈瓶、化学药品等物品,给他当作礼物。”他在寄宿学校的绰号叫“炼金术士”。1927年,在谢伯恩(Sherborne)中学,他的舍监报告称:“艾伦将大把的时间花在研究高等数学上,以致忽略了基础功课。”他继续说道:“我还在无意中发现,艾伦在打开的窗台上,用两枝忽明忽暗的蜡烛熬制女巫药水。”
9月29日,“贝伦加利亚号”登陆纽约。图灵通过了安检,又乘坐了昂贵的出租车,来到普林斯顿大学研究生学院。接下来,他将待在这里直到获得博士学位。而冯·诺依曼6年前就来到了普林斯顿,他已经完全适应了美国的生活,但图灵自始至终都不太适应。还在船上的时候,他就曾对母亲说:“美国人是你能想到的最难以忍受、最麻木不仁的生物。”
普林斯顿大学曾不惜重金复制图灵的母校——剑桥大学的建筑,同时动用20世纪所有的资源装扮校园,特别是新研究生学院,它看起来好像是13世纪的建筑。大学的教堂是剑桥大学国王学院教堂的翻版,一系列新宿舍也是剑桥大学和牛津大学宿舍的“学院哥特式”改版,但没有配备淋浴和中央供暖系统。图灵安顿下来后抱怨道:“除了他们说话的方式,我发现美国人的生活只有一点(不是两点!)确实让人讨厌:不能做到普通意义的洗澡,以及他们对于室温的想法。”
研究生学院设在斯普林代尔高尔夫球场和奥尔登农场之间的高地上,那里还有1913年从剑桥大学和牛津大学运来的石头。克利夫兰塔(Cleveland Tower)拔地而起,高53米,里面放着一架音域跨越5个八度的钟琴。这架钟琴是1892年那一届的班级委托制造的,他们还约定要定期奏响这架钟琴,只有博士考试期间除外。最大的钟重达5842千克,发低音G调。研究生学院的食堂采用彩绘玻璃、拱形天花板,还配备了一架管风琴。它是由威廉·库珀·普罗克特(William Cooper Procter)设计并建造的。威廉是宝洁公司共同创办人的孙子,他以自己和妻子的名义设立了一项奖学金,以保证剑桥、牛津和巴黎每年至少有一名学者来这里学习,该学者必须“身体健康,拥有高素质、优秀的教育背景和卓越的学术前景”。这位捐助者的雕像立在一座橡木屋的旁边。塑像手持一个象征奖学金来源的实验室烧杯,俯视下方。
1935年,冯·诺依曼在剑桥大学做春季访问期间,曾给奥斯瓦尔德·维布伦发来一封信,他在信中说:“去普林斯顿的路上似乎非常拥堵。”他还特别提到了图灵(把他的名字拼写成了“Touring”):“图灵似乎在剑桥大学数学家们的强烈支持下,获得了普罗克特奖学金(我认为他很有前途);还有一两个人,他们的名字我忘记了。”图灵的第一篇论文《左右殆周期性的等价性》(Equivalence of Left and Right Almost Periodicity),就是对冯·诺依曼一项成果的推广,虽然第一次未能一举获得普罗克特奖学金,但是第二年他就成功了。
1935年,冯·诺依曼在剑桥大学期间,与组合拓扑学家麦克斯韦·纽曼成为朋友。他向维布伦这样描述纽曼:“无论是从拓扑学还是从性格方面来说,他都非常有吸引力。”纽曼的父亲是波兰裔德国犹太人赫尔曼·亚历山大·纽曼(Herman Alexander Neumann)。1879年,赫尔曼·亚历山大移民到英国。1916年,改名纽曼。麦克斯韦·纽曼是图灵的导师。冯·诺依曼邀请他来高等研究院,他于1937年9月抵达普林斯顿,随后在此处待了一学期。他的妻子琳恩(Lyn)向英国的家人报告说:“麦克斯(麦克斯韦的昵称)在这里没有工作,他只是待在家里做自己喜欢做的事。”他把大部分时间花在庞加莱猜想的证明上,后来却发现他的证明中存在一个致命错误。琳恩和图灵结为亲密的朋友。在战争期间,她带着纽曼的两个孩子回到了普林斯顿。
和冯·诺依曼一样,图灵在成长期间受到了大卫·希尔伯特的影响,后者雄心勃勃的形式化计划为两次世界大战期间的数学发展设定了道路。希尔伯特学派认为,如果一个命题可以用数学的语言加以阐述,那么仅通过逻辑就可以证明该命题成立与否,而无须跳跃性的思维介入。1928年,希尔伯特提出了三个问题,通过它们来确定无所不包的数字宇宙是否可以由一套有限的规则来定义:这些基础是相容的吗(以致一个命题及其反命题绝不能同时得证)?它们是完备的吗(以致所有真命题在系统内部就可以得证)?是否存在一个决策程序,对于用特定语言表述的任意命题,是否始终会产生对该命题的有限证明或明确的反证,并且两者不会同时存在?1931年,哥德尔提出的不完备定理终结了希尔伯特的计划。不存在足以解决普通算术的相容的数学系统,该系统不能建立自身的相容性,也不具备完备性。
希尔伯特留下的判定性问题或“决定性问题”——在特定系统中(比如,由基本逻辑或算术公理定义的系统),任意精确的机械程序是否可以将可证明的和不可证明的语句区分开来,还未得到解答。即便是提出这个问题,也需要在数学上定义机械过程的直观概念。1935年春天,冯·诺依曼访问剑桥期间,图灵参加了麦克斯韦·纽曼讲授的数学基础课程,首次注意到判定性问题。希尔伯特提出的挑战让图灵直觉地认为,可以证明排斥严格机械程序的数学问题存在。
图灵的论证简单直接:抛开所有的假设,从头开始。杰克·古德曾说:“极端独创性的一个方面,就是不将庸人口中的真相视为真相。”在第二次世界大战期间,他曾担任图灵的助理(当时被称为“教授”)。据杰克·古德称,独创性可能比智力更重要,而图灵就是很好的证明。“亨利·庞加莱(Henri Poincaré)智力测试的成绩很差,而教授参加这一测试的成绩也差不多只有研究生一半的水准。”假使图灵走阿隆佐·邱奇(Alonzo Church)和埃米尔·波斯特(Emil Post)的老路,紧紧跟进他们的工作,他的兴趣也许就不如原创时那么浓烈了。“他使用具体事物(比如,练习本、印刷油墨)论述和控制论证的方式,体现了他典型的洞察力和原创性,”他的同事罗宾·甘迪(Robin Gandy)说,“让我们赞美这个思维灵活的天才。”
如果存在一个指令(或算法)的有限序列,正确规定如何列举函数f(0)的值;以及对于任意自然数n,函数f(n+1)的值,则该函数在自然数的域(0,1,2,3……)上是可计算的。图灵从产生的结果反向解决可计算函数的问题。“根据我的定义,”他解释道,“如果一个数的小数部分可以由一台机器写下来,那么这个数就是可计算的。”
计算机的萌芽
1935年,图灵开始萌发了计算机的设想,这在当时并不意味着一台计算机器,而是一个人,具备了铅笔、纸张和计时的功能。然后,他将其中的大部分替换成明确的成分,到最后只剩下“可计算”的正式定义。因此,图灵机(他称为LCM,或逻辑计算机器)包含一个黑盒子,能够在一条无限长的纸带上读取和书写有限字母表中包含的符号,并能够改变自身的“m-配置”(m-configuration)或“思想状态”。
图灵写道:“我们也许会将正在计算实数的人比作只能在有限条件下运行的机器……这就叫作‘m-配置’。”
图灵机和一条“带”(类似纸)相连,这条“带”被分成许多节(称为“方格”),每个方格填写一个“符号”。任何时候,“机器中”都只有一个“方格”……然而,通过改变它的“m-配置”,机器能有效地记住之前“见过”的一些符号……在某些配置中,扫描的方格为空(即没有符号),机器就会在该方格中填写新的符号;在另外的配置中,它会删除扫描到的符号。机器也可能改写正被扫描的方格,但只能通过将它向左或向右移动一个位置才能做到。除了这些操作外,也可能改变“m-配置”。
图灵引入了两个基本假设:时间离散性和思想状态的离散性。对于图灵机,时间并不是以一个连续统存在的,而是一个状态的变化序列。图灵假定在任何特定的时间内,存在有限的可能状态。“如果我们认定存在无穷的思想状态,其中的一些将会‘无限接近’,并引起混乱,”他解释说,“所受的限制不在于严重影响计算的因素,因为通过在纸带上写下更多的符号,就可以避免更复杂的思想状态的使用。”
如此一来,图灵机体现了空间的符号数组和时间的事件序列之间的关系。一切智能的痕迹都被消除了。在特定时刻,机器只能进行像做标记、清除标记和将纸带向左或向右移动一个“方格”这样简单的操作。纸带并不是无限的,但是如果需要更多的纸带,可以继续接上,而不至于用完。纸带和图灵机之间关系的每一步都由一个指令表决定,指令表上列出了所有可能的内部状态、所有可能的外部符号,以及对应每一种可能的组合出现时的反应(包括写下或清除符号,向左或向右移动,改变内部状态)。图灵机严格遵循指令,从不出错。复杂的行为并不需要复杂的思想状态。通过记录大量笔记,图灵机仅依靠两个内部状态进行运作。行为复杂性同等体现在复杂的思想状态行为(m-配置)及纸带上编码的复杂符号(或简单的符号串)。
图灵的《论可计算数及其在判定问题上的应用》一文仅用10页就阐明了后来所谓的图灵通用机。他宣称:“发明一台可以用来计算任何可计算序列的机器是有可能的。”如果你向通用机提供和其他机器一样适当编码的描述,它就能执行该描述,产生相同的结果。所有的图灵机都能编码成有限长度的字符串,因此所有可计算函数也同样如此。既然可能存在的机器数量是可数的,而可能存在的函数数量是不可数的,那么不可计算函数以及图灵所说的“不可计算数”就一定存在。
图灵运用与哥德尔相似的方法,能够构建出这样的函数:可以给出有限的描述,但是不能通过有限的手段进行计算。其中一个就是停机函数:给出一个图灵机的数字和一个输入纸带的数字,根据计算是否会停下来决定返回的值为0或1。图灵将停机的配置称为“循环的”,将无限期继续运行的配置称为“非循环的”,并证明了停机问题(halting problem)的不可解性意味着一类相似问题也不可解,包括判定性问题,与希尔伯特的期望相反,不存在一个机械程序可以在有限步骤内判定任何特定数学语句,这让希尔伯特计划走向终结;而希特勒对德国大学的清洗则让哥廷根作为世界数学中心的地位宣告结束,为图灵的剑桥和冯·诺依曼的普林斯顿制造了填补空白的机会。
1936年4月,图灵学习满一年,他给纽曼送去了论文的草稿。麦克斯韦的儿子威廉·纽曼(William Newman)说:“麦克斯韦看到艾伦的杰作时,一定异常激动。从那天起,艾伦就成为麦克斯韦的核心门徒之一。”麦克斯韦·纽曼为《论可计算数及其在判定问题上的应用》一文在《伦敦数学学会期刊》(Proceedings of the London Mathematical Society)上出版进行游说,并安排图灵去普林斯顿与阿隆佐·邱奇一起做研究。纽曼给邱奇写信说:“你应该尽快接触到这一行的领军人物,这样就不至于单打独斗。”
图灵带着他的六分仪来到了普林斯顿,他节衣缩食,靠着国王学院的奖学金(300英镑)支撑过了一年。10月3日,《论可计算数及其在判定问题上的应用》一文的校样以邮件的形式从伦敦发了过来。10月6日,他给母亲写信说:“这篇论文很快就要出版了。”然而,这篇文章(于1936年11月30日出版)并未受到人们的关注。1937年2月,图灵给母亲写信说:“我为它在这里受到冷遇而感到失望。”他还补充说:“我不太喜欢在这个国家度过漫长的夏天。”只有两家出版机构发来再版的请求。工程师们之所以回避图灵的论文,是因为它似乎完全是理论上的内容;而理论家持相同的态度,则是因为其中提到了“纸带”和“机器”。
“我记得1942年在圣三一学院图书馆(Trinity College Library)拜读过图灵的论文,”弗里曼·戴森说道,“我认为它是‘非常绝妙的一篇数学作品’!但我从未想过有人能把这些成果付诸实际。”一名24岁的研究生不可能引领一场技术革命,而数理逻辑更是最不可能发生此类革命的领域。“当我还是一名学生时,即使是拓扑学家也把数理逻辑学家当作外太空人,”1986年,马丁·戴维斯评论道,“而今天,人们可以走进一家商店,向老板要‘逻辑探头’。”图灵的通用机已经被耽误了76年。
1937年3月,阿隆佐·邱奇在《符号逻辑杂志》(Journal of Symbolic Logic)上评论了《论可计算数及其在判定问题上的应用》一文,并创造了“图灵机”这个术语。邱奇写道:“图灵机得出的可计算性,其优点是能立即有效地识别一般(非显式定义)意义上的明显结果。”邱奇的论题将“可计算性”和“可有效演算性”等同,从那以后,它被称为邱奇-图灵论题。
即使哥德尔并未大力推进自己的成果,但他还是认识到邱奇-图灵论题是一大进步。他在1946年承认:“有了这个概念,人们首次成功地给出了绝对定义……不依赖于所选择的形式主义。”在邱奇和图灵之前,机械过程的定义一直受到定义概念的语言限制。“然而,对于可计算的概念……情况就不同了,”哥德尔评论道,“它奇迹般地不必辨别指令,且对角线法并未跳出所定义的概念。”
1955年,麦克斯韦·纽曼回忆说:“今天的人们难以想象,将纸带和穿孔模式引入数学基础的讨论在当时是多么大胆的一项创新。”对于图灵,下一个挑战是将数理逻辑引入计算机基础。“图灵对各种实用性实验有着浓厚兴趣,这使得他即使是在那时,也对实际建造一台机器的可能性感兴趣。”
“论可计算数”(而不是“论可计算函数”)的标题标志着一个根本性的转变。在图灵之前,人们都在研究数字;图灵以后,数字开始为人们解决问题。通过展示一台机器可以被编码为一个数字,一个数字可以解码为一台机器,“论可计算数”催生出了数字(现在被称为“软件”),这些数字是全新意义上“可计算的”。
耐心、创造力与直觉
虽然图灵和冯·诺依曼一个在普林斯顿大学、一个在研究院,但是两个数学家团队都在法恩楼办公。“图灵的办公室就在冯·诺依曼办公室的右边,冯·诺依曼也对这些事情很感兴趣,”赫尔曼·戈德斯坦说,“他了解图灵的全部工作,并且适时地明白了其重要意义。我认为,串行计算机、纸带和所有诸如此类的东西,它们的整个关系是很清楚的——那就是图灵。”朱利安·毕格罗对此表示同意。“波斯特和图灵为这种思想设定了框架……大约10年后,存储程序计算机得以实现并非巧合,”他证实说,“冯·诺依曼对哥德尔的工作、波斯特的工作、邱奇的工作都非常、非常了解……他就是这样了解了这些工具并且知道其快速实现方法,你们已经得到那种通用的工具了。”
毕格罗说:“直到我来到普林斯顿,我才听说了图灵这个人。”
不过,来到这里一个月后,有一次我和冯·诺依曼谈论各种归纳过程和进化过程时,他顺带提了一句:“当然,这就是图灵所讲的。”我问:“谁是图灵?”他回答:“你去查查1937年的《伦敦数学学会期刊》。”存在模仿所有其他机器的通用机这一事实……只有冯·诺依曼和其他少数人了解。而当他了解之后,他就知道我们可以做些什么了。
1937年,无论是图灵还是冯·诺依曼都在研究纯数学,不过图灵发现与法恩楼数学系仅一条过道之隔的帕尔默物理实验室对他的诱惑无法抵挡。马尔科姆·麦克费尔(Malcolm MacPhail)说:“图灵居然设计了一个电动乘法器,并建立了最初的三、四级,看是否能让它运作起来。”他曾将一把机械加工车间的钥匙借给图灵。“当时,他需要继电器式开关,而市面上没有销售,他就自己制造……他把继电器缠绕起来并进行加工。让我们惊喜的是,计算器能正常工作了。”
图灵先借助他的通用机将数理逻辑的边界尽可能地拓宽,然后开始思考如何摆脱封闭形式系统和纯确定性机器限制的方法。他的博士论文完成于1938年5月,1939年以《基于序数的逻辑系统》(Systems of Logic Based on Ordinals)为题发表。这篇论文试图通过一系列的形式系统超越哥德尔的不完备性,逐渐实现更完整的逻辑系统。图灵解释说:“哥德尔证明每个逻辑系统在一定意义上都是不完整的,但同时……表明,借助一定的手段,由逻辑系统L可能得出更为完整的逻辑系统L'。”为什么没有包含L'呢?既然L'包含在内,那么L"呢?然后,图灵通过参考一个所谓的“谕示”(oracle),提出了一类新机器,这类机器逐步开展确定性运作,但是偶尔会出现非确定性运作。
“我们不应该再进一步探究这个谕示的本质,且不用说它不可能是一台机器,”图灵解释说(或者并未解释),“在这个‘谕示’的帮助下,我们可以形成一种新的机器(称为O型机)。”图灵指出,在没有外部‘谕示’的支撑下,仍然可以构建不可判定语句,判定性问题也依然得不到解决。1936年的通用图灵机获得了所有人的关注,不过1939年图灵的O型机可能更接近智能的工作方式(真实和虚拟):逻辑顺序遵循一定的步数,而直觉则弥合了其间的差距。
“数学推理可能会被计划性地看作两种能力组合的行为,这两种能力我们可以称为直觉和创造力,”图灵解释说,“直觉在于自发做出判断,这些判断并非有意识的推理序列的结果。这些判断经常出现,但并不是永远正确(姑且不论何谓‘正确’的问题)。”图灵认为创造力对直觉起到辅助的作用,而非取代。“在前哥德尔时代,有人认为将这种程序改变到一定程度大概是有可能的,即所有直观的数学判断都能被有限的这种规则替代,”他总结道,“那么,直觉的必要性就完全不存在了。”假设直觉能被创造力所替代,并且反过来,创造力又能被穷举搜索替代,那么又会怎样呢?“我们始终都能从形式逻辑的规则中获得一种列举命题的方法,这些命题都是通过一定手段证明过的。那么我们可以想象,所有证明都需要列举所需要的定理,从而表现为搜索的形式。这样,创造力就被耐心所取代。”然而,耐心再多也不足以成事。创造力和直觉并未就此消失。
耐心、创造力和直觉之间的关系让图灵开始思考密码学。在密码学中,如果一条电报在传播过程中被拦截,编码该电报所使用的少许创造力就能抗衡破解时耗费的大量创造力。根据指令,图灵机可以将有意义的语句隐藏在看似无意义的噪声中。除非你知道密钥,否则很难将这些有意义的语句提取出来。图灵机也可以根据指示来搜寻有意义的语句,但是因为无意义的语句总是不计其数,比有意义的语句多得多,所以保密比较容易实现。“我刚发现一种可能的应用,也就是我现在研究的这件事,”1936年10月,图灵给母亲写信说,“它解答了‘可能存在的、最一般形式的代码和密码是什么’的问题,同时能够让人们相当自然地建立大量的特定代码,这些代码非常有趣。其中就有一种代码:编码非常快捷,解码则需要密钥,否则将极其困难。我希望我可以把这些代码卖给英国政府,从而获得一笔可观的报酬,但是我相当怀疑做这件事情是否有悖道德。您怎么看呢?”
随着博士论文的完成,图灵开始为他返回英国做准备。冯·诺依曼向他提供了在研究院担任自己助手的职位,年薪为1500美元,但是战争的乌云正在聚拢,图灵准备回家。“7月中旬我就能见到你,”他写信给他的朋友、在国王学院研究数学的同事菲利普·霍尔(Philip Hall),“我也希望看到2.5米宽的战壕纵横交错地密布在后草坪上的情景。”1938年7月19日,他回到南安普敦。
破解Enigma
对于第二次世界大战的进程,密码学和密码分析很快就变得和物理学一样重要了。第一次世界大战末期,德国电气工程师亚瑟·谢尔比乌斯(Arthur Scherbius)发明了密码机,并向德国海军做了推荐,却遭到了拒绝。之后,谢尔比乌斯创办了密码机股份公司(Chiffriermaschinen Aktiengesellschaft)来生产这种机器,品牌名称定为Enigma,用途是为商业通信加密,比如银行之间转账。后来,德国海军改变了主意,于1926年采用了修改版的Enigma机器。其后,德国陆军和空军分别于1928年和1935年开始使用这种机器。
Enigma包含几个车轮形转子和26个电触头,每个电触头代表字母表中的一个字母,循环排列在一个转子的外表面上。触头按照一定的方式连接,使得某个字母可以作为信号在转子的一侧输入,然后在另一侧出现另一个字母。因此,对于每个转子有26!(或403291461126605635584000000)种可能的配线方法。在特定的银行或通信网络中,每一站都有各种不同的、相匹配的转子集合。电报通过键盘输入,发送电流,电流通过三个相邻的转子传到第四个转子,然后反射转子(仅有7905853580025种状态),之后回流到之前的三个转子,最终点亮26个灯泡中的一个,该灯泡即表示要用于加密文本的字母。转子与键盘机械耦合,就像里程表和车轮,这样,机器的思想状态每一步都会发生改变。如果收件人有一台相同的机器,且完全相同的转子设置在相同的起始位置,这个功能就能反向执行,产生解密的文本。
1939年9月,图灵加入了英国外交部的政府代码及加密学校(Government Code and Cypher School)。学校位于白金汉郡一块被称为布莱切利园(Bletchley Park)的土地上,与世隔绝。他们的任务是破解Enigma代码。现在,德国军事当局对Enigma做了改进,不仅引进了新的转子配置,还经常修改密钥。对于绝密通信,特别是U型潜艇舰队的通信,还额外增加了一个转子位置和一个辅助键盘,辅助键盘上乱置了10对字母,只有6个字母不变。杰克·古德回忆说:“因此,在电报的开头,机器可能的初始状态约有9×1020种。对于U型潜艇,大约为1023种。”1941年5月,当时25岁的他成为图灵的统计助理。
对于三个转子的Enigma,蛮力试错法必须每秒测试约1000种状态,才能在地球生命起源至今的30亿年里完成所有可能的组合测试。而对于4个转子的Enigma,蛮力试错法必须每秒测试约20万种状态,才能在宇宙形成至今的150亿年里得出解决方案。布莱切利园最终能在情报失效之前的数天或数小时内,成功破译所截获的Enigma电报。这一成功是英国人直觉和创造力的产物,同时也得益于人为误差。
“战争开始时,大概只有两个人认为德国海军的Enigma可以被破解,”休·亚历山大(Hugh Alexander)在战争结束后所写的一部内部史中说道,“伯奇(Birch,亚历山大的上司)认为可以破解,因为这势在必行;而图灵认为可以破解,则是因为破解Enigma十分有趣。”据亚历山大称,图灵对他的兴趣做了这样一番解释:“没有人做这件事情,只有我自己在做。”破解海军Enigma,就能发现威胁英国补给线的U型潜艇的位置,这对于英国海上的稳定至关重要。
在战争爆发之前,波兰密码学家曾破解三转子Enigma电报,为这项事业提供了一个良好的开端。三名年轻的波兰数学家亨里克·佐加尔斯基(Henryk Zygalski)、杰尔兹·罗佐基(Jerzy Rózycki)和马里安·雷耶夫斯基(Marian Rejewski)在法国情报机关的协助下,并怀着对德国Enigma的兴趣(可以追溯到1928年波兰海关工作人员的一次拦截),缩小了转子配置的搜索范围,使那种机电设备(波兰人称为“bombas”,英国人称为“炸弹机”[bombes])可以对剩余的特定子项进行试错测试。“炸弹机”在一片可能性的区域中搜寻,如果找到一种可能的转子配置,就会停下来。滴答声响之后就是静默,也许就是滴答声这一特点赋予了这台机器这个名字。后来的版本在图灵的帮助下被设计了出来,并由英国制表机器公司(British Tabulating Machine Company)大规模生产。它一次能模仿36台Enigma机器。“炸弹机”是对图灵单一机器能模仿众多其他机器行为思想的具体实施。
1941年,德国通信部门开始使用更为快捷的数字设备进行加密:由西门子公司生产的Geheimschreiber和由洛仑茨制造的Schlüsselzusatz。这些装置统称为Fish,都是从自动电传打字机设备衍生而来的。它们生成0和1的序列(密钥),然后被添加到一份未加密(明文)的电报的二进制表示法中,再输出普通的5位电传打字机纸带用于传输。机器的12个编码盘半径长度不等,总共包含501针,每一针都可以在两个位置之间转换,赋予系统2501(约10150)种可能的状态。密钥向明文消息中添加了模数2(以2计,方式和我们按12小时计一样,以使0+1=1和1+1=0),其中,1和0表示纸带上孔的存在或缺失。再次将密钥添加到加密文本,就会返回初始文本。
Fish的通信流量超出了机电“炸弹机”的测试范围。电子设备是迎头赶上的唯一希望。于是,人们建造了一系列机器,并将其命名为“希思·罗宾逊”(Heath Robinson)。它们是依据这样的原理建造的:通过同时将两条不同(且互素)长度的穿孔卡片纸带扫描为连续循环,就可以比较这两个序列的所有可能组合。希思·罗宾逊系列机器虽然基于标准电传打字机纸带和标准5位电传码,但是它通过光电磁头高速运行。它们使用电子电路来比较两个序列,不过难以维持两条纸带同步。
后来,工程师托马斯·弗劳尔斯(Thomas H.Flowers)提出,通过将一条纸带的序列读入一个内部存储器来消除这条纸带。这个内部存储器由5万根真空管(英国人称为“真空阀”)构成。弗劳尔斯供职于英国邮政总局设在多利士山(Dollis Hill)的电信研究站。然后,这个内部存储器可以与另一条纸带读取的脉冲序列保持同步,在没有链齿轮的情况下,它们可以借助摩擦驱动以更快的速度运行。“读取这些纸带的速度为每秒5000个字符,这意味着每小时能读取近48千米长的纸带,”杰克·古德回忆说,“我把电传打字机纸带能以如此高速运行看作第二次世界大战中的一大秘密!”
通过实践,运行长达60米的纸带循环是有可能的。新型机器代号为Colossus,它在弗劳尔斯的监督下制造,并在麦克斯韦·纽曼的指导下运作和编程。早在1935年,麦克斯韦·纽曼激起图灵对判定性问题的最初兴趣时,他就把所有这些事项推动起来了。Colossus是一台电子图灵机,虽然还不能算通用,但是其中所有的元素都已到位。
Colossus非常成功(Fish的亚种也非常丰富),以致到了战争末期,投入使用的Colossus已经有10台,而后续的版本使用了2400根真空管。人们通过机器背面的插板和双态开关进行编程。“编程的灵活特性可能是由纽曼提出的,或许图灵也有参与,两人都熟悉布尔逻辑,而且这种灵活性卓有成效,”杰克·古德回忆说,“操作模式就是,密码破译者坐在Colossus前,根据自动打字机所打印的内容,向皇家海军女子服务队(Women's Royal Navy Service)发出指令,要求修正堵塞。在这个阶段,男人、女人和机器之间存在一种密切协同的关系。”作为迈向现代计算机的一步,Colossus象征着一次巨大的跨越,堪比ENIAC。当独一无二的ENIAC仍在建造时,它就已经在运转并被复制了。每台Fish机器都是一种形式的图灵机。使用Colossus破解各种Fish的过程,展示了一台图灵机如何编码另一台图灵机用于执行的功能(或部分功能)。由于英国方面不清楚Fish不断变化的状态,他们不得不进行猜测。研究人员训练Colossus感知极其微弱的梯度方向,借此将加密的德文与随机字母的(噪声)区分开来。Colossus是搜索引擎的远祖:在前寒武纪数字宇宙中搜寻遗失的密钥碎片,直至找到为止。
首次展示可行的存储程序计算机(1948年6月21日,曼彻斯特大学的小规模实验机运行了它的第一个程序)及首次制造千位级的电子存储器(静电威廉姆斯管)的人正是布莱切利园的校友图灵。但是,计算机发展背后的驱动力已经转移到了大西洋彼岸,重心由密码分析的逻辑难题转向了氢弹的数值设计。在布莱切利园解散之后,碍于《官方保密法》,曾在这里工作过的人们不能公开提起他们战时的工作。1946年2月,ENIAC公开亮相,而Colossus的存在却在之后的32年内未得到正式确认。
和而不同的冯·诺依曼
图灵和冯·诺依曼直接合作的程度(假使存在)仍然不得而知。英国有一个与冯·诺依曼开展磋商的核武器研究小组,为洛斯阿拉莫斯国家实验室做出了重要贡献。美国则有一个与图灵联系的密码专家小组,为布莱切利园开展工作做出了重要贡献。1942年11月至1943年3月期间,图灵待在美国。而1943年2月至7月,冯·诺依曼待在英国。这两次访问都是秘密任务,这两位先驱在战时的联系也没有留下任何记录。
“在他工作期间出现了一些停顿,这牵涉到他在纽约度过的一段空闲时光,”萨拉·图灵谈论艾伦在战时到访美国的三个月时说,“他似乎借此机会拜访了普林斯顿,可能见到了美国计算器械取得进展的一些东西。他乘坐一艘驱逐舰或类似的舰艇回来,在大西洋上颇费了一番折腾。”杰克·古德记得,1943年3月,图灵从美国回来后就立刻讨论了关于飞机中各个整数坐标点上的火药袋的问题。给定一袋火药爆炸会造成相邻火药爆炸的概率,爆炸会蔓延至无穷远的概率是多少呢?如果在不提及裂变截面的情况下,要描述确定核链式反应的概率问题的特征,飞机中整数坐标上的火药袋不失为一个很好的数学拟合。
沃默斯利(J.R.Womersley)是英国国家物理实验室数学部主管,他读过《论可计算数及其在判定问题上的应用》一文,在战争爆发之前就对图灵机产生了兴趣。1945年春天,他被派往美国,调查计算机发展的最新情况(当时还是机密),包括哈佛大学的自动顺序控制计算器“马克一号”(Mark I),他在一封家信中将这个计算器描述为“硬件图灵机”。沃默斯利向道格拉斯·哈特里(Douglas R.Hartree)做了报告,后者又向英国国家物理实验室主任、查尔斯·达尔文的孙子小查尔斯·达尔文爵士进行报告。1946年,沃默斯利写道:“我看到了ENIAC,冯·诺依曼和戈德斯坦向我介绍了EDVAC的信息。”1945年6月,沃默斯利和麦克斯韦·纽曼进行了面谈,并要求和图灵见面。“同日,我和图灵见面,并邀请他到家里来,”沃默斯利写道,“我们向图灵展示了EDVAC的第一份报告,并说服他加入国家物理实验室的队伍。我安排了面试,并说服了主任和部长。”1945年9月,图灵被派去研究ENIAC和EDVAC的报告。沃默斯利指出:“图灵认定针对EDVAC所提出的机制适合自己的想法。”
“当然,我与图灵联系密切,”1946年2月初,麦克斯韦·纽曼给冯·诺依曼写信说,“大约一年半前,当我外出的时候,就决定试着启动一个运算装置。”由于接触ENIAC的技术细节仍受到限制,而Colossus的存在还不为外人所知,所以他们安排了一次私人拜访。“我最想做的就是出来和你谈谈(我仍然对讨论过去有点不安,请你务必注意分寸,即便不慎失言,也应点到为止)。”
冯·诺依曼为麦克斯韦·纽曼访问普林斯顿向高等研究院申请了固定津贴。1947年1月,图灵本人前往,他报告说:“我这次访问美国并没有发现任何新技术的重要信息,我认为主要是因为美国人已经在过去的一年里不断向我们透露信息……在我看来,普林斯顿的小组似乎是这些美国组织中思路最清晰、最富有远见的,我会尽量与他们保持联系。”
战争已经抢占了各种新发明,甚至不放过Enigma机器传播的一条电报。雷达、密码分析、防空火力控制、计算机和核武器都是秘密战时项目。它们在安全屏障背后,享受到思想自由交流的好处,不必担心个人版权或同行评审等问题。冯·诺依曼担任信使RNA的角色,帮助传达这些思想的精华,其中就包括图灵通用机的威力。在高等研究院图书馆的书架上,摆放着装订成册的《伦敦数学学会期刊》,其中有一卷的封面因为被翻阅太多次而脱落:第42卷,第230-65页是图灵的《论可计算数及其在判定问题上的应用》一文。
图灵和冯·诺依曼两人在各个方面的表现都大相径庭,只有对计算机的兴趣是共通的。冯·诺依曼在公开场合大多穿西装;图灵则经常衣冠不整,甚至连他的母亲都坦承:“他常常不修边幅。”冯·诺依曼言谈洒脱,言辞肯切;图灵讲话吞吞吐吐,语言好像跟不上思想的脚步。图灵住宿舍,也是一位有竞争力的长跑运动员;冯·诺依曼则出入一流酒店,对运动十分反感。冯·诺依曼爱慕女性,而图灵则有断袖之癖。
当冯·诺依曼谈论计算时,从不提及人工智能;图灵则必谈人工智能,很少谈及其他。图灵和冯·诺依曼设计了不同风格的计算机,编写了不同风格的代码。冯·诺依曼的设计体现在1945年6月30日的《关于离散变量自动电子计算机的草案》和1946年6月28日的《电子计算机逻辑设计初探》。图灵的设计则体现在《电子计算机计划》(Proposed Electronic Calculator)这篇文章里。这篇论文是他在1945年9月看过EDVAC报告后,到当年年底的短短几个月内,为英国国家物理实验室创作的。在文中,他完整地介绍了每秒达百万次循环的自动计算机,并伴有电路图、详细的内存储系统的物理和逻辑分析、示例程序、详细的(即便存在bug)子程序,以及11200英镑的成本估计。萨拉·图灵后来解释说,她的儿子的目标是“将他之前在《论可计算数及其在判定问题上的应用》论文中陈述的通用机逻辑理论投入实践”。
机器已经“长大”
对实用的各种存储器(从通过“大脑皮质”[cerebral cortex]的穿孔纸带到声延迟线)进行比较之后,图灵将水银延迟线指定为高速存储器。他估算了各种存储器的成本、存取时间和“空间经济性”(按照位数/升),把一个大脑皮质每年的成本定为300英镑,这也是国王学院当年为他提供的奖学金数额。延迟线被视为有限状态图灵机的一部分,它表示1000个方格的纸带的连续循环,在读/写磁头下每秒完成1000次读写。图灵指定了约200根管,每根存储32个32位的字,总共约为200000位,“堪比一条米诺鱼的记忆容量”。图灵用了10页的篇幅来阐述这个想法,他从第一原理出发,计算出了存储容量、衰减、噪声、温度灵敏度和再生要求。
图灵的自动计算机因为战后的官僚作风而陷入了停滞,和巴贝奇的分析机一样再也没有投入建造。1950年5月,样机的局部(Pilot ACE)终于完成。威尔金森(J.H.Wilkinson)写道:“事实证明,它是远超我们想象的、更加强大的计算机,尽管它的水银延迟线每根仅能容纳300个32位的字。说来也怪,它的效能很大程度上源于设备的经济性所造成的劣势,而装备的经济性对其设计有决定性的影响。”
图灵已经领略过了战时布莱切利园“立刻行动”的风格,他对拖延的国家物理实验室当局逐渐失去了耐心,而国家物理实验室对图灵大步向前的势头也感到沮丧。1947年7月,查尔斯·达尔文爵士给上级写信说:“大型计算引擎……现在已经到了停滞的阶段。”他还解释说:“沃默斯利和图灵都一致认为,最好关闭它一段时间。”
“图灵想将这台机器的工作进一步向生物方面推进,”达尔文继续说道,“我能想到的最好的描述就是,至今这台机器计划完成的工作已经相当于大脑执行的低等活动,他想看看机器能将高等活动完成到什么程度。例如,能否使一台机器从经验中进行学习?”最后,达尔文提到了图灵要求的本意。他解释说:“图灵会对半薪之类的感到满意……他确实说过更愿意这样,因为如果他拿全薪,他会觉得‘虽然我早上想去打网球,但是我不应该去’。”
图灵向国家物理实验室请假,回到国王学院担任一年的研究员职位。1948年5月,他从国家物理实验室辞职,加盟麦克斯韦·纽曼在曼彻斯特大学的计算工作组。在那里,他对机械智能的兴趣得到自由发展。图灵在1948年向国家物理实验室提交的休假报告中写道:“有些知识分子不愿意承认人类在智力方面存在对手的可能性,其比例和其他阶层中持相同观点的人一样多:他们遭受的损失更多。”
与10年前提出可计算数的方法一样,图灵实现机器智能的方法也不受阻碍。他再次从哥德尔止步的地方出发。难道形式系统的不完备性限制了复制人脑智力和创造力的能力吗?1947年,图灵总结出这一令人费解的论点的本质和弱点,他说:“那么换句话说,即便是一台绝对可靠的机器,它也不可能具备智能。”我们不必建造绝对可靠的机器,而是要开发能够从错误中学习的、不可靠的机器。
“哥德尔等定理的论点本质上是基于机器不能犯错的条件,”他解释说,“但是,这不是对智能的要求。”图灵提出了一些具体的建议。他提议添加随机数生成器,以创造他所说的“学习机”,赋予计算机猜测的能力,然后对后续的结果进行强化或舍弃。如果猜测应用于计算机自身指令的修改中,机器就可以学会自我教育。“我们需要的是一台可以从经验中学习的机器,”他写道,“让机器改变自身指令的可能性为实现这一目标提供了相应的机制。”他指出,纸带对通用机的作用和螺丝刀对实际零件的作用一样。1949年,图灵开发“曼彻斯特马克一号”(Manchester Mark I,它是第一台商业化量产存储程序电子数字计算机“费伦蒂马克一号”[Ferranti Mark I]的原型)时,就设计了一个随机数生成器,这个生成器并不是通过数值处理生成伪随机数,而是包含了真正的随机电子噪声源。这避免了冯·诺依曼“出错的状态”。
图灵还探讨了“无组织机器……很大程度上结构混乱,由N(数值相当大)个类似元件组成”的可能性。他考虑了一种简单的模式,对象是拥有两种状态的元件,每个元件与两个输入端和一个输出端相连接,他得出的结论是:“当元件的数量较大时,具有这种特征的机器能以非常复杂的方式运转。”他展示了如何能让这种无组织机器(“关于神经系统的最简单模式”)进行自我修正,并在适当的教育下,使它变得比人为设计的任何事物都更加复杂。人类的大脑必须像无组织机器那样开始发育,因为只有那样做,才能复制非常复杂的事物。
图灵将智能与遗传或进化搜索(借以寻找基因组合)进行比较,标准就是生存值。这种搜索的显著成功在一定程度上证明了:智力活动主要是由各种搜索构成的想法。进化计算将催生出真正的智能机。他提出:“为什么要尝试开发模仿成人头脑的程序,而不是模仿小孩头脑的程序呢?通过一点一滴的积累,我们就能让机器做出越来越多的‘选择’或‘决定’。最终,我们会发现可以对其进行编程,以促使其行为成为相对小众的一般原则的结果。当这些足够普遍,将不必再对其进行干扰,机器会自行‘成长’。”
图灵对未来给出了令人振奋的提示。“我问图灵,他认为一台机器在什么情况下称得上有意识,”1956年,杰克·古德回忆说,“他回答,如果他说话时前言不搭后语,机器会惩罚他,那么这台机器就是有意识的。”琳恩·纽曼曾回忆起麦克斯韦·纽曼和图灵的一次长谈,话题是关于“如何建造会修改自身程序并从自身错误中学习的机器”。她在1949年的报道中提到:“当我听图灵说到进一步的可能性:‘在那个阶段,如果我们不懂其运作机制,就会迷失方向。’我当时确实意识到,它的前景让我非常不安。”杰克·古德后来解释说:“超智能机器则是一台认为人类不会思考的机器。”
数字计算机能够解答大部分(但不是全部)用有限、明确的术语陈述的问题。然而,它们可能需要很长时间才能给出答案(在这种情况下,你可以建造更为高速的计算机),或者制定问题时需要花费更长时间(在这种情况下,你可以聘请更多的程序员)。计算机在解答问题方面的表现已经越来越好,但是仅限于程序员能够提出的问题。对于计算机能够有效解答但却难以定义的问题又会如何呢?
在现实世界中,多数时候找到答案比定义问题容易。画猫也比定义究竟什么是猫要容易。小孩胡乱涂鸦,最终会画出类似猫的图案。答案要找到对应的问题,却没有其他任何办法。当世界开始产生意义,无意义的涂鸦(和未使用的神经连接)就会被抛弃掉。1948年,图灵在给杰克·古德的信中说:“我同意你对‘类比思维’的看法,但是我认为大脑不是在‘寻求类比’,而是由于大脑自身的缺陷才出现了类比。”
随机搜索可以比非随机搜索更高效,古德和图灵在布莱切利园时就发现了这一点。无论是神经元、计算机、文字还是思想的随机网络,都包含了解答无须明确定义的问题的方案,它们等待着人们去发现。找到明确的答案比提出明确的问题要容易,这使得程序员的工作颠倒了过来。1958年,古德曾向IBM建议道:“一种支持建造具有初始随机性的机器的看法是:如果它足够庞大,就会包含需要的所有网络。”
人工智能的悖论是:任何系统如果足够简单、可以理解,就会因为不够复杂而无法达到智能;而如果复杂到足以达到智能,就不会太简单,从而无法理解。图灵提出,实现人工智能的途径是将孩子的好奇心赋予机器,并让智能进化。
实现图灵所设想的机器,即能够解答任何人提出的所有可以回答的问题的机器,该如何入手呢?可计算函数较为容易。从加法(或减法,它的二进制补码)开始,我们已经由此一步步建立了数据库。有了答案却没有明确的算法映射的问题或者具有非对称性映射的问题,比如由X射线衍射图谱确定分子结构的问题,又该怎么办呢?
一种方法是从问题入手,寻找答案;另一种方法是从答案入手,搜索问题。因为收集答案(已经编码)比提出问题(必须编码)更为容易(成本更低),所以第一步将是在矩阵中搜索并收集有意义的字符串。不幸的是,在1022位的矩阵中,有意义的字符串的数量太多,搜索都显得困难,更不用说收集了。其数量太过庞大,甚至多到写不下来。幸运的是,我们有办法解决。人类和机器都已经为此做了大量的工作:自从数字宇宙开辟以来,将有意义的编码字符串归档,而自从互联网出现以来,又为它们分配了独特的数字地址。
为了收集答案,你不必搜寻整个矩阵;只需要查验较少的有效地址,收集生成的字符串。结果得到的是一个索引列表(在你的机器的“思想状态”中,需要使用图灵的语言)列表中包含数字宇宙中相当一部分有意义的答案。不过,其中存在两个巨大的缺陷:你没有问题,只有答案;你根本不知道意义何在。
你要去哪里找问题,你又怎么找到意义所在呢?按照图灵的设想,如果你拥有小孩的思想,你就会询问别人、猜测,并从错误中学习。你让别人提出问题,记录所有的内容,从简单的模板匹配开始,从你的索引列表中找出可能的答案。人们更频繁地点击结果,结果提供更有意义的答案,借助简单的记账、意义以及问题与答案之间的映射,开始长时间的积累。那么,是我们在搜索搜索引擎,还是搜索引擎在搜索我们呢?
搜索引擎是“复制”引擎:复制它们发现的一切。当一个搜索结果被检索时,数据就会被本地复制在主机、各个服务器和沿途的缓存中。被广泛复制或与搜索请求频繁相关的数据建立起物理接近(physical proximity),这种物理接近表现为时间接近。更有意义的结果出现在列表中的频率更高,不仅是因为一些神秘的、自顶向下的加权算法,也因为当微秒有意义时,从下到上看它们时在时间上更接近。意义似乎先“被大脑理解”。
互联网搜索引擎是一个有限状态的确定性机器。例外的时候就是,人们(个人和群体)对于将哪个结果选为有意义及点击哪个结果做出非确定性选择。然后,这些点击立即融入确定性机器的状态中,随着该机器对每次点击的认识不断加深。这就是图灵定义的谕示机。
搜索引擎并不是一次学习一个人的智慧,而是同时学习集体的智慧。每次执行搜索,都会找到一个答案,这就为某个意义的碎片所在留下了微弱而持久的痕迹。随着碎片的不断积累,到了某一时刻,正如1948年图灵所说的,“机器已经‘长大’”。