预计阅读本页时间:-
第9章 编制一张神经网络:把共同发放的神经元连在一起
我想问题是……失去这么一大块脑子,这个人的智商或智力怎么没受太大影响呢?对他的家人来说,他的智力几乎没有损失,这怎么可能呢?他可是失去了……整个右脑皮质啊。
——唐纳德·赫布
我们可以开始把之前讲过的一切都串起来,聊聊你到底是怎么识别你女儿的了。让我们先回到20世纪60年代,了解一些基本知识。我将向你展示神经科学和计算生物学一条精彩分支的历史。半个多世纪以前,加拿大神经学家唐纳德·赫布为开创这条分支奠定了基础。
广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元
让我们想象一个简化的大脑,它仅包含两个神经元,它们通过突触相连。(暂时不必担心该大脑如何与外界对话,这只是一个假想的大脑。)忽然,这两个神经元被激活了。(这里的“激活”只是意味着它们发放神经冲动。)

让我们比较两种情况。第一种情况下,两个神经元都被激活,但是第一个神经元的激活时刻和第二个神经元的激活时刻没有关系。两个神经元各自响应输入而发放,彼此无关。在第二种情况下,每当一号神经元发放时,二号神经元也会被激活,反之亦然。神经元在两种情况下的活动水平相当,区别是一种情况下它们总是同时发放,另一种情况下它们的发放时刻毫无关联。
事实证明,两个神经元发放不同步时,不会发生什么特别的事情。但是,如果它们总是同时发放,就会发生一些有意思的变化:神经元之间的突触连接会得到加强,这样一来,一个神经元的活动就能够触发另一个神经元的活动。为了使规则易于记忆,有人将其表述为“若共同发放,则携手相连”。
我刚刚用了不到400个字向你描述了一个神经科学小知识。这种基于同时性的突触连接增强是一种最基本的记忆形式。所有的感知、情感和动作都以此建立。唐纳德·赫布是现代神经科学的创始人之一。他在1949年出版的《行为的组织》(Organization of Behavior)一书中描述了关于神经网络的想法,具有非凡的先见之明。两个神经元之间可调节的联系后来就称为赫布突触。稍后,我们将在现代神经网络中碰到它引申出的变种。赫布突触(或它的硅基版本)给大多数的现代人工智能提供了能量。
赫布原创的神经网络
在《行为的组织》中,赫布提出了一个涵盖神经科学许多方面的大理论。这一理论解释了动物在自然界得以生存的关键,也为如今的机器学习奠定了基础。但是他的原初热爱、他思想的基石,来自感知觉研究。
让我们从简单的感知开始。以一个简单的线条图为例,假设白色背景上有一个黑色轮廓的正方形。我们将其视为一个整体、一个连续的图形。但在足够精细的尺度上,正方形的轮廓实际上是由一排点组成的。准确地说,是我们的视网膜将黑线检测为一排点,因为黑线落在一系列单独的感光神经元(视杆和视锥细胞)上。它们紧密而规则地排列在视网膜上。无论线条有多平滑,视网膜都会将其检测为一排点,而不是一条线。
这当然不是我们所看到的。我们在白色背景上看到了一个黑色正方形,因为我们的大脑将点连接成了线。此外,我们感知到的也不是组成正方形的四条线,而是作为一个整体的正方形。唯有在受损的大脑中,我们的知觉才会瓦解:麻省理工学院的神经心理学家汉斯–卢卡斯·特伯(Hans-Lukas Teuber)报告过一名患者,从这名患者身边经过的摩托车在他的眼里不是一辆摩托车,而是一列静止的摩托车。在正常的大脑中,事物往往被视为整体,而不是各个部分的集合。但是本质上,视觉世界并没有告诉我们哪些东西属于一个物体。它只向我们显示像素阵列,而大脑必须弄清楚哪些元素归属一物。在上面的例子里,正常的大脑能搞清楚自己看到的是一辆正在行驶的摩托车,而不是一列摩托车。这个叫作认知闭合的原理令赫布离他对记忆的理解又近了一步。
20世纪初的心理学家知道每个对象在我们心中都有一个格式塔:归属同一对象的物体具有一致的形式,这种一致的形式可以掩盖具体细节的不同。其中最为人津津乐道的例子,是熟悉的图像并不会因为部分的缺失而失去整体性,虽然下图中三角形的一条边有缝隙,它也会立即被视为一个三角形。

赫布和他学生在实验中使用了被称为“稳定视网膜图像”的技术,首次描述了这一有趣的现象。正常情况下,人眼会不断进行很小的运动,像是眼球在震颤——不同于目光从一个地方移到另一个地方的眼动,它们的幅度是如此之小,我们甚至不会注意到它们。但是这些微小的动作会影响我们的视觉系统和视力。赫布和他的团队使用了一个巧妙的隐形眼镜来稳定视网膜图像,该隐形眼镜的表面粘着一根细小的茎,茎末端更细小的透镜将测试图像聚焦在视网膜上。这种隐形眼镜消除了眼球轻微移动造成的视网膜图像的位移。
视网膜的大部分神经元和大脑的视觉区域对不变的对象不是很感兴趣。当一个新物体出现时,它们会剧烈响应,但是如果图像完全没有变化,它们将逐渐停止响应。这很有用,因为这意味着大脑不会在没有新信息的事物上花费精力。但副作用是图像如果不移动,就容易从感知中淡出。眼球静止时的震颤(那种我们几乎无法感知的微小运动)通过使图像在视网膜上来回滑动抵消了这一过程,因此神经元不会疲劳,可以一直看到物体。但是实验用的隐形眼镜却抵消了这些微小的眼球运动,因此,只要眼球转动,视网膜图像也就会相应移动。
你可能可以猜到,使用该隐形眼镜会让图像从你眼前消失,因为没有震颤来稳定它。对于赫布来说,关键的结果不是图像消失了,而是它消失时发生了什么。图像的消失并不是无组织地分解成一堆散点。相反,它是成块消失的:正方形可能会一整个儿一起消失,它会先消失一条边,但保留其他三个边,然后再失去两条边,最后失去剩余的最后一条边。
赫布假设成块消失的形状对应于大脑当中一群神经元的同时激活。他称这些为“细胞集群”,这是他最基本的神经网络。稍后,我们将介绍细胞集群是如何形成的,那是赫布的天才想法,其中涉及了著名的赫布突触。
赫布关于细胞集群的假设实际上有两个目的。第一,它解释了为什么感知会成块出现。在他的理论中,正方形的大脑图像由四条边中的每条边的细胞集群的激活组成,它们通过突触连接在一起。但是,连接在一起形成正方形的细胞组件不必位于大脑内的物理正方形中。(实际上,细胞集群及其与其他细胞集群的高级连接广泛分布于整个大脑中。)赫布提出了一个假说,其中简单的元素(例如我们的正方形)由简单的细胞集群来表征,这些简单的细胞集群可以链接在一起以形成更复杂的对象,甚至形成思想和意识记忆。我们特定的正方形可能起源于4条线的感觉表征,但是通过链接到其他细胞集群,它成为对正方形的记忆的一部分。
在本书中,我们的讨论限于视觉范畴,但是值得注意的是,赫布的细胞集群不仅能把视觉对象相互关联,还能把它们与表征声音、气味和口味的细胞集群相关联。情感也是如此——构成每个人的历史的整个体验网络。细胞集群可以与遥远的记忆联系起来,当然,它们包含的不是几个,而是成千上万甚至上百万个相互连接的神经元,它们在大脑中的位置或近或远。这些包括概念和情感上的联系。如果你是普鲁斯特的书迷,你应该理解玛德琳蛋糕的味道是如何让他回忆起关于逝去事物的一整段记忆的。
当我们听到“神经网络”一词时,我们许多人首先想到的是一种类似于蜘蛛网的关联属性。从远处看时,大脑的连接网确实是这样的。但是在大脑中存在高度特异的联系,而这些联系会影响视觉的基本原理。
赫布的想法有第二层有趣的含义,与感知不完全相关。它能解释大脑被损伤后惊人的恢复力。1937年,蒙特利尔的外科医生维尔德·彭菲尔德(Wilder Penfield)做了一项开创性的手术,将癫痫病人的部分大脑切除,以平息从该区域扩散到大脑正常部分的异常放电。这是一种有效的手术,通常可以控制患者的癫痫发作。但是,如果手术切除的部分包含感觉或运动区域,那患者就会失去一些视力、听觉、触觉,或者行走或熟练运动身体的能力。因此,彭菲尔德在手术过程中仔细绘制了大脑的图谱,并且使患者在手术过程中保持清醒,以确保这些特定的感觉和运动区域不被破坏。
根据这个标准,大部分的大脑表面都可以切除,它们不是我们必需的感觉或运动系统。现在我们对这些区域的功能知之甚少。彭菲尔德雇用唐纳德·赫布来找出是否存在因这些“沉默”地区遭到破坏而造成的隐性缺陷。去除任何特定的患病部位是否会对智力产生影响?彭菲尔德知道,如果在这些未探索的区域中切除组织会造成损失,这些损失将是微妙的,因为他在手术后与患者交谈时,发现他们几乎没有沟通障碍。
不过,任何一个理智的人都不会认为大脑的大部分区域是没有用的。彭菲尔德希望赫布找出丢失的内容,即使它们很难通过日常对话来发现。随后的数十年研究终于表明,在大多数脑部病变之后,确实存在功能的细微丧失。但是,给赫布留下更深刻印象的是那些没有丢失的东西:脑部损伤似乎并没有引起特定记忆的丧失。
为了避免混淆,重要的是区分特定记忆的丢失和特定能力的丢失。从阅读或影响我们朋友和家人的悲剧中,我们大多数人都知道,大脑受损会导致非常特殊的残疾。语言理解能力可能会丧失(失语),肢体可能会麻木或瘫痪,面部肌肉可能会下垂。这种损失可能是非常具体的:一个人可能会失去说话的能力,但他可能会完全保留理解口语的能力。但是,这些与赫布研究的记忆丧失是不一样的,它们只是能力的损失。
赫布说过一句令人难忘的话:“我们不会失去关于红色秋千的记忆。”如果你祖母的屋前有个门廊,门廊上悬挂着红色的秋千,你可能会失去对门廊(或农舍或农场)的全部记忆。但是,你不可能只失去对那个红色秋千的记忆,否则你不可能记得门廊的清晰图像。
赫布观察到,一般来说患者可能会丢失很多旧记忆(或者可能会失去形成新记忆的能力),但是一旦发生这种情况,这些记忆的所有部分都将丢失。记忆可能会褪色(如果你从未遇到过这种情况,我向你表示祝贺),但是对于保留的每项记忆,我们都会保留其大部分元素,包括其特定部分。
这似乎暗示着记忆并不在你的大脑中。怎么可能呢?记忆不是短暂的、精神的、漂浮在你身体之外的东西。它们肯定确实必须得在某个地方,这个地方显然在大脑中。被我们称为大脑的那个计算机包含着这些记忆,但是特定的单个记忆似乎在大脑中没有单独的物理位置。
赫布的神经网络概念不仅解释了感知的统一性,同时也解释了为什么彭菲尔德在去除患者大脑的一部分后并没有发现更大的缺陷。让我来解释一下原因。
神经网络遍布于大脑之中。如果一张神经网络并不局限于一个紧凑的位置,而是广泛分布,那么就可以解释为什么个别记忆没有各自固定的位置。如果一个细胞集群由大量相互连接的神经元组成,丢失一些神经元不会对我们造成太大伤害。集群中的大多数细胞将保留,仍相互连接,并将继续表征一种感觉、记忆或思想。这就是为什么记忆不局限在脑中一个特定的地方,而分布在整个大脑中。现在来回答彭菲尔德的问题,神经网络的损坏确实会导致功能下降,但变化是如此之小以至于无法测量——尤其是在彭菲尔德所处的时代。神经网络让大脑变成了工程师所谓的“容错”系统。
可调教的突触创造了细胞集群
细胞集群把感知到的部分组合成整体,神经网络在大脑表面的广泛分布解释了记忆为什么没有固定的位置。到这里,赫布的细胞集群只是一个可爱的理论。它之所以能成为不朽的经典,是因为赫布还告诉了我们细胞集群是如何组装的,即赫布突触原理。
假设我们有一张在大脑表面广泛分布的细胞集群,它的工作是表征和存储某个物体的感觉。细胞集群是微型神经网络。这张特定的神经网络如何与大脑对外界中特定对象的感知相对应?换句话说,大脑中代表正方形的4条边(实际上在世界上作为一个单位出现的正方形)的细胞集群与看正方形的体验之间有什么关系呢?
因为世界是有序的,所以大脑以有序的方式获取输入。世界以拓扑的方式投射在视觉皮质上——在大脑表面有视觉世界的地图,或者更准确地说,在视觉皮质表面上有视网膜的投射图。因此,一根边的线条激活的神经元也大致排列在视觉皮质上的一条线上。视觉皮质是信息传递到对象识别中枢的主要门户。结果,当观察到一条线时,相邻的皮质神经元会一起发放。你可以猜出下面发生了什么:因为这组同时发放的神经元通过突触相连,所以这些突触通过同时发放而得到增强,它们被“连线”在一起。它们形成一个表征一条线的细胞集群。这样以后,每当其中一个或几个连接的神经元发放时,也会触发其余的神经元。刚开始时,细胞集群内的所有突触都具有相同的连接强度。在被线条反复刺激后,它们中的一部分(与线条相对应的那部分)神经元之间的连接便得到了加强。
一旦发生这种情况,皮质就会偏向于看到线条。如果看到一条线的一部分,那么现在连接的神经元往往会一起发放,并向大脑的其余部分报告刺激是一条线。大脑皮质的报告很可能是真实的,因为视觉世界中线条出现的频率很高。真正的非冗余视觉场景——各种视觉元素出现概率完全均一的世界,看起来就像乱糟糟的电视雪花。视觉世界的规律性使大脑对输入的解释偏向于这些规律。
在下一层复杂性上,以联合方式出现的4条线(一个正方形)也会引起神经元发放的关联,在这种情况下,神经元的发放表征了一个正方形。从这里开始,我简单的二维插图开始崩溃,因为我们必须超越任何特定的正方形,才能到达一个代表“方格”的格式塔(代表个体细节变化的身份)的细胞集群,而无法以一种简单的方式表征。稍后我们将解决此问题,因此,让我们此刻暂且这么说:可以将用于简单几何形式的单元组件连接到更大的神经网络中,该网络从特定实例中抽象出“方形性”。赫布认为,这种相当无意识的知觉学习是所有感知的基础。

赫布对线条的强调对于神经科学的知识史来说是不幸的,因为20世纪60年代的实验证据(后来的事实又证明那不是很好的证据)表明大脑从出生起就有线条检测神经元。这似乎使他的整个理论付之东流。但是,赫布的基本原理——赫布突触及其如何建立大脑的联系——并没有消亡。它沉睡了大约10年,然后又引人注目地回潮,人们对神经网络的兴趣恢复了。
蒙特利尔的唐纳德·赫布
唐纳德·奥尔丁·赫布(Donald Olding Hebb)——他被同事和学生称为“D.O.”,是个中等个子、身材瘦弱的男人。一次严重的骨结核发作造成了他的长短腿。尽管他直立时站得稳稳当当,但由于双腿不对称,所以人的轮廓弯曲得像括号一样。1965年,他60岁时,一头沙色头发变成了灰色,那张苏格兰–爱尔兰人的方脸上长着苏格兰–爱尔兰人的白皙皮肤。[1]
赫布出生和长大的地方叫切斯特——加拿大新斯科舍省南海岸岩石港口上的一个稀疏乡村,村里尽是简易的框架房屋。头一个赫布(当时的拼写是Heb)于1753年从德国移民到森林茂密的新斯科舍省。他的许多后裔遍布全省,在切斯特不远处还有一个叫赫布庄的小镇。这些德国人随后与当地人口更多的苏格兰人结合,D.O.本人就自豪地将自己视为苏格兰人的后裔。
唐纳德·赫布出生于1904年。他的父亲是一名城镇医生。赫布的母亲婚前姓名是玛丽·奥尔丁(Mary Olding),她也是一名医生,于1892年入读达尔豪西大学。她是北美最早的医学专业女性之一,赫布精神上的独立性很有可能继承自她。他的姐姐凯瑟琳(Catherine)成了著名的神经化学家,并在英国剑桥大学度过了她的大部分职业生涯。
D.O.一家人住在切斯特市主街上一栋长方形的普通房子里,离港口只有几步之遥。在以后的时光里,有许多姓赫布的家庭会回到切斯特度假。赫布一家在附近还保有一处房产。D.O.的兴趣之一是帆船航行。切斯特的一位居民回忆说,她的兄弟曾为赫布家维修帆船,他常回家抱怨赫布家“要求太高了”。
赫布确实要求很高,但他更关心的是原创性。他很强调要回避那些缺乏想象力的人。他一直在追寻真正新颖的想法,而他所在的系所也取得了非凡的发现:大脑中的“愉悦中心”、损伤后会选择性丧失近期记忆的大脑区域、告诉老鼠它在空间中的位置的大脑神经元、癫痫发作的“种类”。这些发现中的每一个都出人意料,而不仅仅是过去成果的改进。我在麦吉尔的同学约翰·奥基夫(John O’Keefe)赢得了诺贝尔奖,因为他敢于在大鼠跑迷宫时记录它们的神经活动,并注意到“位置细胞”的神奇行为,它们的活动能确定动物在空间中的位置。
赫布的第二个信条是要重视科学的传达。他喜欢写作,他最初的梦想是成为一名小说家。至少在我结识他的时候,他已经不再写虚构作品了——他开玩笑地评论说,他最伟大的虚构作品就是《行为的组织》。不过,他平时有一项娱乐就是阅读廉价科幻小说,他能囫囵着一口气读上几册。每隔几周,一整箱赫布读完的科幻杂志就会出现在他家门外,以供废纸回收。
“听着,”他说,“知识的传达是科学的一部分。知识藏在你自己脑袋里对你和他人都没有用,你必须让它能被他人获得才成。无论你的研究做得有多好,你的想法有多聪明,只要没有人阅读它们,那都是浪费。你得会说给别人听。”我想过,赫布在写《行为的组织》初稿的同时,或许一直会想:“如果我不能很好地推销这些想法的话,它们就会消失得无影无踪。”不过他的确很能推销:这本书在出版时就立即获得了成功,它的魅力之一就是赫布那清晰的分析、流畅的文笔以及藏在文字背后的那一丝欢乐。
赫布拘谨自律的外表之下是一个温和的人。他当时的秘书是个身材高大、红发、据说之前做爵士俱乐部酒保的年轻女人。我无法证实她的经历,赫布一定很高兴能聘请一位与严肃正式场合完全不沾边的人。(她自然对蒙特利尔市中心出色的爵士乐和布鲁斯音乐很熟悉。)
赫布非常有创造力。甚至他关于创造力的观点都很有创意。他的想法与众不同,他坚信学习不必要的东西对你不利,并用一则老笑话来支持自己的看法:一位鱼类学教授曾说,每次他记住了一名学生的名字,他就会忘记一种鱼的名称。这种信念可能是有原理支撑的:赫布认为记忆是靠修改突触形成的,而突触总量是有限的,因此如果你以有涯随无涯,迟早会把突触用光。
这个想法的推论是,不应强迫研究生上课。(我选择麦吉尔大学读研究生的第一重要的原因是有机会与赫布一起做研究,第二重要的原因则是他们没有必修课。)他所在的系对博士唯一的硬性要求是修一门统计学方面的简单课程,而这一要求来自更高级别的学位认证部门,除此之外,系里就没有任何要求了。
感知学习
20世纪60年代的赫布真正关心的是感知学习。“感知学习”有很多种,其中之一就是我们平时说的熟能生巧。例如识别皮肤上的针刺,测试者会用两根距离很近的针轻轻触碰你的皮肤,让你辨别是两根针还是一根针。一片皮肤的感知“阈值”就是你能辨别的两根针之间的最小距离,它会随着练习缩小。如果每周一连7天让人给你进行这项测试,那你会发现在一周结束时,你可以比开始时分辨出更小的距离。
日常生活的感知学习中,我最喜欢的例子是听音乐。我一生听过很多音乐;现在的我听得比年轻时的我更清楚。这不仅适用于巴赫的独奏曲,而且也适用于重金属咆哮的歌词。我一点儿都不在乎流行乐的歌词,我也不了解巴赫音乐里的结构。能更好地听这些东西不是因为对音乐的理解,它只是表明我们的感官体验本身可以被“培养”。
当然了,你可以有一个简单的解释:经过练习,你只是给了你的皮肤或巴赫音乐更多的注意力。但是还有一个更加微妙而深刻的解读,这个对于感知学习的解读才是让赫布更感兴趣的:感觉系统的神经元会根据刺激调整自身。事实上,赫布认为——那时还是1949年,信息论提出之前——神经元会根据自然刺激的规律而重新组织。他认为这不是锦上添花的附加功能,而是感知的基础。
我们阐释赫布对于线条感知的理论时,已经遇到过自然视觉场景中的规律性了。世界包含许多重复发生的视觉事件。看看窗外:晴朗的日子里,蓝天上的每个像素几乎一样。从技术上讲,这就是“冗余”的意思。它从一个点到另一个点是几乎不变的,因此视觉信号是几乎相同的。其他更复杂的事物也是如此。红色汽车身上的一小片红色区域很可能被其他红色包围(在这个例子里,是同一铁板上的相邻位置)。这也是冗余。
再举个更复杂的例子,想一下森林、电线杆或建筑物。这三样东西的共同重要特征是它们包含直线。直线包含冗余元素:如果在直线上选择一个点,则相邻点很有可能沿着同一条线。另一方面,如果你选择了偏离直线的点,则信号将有所不同。因此,与湛蓝的天空相比,一条线仅是部分多余的(点的位置限制在一个维度上,而不是两个维度上),但是原理是相同的。实际上,在我们的世界中,很少有视觉输入不是多余的。我想再说一遍,一个真正非冗余的视觉场景看起来就像电视雪花一样。
就视觉对神经系统所需而言,这是非常重要的。这意味着你的感知实际上并不需要评估场景中的每个像素。它可以利用视觉场景中的规律来预测相邻像素所包含的内容,并且只要大脑提前知道这些规律性(因为它已经创建了代表它们的细胞集群),就可以节省工作量。这是生物感觉系统设计中的一个巨大的通用原理。我们在边缘检测那章看到了这一点,而在面对复杂物体(例如脸部)时,我们会再次看到这个原理。
赫布的假说是,视觉世界的规律性会被反映在细胞集群中。如我们所见,正因为面对的是规律的视觉世界,一起发放的神经元才能组成细胞集群。它们是一起被激活的神经元集合,因此相连的神经元能一起发放。如果有连续一排四个激活的像素,则对它们做出响应的神经元将被连接起来。事实上,如果前三个像素排成一行,那大脑将预测第四个像素也会在同一行。预测当然可能出错:线条可能会转弯,因此第四个像素可能实际上偏向侧面。但是出现在同一行的可能性更高。因为视觉世界有规律,所以大脑的猜测经常是正确的,感知的效率也因此提高。
换句话说,所有感知都受到之前的影响。我想说的不仅仅是你会在特定情况下预期看到特定的人或事物(如在感恩节聚会上,你预期会看到你的表弟),而且在无意识的基础感官水平上“创造”出感知。即便是最简单的感觉要素也是被大脑创造出来的,这种创造出的感觉和你的眼睛、耳朵、皮肤或鼻子实际感受到的不相上下。
碰巧的是,我在麦吉尔进行的一项实验描述了这种“创造”的原始形式。我正在研究所谓的运动后效应。如果你长时间固定地观察某种运动模式,当运动停止时,你就会觉得图案看上去正朝相反的方向漂移。(运动后效应的另一个名称是“瀑布错觉”:注视瀑布一段时间后,你看到的任何东西似乎都在向上流动。)
人们早就知道这种知觉错觉的存在。不过,与看到强光后产生的短暂后效应不同,运动后效应可以持续数天。这意味着它并不只是某种疲劳,而是对感知造成的更持久的偏差。我还发现它与原始刺激有着独特的联系。面对日常生活中的其他东西时,感知仍然一如既往,只有当你看到原来的运动模式(现在是静止的)时,你才看到相反方向的蠕动。
不仅如此,我发现你只有在原始刺激的视野区域里才能看到这个错觉。由于大脑的视觉中枢像地图一样组织,所以视觉的长期变化不会随便发生在其他区域,只发生在感觉系统这个相当简单的视觉区域里。在这个实验里,没有线索提示被试他们的感知已经改变——他们的视力是完全正常的,除非他们重新看到测试刺激,并意识到它们的奇怪运动。对于那个特定的对象,正如赫布所预言的那样,它们的感知已经高度特定而且或多或少永久地发生了改变。
我发现的现象有些古怪。这种移动并不寻常,虽然它看起来好像在移动,但是你知道它并没有移动,因为你可以用周围的静止物体作参照。这使它成了一个有趣的客厅小游戏。但是,后来,洛克菲勒大学的查尔斯·吉尔伯特和他的同事也证明了类似的结果,他们又设计了一些感知任务来衡量一个人的日常辨别能力,例如辨别直线在空间中的位置等。结果表明,日常经验也可以被感觉经历改变。
核心假设的证据
虽然赫布的研究是从感知出发的,但他对知觉和认知的理论并不如他关于突触可塑性的猜想(即赫布突触)有名。这可以理解。这些理论之所以没引起人们的关注,是因为它们比他关于单个突触细节的想法更难掌握,毕竟突触是一个看得见、摸得着且可以观察的(微观)物体。并且他的感知理论在当时还无法检验。直到21世纪初,可视化分布式神经元系统的目标才似乎不再是梦想。
赫布并不太关心赫布突触。它只是一个假设,是他建立感知和记忆理论的工具。但在21世纪,突触是非常具体的东西。我们可以详细地了解它们的形状——用一台三维打印机就可以打出它的模型放在你办公桌上。我们知道突触传递的信息,我们知道传递突触的分子,我们知道大概有几十个分子,每个分子都执行特定的任务。
1949年,赫布没有任何这些知识。在那时,突触不久前才刚成为一种假设,人们只是因为它的解释性价值而希望其存在,但还缺乏直接证据。赫布对此也无能为力,所以不值得为此烦恼。但是他确实提出,突触强度的变化可以构成记忆的基础。大约在1970年左右,事实证明,在脑子里可以观察到突触强度的变化,这一变化足够简单,我们可以使用基本的实验室设备进行研究。这种突触强度的改变被称为长时程增强(LTP)。(科学家们在自己不确定时,会使用限定严格的术语——“长时程增强”仅准确描述了某种特定的实验中发生的事情,仅此而已。没有人敢称其为“突触学习”,或者发明类似的词来描述它。)
LTP实验发现,如果反复在突触前刺激会使突触增强,这种影响可以持续数小时甚至数天。这正是赫布的猜想:共同发放,携手相连。赫布的突触及其相关理论引发了关于单个突触可塑性的小型研究。最近有一天早晨,我在计算机上搜索“长时程增强”得到了13800篇论文的结果。2000年,埃里克·坎德尔(Eric Kandel)的突触可塑性研究获得了诺贝尔奖。
LTP的第一个实验室演示是由挪威生理学家特耶·洛莫(Terje Lomo)进行的。洛莫在1966年发表了一份简单但准确的描述。随后在20世纪70年代初,洛莫和蒂莫西·布利斯(Timothy Bliss)以及其他合作者发表了一系列认真详尽的论文。洛莫研究了一种容易被电刺激的轴突纤维,它们的突触后神经元是已知的。(那些神经元位于被称为海马体齿状回的地方,其形状一定使某些早期的解剖学家想起了牙齿。)如果高频地刺激突触前纤维(突触的“上游”),那么突触后细胞(下游)的反应可在很长一段时间(几小时甚至几天)内维持高水平的响应。这是非常有趣的,因为在那时能观察到的神经事件只发生在以毫秒计的时间尺度上。长时程增强发生的持续变化可以成为(至少我们希望它能成为)研究记忆的原理的开端。
神经网络的式微
我希望我传达了赫布在1949年弄清楚、我们10年后才开始凭经验证明的想法。1949年,没有人想到突触具有记忆力。突触的“细胞集群”或“神经网络”的想法与早期神经科学家的想法相去甚远,早期神经科学家专注于弄清楚简单的反射——由很少的神经元组成通路沿着单一方向上传递信息。尽管早期的解剖学家画笔下的图谱隐含了更复杂的网络,但人们从未探索过。当然更没有人像赫布提出细胞集群的假设那样,试图用一个单一的猜想来解释我们对物体的识别以及个体的持久记忆。
此外,赫布没有利用我们从计算机技术中获得的概念的优势。现在大多数受过良好教育的人至少对计算机中实现的神经网络非常熟悉。这些是大部分机器学习的基础,这让人们得以在大数据中找到显著的模式,例如在流行病发生之前进行预测,或者对恒星的演化进行建模。
赫布没有这些。1949年,脑科学家知道损害大脑的特定部分会破坏特定的能力,但是没有人敢于提出有关记忆或大脑—感知关系的任何详细理论。赫布跨越到未来,问了一些我们才刚刚开始讨论的问题。
事实证明,他可能跨越得太远了。10多年内,他的神经网络假说并未呈现在人们的聚光灯下,直到约1960年,它才被新兴的计算机理论领域采纳,提出了几种类似赫布的发明。其中一个特别有趣的例子是感知器,我们将在第10章中详细讨论。但是到那时,赫布于1949年出版的有关细胞集群的书已经是旧闻了,赫布并没有用计算机科学那套准数学的方法来表达自己的观点。
利用赫布的理论还存在许多实质性障碍。首先,很难想象理解细胞集群后的下一步,然后呢?感知到底是怎么做到的?细胞集群如何与其他细胞集群相链接起来以创建概念和动作?复杂的感知(例如面部表情)如何组合在一起?赫布认为从简单的感知到更大的观念是一个连续谱,中间没有断层或跨越,这正确吗?是否存在表征思想的细胞集群,而不仅仅表征物体?正如我已经说过的,坐在你的办公桌旁试图仅通过思考就可以理解大脑是艰苦的工作。(这比将任务分解成小块的实验室实验要困难得多。)而且,赫伯像大多数开拓者一样,会将自己的想法推进得尽可能远。他对细胞集群中的活动反馈有一个有趣的想法,但是它的影响不如赫布突触持久。赫布突触及该理论的扩展,是另一条路。
另一个大问题,同时也最终导致包括我在内的许多神经科学家转向更直接的生物学方法的问题是,我们没有任何可以处理分布式系统的实验工具。根据定义,分布式神经系统的发放遍布整个大脑。可是那个时候,即使一次只观察到一个大脑神经元也能让我们兴奋。我已经向你描述过这一过程有多艰辛了,你也知道我们每天只能对几个细胞做有价值的单细胞观测。从单细胞记录到观察神经网不是一条容易的路,从定义上说,神经网包括广泛分布在大脑表面的神经元。我决定与我的许多朋友一起离开认知神经科学领域,并以生物学家的身份再次接受培训,以致力于感知方面最基本的步骤。你已经听到了我们工作的结果;现在,我们对从眼睛到大脑的信息有了一个很好的理解。现在,让我们看看,神经网络是否可以帮助我们了解视觉处理的下一步发生了什么。
[1] 作者本人的回忆和访谈是在2016年8月新斯科舍省切斯特市进行的。赫布的传记可以参见Hebb,D.O.(1980).D.O.Hebb,In Lindzey,G.(Ed.) A history of psychology in autobiography.San Francisco:Freeman.Brown,R.E.,& Milner,P.M.(2003).The legacy of Donald O.Hebb:more than the Hebb synapse.Nature Reviews Neuroscience,4,1013–1039.