第13章 一些谜题与一些进展

如果你不知道自己走向何方,那你可能已经走错了方向。

——约吉·贝拉

面部识别细胞从原则上回答了对象识别问题——这个我们在第1章提出的经典问题。颞叶前部的一些细胞会对特定的脸反应,无论这张脸朝向哪个角度、光照条件如何以及它在视网膜的哪个位置。但是,我们在理解感知之路上走了多远?距离大多数人所理解的感知,我们又前进了多少呢?

广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元

其实并没有多远。对于颞叶里的这少数细胞,除了知道它们能识别对象,我们也没有更多可说的了。我只能说这是对感知世界非常轻率的解读。而另一个我们喜欢的模型——看看计算机吧,它们只能胜任非常有限的任务,而且它们笨重且低效。我们再看看这些机器,虽然它们的成功很耀眼,但还有一个具有挑战性的大问题尚未得到解决。

有监督和无监督学习

我们每天都能听到机器学习又完成了什么新的感知任务:自动驾驶汽车、面部识别,等等。人们也许会为智能机器不再受控于人类的潜在危险而担忧,担心它们使用智能超越人类而以某种方式占领世界。但是,大多数此类讨论都忽视了一头房间里的大象:虽然机器学习确实可以做一些非凡的事情,但是,正如AI人士痛苦地意识到的那样,它的智力仍然比4岁孩子的平均水平还要低。

原因是目前名声大噪的AI算法只能通过使用大量数据和超高速计算机来发挥作用。而一个4岁的孩子却可以通过几个例子自己学习。可以肯定的是,虽然我们会努力地向孩子们教授技能和概念,但是他们所知道的大多数东西——他们的基本感知机制,都是自学的。他们的小脑袋自己会完成学习。实际上,即使是多层感知器、反向传播以及所有方法,也比我的小孙子要愚蠢。他可不需要大量的例子,也不需要向老师来学习认识他的祖父。只需要一些拥抱,他很快就学会了喊“爷爷”。

AI研究人员区分了监督学习和非监督学习。你会记得我们简单的标准感知器有一位老师。苹果的语音识别软件、塞伊诺夫斯基的会说话的计算机以及吓倒隐私倡导者的面部识别软件都是如此。面部识别算法使用巨大的人脸目录来教软件识别。计算机之所以能够做到这一点,是因为它们是如此之快——实际上,最近的机器学习之所以能取得巨大成就,正是因为最近(也就是过去5年)有了大量的培训数据集和大型的专用计算机。大脑的神经元运行得如此之慢,它们本不能在这个领域和计算机竞争的。

然而大脑却做到了,甚至比计算机更为胜任。赫布早就认识到,细胞集群可以由无监督学习组成:边缘上连续的点总是自己就在一起,而大脑也完全仅凭自己创造出对边缘敏感的神经元。计算机科学家当前面临的紧迫任务是使机器在训练中更像大脑。[1]

我们很快会回到真正的大脑,但是首先,我们来看看另一种形式的机器学习。它将神经网络与一种新原理结合在一起。计算机科学家慷慨地将这个原理用神经科学的术语命名:强化学习。它最早由伟大的俄罗斯生理学家巴甫洛夫系统地研究,并由哈佛大学的斯金纳(B.F.Skinner)进行了详细阐述。他们称这些算法为“强化学习”。强化只是意味着某种行为会得到奖励,而行为如果得到奖励,则往往会反复发生。导致最终正确行为的步骤更有可能被重复,神经网络中的突触会得到增强。你可以认为这是另一种反向传播形式,强化学习就像感知器学习一样,只是计算机成了自己的老师。

电脑也可以得到奖励。在强化学习中,你告诉计算机去寻求目标。它做出一个猜测,最初是一个非常糟糕的猜测。但是,如果它的猜测使它更接近目标,则计算机将获得回报。我们当然不会给电脑吃糖丸,但只要告诉它“做得对,增强刚刚做这件事情的突触”,然后再次尝试,以新的权重开始,它就能不断重复,每次调整其权重,直到学会执行一个任务。

强化学习已经驾驭了一项不可思议的困难任务:下国际象棋,甚至下更难的围棋。现在这些电脑不仅能击败最强的人类棋手,它们还能自己教自己如何下棋。这个程序被命名为AlphaZero,在2018年的圣诞节前刚刚在《自然》杂志上发表。我们只给它游戏规则:棋盘的格子、落子的规则等。然后,它就和自己对弈。也许这听上去不太直观,不过它和另一个自己相互之间不知道对方是怎么想的,只知道对方怎么走。没有老师教它们,只有一些内在的规则告诉计算机这一步好或不好,以及最后是否赢了棋局。只需要4个小时,这台计算机就可以成为世界级棋手。

这是项令人惊奇的壮举。它不仅能用来解决棋牌问题,还可以应用于很多其他任务。谷歌人工智能团队的戴维·西尔弗(David Silver)曾经展示过一段AlphaZero遥控一架玩具直升机特技飞行的视频,直升机做滚桶特技的那一刻足以让任何人拍案叫绝。

不过,AlphaZero有我的孙子聪明吗?它远远比不上他,除非它和我孙子比赛下棋。交给计算机的任务只能被规定在很小的范围内,而且它们的体积远远超过我孙子的大脑,耗费的能源也要多得多。科学记者凯瑟琳·吴(Katherine Wu)在《史密森尼》杂志上报道说,AlphaZero的硬件需要100万瓦特供电,而我的孙子的大脑只耗能20瓦都不到。把深度学习网络和强化学习结合在一起只是为了验证一个原理,即运用逻辑的计算机可以做到接近人类大脑的表现,即使这个表现依然差得很远。

人类大脑可以运用AlphaZero的深度网络的原理吗?当然,虽然会慢得多。人类大脑是一台被数百万年自然演化塑造而成的计算机,它具有数目庞大的微小突触。与突触相比,一堆计算机芯片要笨重得多;如果计算机能做到,人类大脑当然也能做到。

做人工智能的人很清楚他们的计算机远远比不上我的孙子,而且他们还在不断改进。谁也不知道计算机未来能变得多聪明。我认为它们会超过人类,如今有许多种无监督学习正在被研究中,问题只在于计算机要花多久超越人类,以及它们最终的运行方式是否接近真正的大脑。而且重要的是,计算机的解决方案是否足够经济?我不太会为此感到紧张。事实上,正是计算机所需要的巨大能量让我不担心计算机会占领世界。

温弗里德·登克和连接组

在神经科学领域,如果只比较赤裸裸的创造力,很难有人能比得上马克斯·普朗克神经生物学研究所(马丁斯里德)所长温弗里德·登克(Winfried Denk)。不过,如果你想要效仿他成为一个有创造力的人,得先知道他可是一个在午夜至凌晨4点之间迸发灵感的人。

温弗里德是个身材高大、体格健壮的男人,有着蓬松的头发和小胡子。你看到他时他通常在笑,不过谷歌上只能搜到他一幅板着脸的照片,并且在那幅照片中,他穿着一件白衬衫,打了一条领带。这对他来说很罕见,因为他通常穿着牛仔裤和宽松的衬衫,也许这就是为什么他在照片中不笑吧。这种照片是他被授予科维理奖——神经科学领域的一项重大荣誉时拍摄的。显然,领奖需要端庄的正式肖像。

温弗里德因一系列重要发现而获得了科维理奖和其他奖项,其中大部分基于他在物理学和光学上的功底。首先是改进共聚焦显微镜。前面提到的共聚焦显微镜是一种光学仪器,具有比以前更高的分辨率。共聚焦显微镜将光学显微镜和计算机分析融为一体,没有传统意义上的图像,只有一系列扫描点,随后再将其数字化重新组装为图像。它很快取代了传统显微镜,现在已经成为显微成像界的行业标准。

这是他在康奈尔大学做博士后期间与他的导师瓦特·韦伯(Watt Webb)共同做出的成果。共聚焦显微镜至少在理论上已经存在了一段时间:温弗里德所做的是将它改造为生物学家所用。他的另一项创新——双光子显微镜——则是他和戴维·汤克(David Tank)在贝尔实验室短暂工作期间构思、制造并申获专利的。贝尔实验室是著名的创意工厂,曾一度接受贝尔电话公司的资助,如今这家公司已经在商海浮沉中不幸泯然而去了。双光子显微镜让你能看得更清楚、看到组织更深处,而且对组织的损伤更少。

随后,温弗里德搬回了德国,去领导位于海德堡的马普所医学研究中心。有了更多的资源之后,他可以雇佣一批自己的机械师、工程师和程序员。他施展手脚,继续攻克两项大课题。

第一个项目是与年轻教授托马斯·欧拉(Thomas Euler)一道,用双光子显微镜解决一个50年的难题:视网膜神经元的方向选择性。欧拉、温弗里德和他们的同事一边给视网膜呈现运动的物体,一边观察视网膜的星爆无长突细胞(参见第5章)。他们之所以使用双光子显微镜,是因为其激发光的波长几乎不会刺激到视杆和视锥,这样就能在照亮组织的同时,避免视网膜本身被激发光给晃到饱和。那些星爆细胞内部被置入了活动指示剂,这样研究者就能看到它们对光的反应。总而言之,他们发现,那些为方向选择性神经节细胞提供输入的星爆细胞本身,就是具有方向选择性的。我不会再深入介绍具体机制,重要的是,神经节细胞继承的正是星爆细胞的方向选择性。

在解决方向选择性问题的同时,温弗里德还在幕后开发了一项新技术,甚至不是光学技术。相反,他想方设法绕开了光学。这个新技术可能会对神经科学产生更大的影响。

在深入连接组学的领域之前,我们先来看看温弗里德的工作日常。我已经说过他在晚上上班,这能让他有大段时间不被干扰。他在凌晨2点的办公室里做什么?他不用做一个教授的杂务活——教课。马克斯·普朗克学会的教授不需要讲课。而且他也逃避审稿等其他杂事。在打理实验室方面,他是熟练的代名词。他不会在意一些浪费时间的东西,而会稳妥地委派给其余人。他读书并思考。我们大多数人只是一时兴起地读书,但他读得认真且深入。

他还有很多时间在飞机上,因为他被邀请做很多演讲。虽然他并不特别喜欢自己这份工作中演讲的那部分,但这些邀请主要是与熟人交流的机会。温弗里德是社交达人。他会被吸引到任何他感兴趣的领域的科学家身边,然后不懈地去探索他们的思想。我不止一次听到他在获得新资料后说“嘿,我最好尽快拜访他”,即使资料的作者对他来说完全是一个陌生人,在美国西海岸甚至远在中国。

我引起了他对方向选择性问题的兴趣,随后几年里他每几个月就会来找我一次。在他解决该问题的大作在《自然》杂志上发表之后,他又来拜访了我,评价说:“你给了我上一个问题,下一个是什么?”但我并没有一个新问题,至少没有一个比得上方向选择性那么重要的问题。之后,他的拜访渐渐少了。请注意,我这不是在批评温弗里德,他的拜访对双方都很有益,这是最好的科学交流。我还是会随时去和温弗里德交际的。

如果他接受所有邀请,他一年要进行数百次演讲。温弗里德的讲座非比寻常,因为它们几乎(或者至少看起来)毫无准备。他徘徊在台上,看着地板,似乎在喃喃自语。他的演讲似乎没有经过排练,它随意散漫,有时甚至有些混乱。他会忘记下一张幻灯片。他本人并没有口齿不清,他的书面作品也十分清晰。但是他的演讲与当今时代青睐的精巧演讲相去甚远,在当今时代,人们花几天时间练习线条和打磨图表。温弗里德总是有很重要的话要说,但是他不会牵着你的鼻子引导你。我欣赏他,他对当今企业界浪费时间的这些部分不屑一顾。

现在让我们回到连接组(connectome)。“组”(-ome)这个后缀赋予了它“所有连接”的含义,而连接组学是一次令人激动的尝试。它旨在探明大脑神经元之间的所有连接。仅靠莽撞的勇气不足以攻克这样的挑战。这可能不是我或温弗里德的职业生涯内所能完成的。但温弗里德演示了完成它的路径,科学的进步将会沿着它攻破这一挑战。

你要怎么鉴定两个神经元之间的连接呢?你需要鉴定它们之间的突触。这并不容易,因为它们很小,只有0.5~1微米。这个尺寸必须得用电子显微镜观察。你已经知道了,传统的电子显微镜需要把神经组织切成超薄切片,大约50纳米(1纳米等于100万分之1毫米)薄。这意味着对于一个突触,你要切成百上千张切片。这比两个细胞之间的距离要小得多。如果用传统方法,没有人能在这个距离切这么多切片还不切错。即使你做得到,你怎么对齐这些切片呢?

温弗里德发明了解决这两个问题的方法,被称为块面扫描。它实际上是电子显微镜的一种形式,但加了一些改进技巧。首先,切过的部分不保存,直接扔掉。那剩下的是什么?一个组织块,其中一面就是你刚刚从中切出一部分的表面。这种处理的创新之处在于,它要看的不是切片而是这个切面,用的是扫描电子显微镜而非透射显微镜。因为组织块留在原地不用动,所以整个切割过程可以自动化。图像对齐的问题也解决了,因为每次切割切片时,组织块的切割面都在几乎相同的位置。

因此,在电子显微镜的分辨率下,温弗里德最终得到了一长串图像,这些图像代表了穿过组织样本的连续切片。在那之后,有许多技术障碍需要解决,但可以说这些图像可以对齐并且可以在整个序列中跟随神经分叉的走向,甚至可以跨越中等距离(我们希望未来能有更长的距离)。在每个切面中,可能有成百上千的神经元,因此,追踪非常烦琐(即使对于计算机也是如此)。但原则上,最终结果会包含神经元之间的所有连接。

为什么这对神经科学家那么重要?因为这就是他们需要的信息。大脑是一台连接而成的机器,如果你知道所有的连接,那么就离理解大脑如何运转不远了。温弗里德在视网膜里测试了这个方法,并且成功找到了提供方向选择性的突触连接。在其他神经环路中,从没有得到过如此坚实的答案。

该技术屡经改进,许多实验室将其用于不同的问题。不过最大的进步不是技术上的,而是信念上的:它让人们得以设想探明大脑内的所有联系。技术上仍然有一些工作需要解决,而且长距离的连接还需要一段时间才能弄明白。即使是相邻的大脑区域(如V1到V2)之间的连接,也没那么容易追踪。即使绘制好了长距离连接,研究者仍然要面对其他重要问题:这些突触使用哪种神经递质?它们携带了什么信息?但这都会被解决。这是可以肯定的:从长远来看,连接组最终将成为理解复杂神经回路的基础。这个男人接下来会做什么?在清晨的黑暗中,温弗里德·登克将会有什么新的、迄今未曾想到的创新?我们不知道,但是记录显示那将是一件很棒的事。

神经网络,尽在眼前

机器学习的顶级专家大多来自计算机科学领域,这些人算是3/4的计算机专家加上1/4的神经科学专家。不过,有些研究智能的人还是愿意去生物学实验室做研究的。这些人想确切地知道大脑是如何工作的,他们想摸到那些只有从真正的大脑里才能得到的证据。

像我这样的职业实验家遇到的第一个问题是:“我们到底该如何研究由数以万计的神经元散布在整个大脑中构成的神经网络?一次记录数千个神经元?即使可以,你将如何消化数据?”十年前,这似乎是不可能的,但情况正在好转。

我们需要一如既往地在不同领域取得进展。我在这里举4个重要的例子。第一项进步是双光子共聚焦显微镜,它可以比传统显微镜更清晰地看到影像。它不仅可以让人看到物体的表面,还可以让你看到物体下方的结构。就大脑而言,它可以直接看到大脑皮质的各层。如你所知,双光子显微镜是温弗里德·登克提出的,他是所有科学领域的真正创造者之一,并且(我希望)是未来的诺贝尔奖获得者。有人曾写道,传统显微镜和双光子显微镜的区别就像是在黑暗中和明亮的灯光下观看彩色电视的区别。传统共聚焦显微镜还会在观察时损害细胞,双光子显微镜则不存在这个问题。

第二项进步是基因工程。这使我们能够将一种蛋白质塞进大脑的神经元中,这种蛋白质在神经元活跃时会闪烁(更准确地说,会改变荧光)。如果用这种蛋白质改造神经组织,再用共聚焦显微镜观察,就可以实时看到单个神经元的活动。

第三项进步则借鉴自昆虫生物学的世界。假设你想跟踪甲虫的运动,例如,你想看它什么时候左转,哪种情况下右转。你可以拍一部关于甲虫的跑动的电影,然后雇用一名研究生观看视频并标记甲虫的运动。而昆虫学家想出了一种自动方法。他们将甲虫的外壳粘在固定的平台上,这样甲虫的腿就悬在空中了。然后,他们将甲虫放在一个轻巧的球体上面,例如乒乓球,甲虫就可以用它的腿牢牢抓住它。乒乓球悬挂在几乎无摩擦的载体中,因此,球会随着甲虫的运动旋转,其旋转速度和方向可以使用计算机来测量,这样你的研究生就可以腾出手来继续做一些更有趣的事情了。

第四项进步是我们现代人认为理所应当的进步:便宜的计算能力。当双光子显微镜显示出数千个细胞时,每个细胞都闪烁着由活动驱动的微光,那么你手上就有大数据了。如果没有现代的计算能力,我们的实验人员就无法理解这么大的数据。

最后需要的是一位聪明、执着、勇敢的神经生物学家。我说的是普林斯顿大学的戴维·汤克,他是双光子显微镜的共同发明者,他把所有这些碎片放在一起,然后加上了自己的一些绝妙的创新。

汤克想:“让我们放飞思想吧。”“让我们尝试在有意识且不受干扰的动物中一次看到数千个神经元,然后在动物看着事物并思考有关它们的思想时看到它们。”汤克(和其他人)想出了将小鼠约束在固定架子里的方法。小鼠并不在乎这些约束,因为上面有吃的。小鼠站立在一个自由移动的球上,就像前文中的甲虫一样。汤克将共聚焦显微镜穿过小鼠大脑上方的头骨窗口。这是一种通过基因工程方法将指示蛋白质引入皮质神经元的小鼠。因此,当汤克和他的同事监视大脑神经元的活动时,小鼠可以执行其自然行为(奔跑)。而且,哦,是的,小鼠看着使用虚拟现实技术创建的合成世界。然后,汤克和他的同事可以一边教小鼠各种任务——例如在虚拟迷宫中奔跑,一边观察其神经元的活动。

这项技术相当新颖,但是也相当好用。根本的发现是神经元的行为每天都以一致的方式发生,例如,在大多数情况下,每次显示特定刺激时,同一组初级感觉神经元就会亮起。并不一定要这样——它们可以按照自己的逻辑闪烁,以我们无法理解的模式。确实,负责感觉运动整合的皮质区域的神经反应表现为更不稳定的方式,有时会漂移,有时会稳定,但尚未被完全破译。这并不出乎意料,因为这些区域代表了感觉输入与行为活动之间的联系,这些联系因情况而异。但这是实质性的概念性挑战,而不是技术性障碍。

汤克的学生正在将这项技术传播到整个神经科学领域。小鼠在虚拟迷宫中奔跑,它们的神经元将信号闪烁到实验者的计算机中。你我的大脑则在思考和挖掘新的实验。我们可以看到细胞集群的组装过程吗?记忆是留在大脑的同一位置还是会迁移?当小鼠睡眠时,当它想要某物时,当它看到室友时,它的神经元会做什么?工具在那里,剩下的就是进行实验。请继续关注:在我写下这些文字时,新的进展正在不断涌现。

[1] 计算机科学家直截了当地指出,儿童相比于计算机是更好的学习者。有些计算机科学家只专注于特定任务,例如贷款者的信用风险大小。而另一些有梦想的科学家有着更大的愿景。他们想要造出通用智能机器,一台至少能和我孙子相提并论的计算机。这也许是“奇点”,即算法统治世界的开始。我并不否认这种情形的可能性,我也很高兴有些思想家正在为此防备。但我自己一点儿也不担心……因为我觉得算法的限制不在于软件而在于硬件。就像我在上文说的,即使是AlphaZero这么强的程序也只能在某一方面强大,而它是一台耗能怪兽。想想如果一台计算机什么都能做的话,那得要多少能源。它可能会有一座酒店那么大,整个北美洲的电力都不够它用吧。不容置疑的是,机器学习很快就能做一些非常复杂的任务。我是一个乐观主义者,不过同时,我也对AI领域现在的热火朝天保持谨慎。