第14章 看得见、摸不着

在某处,一些令人兴奋的东西尚待发掘。

——布莱兹·帕斯卡

我不知道会发生什么,但是不管会发生什么,我都会大笑面对。

广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元

——赫尔曼·梅尔维尔,《白鲸》

在我们说过的所有关于感知的问题的背后,有一个大问题:是谁在看?它在大脑中的何处?无论对科学家还是普通人,把感知想象成“我们”试图去理解世界的过程似乎是一件很自然的事。我们站在大脑(或计算机)外面向里看,看到神经冲动或电子的流动,试图推断这些流动是如何反映外界发生的事的。这个任务是可以实现的:只是搞清楚大脑里的神经元如何表征物理世界而已。它们确实需要去表征世界,以躲避天敌,或者只是为了在人行道上行走。我们的大脑为视觉现实绘制了一张精确的地图,它让我们能捡起物件或者乘着滑雪板飞过树丛。但我们不能假设我们脑袋里有个小人,像看电影一样看着感觉输入。[1]

关于视觉,也许最难回答的就是所谓的结合问题。大脑的各种视觉输入是如何结合在一起以创建统一的感知的,如“一辆”“红色”“汽车”“向右行驶”?

大脑视觉系统的基本运行原理是把视觉输入分解为并行的信息流。让我们再看一下视网膜。视网膜的首要任务是检测光线并压缩其对狭窄亮度范围的响应。但是,视网膜的许多部分专门用于分割视觉图像,将其分解为代表运动、颜色、边缘等的单独信号。这些信号是真正分开的:检测运动方向的视网膜神经节细胞并不能告诉大脑运动物体的颜色,而编码颜色的细胞并不能说明边缘的存在或不存在。

这些不同的信号到达大脑的不同位置。数量最多的细胞直接投射到LGN上,然后投射到视觉皮质。剩下的细胞另起一支以提供其他功能。一些细胞检测绝对亮度,并向与睡眠觉醒周期有关的大脑中枢发送信号。其他细胞则提供用于稳定眼睛的特殊信号。但是,这些信号在任何地方都无法在解剖学意义上重新组合在一起。它们会进一步分为皮质的简单细胞和复杂细胞,MT中的复杂运动检测器等。它们如何再次“结合”成一个整体?

神经科学家安妮·特瑞斯曼(Anne Treisman)提出,要回答这个问题,得注意到早期视觉系统的不同区域似乎都有一张拓扑投射图。V1有这样一张地图,V2也有类似的,MT也有,甚至更高级的颞叶皮质也有。如果这些拓扑地图相互连接,使得那些表征颜色的细胞与V1、V2、V3和V4中的简单细胞和复杂细胞,以及颞叶的面部斑块以点对点的方式相互映射,该会怎样?这些脑区到脑区之间的连接已知是存在的。

阅读 ‧ 电子书库

上图右侧代表V1边界增强细胞的响应——就像HOG图像。中间的图也许是LGN或视网膜中只做边缘增强的细胞的输出。最左边的图则代表了将各种视觉特征(颜色、灰度等)结合在一起(就像视网膜中持久细胞的响应)。如果三幅图在大脑的不同位置以拓扑地图的方式表征,那么大脑也许能将之重叠,把视觉特征重新结合在一起。

沃尔夫·辛格(Wolf Singer)、克里斯托夫·冯·德·马尔斯堡(Christoph von der Malsburg)和德国的其他人所拥护的另一种答案是,物体不同特征的神经表征通过同步震荡而结合在一起。代表对象的神经元将响应边缘增强图像而发射光。它们还会在颜色分析图像中触发。如果它们同步发放,则将向大脑的其余部分表明这两个神经元属于同一对象。这种机制的合理性尚存争议。

阅读 ‧ 电子书库

另一个相关的老问题是:我们的意识是什么,在哪里?“自我”又是什么、在哪里?我们大多数人觉得我们的自我好像存在于脑袋中央、眼球后方的不远处。有没有可能是这个“自我”解决了大脑的结合问题呢?这个自我可以把视网膜发送来的、所有肢解过的视觉图像以某种方式粘贴在一起,形成一个单一的物体图像。但如果我脑袋里有个小人,占据我个人宇宙的中心,它又是怎么由一团柔软的大脑组织产生的呢?这不仅仅是我,我们所有人都有一个“我存在”的主观感受。但这个存在是什么、在哪里?我对现在给出的任何解释都不满意。

举个例子,图灵测试是一个验证机器意识的著名测试。你可以尽你所能造一台最厉害的计算机,训练它像人类一样思考。随后,你站在机器外面和它对话。如果你不能分辨和你对话的是一台机器还是一个活生生的人,那这台机器就通过了图灵测试,你可以认为它是有意识的了。我一直都觉得图灵测试是皇帝的新衣。图灵毫无疑问是一位出色的数学家,但是图灵测试和数学没有关系。为什么这个测试可以说明机器有意识呢?它还是一堆硅芯片而已啊。

赫布认为我们的个人身份——我们的自我,是我们所有细胞集群的结合,不仅仅是那些用来感知的简单集群,也包括那些构成思维、记忆、情绪和所有让我们之为人的东西的细胞集群,它们交联在一个大脑之中。这个概念至少非常具体。而且我也认同这个把个人体验整合在一起的想法。考虑到如今我们知道大脑中有许多特化,赫布的模型也许需要一点儿更新——他的细胞集群需要占据一些特化的脑区,那些遍布皮质的任务特化斑块。赫布的确拥有一个概念,关于整个大脑是如何作为一系列神经网络而工作的图景。

我们现在已经追踪视觉到了颞叶中心,那里有许多对特定物体(如面孔)反应的神经元。我们认为这些面部识别细胞是整合在细胞集群中的,因为一个细胞不太可能做到识别面部的任务。下一步呢?

自然是更多的细胞集群。赫布可不认为感知、认知和运动(指导肌肉动作的神经信号)之间有鲜明的界限。它们都由相互重叠的神经网络表征。下面是这个概念的示意图。赫布也许会掀开他的棺材板——让我们姑且将下面这幅图称作“新赫布主义”吧。

阅读 ‧ 电子书库

此图中的点表示神经元,它们之间的线是轴突连接。值得注意的是,各个功能区域是相互重叠的:用于感知的细胞集群与用于认知的细胞集群相互渗透。从左到右,我们首先看到皮质视觉的早期阶段。这些区域(V1–V4)对视觉图像进行了初步分析。我们对V1已经知道了不少,尽管有一些更复杂的细胞,但许多简单细胞对定向边缘敏感。我已经指出过,V1所做的事情有助于“分割”图像,即将整个视野拆解为离散的对象。V2中的细胞更进一步,不仅对定向边缘做出响应,而且对边缘具体位置的依赖性更小。V3和V4的细胞很难被精简地描述。它们具有不同的选择性,甚至连最熟练的实验者都无法对该区域进行统一描述。总结一下这些脑区,很明显,V1–V4中的细胞对于视觉输入的特定功能具有选择性,但这样的特征有很多:边缘、拐角、曲率、颜色以及几乎可以肯定还有图像中其他可以被单独提取出来的元素,或者说特征。

网络的连接代表了细胞集群,这些集群经由赫布规则在知觉学习过程中形成。它们可以很短,像是少数神经元组成的小多边形,也可以很大,可以跨越不同功能脑区的边界。我们可以有通过整个网络的任何路径。V1–V4细胞与颞叶的视觉区域相互连接。注意,在主要感觉区域的细胞集群和颞叶之间没有清晰的边界。例如,主要位于颞叶的细胞集群可能与初级视觉区域的一个或多个细胞集群重叠。实际上,这就是早期特征与高阶表示联系起来的方式。一组主要特征被激活后,这些习得的联系就会激活更广泛的感知——在本例中为狼的脸。

它们与代表抽象思想的细胞集群融合。神经网相互重叠,不同特征从而相互触发。“感知”网络的大多数神经元主要与同一网络中的神经元相连,但有些同样是“思想”神经网络的一部分。由于这种重叠,某些感知可以引发思想,并且实际上是其中的一部分(因此我们可以想象感觉事件)。换句话说,思想可以触发“知觉”神经网络的激活,从而使我们回想起感知。一些“思想”细胞集群与“动作”网重叠,因此前者可以激活后者,最后触发身体运动。

于是,表征简单视觉特征的细胞集群与表征更高阶特征的细胞集群相互融合。这种融合总是由赫布规则指导,将同时活跃的神经元连接在一起,而这种同时活跃又源于真实视觉世界的规律特征。概念的细胞集群又与动作的细胞集群连接在一起。这就是为什么我说在赫布的思想中,感知和运动没有严格的界限。

以上当然只是对于赫布思想的卡通简化版,让它更具体、更易于理解。就像我之前强调的,赫布思想还得整合最近发现的不同脑区的特定功能。不过注意,我们在第13章提到的多细胞成像工具让我们得以更深入地探索神经网络中的神经元。这些成像结果也进一步佐证了上述的赫布思想。赫布思想提供的图景也更接近实际解剖呈现的复杂前馈和反馈连接,这些连接既存在于脑区之内,也存在于脑区之间。

现在,让我们看看用现代神经网络的语言描述的同一图景。在一个或多或少随机连接的网络里,有一个输入层、几个隐藏层和一个输出层。这还是一个简化的卡通图,对实际情况的抽象。这种抽象只是为了突出算法的基础特征。

阅读 ‧ 电子书库

你也许能意识到这和第11章识别林肯总统的过程相似,只是我们已将其扩展到面部识别以外,包括感知、思想和行为。这些神经网是相通的。它不仅可以识别狼,而且还可以识别许多其他事物,这一切都取决于在学习阶段中哪些突触得到了加强。就像赫布想的那样,各层之间没有明确界限,因为从一端到另一端,整个突触链都可以被经验修改,反向传播或其他机制会把学习传遍整个网络。我们知道,大脑的神经网络可以充当其自身的训练器:它是无监督的学习者。也许它使用强化学习,或者正在讨论中的其他无监督方法之一。

阅读 ‧ 电子书库

这就是我想带你抵达的终点了,这里有一个模糊的概念——从视觉输入到动作的步骤是通过一系列可修改的神经连接进行的,这些神经连接包括细胞集群(神经网络的隐藏层)。除了实际应用之外(我们知道计算机中的人工神经网络可以做一些相当聪明的事情),它还能教给我们什么?这里最重要的是,这些模型没有中央决策者,没有什么脑袋里的小人来接收信号并发出指令。真实的大脑和人工神经网络一样,都只是一个连接网络。

但是,对于本章提出的问题,即对“自我”的探索——生活在我头脑中的“我”——在哪里,这意味着什么呢?现在假设上面两种看法都是正确的,那我们能从中找到意识吗?可悲的是,不能。实际上,它们说到底都只是行为主义模型——感觉导致知觉,知觉导致思想,思想导致行动。它们不必在物理上分离,可以存在于神经网络的各个部分,甚至是分布在网络各处。你几乎可以将其想象成一连串反射,就像巴甫洛夫的条件反射——狗看到食物会产生吃东西的想法,从而导致它流口水。但是,一连串的反射不一定是有意识的。这样的系统就像可口可乐工厂中的装瓶机器一样,是通过一系列动作来操作的:将瓶子装满,放在顶部,贴上标签。大多数人都不会认为这台机器是有意识的。

很明显,我们大脑中的很多计算也是无意识的。一个数学问题的解法是怎么蹦出来的?骑摩托车时,你是否会告诉自己:“转弯时车要向内倾斜”?也许你可以用语言表达这些规则,但是你在乡间急驰时不会想那么多。文献中著名的H.M.患者就是一个例子,他在癫痫切除手术后失去了形成显式记忆的能力。他可以一遍又一遍地阅读同一本杂志,却不知道自己以前曾经读过。实际上,他的有意识生活在手术那一天就结束了。但是,他仍然可以学习简单的运动技能[2]。尽管他完全无法说出学了什么,也不知道自己已经学了,但他的运动技能却可以随着学习提高。这再次证明了有意识学习与无意识学习之间的区别。

赫布没有深入探究意识。他认为它某种程度上存在于大脑的广泛活动中,依赖于许多神经元的共同发放。克里斯托夫·科赫(Christof Koch)对意识进行了很多思考,他认为“意识是生命的基本属性。”而且他也接受这个观点的推论,即“任何相互作用的系统都具有某种程度的感觉”[3]。这也引出了动物是否存在意识的问题。狗有意识吗?大概有。只有305个神经元的线虫有意识吗?有一点点吧。水母的神经网络、果蝇中的135000个神经元呢?赫布、科赫和其他许多人认识到,在哺乳动物脑中,也许只有分布式的大脑系统以协调的方式工作时,意识才会出现。当控制皮质的更原始中枢受损或皮质被关闭时(如在睡眠中),意识就会消失。因此,每个人都同意,意识取决于某些大的大脑结构。但是,哪些神经回路包含意识,这些神经元中的哪些活动能使意识发生呢?也许你可以假定,某个跨越整个大脑神经网络所有边界的神经网络序列掌管着意识。但是这种“解释”几乎什么也没有说。它只是把问题复述了一遍。意识的问题也许就像芝诺悖论一样,只是一个语言上的诡计。正如科赫暗示的那样,它甚至可能是物质的一个属性,例如质量。但是,我们对意识的直觉没有抓手,没有类比,没有审视问题的立足点。本质上它是主观的,只包含个人。我担心意识说到底是不可知的。哲学家G.E.摩尔曾问他的同行罗素:“我看到一个红色苹果时,看到的红色和你看到的一样吗?”据我所知,还没有人给出令人信服的答案。

[1] 在本章中,我提出的问题,即大脑是怎么重新结合起图像的肢解特征,是一类我们至少可以想象其答案的问题。这只是一个物理问题。一个图像的不同表征总以某种物理形式存在于大脑各处。你可以想象这些特征被联系在一起,或者神经元之间互相交流,告诉大脑:这些特征属于同一个物体。问题只是找出这些联系。而意识和自我则是另一种问题。我意识中的内容只有我自己知道。这是一个主观的东西,也许根本就不是一个“东西”。它会不会只是一个语言游戏?我不这么认为。因为每个人都相当确定自己是有意识的。我们不能否认它的存在。但是它究竟是什么却是一个谜。

[2] 没有新的显式记忆是否等同于没有意识,尚存争议。——译者注

[3] Koch,C.(1982).Consciousness:Confessions of a romantic reductionist. Cambridge,MA:MIT Press.