第12章 为什么演化偏爱神经网络

能生存下来的并不是最强壮的物种,也不是最智能的物种,而是最适应变化的物种。

——查尔斯·达尔文

假设我们相信,假以时日,大自然能造出它想造的任何东西,那它为什么会造出神经网络呢?简单来说,这是因为对演化来说,造出一个可修改的突触要比重新搞一套基因组有效率得多,否则就得为每种动物都设计一套视觉系统的基因蓝图。大脑所做的机器学习被认为是一种普适的机制。它能适应不同视觉环境的特征(例如在森林里的近物和平原上的远处),而且同样这个机制还能让你从操场上认出你的孩子。

广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元

它的优势首先在于,在生命早期,这样构建大脑更有效。想象一个替代方案——由固定连接组成的识别机器,看起来就像18世纪闪闪发亮的瑞士黄铜天文钟。在这样一个大脑中,每个要识别的人都必须对应于齿轮和轮子的特定组合。显然,这样的机器不可能涵盖要识别的所有个体。要识别的对象都必须在被机器看到之前就被预先编程到机器中。如果这台机器是人的话,这意味着把每个可能被记住的个体都编入这个人的建造图纸(即让受精卵变成人的遗传密码)当中。这太荒谬了:大自然事先不知道大脑会识别哪些人。

就需要的编码量而言,这也很荒谬。初级视觉皮质包含大约1400万个神经元,这些神经元投射到V2,而后者又包含大约1000万个神经元。如果精确地确定系统,每个轴突标记有特定的V2神经元,则引导轴突所需的分子信号要比基因组中的基因多得多(每个分子由特定的DNA序列编码,而基因只有微不足道的2万个)。没有人会认为这种水平的特异性确实存在。即使采用了巧妙的捷径,基因组也要比构建整个感知系统所需的信息量少几个数量级。

因此,自然不会尝试指定所有连接,而是使用双重策略。基因编程的规则负责引导神经元,将轴突引导到目标脑区所在的正确位置:面部斑块在所有灵长类动物中都位于相同的位置。它们还会导致每个脑区保留视网膜的拓扑空间图。形成粗略布局之后,则由机器学习规则来决定精确连接,这些精确连接会编码各个特定对象。用利文斯通的话说,分子机制产生“原型面部斑块”。它们通过严格的、基因编程的发育线索决定大概位置,并通过突触可塑性获得最终的选择性。

第二个优点则在于,神经网络解决了识别各种距离、角度的大量视觉对象的问题。在神经网络中,一个神经元可以参与多个识别器,具体取决于下一层如何处理上一层的输出。如果神经网络有很多层,并且每一层都包含成千上万的神经元,那么可能的组合数量就是一个天文数字。这给了大脑巨大的组合优势,让它足以从许多角度涵盖一个人的脸。无论你从哪个角度看你的孩子,你都能把他和在操场上跑跑跳跳的其他孩子区分开。

用最笼统的话来说,神经网络的首要优势在于它们可以使大脑的视觉系统与动物所生活的自然场景相匹配。我们用来训练神经网络做视觉识别所用的,正是我们周围的视觉对象。简单的情况是线条朝向,这是哺乳动物生活中几乎所有视觉场景的主要特征。但是,某些复杂的对象也很重要。例如,面部对于包括我们在内的灵长类动物等社交动物至关重要。如果猴子没有看到过脸,那这些“面部斑块”就会识别其他东西——在我们看到的案例中是手。识别边缘、面部或手部的系统是大脑学习出来的。

阅读 ‧ 电子书库

我不禁要强调感知系统的优雅、经济和简洁。我们再次看到这个伟大的组织原理:感觉系统通过调整自身去适应自然界的统计规律,即视觉输入里对于动物来说最重要的特征。对于我们和我们的进化祖先来说,演化值得花费一些基因,来使视网膜适应那些总是出现在视觉世界中的少数特征。边缘检测在这里又是一个好例子。这是一种预先接好的功能,从马蹄蟹到人类都由演化而来的分子指令创建。[1]

侧向抑制是可以由基因预先编程的简单机制。但是对于复杂的对象,我们的有限基因集需要太多的调整才能完成。神经网络没有这种约束。利用赫布法则,大脑可以与存在的任何高阶规律匹配。在小猴子的视觉世界中,眼睛、鼻子、下巴和发际线总是一起出现,这是知觉学习的前提。

下面是另一个例子。看看下图中的奇怪形状。现在想象一个世界(比如火星),其中的生物的“面孔”看起来像这个怪样。在这种情况下,火星人的颞叶会有一系列斑块,可以检测出这个奇怪的形状,因为正是这个视觉图像天天训练火星人的神经网络。

阅读 ‧ 电子书库

然而,在地球上,我们人类的颞叶仍然会有识别人脸的斑块。即使我们偶尔会看到这个形状,与面孔相比,我们的许多神经元不会太在意它。我画的这个形状你可能今后再也不会看到,但面孔你肯定会碰到成千上万张,它们对你的生活至关重要。你的视觉系统不是通用识别器,神经元会把识别功能花在实际会看到的东西上,而不是花在可能看到的东西上。可以肯定的是,这种关于视觉的思维方式涉及神经硬件效率的非常实际的问题。但是这也很优雅,因为这意味着单个动物的大脑在其细胞与该动物所居住的自然世界的联系中是联系在一起的。通过感知学习,我们的视觉大脑包含了我们的自然环境经过浓缩的内置副本。

[1] 在古生代化石中发现的马蹄蟹(Limulus)和如今的马蹄蟹一模一样。边缘增强(侧向抑制)在马蹄蟹的眼中也有发现。尽管它们的“视网膜”远比哺乳动物简单,但是它们同样有边缘增强:一个被照亮光感受器会抑制周围的光感受器。