我们如何看见,又如何思考-读书笔记
每一天睁开眼,我们就在接收来自外界的信息,我们的眼睛究竟是如何承载这个世界的信息的,又是如何传递到我们的大脑的?人人都说眼睛是心灵和灵魂的窗户,这又是为什么?
在人群中要找一张熟悉的脸是再简单不过的事,我们习以为 常。但是人类是怎么办到这件事的,这是科学界最重要的谜题之一 。我们大脑的运作有三分之一与视觉相关。基本上,科学家要讲清楚人类是如何看见感知人事物的,背后牵连到人类独特的认知本能。
哈佛大学医学院特聘教授、眼科学家及脑神经科学家理查德·马斯兰在本书中试图以科学的角度来解释人类如何透过双眼与大脑去感知、学习与记忆。从光线射到视网膜,到脑部的神经网络如何把光线承载的信息转化成人脑可以辨识与运用的知识,到计算机算法要具有什么样的功能才能被称为“人工智能”,再到我们在回忆过去时为什么会呈现出一种第三人视角。这是一场深刻但并非不可知的探索,让我们一同探索我们的身体对这个世界的理解吧。
视网膜传递信息
视网膜是一层透光的薄膜,我们的眼睛之所以能看到某个物体,就是外界物体的反射光,通过晶状体折射,最终落在视网膜上,形成一个物像。然后这些图像信息通过视神经传给大脑,这样人就产生了视觉。你不要以为视网膜这么简单,实际上,视网膜是一个微处理器,就像你的手机、相机或手表中的芯片一样。
视网膜会对真实世界的信息进行了一系列加工处理。最终目的,就是要从一大堆杂乱无章的信息中,识别出主要矛盾,给到大脑最显著的视觉信号,其余无关紧要的,就被忽略掉了。这是所有感知系统最基本的原则之一,包括听觉、触觉和味觉等等。
视觉一般是我们接收信息的主要来源,信息量更大,也更复杂,所以要想完成这些工作,对视网膜的要求也就更高。它不仅工作效率高,还得会选择,会思考。那么视网膜是如何工作的?
工作内容
作者说,视网膜是一个图像处理器。视网膜的首要任务是检测光线。不同强度的光线从各个角度进入眼睛之后,视网膜上和光线有关的光敏细胞就会开始工作,然后再把这些光学信息转换成其他细胞能够接收工作内容。在这个过程中,视网膜还需要对不同强度,差异巨大的光线变化做进一步的压缩,以确保它们在一个合适的范围内。
比如,我们晚上回卧室睡觉前,客厅的灯光很亮,但是当我们进卧室睡觉的时候,如果里面不开灯,会感觉一片漆黑;相反,如果我们的卧室很黑,我们适应了这个黑度,这个时候我们再出卧室,到了亮的地方,就会感觉刺眼。
刺眼这个状态已经是经过视网膜压缩处理之后的结果了,如果没有这个步骤,我们眼前就可能是一片光斑,眼花缭乱,或者是陷入黑暗中,彻底看不见任何东西,直到视网膜重新组织起一个合适的亮度范围,我们才能真正看得清东西。
为什么会出现这种情况呢?因为对黑暗敏感和对亮光敏感的不同细胞,它们的信息输出大小相差1000倍,而这样的数值差距,是单个神经元、大脑甚至计算机都无法处理的。
所以,视网膜必须得压缩光线变化的范围,在任何给定的环境照明下,让输出的最大光亮强度也只有最小强度的10倍左右,而不是1000倍。而且视网膜还可以“分解”。
比如,如果大老远就要你快速认出一个熟人,实际上是难度极高的。人脸图像每一次都在变,就像你根本无法拍出两张一模一样的照片。所以,想要解决这么复杂的问题,视网膜必须要会“分解”。把一个复杂难题分解成一个个最简单的部分,再分别针对每个单独的部分去处理,就是我们能立马上手的最快方式。
而视网膜的智慧就在于,它还不是简单的拆分图像,而是对图像进行建模分解。简单来说,视网膜的工作并不是机械地把人脸图像,拆分成无数个碎片,然后再像拼拼图一样把它们拼合在一起。它会条理清晰地把人脸图像,按照不同特征点进行分类。
比如,这个图像我需要花多长时间识别,它是动态还是静态的等各个维度分别是什么样。视网膜会根据这些维度进行分类整理,这就是建模。然后再形成几十条并行的信息流,清清楚楚地把这些整理过的内容传输到下一步。
这样一来,人脸图像就不再是一个个杂乱无章的信息碎片了,而是一条条已经整理好的,分门别类并行的信息流。一旦发生任何微小的变化,视网膜也都能有所识别。
总之,视网膜不仅仅是一层会透光的膜这么简单,而是一个充满智慧的图像处理器。它的主要工作是主次分明地整理好一条条并行的信息流,传输给大脑,减轻后续工作的压力。
结构设计
我们可能都有这种模糊的感受,那就是眼睛中间的视力比外周要好,但我们很少会察觉到,两者差距到底有多大。科学家们发现,实际上,我们的中央视觉敏锐,而中央以外,可以说我们基本上是看不见的,这是因为中央区域神经节细胞多而集中,越往边缘,就越稀疏。
为什么自然进化不能让人类拥有更多的神经节细胞呢?毕竟我们眼睛的四周还有很多表面积啊,视力肯定是越清晰越好啊,这样也能更快的分辨危险,做出反应。
生物演化面临的问题从来不是单一维度的问题,而是相互矛盾,让人两难的问题。在这个过程中,你会发现,视网膜的结构设计体现了一种平衡的艺术。
一方面,当前安排最大的好处就是高效。想要拥有更多的神经节细胞,成本是很高的。假如视网膜中央和四周,每个点的神经节细胞密度都一样高,那么它们汇聚在一起形成的视神经,就会像一根橡胶水管那么粗,而我们现在视神经的直径通常只有4毫米。
另一方面,外周视力差也有它的用处,它不仅对变化的东西很敏感,而且我们还能用外周视觉来进行导航,粗略地避开一些障碍物,这样大脑处理的信息也会较少。事实上,一些智能武器,比如视觉制导的炮弹就使用了和人类视觉类似的策略,它们会先用粗糙的视觉定位重点区域,如果这个区域有动静,才会在该区域放大像素密度处理更多细节。这样做的目的和人脑一样,用尽可能少的计算资源来处理次要信息。
大脑如何构建感知
作者在书中提到,科学家通过观察视网膜神经节细胞的活动,已经基本弄清楚,视网膜的输出主要通往大脑的视觉皮质。但是对大脑视觉皮质的研究工作,我们还没有更多的发现。那么大脑如何构建感知的呢?
人脸识别
科学家发现,我们的大脑对某些具体的视觉对象,响应得会更活跃,其中比较特别的视觉对象就是“人脸”。科学家们通过核磁共振成像观察到,当人和猴子看到一张脸的时候,在大脑颞叶中,就会出现6个特定的小斑块。
这些小斑块有点像是专门为识别脸部准备的细胞。有一些斑块功能比较局限,只能响应脸的特定朝向,另一些斑块则更高级,无论这张脸朝着哪个角度,它都可以识别出来。但是不管怎样,科学家们发现,这6个斑块可以作为一个系统来协同工作。
那它们是如何协同工作的呢?有人就推测,这些细胞可能会各司其职。比如说这个细胞负责识别眼睛,那个负责识别鼻子。为了弄清楚这些问题,科学家们按照视觉信息的拆分机制,把一张脸拆分成了不同的元素。
比如,两只眼睛,就是两条横线,一个鼻子,一条竖线,最下方还有一张椭圆形的嘴等等。科学家们在实验过程中,想要通过增加或减少这些面部特征,来观察这些细胞的工作原理。 实验结果发现,这些细胞对不同的脸部组合特征,都有一定的响应,它们确实对“脸”感兴趣,通过增加或减少一些面部特征,细胞的反应强度也有所不同。而且它们会测量一堆面部参数,然后联合分析这些参数,来确定某个对象是否是一张脸。
科学家观察到,有些细胞对一张脸的长宽比敏感,另一些细胞则对眼睛之间的距离敏感,还有一些对眼睛的位置参数更感兴趣。
换句话说,如果我们单独来看每一个参数,没有一个参数是很直白地告诉这些细胞,这是不是一张脸,但是如果用某种方式把这些参数组合在一起,细胞就能做出判断,眼前的对象是否是一张脸。
很强的可塑性
感觉系统的神经连接具有很强的可塑性。可塑性指的就是大脑重新组织神经之间连接的能力,可塑性不仅让大脑能从损伤中修复,还能让大脑把资源分配给当下最重要的任务。我们假设,如果一个人,他的视觉信息中,从来没有接触过和脸有关的任何参数呢?这些细胞还会对面部特征敏感吗?
比如,科学家饲养了一些猴子,从小就没见过任何关于脸的参数,不仅仅是没见过人的脸,也包括它们的同类猴子的脸。每次实验人员在和这些猴子的接触过程中,他们都会戴上电焊工的面罩,把自己的脸捂得严严实实。除了看不到脸,这些猴子在一个完全正常的视觉世界中长大:它们可以看到笼子和周围房间中的一切;它们可以看到实验人员的身体、手臂和脚;可以看到喂奶的奶瓶,可以听到猴群发出的正常声音,也能够与同伴开心地交流。它们唯一被剥夺的是对面部的视觉体验。 那如果在这样的环境中长大,它们的大脑中,还会存在特定的面部斑块吗?科学家们通过扫描这些猴子的大脑就发现,当看到人脸或同伴的脸,它们脑中并没有亮起来的斑块。原本在面部斑块会出现的大脑区域,当这些猴子看到关于手的图像之后,这些细胞就做出了一系列的响应。也就是说,那些对面部敏感的细胞,如果从小就接触不到关于脸的图像之后,它们就会对手更加敏感。
科学家们发现,原来在正常的社交环境中,对于灵长类动物来说,最重要的视觉对象就是脸。不管是人类的脸还是猴子的脸,它们会传递一些愤怒、恐惧、敌对、爱以及所有和生存繁衍有关的情感信息。但是如果看不到脸,环境中第二重要的特征就是手,包括猴子自己的手,以及培育和喂养它们的实验人员的手。因此,原本我们可能判断是面部斑块的脑区,就变成了“手部斑块”。
在猴子被允许,可以看到实验人员或者其他猴子的脸之后,大约过了6个月,科学家们再次观察到,手部斑块中的细胞又逐渐恢复为对脸敏感。显然,面部传达的信息如此重要,以至于它们重新夺回了手的图像所占据的大脑区域,而这个过程就是一种感知学习的过程。
可以说,我们的感觉系统一直在通过调整自身去适应自然界的统计规律,而这个规律指的就是在视觉输入中对于我们来说最重要的特征。这也恰恰说明了,感觉系统的神经连接具有很强的可塑性。