我們如何看見,又如何思考-讀書筆記
每一天睜開眼,我們就在接收來自外界的信息,我們的眼睛究竟是如何承載這個世界的信息的,又是如何傳遞到我們的大腦的?人人都說眼睛是心靈和靈魂的窗戶,這又是為什麼?
在人群中要找一張熟悉的臉是再簡單不過的事,我們習以為 常。但是人類是怎麼辦到這件事的,這是科學界最重要的謎題之一 。我們大腦的運作有三分之一與視覺相關。基本上,科學家要講清楚人類是如何看見感知人事物的,背後牽連到人類獨特的認知本能。
哈佛大學醫學院特聘教授、眼科學家及腦神經科學家理查德·馬斯蘭在本書中試圖以科學的角度來解釋人類如何透過雙眼與大腦去感知、學習與記憶。從光線射到視網膜,到腦部的神經網絡如何把光線承載的信息轉化成人腦可以辨識與運用的知識,到計算機算法要具有什麼樣的功能才能被稱為「人工智能」,再到我們在回憶過去時為什麼會呈現出一種第三人視角。這是一場深刻但並非不可知的探索,讓我們一同探索我們的身體對這個世界的理解吧。
視網膜傳遞信息
視網膜是一層透光的薄膜,我們的眼睛之所以能看到某個物體,就是外界物體的反射光,通過晶狀體折射,最終落在視網膜上,形成一個物像。然後這些圖像信息通過視神經傳給大腦,這樣人就產生了視覺。你不要以為視網膜這麼簡單,實際上,視網膜是一個微處理器,就像你的手機、相機或手錶中的芯片一樣。
視網膜會對真實世界的信息進行了一系列加工處理。最終目的,就是要從一大堆雜亂無章的信息中,識別出主要矛盾,給到大腦最顯著的視覺信號,其餘無關緊要的,就被忽略掉了。這是所有感知系統最基本的原則之一,包括聽覺、觸覺和味覺等等。
視覺一般是我們接收信息的主要來源,信息量更大,也更複雜,所以要想完成這些工作,對視網膜的要求也就更高。它不僅工作效率高,還得會選擇,會思考。那麼視網膜是如何工作的?
工作內容
作者說,視網膜是一個圖像處理器。視網膜的首要任務是檢測光線。不同強度的光線從各個角度進入眼睛之後,視網膜上和光線有關的光敏細胞就會開始工作,然後再把這些光學信息轉換成其他細胞能夠接收工作內容。在這個過程中,視網膜還需要對不同強度,差異巨大的光線變化做進一步的壓縮,以確保它們在一個合適的範圍內。
比如,我們晚上回臥室睡覺前,客廳的燈光很亮,但是當我們進臥室睡覺的時候,如果裡面不開燈,會感覺一片漆黑;相反,如果我們的臥室很黑,我們適應了這個黑度,這個時候我們再出臥室,到了亮的地方,就會感覺刺眼。
刺眼這個狀態已經是經過視網膜壓縮處理之後的結果了,如果沒有這個步驟,我們眼前就可能是一片光斑,眼花繚亂,或者是陷入黑暗中,徹底看不見任何東西,直到視網膜重新組織起一個合適的亮度範圍,我們才能真正看得清東西。
為什麼會出現這種情況呢?因為對黑暗敏感和對亮光敏感的不同細胞,它們的信息輸出大小相差1000倍,而這樣的數值差距,是單個神經元、大腦甚至計算機都無法處理的。
所以,視網膜必須得壓縮光線變化的範圍,在任何給定的環境照明下,讓輸出的最大光亮強度也只有最小強度的10倍左右,而不是1000倍。而且視網膜還可以「分解」。
比如,如果大老遠就要你快速認出一個熟人,實際上是難度極高的。人臉圖像每一次都在變,就像你根本無法拍出兩張一模一樣的照片。所以,想要解決這麼複雜的問題,視網膜必須要會「分解」。把一個複雜難題分解成一個個最簡單的部分,再分別針對每個單獨的部分去處理,就是我們能立馬上手的最快方式。
而視網膜的智慧就在於,它還不是簡單的拆分圖像,而是對圖像進行建模分解。簡單來說,視網膜的工作並不是機械地把人臉圖像,拆分成無數個碎片,然後再像拼拼圖一樣把它們拼合在一起。它會條理清晰地把人臉圖像,按照不同特徵點進行分類。
比如,這個圖像我需要花多長時間識別,它是動態還是靜態的等各個維度分別是什麼樣。視網膜會根據這些維度進行分類整理,這就是建模。然後再形成幾十條並行的信息流,清清楚楚地把這些整理過的內容傳輸到下一步。
這樣一來,人臉圖像就不再是一個個雜亂無章的信息碎片了,而是一條條已經整理好的,分門別類並行的信息流。一旦發生任何微小的變化,視網膜也都能有所識別。
總之,視網膜不僅僅是一層會透光的膜這麼簡單,而是一個充滿智慧的圖像處理器。它的主要工作是主次分明地整理好一條條並行的信息流,傳輸給大腦,減輕後續工作的壓力。
結構設計
我們可能都有這種模糊的感受,那就是眼睛中間的視力比外周要好,但我們很少會察覺到,兩者差距到底有多大。科學家們發現,實際上,我們的中央視覺敏銳,而中央以外,可以說我們基本上是看不見的,這是因為中央區域神經節細胞多而集中,越往邊緣,就越稀疏。
為什麼自然進化不能讓人類擁有更多的神經節細胞呢?畢竟我們眼睛的四周還有很多表面積啊,視力肯定是越清晰越好啊,這樣也能更快的分辨危險,做出反應。
生物演化面臨的問題從來不是單一維度的問題,而是相互矛盾,讓人兩難的問題。在這個過程中,你會發現,視網膜的結構設計體現了一種平衡的藝術。
一方面,當前安排最大的好處就是高效。想要擁有更多的神經節細胞,成本是很高的。假如視網膜中央和四周,每個點的神經節細胞密度都一樣高,那麼它們匯聚在一起形成的視神經,就會像一根橡膠水管那麼粗,而我們現在視神經的直徑通常只有4毫米。
另一方面,外周視力差也有它的用處,它不僅對變化的東西很敏感,而且我們還能用外周視覺來進行導航,粗略地避開一些障礙物,這樣大腦處理的信息也會較少。事實上,一些智能武器,比如視覺制導的炮彈就使用了和人類視覺類似的策略,它們會先用粗糙的視覺定位重點區域,如果這個區域有動靜,才會在該區域放大像素密度處理更多細節。這樣做的目的和人腦一樣,用儘可能少的計算資源來處理次要信息。
大腦如何構建感知
作者在書中提到,科學家通過觀察視網膜神經節細胞的活動,已經基本弄清楚,視網膜的輸出主要通往大腦的視覺皮質。但是對大腦視覺皮質的研究工作,我們還沒有更多的發現。那麼大腦如何構建感知的呢?
人臉識別
科學家發現,我們的大腦對某些具體的視覺對象,響應得會更活躍,其中比較特別的視覺對象就是「人臉」。科學家們通過核磁共振成像觀察到,當人和猴子看到一張臉的時候,在大腦顳葉中,就會出現6個特定的小斑塊。
這些小斑塊有點像是專門為識別臉部準備的細胞。有一些斑塊功能比較局限,只能響應臉的特定朝向,另一些斑塊則更高級,無論這張臉朝着哪個角度,它都可以識別出來。但是不管怎樣,科學家們發現,這6個斑塊可以作為一個系統來協同工作。
那它們是如何協同工作的呢?有人就推測,這些細胞可能會各司其職。比如說這個細胞負責識別眼睛,那個負責識別鼻子。為了弄清楚這些問題,科學家們按照視覺信息的拆分機制,把一張臉拆分成了不同的元素。
比如,兩隻眼睛,就是兩條橫線,一個鼻子,一條豎線,最下方還有一張橢圓形的嘴等等。科學家們在實驗過程中,想要通過增加或減少這些面部特徵,來觀察這些細胞的工作原理。 實驗結果發現,這些細胞對不同的臉部組合特徵,都有一定的響應,它們確實對「臉」感興趣,通過增加或減少一些面部特徵,細胞的反應強度也有所不同。而且它們會測量一堆面部參數,然後聯合分析這些參數,來確定某個對象是否是一張臉。
科學家觀察到,有些細胞對一張臉的長寬比敏感,另一些細胞則對眼睛之間的距離敏感,還有一些對眼睛的位置參數更感興趣。
換句話說,如果我們單獨來看每一個參數,沒有一個參數是很直白地告訴這些細胞,這是不是一張臉,但是如果用某種方式把這些參數組合在一起,細胞就能做出判斷,眼前的對象是否是一張臉。
很強的可塑性
感覺系統的神經連接具有很強的可塑性。可塑性指的就是大腦重新組織神經之間連接的能力,可塑性不僅讓大腦能從損傷中修復,還能讓大腦把資源分配給當下最重要的任務。我們假設,如果一個人,他的視覺信息中,從來沒有接觸過和臉有關的任何參數呢?這些細胞還會對面部特徵敏感嗎?
比如,科學家飼養了一些猴子,從小就沒見過任何關於臉的參數,不僅僅是沒見過人的臉,也包括它們的同類猴子的臉。每次實驗人員在和這些猴子的接觸過程中,他們都會戴上電焊工的面罩,把自己的臉捂得嚴嚴實實。除了看不到臉,這些猴子在一個完全正常的視覺世界中長大:它們可以看到籠子和周圍房間中的一切;它們可以看到實驗人員的身體、手臂和腳;可以看到餵奶的奶瓶,可以聽到猴群發出的正常聲音,也能夠與同伴開心地交流。它們唯一被剝奪的是對面部的視覺體驗。 那如果在這樣的環境中長大,它們的大腦中,還會存在特定的面部斑塊嗎?科學家們通過掃描這些猴子的大腦就發現,當看到人臉或同伴的臉,它們腦中並沒有亮起來的斑塊。原本在面部斑塊會出現的大腦區域,當這些猴子看到關於手的圖像之後,這些細胞就做出了一系列的響應。也就是說,那些對面部敏感的細胞,如果從小就接觸不到關於臉的圖像之後,它們就會對手更加敏感。
科學家們發現,原來在正常的社交環境中,對於靈長類動物來說,最重要的視覺對象就是臉。不管是人類的臉還是猴子的臉,它們會傳遞一些憤怒、恐懼、敵對、愛以及所有和生存繁衍有關的情感信息。但是如果看不到臉,環境中第二重要的特徵就是手,包括猴子自己的手,以及培育和餵養它們的實驗人員的手。因此,原本我們可能判斷是面部斑塊的腦區,就變成了「手部斑塊」。
在猴子被允許,可以看到實驗人員或者其他猴子的臉之後,大約過了6個月,科學家們再次觀察到,手部斑塊中的細胞又逐漸恢復為對臉敏感。顯然,面部傳達的信息如此重要,以至於它們重新奪回了手的圖像所占據的大腦區域,而這個過程就是一種感知學習的過程。
可以說,我們的感覺系統一直在通過調整自身去適應自然界的統計規律,而這個規律指的就是在視覺輸入中對於我們來說最重要的特徵。這也恰恰說明了,感覺系統的神經連接具有很強的可塑性。