魔鬼數學-讀書筆記
作者喬丹·艾倫伯格 美國威斯康星大學數學系教授。他在世界範圍內發表他的關於數論研究的演講,並於2013年在世界最大的數學會議——數學聯合會議上做主題演講。他的文章主要發表在《連線》《紐約時報》《華盛頓郵報》《華爾街日報》《波士頓環球報》等 媒體上,他還為《石板》雜誌寫作「Do the Math」專欄文章,十分受歡迎。
你應該提前多長時間到達機場?民意調查的結果真的能代表人們的意願嗎?為什麼父母都是高個子,孩子的身高卻比較矮?用什麼策略買彩票才能中大獎?《魔鬼數學》運用數學方法分析和解決了很多的日常生活問題,幫助數學門外漢習得用數學思維思考問題的技能。
線性
簡單說,線性就是指兩個變量之間存在一定的函數關係,比如,成正比或成反比。在應用上,最常見的就是統計上的線性回歸法,也就是運用數理統計中的回歸分析,確定兩個或者兩個以上變量之間的關係。不過,這種方法也存在着很多濫用,並且對人造成誤導的現象,特別是在一些新聞報道里。比如,每當世界上有災難發生的時候,報紙上總會出現一些嚇死人的數字分析。倫敦大學的反恐專家曾經在報紙上說:
2005年10月底,恐怖襲擊讓1074個以色列人死亡,7520人受傷。對以色列這樣一個小國而言,這兩個數字已經大得驚人了,按照比例換算,相當於有5萬個美國人死亡,30萬個美國人受傷。
怎麼算出來的呢?它是按照人口百分比換算的。用以色列恐怖襲擊傷亡人數,除以以色列總人口數,得出一個比例,再用這個比例去乘美國的總人口數。在政治上,這樣的表述有助於引起公眾的強烈情緒,從而推動某項法案,但是在數學上,這種算法是錯誤的,這就是典型的濫用線性回歸法,只考慮了簡單的數字比例,而忽略了複雜事件中的其他因素。本書作者稱這種方法為,粗暴線性回歸法。
比如,美國大作家馬克·吐溫,早年間,曾經在密西西比河上當水手,還寫過一本《密西西比河上的生活》,裡面這樣寫着:176年前,下密西西比河在凱羅與新奧爾良之間的河段長1215英里,經過截彎取直之後,縮短為1180英里,之後在美洲灣取直,縮短為1040英里,再後來,這個河段又縮短了67英里。也就是說,在176年的時間裡,下密西西比河縮短了242英里,平均每年縮短一又三分之一英里,因此,只要不是瞎子和白痴,我們就不難推測出,再過742年,下密西西比河將只剩下不到兩英里長。
馬克·吐溫用到了線性回歸法,得出結論是下密西西比河會不斷縮小,看起來還蠻有道理的,但真的會是這樣嗎?我們知道,下密西西比河並沒有在我們眼前一點點消失,甚至隨着雨季和新航道的開闢,它還偶爾變長呢。 那麼問題出在哪裡呢?問題就在於馬克·吐溫使用的是典型的不假思索的線性回歸法,只考慮了表面原因,沒有考慮地理、氣候、地表進化等等之類的其他原因,所以才得出似是而非的結論,根本經不起推敲。這就是說,無論恐怖襲擊,還是地理、地質問題,背後都是一系列複雜的原因,不是簡單套用某一個線性關係的公式就能搞清楚的。而且,考慮這樣的問題,如果應用不同的數字關係,也會差異很大的不同結論。
比如,2004年,西班牙發生了3·11馬德里地鐵爆炸案,近200人遇難,假如事件發生地換成紐約,會是什麼結果呢?如果按照西班牙和美國的總人口來算,美國人口大約是西班牙的7倍,所以紐約將會有大約1300人遇難。而如果按照馬德里和紐約的人口比例來算,這個數字就會變成463人,要是再按照馬德里省和紐約州的人口相比較,那麼得出的結論是600人。
每個數字都不同,數學領域中有個檢驗對錯的原則,那就是,如果按照不同的方法進行計算,得出了不同的結論,那麼說明我們的方法有問題。也就是說,處理這樣的複雜問題時,不適合採用線性回歸法來研究。這就從數學的角度告訴了我們,線性回歸法的簡單運用,聽起來挺靠譜,但實質上是複雜問題簡單化,往往得出錯誤結論,所以,當你再聽到所謂專家大談統計數據、特別是一些用線性回歸法推導出的數字時,要記住,不是所有的線都是直線,不是所有的數據都道出了真相。
推理
有一天,你收到一封信,一個來自美國巴爾的摩市的股票經紀人建議你買某一隻股票,因為他預測在下個周這隻股票會大漲。你並沒當回事,但到了下個星期,你翻看了股票大盤,發現那隻股票真的大漲。很快,你又收到這個股票經紀人的來信,他預測下個星期另一隻股票會大跌。下個星期,這個預測又靈驗了。這個股票經紀人連續十個星期給你來信預測,每一次都准得好像證券所是他開的一樣。最後,他建議與你長期合作,把你的錢拿來由他投資。你會怎麼做決定呢?
讓我們引入數學,根據概率論,即使一個股市白痴,他隨便猜測,每次得出一個正確的預測的概率是50%,那麼連續十次預測全部命中的概率是:1/1024。這麼低的概率,他都能百發百中,你是不是會對他驚為天人,放心地把錢交付給他去投資了呢?我們研究一下。
第一周,這個股票經紀人發出了10240封郵件,其中A組,預測股票會漲,B組,預測股票會跌。第二周,股票漲了,這個經紀人就把 B 組人完全刪掉,繼續給預測成功的 A 組人寫信,依然是分成兩半,一半預測某隻股票會漲,另外一半預測相反。這樣一周一周下去,每一周經紀人都會淘汰掉一半的人,那麼十周之後,經紀人手裡就會剩下10個幸運兒,他們連續十次收到巴爾的摩股票經紀人的正確預測,很自然地認為這位經紀人就是位天才,那麼這位經紀人很可能從這十個人身上狠撈一筆。
2008年英國 BBC 有一檔真人秀節目,魔術師用相同的手段給成千上萬的英國人發送賭馬的郵件,最後他成功地讓某些人相信了他具備某種超能力。這套把戲在我們生活中隨處可見,它之所以能奏效,是因為它並不是徹頭徹尾的欺騙,它是用真實信息讓你得出錯誤結論。我們在做數學推理的時候要知道:面對大數據的分析,必須小心翼翼,同一個觀察結果,可以倒推出多種可能的原因,讓我們誤入歧途的,不是事情的真偽,而是推理的時候,是否漏掉了某種假設。
回歸
你有沒有發現一個現象,某個商鋪在銷售額快速增長十年後,漸漸回歸平庸;一對極度聰明的父母所生的子女表現稀鬆平常,完全沒有他父母一半的成就。這裡面是有什麼原因嗎?商人可以說,自己的策略有問題,沒有把握住市場的脈搏。父母可以說,也許是教育,也許是機會,也許只是時代變了。但是如果我們從數學角度來看,這種現象是完美的數學呈現,這是數學的「回歸平均值」概念。什麼是回歸平均值?它指的是,只要研究對象受到隨機性的影響,就會發生回歸平均值的現象。
最先發現這個理論的是19世紀的英國科學家高爾頓,他是一名好奇心滿滿的數學家。他有個願望,要把遺傳問題量化。首先,他從父親與孩子的身高入手,因為這是組比較容易採集的數據。他拿出一張白紙,用尺子畫出坐標軸,橫軸表示孩子的身高,縱軸表示父親的,每一對父子在坐標圖上就是一個黑點。他在收集了大量的數據之後,發現了「散點圖」。
讓我們先做一下假設:如果孩子的身高完全取決於父親的身高的話,這張圖就會變成一條直線。如果孩子的身高與父親毫無關係,那麼我們會得到一張雜亂無章的圖,充滿了隨機的小黑點。但實際上呢,高爾頓得到的既不是直線圖,也不是雜亂無章的圖,而是一張散點圖,也就是說,它呈現出一個近似橢圓的形狀,其中心對應的就是父母與孩子正好都是平均身高的那個點。也就是說,不管父母的身高是高是矮,大數據表示,孩子們的身高都是逼近普通人的身高,也就是回歸平均值的。
他在1889年《自然的遺傳》一書中是這麼總結的:我認為,從整體情況看,成年子女的身高與他們的父母相比更趨於平均水平。所以如果你個子很矮也不必擔心,因為你的後代是有很大可能會達到正常人身高的。那我們到底還受不受遺傳學的影響呢?高爾頓發現,遺傳還是影響我們,但是通過相關函數發揮作用的。
高爾頓的橢圓形有胖有瘦,如果離心率大,則意味着遺傳因素的作用大,橢圓形就胖,回歸平均值的作用小,相反的話,回歸平均值就起到了決定性作用。高爾頓把這個量稱為「相關函數」。高爾頓就此推論,不僅身高,人們的智力水平肯定也會如此。
不管父母的智商如何高,後代不可能永遠聰明下去,他們必然受到回歸平均值的影響,成為普通人中的一員。這一理論後來被大數據的分析證明了,事實上,生活中隨着時間產生變化的任何東西,幾乎都會受到回歸效應的影響。
民意
我們認為,所謂好政府,應該儘可能地傾聽人民呼聲,尊重人民的意願。那麼怎麼知道什麼才是人民的意願呢?一般是通過民意調查,但是在現實操作中,往往不是這麼簡單。
比如,關於如何解決政府赤字的問題,美國政府展開了一次民調,結果是這樣的。有三分之一的人認為,我們應當在不削減政府開支的前提下,通過提高稅率的辦法解決預算赤字。有三分之一的人認為,我們應當削減國防開支。剩下三分之一的人認為,我們應當大幅削減醫療福利。這會造成一個自相矛盾的結果,有三分之二的人同意削減開支,但是也有三分之二的人反對削減國防開支,三分之二的人反對削減醫療福利。也就是說,你滿足了任何一群人,都放棄了更大一群人。每一位投票人的政治立場都富有理性而且合乎邏輯,但是,把所有人的立場匯總起來就成了鬧劇。
「少數服從多數」原則簡單明了,看似公平,但只有在僅涉及兩種觀點時,它才能取得最佳效果,只要觀點多於兩種,大多數人的喜好就會有自相矛盾的地方。那麼一個政府官員他將如何履行自己的職責呢?很簡單,既然人民沒有達成一致意見,官員們自行其是就可以了。 如果你是一名平庸的政客,你就會認為民調數據自相矛盾,並為此痛苦不已。但是,如果你是一名優秀的政治家,你就會說:人們選擇我,是希望我履行政府官員的職責,而不是研究民調數據。如果你是一位偉大的政治家,你會從另外一個方面思考問題,想方設法,對不一致的民調加以利用。
比如,你可以告訴大家,我保證大家無須多繳一美分的稅,我將為城市提供必需的設施和優質的公共服務,還不會多花納稅人一分錢。這個策略是顯而易見的,你沒有選擇他們三個人群中的任何一個,而只是排除了一個選項:增稅。馬上,你就獲得了三分之二的民眾的支持。這就是順應民意。
彩票
彩票是否值得購買呢?當然是不值得。但是,大家還是樂此不疲地購買彩票,為什麼呢?因為購買彩票是賭博,人人都想以少博多。亞當·斯密也是彩票的反對者之一,他在《國富論》裡是這樣說的:
政府賣彩票能賺錢這件事告訴我們,人們過高地估計了中獎的概率。我們從來沒有看到過完全公平或者損益相抵的彩票,將來也不會看到,因為這樣的彩票不會給發行方帶來任何收益的機會。
亞當·斯密的表述是清晰有力的,但是我們不應該盲目相信他的話,因為嚴格來講,他得出的結論並不完善,屬於經驗分析。每一種彩票的購買價值和獲獎價值都不同,購買價值是你購買一張彩票所用的金額,而獲獎價值是引入概率論之後,彩票的真正價值,我們用期望值來表達。期望值的計算方法是這樣的,假定該彩票一共有1000萬種號碼組合,其中只有一種會中獎,每張彩票售價1美元,獎池累計資金為600萬美元。 那麼,該彩票兌獎一千萬次,其中有九百九十九萬九千九百九十九次的結果毫無價值,其中有1次的價值是600萬美元。彩票的期望值為該結果的概率與該結果所對應的彩票價值相乘。也就是說你花了1美元,購買了價值0.6美元的商品。用1美元,購買60美分的商品,當然是不明智的,彩票的發行方是穩賺不賠的,發行量越大,發行方賺得越多。但是根據期望值的計算,這表述並不周全,因為有可能存在期望值大於購買值的彩票。
比如,2004年秋天,麻省決心振興該州的彩票業,於是他們想出了一個主意,設計了一款新彩票。這款彩票不僅增加了很多小獎項,而且為了刺激銷售,還規定如果一周之內沒有人領走大獎,並且大獎基金超過200萬美元的時候,獎金就會向下分配,增加容易贏取的獎項的金額。這種機制導致彩票期望值極速增長,高達5.53美元,而每一張彩票才賣2美元。
首先發現這個空子的是麻省理工的學生們,他們組團購買了1000張彩票,獲得了三倍的收穫。接着一個退休的數學教師也成立了多達70人的親友團,一次購買了6萬張彩票,獲得超過5萬美元的收入。還有東北大學的張英博士,他收益更多,以至於在2006年的時候,張博士乾脆放棄了醫學研究,全身心地投入到博彩活動中來。
彩票是賭博,可是它是否能給你帶來巨大收益,除了小概率的運氣之外,還有數學公式支持的期望值。2012年的時候,麻省彩票中心終於明白了這件事,取消了這款彩票,可是,在這七年的時間裡,麻省理工的學生團隊共獲利超過350萬美元。
數學可以讓我們更好地思考:它可以磨練我們的直覺,讓我們的判斷更敏銳,它還可以馴服不確定性,讓我們更深入地了解世界的結構和邏輯。擁有了數學工具,我們就可以把那些我們想當然的事情看得更透徹,從而做出正確的決策。