魔鬼数学-读书笔记
作者乔丹·艾伦伯格 美国威斯康星大学数学系教授。他在世界范围内发表他的关于数论研究的演讲,并于2013年在世界最大的数学会议——数学联合会议上做主题演讲。他的文章主要发表在《连线》《纽约时报》《华盛顿邮报》《华尔街日报》《波士顿环球报》等 媒体上,他还为《石板》杂志写作“Do the Math”专栏文章,十分受欢迎。
你应该提前多长时间到达机场?民意调查的结果真的能代表人们的意愿吗?为什么父母都是高个子,孩子的身高却比较矮?用什么策略买彩票才能中大奖?《魔鬼数学》运用数学方法分析和解决了很多的日常生活问题,帮助数学门外汉习得用数学思维思考问题的技能。
线性
简单说,线性就是指两个变量之间存在一定的函数关系,比如,成正比或成反比。在应用上,最常见的就是统计上的线性回归法,也就是运用数理统计中的回归分析,确定两个或者两个以上变量之间的关系。不过,这种方法也存在着很多滥用,并且对人造成误导的现象,特别是在一些新闻报道里。比如,每当世界上有灾难发生的时候,报纸上总会出现一些吓死人的数字分析。伦敦大学的反恐专家曾经在报纸上说:
2005年10月底,恐怖袭击让1074个以色列人死亡,7520人受伤。对以色列这样一个小国而言,这两个数字已经大得惊人了,按照比例换算,相当于有5万个美国人死亡,30万个美国人受伤。
怎么算出来的呢?它是按照人口百分比换算的。用以色列恐怖袭击伤亡人数,除以以色列总人口数,得出一个比例,再用这个比例去乘美国的总人口数。在政治上,这样的表述有助于引起公众的强烈情绪,从而推动某项法案,但是在数学上,这种算法是错误的,这就是典型的滥用线性回归法,只考虑了简单的数字比例,而忽略了复杂事件中的其他因素。本书作者称这种方法为,粗暴线性回归法。
比如,美国大作家马克·吐温,早年间,曾经在密西西比河上当水手,还写过一本《密西西比河上的生活》,里面这样写着:176年前,下密西西比河在凯罗与新奥尔良之间的河段长1215英里,经过截弯取直之后,缩短为1180英里,之后在美洲湾取直,缩短为1040英里,再后来,这个河段又缩短了67英里。也就是说,在176年的时间里,下密西西比河缩短了242英里,平均每年缩短一又三分之一英里,因此,只要不是瞎子和白痴,我们就不难推测出,再过742年,下密西西比河将只剩下不到两英里长。
马克·吐温用到了线性回归法,得出结论是下密西西比河会不断缩小,看起来还蛮有道理的,但真的会是这样吗?我们知道,下密西西比河并没有在我们眼前一点点消失,甚至随着雨季和新航道的开辟,它还偶尔变长呢。 那么问题出在哪里呢?问题就在于马克·吐温使用的是典型的不假思索的线性回归法,只考虑了表面原因,没有考虑地理、气候、地表进化等等之类的其他原因,所以才得出似是而非的结论,根本经不起推敲。这就是说,无论恐怖袭击,还是地理、地质问题,背后都是一系列复杂的原因,不是简单套用某一个线性关系的公式就能搞清楚的。而且,考虑这样的问题,如果应用不同的数字关系,也会差异很大的不同结论。
比如,2004年,西班牙发生了3·11马德里地铁爆炸案,近200人遇难,假如事件发生地换成纽约,会是什么结果呢?如果按照西班牙和美国的总人口来算,美国人口大约是西班牙的7倍,所以纽约将会有大约1300人遇难。而如果按照马德里和纽约的人口比例来算,这个数字就会变成463人,要是再按照马德里省和纽约州的人口相比较,那么得出的结论是600人。
每个数字都不同,数学领域中有个检验对错的原则,那就是,如果按照不同的方法进行计算,得出了不同的结论,那么说明我们的方法有问题。也就是说,处理这样的复杂问题时,不适合采用线性回归法来研究。这就从数学的角度告诉了我们,线性回归法的简单运用,听起来挺靠谱,但实质上是复杂问题简单化,往往得出错误结论,所以,当你再听到所谓专家大谈统计数据、特别是一些用线性回归法推导出的数字时,要记住,不是所有的线都是直线,不是所有的数据都道出了真相。
推理
有一天,你收到一封信,一个来自美国巴尔的摩市的股票经纪人建议你买某一只股票,因为他预测在下个周这只股票会大涨。你并没当回事,但到了下个星期,你翻看了股票大盘,发现那只股票真的大涨。很快,你又收到这个股票经纪人的来信,他预测下个星期另一只股票会大跌。下个星期,这个预测又灵验了。这个股票经纪人连续十个星期给你来信预测,每一次都准得好像证券所是他开的一样。最后,他建议与你长期合作,把你的钱拿来由他投资。你会怎么做决定呢?
让我们引入数学,根据概率论,即使一个股市白痴,他随便猜测,每次得出一个正确的预测的概率是50%,那么连续十次预测全部命中的概率是:1/1024。这么低的概率,他都能百发百中,你是不是会对他惊为天人,放心地把钱交付给他去投资了呢?我们研究一下。
第一周,这个股票经纪人发出了10240封邮件,其中A组,预测股票会涨,B组,预测股票会跌。第二周,股票涨了,这个经纪人就把 B 组人完全删掉,继续给预测成功的 A 组人写信,依然是分成两半,一半预测某只股票会涨,另外一半预测相反。这样一周一周下去,每一周经纪人都会淘汰掉一半的人,那么十周之后,经纪人手里就会剩下10个幸运儿,他们连续十次收到巴尔的摩股票经纪人的正确预测,很自然地认为这位经纪人就是位天才,那么这位经纪人很可能从这十个人身上狠捞一笔。
2008年英国 BBC 有一档真人秀节目,魔术师用相同的手段给成千上万的英国人发送赌马的邮件,最后他成功地让某些人相信了他具备某种超能力。这套把戏在我们生活中随处可见,它之所以能奏效,是因为它并不是彻头彻尾的欺骗,它是用真实信息让你得出错误结论。我们在做数学推理的时候要知道:面对大数据的分析,必须小心翼翼,同一个观察结果,可以倒推出多种可能的原因,让我们误入歧途的,不是事情的真伪,而是推理的时候,是否漏掉了某种假设。
回归
你有没有发现一个现象,某个商铺在销售额快速增长十年后,渐渐回归平庸;一对极度聪明的父母所生的子女表现稀松平常,完全没有他父母一半的成就。这里面是有什么原因吗?商人可以说,自己的策略有问题,没有把握住市场的脉搏。父母可以说,也许是教育,也许是机会,也许只是时代变了。但是如果我们从数学角度来看,这种现象是完美的数学呈现,这是数学的“回归平均值”概念。什么是回归平均值?它指的是,只要研究对象受到随机性的影响,就会发生回归平均值的现象。
最先发现这个理论的是19世纪的英国科学家高尔顿,他是一名好奇心满满的数学家。他有个愿望,要把遗传问题量化。首先,他从父亲与孩子的身高入手,因为这是组比较容易采集的数据。他拿出一张白纸,用尺子画出坐标轴,横轴表示孩子的身高,纵轴表示父亲的,每一对父子在坐标图上就是一个黑点。他在收集了大量的数据之后,发现了“散点图”。
让我们先做一下假设:如果孩子的身高完全取决于父亲的身高的话,这张图就会变成一条直线。如果孩子的身高与父亲毫无关系,那么我们会得到一张杂乱无章的图,充满了随机的小黑点。但实际上呢,高尔顿得到的既不是直线图,也不是杂乱无章的图,而是一张散点图,也就是说,它呈现出一个近似椭圆的形状,其中心对应的就是父母与孩子正好都是平均身高的那个点。也就是说,不管父母的身高是高是矮,大数据表示,孩子们的身高都是逼近普通人的身高,也就是回归平均值的。
他在1889年《自然的遗传》一书中是这么总结的:我认为,从整体情况看,成年子女的身高与他们的父母相比更趋于平均水平。所以如果你个子很矮也不必担心,因为你的后代是有很大可能会达到正常人身高的。那我们到底还受不受遗传学的影响呢?高尔顿发现,遗传还是影响我们,但是通过相关函数发挥作用的。
高尔顿的椭圆形有胖有瘦,如果离心率大,则意味着遗传因素的作用大,椭圆形就胖,回归平均值的作用小,相反的话,回归平均值就起到了决定性作用。高尔顿把这个量称为“相关函数”。高尔顿就此推论,不仅身高,人们的智力水平肯定也会如此。
不管父母的智商如何高,后代不可能永远聪明下去,他们必然受到回归平均值的影响,成为普通人中的一员。这一理论后来被大数据的分析证明了,事实上,生活中随着时间产生变化的任何东西,几乎都会受到回归效应的影响。
民意
我们认为,所谓好政府,应该尽可能地倾听人民呼声,尊重人民的意愿。那么怎么知道什么才是人民的意愿呢?一般是通过民意调查,但是在现实操作中,往往不是这么简单。
比如,关于如何解决政府赤字的问题,美国政府展开了一次民调,结果是这样的。有三分之一的人认为,我们应当在不削减政府开支的前提下,通过提高税率的办法解决预算赤字。有三分之一的人认为,我们应当削减国防开支。剩下三分之一的人认为,我们应当大幅削减医疗福利。这会造成一个自相矛盾的结果,有三分之二的人同意削减开支,但是也有三分之二的人反对削减国防开支,三分之二的人反对削减医疗福利。也就是说,你满足了任何一群人,都放弃了更大一群人。每一位投票人的政治立场都富有理性而且合乎逻辑,但是,把所有人的立场汇总起来就成了闹剧。
“少数服从多数”原则简单明了,看似公平,但只有在仅涉及两种观点时,它才能取得最佳效果,只要观点多于两种,大多数人的喜好就会有自相矛盾的地方。那么一个政府官员他将如何履行自己的职责呢?很简单,既然人民没有达成一致意见,官员们自行其是就可以了。 如果你是一名平庸的政客,你就会认为民调数据自相矛盾,并为此痛苦不已。但是,如果你是一名优秀的政治家,你就会说:人们选择我,是希望我履行政府官员的职责,而不是研究民调数据。如果你是一位伟大的政治家,你会从另外一个方面思考问题,想方设法,对不一致的民调加以利用。
比如,你可以告诉大家,我保证大家无须多缴一美分的税,我将为城市提供必需的设施和优质的公共服务,还不会多花纳税人一分钱。这个策略是显而易见的,你没有选择他们三个人群中的任何一个,而只是排除了一个选项:增税。马上,你就获得了三分之二的民众的支持。这就是顺应民意。
彩票
彩票是否值得购买呢?当然是不值得。但是,大家还是乐此不疲地购买彩票,为什么呢?因为购买彩票是赌博,人人都想以少博多。亚当·斯密也是彩票的反对者之一,他在《国富论》里是这样说的:
政府卖彩票能赚钱这件事告诉我们,人们过高地估计了中奖的概率。我们从来没有看到过完全公平或者损益相抵的彩票,将来也不会看到,因为这样的彩票不会给发行方带来任何收益的机会。
亚当·斯密的表述是清晰有力的,但是我们不应该盲目相信他的话,因为严格来讲,他得出的结论并不完善,属于经验分析。每一种彩票的购买价值和获奖价值都不同,购买价值是你购买一张彩票所用的金额,而获奖价值是引入概率论之后,彩票的真正价值,我们用期望值来表达。期望值的计算方法是这样的,假定该彩票一共有1000万种号码组合,其中只有一种会中奖,每张彩票售价1美元,奖池累计资金为600万美元。 那么,该彩票兑奖一千万次,其中有九百九十九万九千九百九十九次的结果毫无价值,其中有1次的价值是600万美元。彩票的期望值为该结果的概率与该结果所对应的彩票价值相乘。也就是说你花了1美元,购买了价值0.6美元的商品。用1美元,购买60美分的商品,当然是不明智的,彩票的发行方是稳赚不赔的,发行量越大,发行方赚得越多。但是根据期望值的计算,这表述并不周全,因为有可能存在期望值大于购买值的彩票。
比如,2004年秋天,麻省决心振兴该州的彩票业,于是他们想出了一个主意,设计了一款新彩票。这款彩票不仅增加了很多小奖项,而且为了刺激销售,还规定如果一周之内没有人领走大奖,并且大奖基金超过200万美元的时候,奖金就会向下分配,增加容易赢取的奖项的金额。这种机制导致彩票期望值极速增长,高达5.53美元,而每一张彩票才卖2美元。
首先发现这个空子的是麻省理工的学生们,他们组团购买了1000张彩票,获得了三倍的收获。接着一个退休的数学教师也成立了多达70人的亲友团,一次购买了6万张彩票,获得超过5万美元的收入。还有东北大学的张英博士,他收益更多,以至于在2006年的时候,张博士干脆放弃了医学研究,全身心地投入到博彩活动中来。
彩票是赌博,可是它是否能给你带来巨大收益,除了小概率的运气之外,还有数学公式支持的期望值。2012年的时候,麻省彩票中心终于明白了这件事,取消了这款彩票,可是,在这七年的时间里,麻省理工的学生团队共获利超过350万美元。
数学可以让我们更好地思考:它可以磨练我们的直觉,让我们的判断更敏锐,它还可以驯服不确定性,让我们更深入地了解世界的结构和逻辑。拥有了数学工具,我们就可以把那些我们想当然的事情看得更透彻,从而做出正确的决策。