这类华而不实的比赛大概是非常有美国特色的了:奖励1万美元的半场投篮,奖励3万美元的掷骰子,奖励100万美元的一杆进洞。当商家
推出这样的促销噱头时,风险是微乎其微的。
也许有人会赢。
但事实证明,这样的市场就是最理想的卖保险情况。作为概率商人,保险公司的偿付能力依赖于精确的计算:在发生概率为 的事件中,
50比1的支付比率就能使他们保持盈利;而在发生概率为 的事件中,100比1的支付比率会让他们破产。对于家庭、生命和健康保险来说,保
险精算的复杂性相当高,保险公司很容易计算错误。
但上述奖金呢,就完全没问题了!
还是以一杆进洞为例。业余高尔夫球手大约在每12 500次尝试中才能成功1次,所以当奖金是1万美元时,组织比赛的公司在球手的每次参
赛上平均花费0.8美元。某公司向球手收取参赛费2.81美元/次,获得了可观的利润。这家公司同时还为100万美元的一杆进洞奖购买了300美元的
保险12,这对双方来说都是一笔不错的交易:该公司的风险被分担,而保险公司的预期价值成本仅为80美元。
这家公司还为NBA球迷的1.6万美元半场投篮奖金购买了800美元的保险。除非球迷获胜的概率超过 (相当于NBA球员在比赛中的水
准),否则对于投保公司和保险公司来说依然是一笔划算的交易。也可以看看哈雷戴维森公司(Harley-Davidson)的例子,如果顾客能掷出6个
字母骰子,正好拼出“H-A-R-L-E-Y”,就能得到3万美元的奖金,而这家公司为这3万美元购买了保险。每个参赛者的期望值仅为0.64美元,而公
司向他们每人收取1.5美元。这比其他的保险精算简单多了。
但这种保险也不是毫无风险的。2007年,波士顿地区的零售商乔丹家具进行了一场很有吸引力的促销活动:如果红袜队能在10月举行的世
界职业棒球大赛蝉联冠军,那么顾客在4月或5月购买任何沙发、桌子、床或床垫的钱将全额退还。在这个活动中,销售量接近3万件,销售额
约为2 000万美元。13
最终,红袜队真的赢了。在乔丹家具工作的红袜球迷也兴奋不已,毕竟他们买了保险。
而保险公司的人呢?当然不高兴了。
8. “婚礼变心”险
现在请和我一起做个心理试验。一个陌生人递给你一枚硬币,你抛出它后隐瞒了结果,请问正面的概率是多少?
• 路人甲:“我不知道……50%?”
• 那个给你硬币并知道它被动过手脚,可能会偏向正面的人:“70%!”
• 偷偷看过了一眼结果的你:“100%。”
大家说得都没错。不确定性是对知识的一种度量,每个人都对自己已知的信息给出了合理的考量和分析。事实上,每一种可能性都应该加
上一个脚注:“就我所知。”
这种动态的不确定性可能成为保险公司的噩梦。如果他们是随机的路人,而买保险的人却偷偷看了一眼硬币呢?
Wedsure婚礼保险公司为各种各样的婚礼失败提供保险14:损坏的新娘礼服、被盗的礼物、未到场的摄影师、集体食物中毒等。但他们最吸
引人眼球的保险方案也是出现问题最多的:“婚礼变心”险。
1998年,一位记者问这家公司的老板罗布·纽克西奥(Rob Nuccio),是否考虑为因后悔而取消的婚礼提供保险方案。对方笑答:“这太容
易让我们被结婚的双方骗保了,如果你心里存在这个问题,那就不要结婚。”然而,2007年他改变了主意,提供了这样的保险:在至少提前120
天通知的情况下,向第三方(而非夫妇本人)提供保险赔付。15但纽克西奥说:“一个问题出现了,新娘的母亲向我们提出索赔要求,但她事先
就知道她的女儿不宜结婚。”不用说,每个母亲都比保险公司更了解自己女儿的心事,她们偷看了那枚硬币。这件事发生后,纽克西奥将时间
范围的要求扩大到180天,后来又增加到270天,最后定为365天。
这是保险公司最常遇到的核心问题,购买保险的人通常知道保险公司无法知道的细节。对此,保险公司有五种可能的解决方案:
1. 将利润率设置为高于正常水平。
2. 采取详细的应用规程弥补双方对细节了解的差异。
3. 同时提供便宜的低覆盖选项和昂贵的高覆盖选项,高风险人群自然会被后者吸引。
4. 比客户更了解所投保的风险。16
5. 停止为这种风险投保。
9. “保险公司”险
和投保人的信息不对称让保险公司感到担心,但还不至于让他们夜半惊醒。保险公司真正的噩梦其实是:依赖。
再回想一下中国商人,他们把商品分散在一百艘船上。但是如果沉船事故不是一个个地发生,而是一起发生呢?如果99%的日子里没有船
沉,而在1%的日子里所有的船都沉了呢?那么保险就失去作用了,我们面临的个人风险无法通过再分配而减轻。每个人都拿着一张糟糕透顶的
彩票去交换另一张同样糟糕的彩票。命运碎片的交换变得毫无用处,当我们倒下的时候,大家都会一起倒下。
这是依赖。对保险公司来说,这是万劫不复的深渊。例如,卡特里娜飓风一次造成了410亿美元的损失,远远超过当年约20亿美元的保险
费。在这种情况下,所有鸡蛋都放在一个大篮子里,保险公司面临的风险和被保险人是相同的。
解决这一问题的办法是继续扩大交换命运的规模:保险公司也购买保险,这就叫作“再保险”17。来自不同地区的保险公司看上去是在交易
资产,实际是在交换客户,这样使一个地方的公司可以建立起一个分散的风险投资组合。
因此,如果你的财富分散到一百条船上还不足以对抗风险的话,试试将它们分散到一百条河上。
10. “大学橄榄球运动员退步”险
再来一次角色扮演吧:你是一个大学的橄榄球明星,球迷在赤裸的胸膛涂上你们球队的颜色,你拥有的技能价值数百万美元。但你并不能
一次得到自己所价值的报酬,而且你随时可能因为受伤而开始走下坡路。这就像你的身体是一张中了头奖的彩票,但你却不能马上把它兑换成
现金,要把它扔进洗衣机里洗几次,还得祈祷彩票上的中奖号码不要褪色。
孩子,你打算怎么办呢?
你可以为让你结束职业生涯的伤病投保18,但这还不够。如果伤病只是阻碍了你的职业生涯,却没有结束它呢?如果它使你错过首轮选秀
(签700万美元合约),成为第六轮选秀的球员(签100万美元合约)呢,你该怎么办?超过80%的薪酬会化为乌有,而由于你的职业生涯还没
结束,前期支出的昂贵保险费(每100万美元的保险费用是1万美元)也毫无用处。
这就是顶级球员开始购买“身价降低”保险的原因。19尽管它并不便宜,赔付金每增加100万美元,保险费将增加4 000美元。但考虑到高价值
的前景,这是非常值得的,比如橄榄球角卫伊夫·埃克普-奥洛姆(Ifo Ekpre-Olomu)和近端锋杰克·布特(Jake Butt)20都得到了赔偿。毫无疑
问,以后还会有更多球员通过这一保险得到赔付金。
11. 健康险
我把最特别的保险产品留到最后:健康保险21。
这有什么特别的呢?首先在于它的复杂性。免赔额、保险范围限制、既有病症、自费比例、可变保费……尽管它不像脑外科手术那么复
杂,却事关脑外科手术的资金来源,因此同样令人如履薄冰。其次,随着医疗水平和对健康预测能力的提高,医疗保险能否继续发挥作用,本
身就是一个令人头疼的问题。
看看这个简单的医疗保健模型:假设我们每人抛10枚硬币。如果你得到的结果是10个都正面朝上,那么你就患上了可怕的“10个正面病”,
这种病将需要50万美元的医药费。
每个人患上重病的概率约是千分之一,但如果每人都拿出800美元来买保险,问题就解决了。对保险公司来说,这就意味着在每1 000人
中可以收取80万美元,但只需要支付50万美元。保险公司从中获利,而我们通过购买保险实现风险对冲,可以有效地防止个人破产。这是个双
赢的局面。
但是,如果我们知道了更多关于健康的信息呢?如果在决定是否购买保险计划之前,我们可以先看一下前5枚硬币,会得到怎样的结果
呢?
现在,每1 000人中大约有970人至少看到了1个反面朝上,他们松了一口气:安全了,没有购买保险的必要。但是剩下的30个人紧张了起
来,他们其中有一个人可能患有可怕的疾病,这30人预计总共将支出50万美元。即使重新平均分配成本,每人仍要承担上万美元的损失。这样
的保险不再能够提供任何安心了。
当我们看到前面5枚硬币时,我们的不确定性降低了,而不确定性降低到一定程度时,保险就会崩溃。如果我们事先知道谁会遭受损失
——谁的船会沉没,谁的员工会中彩票,谁会受伤、最终无法进入全美橄榄球联盟(NFL)——那么保险就不会存在了。因为只有真正会遭遇
损失的人愿意一起分担风险。
在现代医疗系统中,这样的问题正在逐年显现,基因检测和统计学的发展正在威胁着保险的基本逻辑。
针对这个问题,我想不到行之有效的对策。如果将保险费根据不同客户的患病概率进行个性化设置,那么有些人只需支付几分钱,而另一
些人的保费几乎与医疗费用一样高,但如果向每个人收取同样的费用,就将原本用于对冲个人风险的互惠项目变成了补贴特定人群的集体慈善
项目,这很难让投保人接受。这也是美国的医疗保健制度仍然存在这么大争议的原因之一。
作为一名教师,我倾向于认为所有的知识都是一份礼物。但保险让情况变得复杂起来。对命运的无知会迫使人们互相合作、共同对抗命
运,我们就是这样在不确定性中建立了民主制度的,而现在,新的知识和信息如洪水猛兽般威胁和冲击着这种平衡。
第15章
如何用一枚骰子击溃全球经济?
1. 见鬼的招聘会
2008年9月,对我来说,可以到处蹭吃免费比萨饼的大学生活到了最后一年。我多少还是知道大学毕业后,只有有了工作和薪水才能买到
比萨饼的,于是决定参加一年一度的招聘会。在往年的招聘会上,学校的体育馆里总会摆满雇主的摊位,并提供免费赠品(这个比较吸引人)
和工作的申请机会。
然而,当我到达招聘会现场时,我的眼前是一个空荡荡的体育馆,就像一个鬼城。投资银行突然一致认为,现在或许不是招聘的好时机。
而且仍未重启成功。华尔街上演着莎士比亚悲剧的最后一幕:拥有百年历史的金融机构蒙上了尘埃,剑插在其中,发出喘息的死亡独白。
记者们的报道充斥着诸如“最糟糕”“衰退”“自大萧条以来”这类的字眼,就连比萨饼皮都沾染了焦虑的气息。
在这一章中,我们将进入关于概率的最后一课,这可能是最难的一课。许多想成为概率学家的人都喜欢“独立”这个诱人的概念,把我们的
世界想象成独立事件的集合。但如果概率要面对世界的不确定性,它就必须面对世界的互联性:包括这个世界的叙事线索和因果链。
举一个简单的例子:掷两个骰子后得到的两个数字之和,与掷一个骰子再将数字翻倍有什么区别?
在这两种情况下,最后得到的数字都是最小为2(两个1),最大为12(两个6)。
对于两个独立的骰子,极值只能以少数的几种方式展开(例如,只有两种组合能得到3),而中间值可以以多种方式展开(例如,有6种不
同的组合可以得到7)。因此,中间值更有可能出现。
那么,如果只投掷一个骰子再将数字翻倍会怎样呢?现在,“第二轮”翻倍得到的数字完全取决于第一轮投掷的数字,我们眼前是伪装成两
个事件的单个事件,极值出现的概率和中间值出现的概率是一样的。
两种投掷方式的差别显而易见,独立事件突出了极值的特别性,而非独立事件则放大了极值的概率。
再进一步来看,我们把骰子的数量从2个增加到100万个。现在,结果的范围变成了从最小的100万(所有骰子都掷出“1”)到最大的600万
(所有骰子都掷出“6”)。
如果每个骰子掷出的结果都独立于其他999 999个骰子,会怎样呢?我们会发现自己处于长期稳定趋势的世界中,兴奋的6和失望的1出现的
比例相等。此外,所有骰子的总和极有可能正好落在中间,而不是两个极端。更确切地说,有99.999 999 5%的概率落在349万到351万之间,但
几乎不可能得到最小值100万,这个概率小于“天文数字”分之一。
但是,如果我们不是掷100万个骰子呢?如果我们只掷一个骰子,然后将它的值乘以100万,结果会怎样?由于第二个步骤完全依赖于第一
个步骤,无法提供任何概率的平衡,我们还是会得到随机的结果。在这个方案中,得到最小值100万就不是“猪会飞”的荒谬命题了,得到100万
的概率高达六分之一。
保险、多样化投资组合和篮子里鸡蛋的配置都依赖于同一个基本原则:通过组合事件来克服风险。只买一只股票是一场赌博,将多只股票
组合起来,就得到了一项投资。
但这一切都取决于独立性。如果把鸡蛋分散在几个篮子里,却把篮子捆在一起,再装到同一辆小货车上,这样的组合就毫无意义了。现实
世界中的事件是互相关联的,是无数个反馈回路和多米诺骨牌的集合,因此存在很多极值。在这个世界上,招聘会要么像节日,要么像葬礼,
二者之间几乎没有交集;所有银行要么一起蓬勃发展,要么一起突然倒闭。
2. 万物皆有价
快问快答:华尔街银行的基本业务是什么?1
A. 通过资本的智能配置推动世界经济发展
B. 用从工人阶级口袋里抢来的血汗钱购买意大利西装
C. 为商品定价
如果你的答案是A,那么你应该是在华尔街工作。(嘿,这西服不错!是在意大利买的吗?)如果你的答案是B,那么我很荣幸你在读我的
书,桑德斯参议员(7)。如果你的答案是C,那么你已经对本章的关键主题很熟悉了:金融部门的基本功能是决定事物的价值,这些事物包括股
票、债券、期货、网页制作公司的合同、标准巴黎障碍期权、信用违约互换等。无论是要购买、销售,还是在网上搜索这些东西是不是我编造
的,你都想知道这些东西的价值,毕竟你的生计就靠它了。
当然,问题在于定价并不容易。
以债券为例。债券就是承诺会把钱偿还给你的债务。假设某人借钱买房,并承诺在五年内偿还10万美元。
那么,这张欠条对你来说值多少钱?
好吧,我们从第一项定价挑战开始:为时间定价。在金融行业“把握当下”的逻辑中,今天的1美元比明天的1美元更有价值。原因有二,首
先是通货膨胀(会逐渐降低1美元的价值),其次是机会成本(如果明智地投资了1美元,下一年就会升值)。粗略估算,今天的1美元相当于
明年的1.07美元。再继续计算下去,一年年累计相乘,你就会发现今天的1美元相当于5年后的1.40美元。
因此,在5年后只能拿回10万美元听起来并不太诱人,因为5年后的10万美元就相当于今天的7.1万美元。
这就是债券的真实价格吗?我们的分析是不是到这里就可以结束了,就此摆脱那些讨厌的华尔街气息对我们的影响?唉,才刚开始呢。我
们还必须为风险定价:谁欠我们的债,我们能指望他们吗?如果欠债的是一个信用记录完美的双职工中产家庭,那我们还有机会。但是,如果
我们的债务人是一个游手好闲的人,比如说,一个对比萨上瘾的刚毕业的大学生,他的爱好是画很糟糕的画,那么我们的债券可能会变得一文
不值。
我们该如何调整价格?
非常简单:根据期望值。如果借出的钱有90%的概率得到偿还,那么债券的价值就是原来的90%。
定价的过程还没结束。违约与否,不是非黑即白的,并不意味着债务人要么全部偿还,要么什么也不偿还。在现实中,法院和律师会进行
干预,敲定一项协议,让债权人获得欠款的一部分,可能是1美元中的几美分,或者是接近全部。这样,我们的债券就像一张高风险的彩票,
你要怎么给这么多品种的产品定价呢?
还是要根据期望值,在有理有据地估测2可能会得到的回报比例后,我们可以想象购买数百万这样的债券,再计算所有这些债券的长期平均
值,而不是一味猜测这种债券不得而知的价格。
现在我们得出结果了,债券的定价应该为50 000美元。
在华尔街,给商品定价是基本的日常工作,对金融机构的生存至关重要。然而,数十年来,银行觉得有把握轻松评估的商品基本上只有股
票(公司的一部分)和债券(债务的一部分)。各种“衍生品”是不包括在内的,这些“衍生品”既不是股票也不是债券,而是这二者的变种后
代。它们游走在金融业的边缘,就像一个坐落在体面银行旁边的小赌场。
20世纪70年代,翻天覆地的变化发生了:定量分析(quantitative analysis)。借助数学建模的力量,数量分析专家们找到了为衍生品定价的
方法——即便是那些和苏斯博士(Dr. Seuss)(8)一样古怪的衍生品。其中最复杂的是CDO——担保债务凭证3。
虽然它们的种类有很多,但最常见的组成结构是这样的:
1. 将数千份抵押贷款(就像我们之前定价的那份一样)打包成一份。
2. 将这些组合分成几层(称为“部分”),从“低风险”到“高风险”不等。
3. 当获得大量利息时,低风险部分的所有者首先得到利息,高风险部分的所有者最后得到利息。
担保债务凭证提供了一份风险和回报的组合菜单,这份菜单可以提供任何口味。你愿意为一个安全的保障额外付出一些代价吗?尝尝美味
的最上层吧。想寻找更便宜、风险更高的方案?那就试试最下面这一层的辛辣口味,你会喜欢的。或者,你希望风险和回报介于两者之间?好
的,我和主厨说一下,他会准备好的。
投资者们咂巴着嘴,敲着桌子,想了解更多的菜式……直到2008年9月,他们收到了账单。
3. 房子的问题
让我们回到1936年,当时超现实主义画家勒内·马格利特画了一系列名为《房子的问题》的作品4。这些草图展示了一些位于特殊地点的房
屋:架在树枝上,藏在悬崖的洞穴里,建在巨大的沟壑里。在我最喜欢的一幅画中,一所看起来很普通的房子矗立在空旷的平原上,它的两个
邻居是一对巨大的骰子。
(不要被我的艺术才能骗了;这是一份近乎完美的临摹作品,不是原作)
马格利特的这幅画是什么意思呢?这可是那个曾经画过一只鸟抓住女士的鞋子,并把它命名为《上帝不是圣人》(God Is No Saint)的男
人,我认为他是在挑战人们把家视为安全象征的想法。我没有故意吓你,但房子是一种危险和不稳定的东西,存在着风险。房子可能是你一生
中最大的投资,价格相当于你年薪的好几倍,让你欠下了一辈子的债务。这所房子不是稳定的象征,而是可能性的象征。
在马格利特的视觉双关语出现的70年后,华尔街也面临着一个关于债券定价的小问题,问题是确定各种抵押贷款之间的关系。我说过,你
和我是独立的个体。如果我欠债不还,也许对你没有影响。然而另一方面,由于我们处在共同的经济形势下,都逃不过经济大衰退,正如我们
摆脱不了夏季流行歌曲一样。所以,如果我欠债不还,就意味着你可能也有危险。用华尔街的话来说,问题在于这样欠债不仅是一种特殊风
险,还是一种系统性风险5。
我们的房子是成千上万个独立的骰子吗?还是它们就是同一个骰子,只是上面的数字被两面相对的镜子反射了几千次?
想象一下,有一个债券(按现实世界的标准来看很小)是根据我们此前讨论的1 000种抵押贷款构建的。因为单价为5万美元,所以1 000种
抵押贷款的总价应该是5 000万美元。
现在,如果各项抵押贷款是独立的,华尔街的精英们就可以安心睡觉了。当然,我们的投资有可能比预期低100万美元,而损失200万美元
的可能性非常小,500万美元的损失则是几乎不可能的,其概率小于十亿分之一。如果这样的独立性是稳定的,就几乎消除了灾难性损失的可
能性。
而反过来想,如果所有房子都和某一次投掷骰子的结果相关联,那么华尔街的精英们就将浑身冷汗、夜夜噩梦了。不难想象,不久前的稳
定局面会在刹那间变得非常危险。在这笔交易中,我们的投资损失近一半的概率高达三分之一,而损失一切的概率达到了可怕的十分之一。
当然了,这两种假设都不太符合现实。我们的生活既不可能和别人始终同步,也不可能完全独立,连屋外的天气都和邻居不同。相反,我
们的生活介于两者之间,我们和其他人的未来微妙地交织在一起。很明显,当我们之中有人欠债不还时,其他人欠债不还的可能性会增加——
只是会增加多少?又是在什么条件下增加的呢?这些是概率模型可能面临的最微妙的挑战。
对此,华尔街提出的解决方案之一就是臭名昭著的“高斯连接函数”(Gaussian copula)6。这个函数衍生自人寿保险的计算公式,原本用于
校正一对夫妻中一方在另一方死亡后幸存的概率,用“房子”代替“配偶”,用“欠债不还”代替“死亡”,就得到了一个计算抵押贷款之间依赖关系
的模型。
这个函数公式用一个数字来表示两个抵押贷款之间的关系:-1和1之间的相关系数。
值得肯定的是,连接函数是一种巧妙、简单而优雅的数学方法。然而,全球经济却并不是这么简单的,通过事后分析,连接函数(以及类
似的方法)的缺陷显而易见。
首先,数据是片面的。华尔街的电脑里有的是各个城市的房价数据表,但大部分的数据都是最近同一时期的数据,碰巧在此期间房价稳步
上涨。而这些模型大大提升了华尔街精英的信心,仿佛他们已经完成了整个美国房地产历史的研究。事实上,他们看到的不过是同一个骰子掷
出的数字乘以100万后的结果罢了。
其次,这个函数模型原本是为夫妻建立的(因此英文为“copula”),但是房子和夫妻不同,并不是成对的,而是以松散的全国性市场的形
式存在。一个单一的变化,比如当飙升的房价跌至谷底,就可以同时影响到这个国家的每一笔抵押贷款。当所有房子的命运以若隐若现的巨型
多米诺骨牌的形式存在时,只担心一个多米诺骨牌会撞倒它旁边的邻居是非常愚蠢的。
最后,如果你对统计学词汇有些了解,就会特别警惕“高斯分布”(正态分布)这个术语。在数学中,当你把许多独立的事件相加时,这个
词就会出现,但这就是问题所在——这些事件不是独立的。
在以上所有方面,华尔街都忽视了马格利特所看到的风险,最终导致了一场这位画家从未料想过的超现实灾难。不过,我们还没讨论到这
个问题最糟糕的部分。尽管定价失误的债务抵押债券价值高达数万亿美元,造成了惨重的经济损失,但仍不足以解释2008年9月的金融危机。
究竟是什么导致了金融危机的全面爆发?致命的那一拳来自何处?这其实是一个范围更大的概率失败案例。
4. 要么加倍、要么归零的60万亿美元
如果你读过上一章,你就会知道为整个家庭的幸福和欢笑购买保险是有意义的。我不能承受失去房子的痛苦(否则比萨饼要送到哪
里?),所以我愿意每个月支付一点儿额外的费用,这样如果房子不幸被烧毁,我还可以得到一大笔钱。通过为房子投保,我消除了自己面临
的风险,保险公司实现了盈利,又是一个双赢的交易。
但是,我想到一个奇怪的漏洞:如果你给我的房子投保怎么办?
你可以按我说的试试,平时定期支付小额款项,当灾难发生时,就会为你带来一大笔意外之财。这复制了保险的金融结构,但和保险的目
的却不同,这只是一场赌博,一场非赢即输的零和游戏。如果我的房子被烧毁,就是你赢;如果我的房子安全,保险公司就会赢。更奇怪的
是,如果成千上万的人都这么做,每个人都为我的房子买保险,那么一旦我的房子被烧毁了,他们是不是都躺赢了呢?
如果真是这样,当我开始收到匿名的礼物时,比如便宜的鞭炮和手榴弹,我可能会惴惴不安。但在这种情况下,我不是唯一一个辗转反侧
的人:保险公司甚至比我更害怕。如果我的房子被烧毁了,他们就只能手捧灰烬,准备支付巨额的赔偿款。
这就是为什么没有保险公司会同意这种情况。95%的轻松获利机会无法抵消5%的彻底破产概率。
可惜没人向华尔街的精英们指出这一点。
对华尔街来说,厄运伴随着三个字母的首字母缩略词:CDS。它代表“信用违约互换”(credit default swap)7,大致上可以看作一种CDO的
保险方案。由客户定期支付适度的费用,只要CDO继续支付利息,就什么都不会发生,但当抵押贷款违约达到一定数量时,CDS就意味着一笔
巨额的支出。
到目前为止,一切都很合理。但猜猜华尔街接下来都做了些什么?他们为每一个CDO都出售了数十个CDS。这和用同一栋房子卖了几十份
保单几乎没有区别,当然,上面的金额要比房子的保单大得多。到2008年年初,这一数字已经达到60万亿美元,大概相当于全球的生产总值。
现在我们来快速回顾一下,CDO原本设计的目的是实现100万个骰子投掷结果的稳定性,而实际上,它们却体现了单个骰子投掷结果的脆
弱性。CDS不断地翻倍,直到这场赌博的规模大到足以危及整个世界经济。这一切自然引发了一个问题:
华尔街的精英怎么会这么愚蠢呢?8
你从最顶尖的大学里招聘到最优秀的人才,为他们购买价值百万美元的超级计算机,给他们支付丰厚的薪水,让他们每周工作90个小
时……可是当你走进办公室时,却发现他们在一边尖叫,一边把叉子塞进墙上的插座里?
我希望我能将这些“独立VS非独立”的错误当作一次性的异常情况,只属于CDO和CDS的特殊情况。但天不遂人愿,事态是非常严峻的,这
种错误一直延伸到金融市场的核心。
5. 我们都将化作灰烬
冒着被称为新自由主义的“托儿”的风险,我要阐述自己的信念:市场经济是一种非常好的经济体制。我还要再说得更进一步:它的运行和
调控真的很有效。
比方说,这个星球上恰好有一种叫作“苹果”的美味水果。我们应该如何分配它们?如果农民种的苹果比消费者想要的多,我们会发现成堆
的美味苹果腐烂在街头。如果消费者想要的苹果比农民种的多,我们就会看到陌生人为了抢到最后一个苹果打得不可开交。然而,尽管困难重
重,我们还是设法种出了适量的苹果。
这其中有什么诀窍吗?诀窍就是价格。虽然我们认为价格决定了我们的行为(“太贵了,所以我不会买”),但事实正好相反,我们每个人
的选择都会对价格产生微小的影响。如果有足够多的人拒绝购买,价格就会下降;如果有足够多的人拒绝出售,价格就会上涨。价格是我们所
有独立判断和决定的总和。
因此,与其他独立事件的总和一样,价格往往会产生平衡、稳定、合理的结果。亚里士多德称之为“群体的智慧”9,亚当·斯密称之为“看不
见的手”,我把它叫作“独立的骰子又来了,但是这次,骰子是我们自己”。
理论上,市场既然对苹果有用,对CDO也应该有用。有些人会高估它们的价值,而另一些人会低估它们的价值。但最终,一个充斥着独立
投资者的市场将推动价格走向稳定的均衡状态。
但还有一个问题:绝大多数时候,投资者的行为往往不像数百万个独立的骰子,而更像是一个骰子乘以数百万倍。
以1987年的股市崩盘为例。10当年10月19日,房价暴跌,跌幅超过20%。这一切来得毫无预兆:没有撼动市场的新闻,没有引人注目的破
产,美联储主席也没有发表:“噢,天哪,我现在有点儿慌”……市场就这样崩溃了。直到后来进行了复盘分析,人们才发现一个特殊的触发因
素:许多华尔街公司都依赖于同样的投资组合管理基本理论,许多人甚至使用的是相同的软件。当市场下滑时,他们不约而同地出售了同样的
资产,导致价格不断下跌,形成了恶性循环。
投资组合管理的全部目的就是通过多样化带来安全,但如果每个人都以完全相同的方式进行多样化,那么最终的市场就不能实现多样化。
如果投资者是自己独立判断价格的,那么每日的价格变化应该遵循钟形正态分布:有时候涨一点儿,有时候跌一点儿,但几乎不会涨得太
快或太远。唉,但事实却不是如此。市场的波动大多遵循幂律分布,伴随着偶尔的大幅下跌。在遭遇地震、恐怖袭击以及高度敏感系统被严重
破坏时,我们也会使用这一数学模型。
市场的变化并不像许多骰子的数字相加那样随机,而是像雪崩一样随机。
在2008年金融危机之前,许多银行都依赖于为数不多的几种模型(如高斯连接函数模型)。他们没有新的见解,而是围绕着一个单一的策
略。甚至连评级机构——其目的和职责是提供独立分析——也只是照搬银行本身的说法,也没有独立意见。就这样,裁判成了啦啦队队长。
那么,回到2008年9月,为什么我到达在体育馆举办的招聘会时,却发现昏暗的体育馆只有一半的摊位有人?换句话来说,为什么金融体
系会崩溃?
好吧,这是相当复杂的。正如在大多数失败案例中一样,无能是失败的原因之一(只要来我烤面包的现场看看就知道了),但错误的激
励、盲目的乐观、赤裸裸的贪婪、令人眼花缭乱的复杂性、政府功能失调和利率也都是原因。这个简短的章节只讲述了故事的一小部分,围绕
着一个特定的主题:进行独立假设的危险性在于,有时候非独立性才是真正占据主导地位的。
当非独立性占据了主导地位时,抵押贷款都一起违约,全部的CDS都要同时赔付,市场中的参与者围绕着类似的定价策略共同行动。
你想用一对骰子摧毁经济吗?说实话,这很简单。只要骗自己,你投掷的是一百万对骰子,然后把你的财富全部押在这对骰子上。
第四部分 统计学:诚实说谎的艺术
曾经有一项针对医学专业人士的调查1,要求调查对象将临床诊断法与统计方法进行对比,以下是他们用来形容这两种不同方法的词语:
临床诊断法的特点包括……
统计方法的特点包括……
请允许我代表世界各地的统计学家说一句——扎心了。
我承认,整个统计学项目具有某种还原性,会把野性的、不可预测的世界驯服成温顺的一行行数字。因此,以怀疑和谨慎的态度对待所有
统计数据是非常重要的。从本质上来说,统计数据是对现实的压缩、截取、提炼和简化。
当然,这确实就是他们力量的来源。
为什么科学论文有摘要?为什么新闻有标题?为什么动作片的预告片会把所有精彩和最炸裂的镜头都剪辑出来?因为简化在生活中是非常
重要的,没人有时间整天欣赏现实璀璨的千变万化。因为我们还有很多地方要去,还有很多文章要浏览,还有很多视频要看。我不会为了7月
要去一个新城市就去找一本专门描写湿热气候的小说来读,而是会查一下当地温度。这样的统计数据并不是“生动的”“深刻的”或“结构性
的”(我也不明白这个词是什么意思),但它简单、明了、有用。通过浓缩和简化世界的信息,统计学给了我们一个把握全世界的机会。
然而,统计学还可以做更多的事。统计还会对信息进行分类、推断和预测,使我们能够建立起强大的现实模型。没错,整个过程的关键是
简化,简化意味着省略细节,进而意味着和现实有出入——也可以算是一种谎言。但在最好的情况下,统计数据是一种诚实的谎言,这需要人
类思维中所有美好的品质,包括好奇心和同理心。
这样的话,统计数据和简笔画就差不多了,它们都是对现实拙劣的描绘,也许缺鼻子少眼睛,但它们都在以自己独特的方式讲述着事实。
第16章
为什么不要相信统计数据
以及为什么还是要用它们
好的,让我们一起来解决这两个问题。历史上的顶级智士都说过,统计数据是不可信的谎言,不是吗?
我在网上搜索到的名言 通过更深入的搜索,我发现的真相
“谎言有三种:谎言、该死的谎言和统计数据。”——马克·吐温 人们常常误以为这句名言出自马克·吐温,这也挺公平的,因为马克·吐温自己也误以为这句话出自本杰明·迪斯雷
利。实际上,这句话的出处是未知的。
“任何不是你自己捏造的数据,都别相信。” (或者:“我只相信那些 这是对丘吉尔的诽谤,它可能出自纳粹宣传部长约瑟夫·戈培尔。
我篡改过的数据。”)——温斯顿·丘吉尔
“87%的统计数据是当场编造的。” “87%的名言是当场被误传的。”——奥斯卡·王尔德
“统计数据有两种,一种是你查阅的数据,另一种是你编造的数 雷克斯·斯托特是一位小说家。他没这么说过,是他笔下的一个角色说的。
据。”——雷克斯·斯托特
“统计数据之于政客,就像路灯之于醉汉——用来支撑自己而不是照明 这个是真的,而且说得很好。
方向。”——安德鲁·朗格
“总有一天,统计思维将和读写能力一样成为公民必需的能力。”——赫 唉,就连统计专业数据中也有这种误用的问题。实际上,威尔斯说的是“可以想见有那么一天,计算的能力,考虑
伯特·乔治·威尔斯 平均值、最大值和最小值的能力会变得和读写能力一样必需。”
所以,我要说的是什么?是的,数字会骗人。但是文字也可以,更不用说图片、手势、嘻哈音乐剧和筹款邮件了。我们的道德体系谴责的
是说谎者,而不是他们为谎言选择的媒介。
对我来说,对统计学最有趣的批评不是针对统计学家的不诚实,而是针对数学本身。我们可以通过了解统计数据的缺陷,通过观察每个统
计数据捕捉的对象以及故意忽略的对象来提高统计数据的价值。也许到那时,我们就能成为赫伯特·乔治·威尔斯所设想的那种公民。1
1. 平均数
计算方法:把所有的数据相加后,再除以数据的个数。
适用范围:平均数(又称为“均值”)满足了统计学的一个基本需求——捕捉一个群体的“集中趋势”。那个篮球队的队员有多高?你们一天
卖多少个甜筒冰激凌?这个班考得怎么样?如果你试图用一个单一值来概括整个总体,那么平均数是明智的第一选择。
不可信之处:平均值只考虑两条信息,总数和为总数做贡献的人数。
如果你参与过一批海盗宝藏的分配,那么你就会发现其中的陷阱:分享这些宝藏的方法可以有很多。每个人该分配多少?是平均分配还是
有侧重地分配?如果我吃了一整张比萨饼,却什么都没给你留下,但我们“平均”每人吃了半张比萨饼,这样公平吗?或者,你可以在晚宴上和
客人们说,每个人“平均”都有一个卵巢和一个睾丸,这不会让谈话陷入尴尬的境地吗?(我试过,会的。)
人类关心分配方式,平均值却对此毫不在意。
不过呢,平均数倒是有一个可取之处,就是容易计算。假设你三次考试的成绩分别是87、88和96(是的,你前两次考得不够好)。那么考
试的平均分是多少呢?不要过分纠结于加法和除法,只要重新分配就可以了。从最近的一次考试分数中拿出6分,分3分给第一次考试,分2分
给第二次考试,这样三次考试的分数就是90、90、90,还剩下1分,将这孤独的1分拆分成三份再分配到三次考试中,就得出了你的平均分:90
,是不是很容易呢?
2. 中位数
计算方法:把所有数据从高到低排序后,找出中间的一个作为中位数,数据的一半在中位数以下,一半在中位数以上。
适用范围:和平均值一样,中位数也能体现总体数据的集中趋势,而二者的不同之处在于,中位数对极端值的灵敏度很差,或者更确切地
说,它完全不灵敏。
就拿家庭收入来说,在美国,富裕家庭的收入可能是贫穷家庭的数十倍(甚至数百倍)。平均值是假设每个家庭在总收入中有平等的份
额,极端值会拉扯这个平均份额,让平均值偏离多数数据的值。美国家庭收入的平均值是75 000美元。2
而中位数会抵抗极端值的拉力,不受极端值的影响。相反,它体现出的是在美国绝对的中等家庭收入,这是一个完美的中点,有一半的家
庭比这更富裕,而另一半家庭比这更贫穷。美国家庭收入的中位数接近58 000美元,这比平均值更能体现 “典型”美国家庭的收入水平。
不可信之处:一旦找到了中位数,你就知道有一半的数据在其上,另一半数据在其下。但是这些点离中位数有多远呢?如果你只盯着一张
饼的中心,而不管其他部分有多大或多小,就无法了解这张饼的真实情况。
一位风险投资家投资新企业时,她预计大多数企业都会失败,但十分之一的企业会赚得盆满钵满,这完全能弥补失败的企业带来的微小损
失。然而,中位数忽略了这种动态的变化,只盯着中间的“典型”数据,它大喊:“创业的典型结果是失败,快停止投资吧!”
与此同时,一家保险公司建立了一个谨慎的投资组合,其中发生概率为千分之一的罕见灾难带来的损失可能会远高于多年积累的微薄利
润。但中位数会忽略潜在的危险,它在欢呼:“嘿,保险的典型结果是不会发生危险,我们会获得利润,这个方案永远不要停!”
因此,你会发现统计报告中常常既有中位数,又有平均值。中位数体现的是数据中的典型数值,而平均数展示整体的水平。中位数和平均
值就像两个不完美的目击者,他们共同讲述的故事会比单独讲述的故事更完整,而且更接近事实。
3. 众数
计算方法:众数是统计数据中重复次数最多的数值,代表数据中的潮流。
但如果每个值都是唯一的,没有重复呢?在这种情况下,可以将数据分类,并将最常见的类别称为“众数组”。
适用范围:众数在民意调查和制作非数字类型数据表的方面优势明显。如果你想总结人们最喜欢的颜色,就不可能用“合计颜色”来计算平
均值。或者假设你在主持一场竞选,如果你把选票按照从“最自由的”到“最保守的”排序,然后让处在最中间的候选人当选,公民会抓狂的。
不可信之处:中位数忽略了整体性,平均数忽略了分配方式,而众数则把整体性和分配方式都忽略了,应该说,它几乎忽略了其他全部信
息。
众数代表的是一组数据中出现次数最多的值,但出现次数最多并不意味着最有代表性。比如说,美国的工资众数是0——不是因为大多数
美国人破产或失业,而是因为工薪阶层的收入从1美元到1亿美元之间,数字是分散的。而所有没有工资的人收入都是相同的数字——0。因
此,这一数据不能说明任何问题。事实上,在每个国家的工资众数都是0。
将数据分类后,使用“众数组”并不能完全解决这一问题,只是给了展示数据的人一手遮天的权力,他们可以根据自己的想法划分类别边
界。通过不同的划分方式,他们可以把美国家庭收入的众数组“设定”为1万至2万美元(每1万美元为一个类别),或2万至4万美元(每2万美元
为一个类别),或3.8万至9.2万美元(每个纳税等级为一个类别)。
尽管用的是完全相同的一组数据集和完全相同的统计数据,但由于画家对画框的选择不同,画像完全变了。
4. 百分位数
计算方法:中位数将一组数据一分为二,而百分位数是一个有调光开关的中位数。第50个百分位数就是中位数本身(一半的数据在其上,
一半的数据在其下)。
但你也可以选择其他的百分位数。比如,第90个百分位数位于这组数据的顶部:只有10%的数据位于其上,而90%的数据位于其下。与此
同时,第3个百分位数位于数据集的底部:只有3%的数据低于这个值,而97%的数据高于这个值。
适用范围:百分位数是非常灵活和方便的,非常适合在排序中使用。这就是为什么标准化考试通常以百分位数的形式给出分数。类似“我
答对了72%的问题”这样的原始分数提供的信息是不够的,因为这些题目的难度是未知的。然而,如果你说“我在第80百分位”就体现了你的水
平:你考得比80%的考生好,比20%的考生差。
不可信之处:百分位数和中位数的缺点是一样的,它们可以告诉你有多少数据位于某个点的上方或下方,但不会告诉你这些数据的距离有
多远。
在金融行业中,百分位数常用于衡量投资的风险。人们将可能的结果从赢利到亏损进行排序,然后选择一个百分位(通常是第5个),将
其定义为“风险值”(VaR,value at risk)。设定VaR的目的是了解最坏的情况,但实际上,还有5%的可能会比这更糟。而VaR却不能让人看
出“更糟”的程度,我们仍然不知道最糟的情况是再多损失几分钱,还是数十亿美元。
通过观察更多作为VaR的百分位数(例如,第3、第1或第0.1个百分位数),我们可以更好地看到各种可能性,但从本质上来讲,百分位数
无法体现最剧烈和极端的损失。因此,真正最糟的情况总是在百分位数的盲区。
5. 变化百分比
计算方法:用变化除以原来的总数。
适用范围:变化百分比有利于我们正确地结合整体看待事物,它用在整体中的占比表现收益和损失。
想象一下,我今天赚到了100美元。如果我最初只有200美元,那么这笔收入就意味着我的财富迎来了50%的增长,非常值得我跳夏威夷草
裙舞庆祝了。但如果我本来就有2万美元,那么这笔新收入就只是0.5%的增长,我大概只会微笑着挥挥手,并没有太多的兴奋。
当你看到一个增长的百分比时,学会结合整体看待事物是至关重要的。如果70年前的美国人听说美国去年的GDP增长了5 000亿美元,他
们会惊叹不已,但如果是听说它增长了3%,就会觉得没什么了不起的了。
不可信之处:嘿,我常以发展的眼光看事情,但对于变化百分比而言,尽管它在努力地展现发展的趋势,但很多时候其实并无作用。
我住在英国的时候,有时候只要1英镑就能买到原价2英镑的番茄酱3。那种感觉就像中了头彩:节省了50%!我拖着一打番茄酱回家,足够
蘸几个月的意大利饺了。后来,我要买机票去美国参加婚礼,因为晚了一周购买,价格上涨了5%。“啊,好吧,也就是多了一点儿。”我很轻易
地就接受了这样的涨价。
你可以看到问题在哪儿了,我的直觉是小事聪明,大事糊涂。番茄酱的“超大折扣”为我省了12英镑,而机票价格的“小小上涨”让我多花了
30英镑。但是呢,不管是在20美元的超市小票还是在20万美元的贷款协议书上,1美元都是1美元。廉价商品价格的大幅下跌与贵价消费品价格
的小幅上涨相比,其实是微不足道的。
6. 极差
计算方法:极差是一组数据中,最大值和最小值之间的差值。
适用范围:平均数、中位数和众数体现的都是数据的“集中趋势”,目标都是将一组多样化的数据分解为一个具有代表性的数值。而极差的
目标则相反,不是掩盖分歧,而是量化和显示分歧,以衡量数据的波动范围。
极差的主要优点在于简单。它把一组数据想象成一个波长从“最小”排列到“最大”的光谱,并告诉我们这个光谱的宽度,是一种对多样性的
粗略总结。
不可信之处:如果把数据比作切成一块块的蛋糕,极差只关心最大和最小的两块蛋糕,而忽略了很多关键信息,比如所有中等切块的大
小。它们是更接近最大值还是更接近最小值?还是均匀分布在最大值与最小值之间的范围内?极差既不知道也不关心。
数据集越大,极差的可信度就越低,因为它忽略了数百万个中间值,只关注到两个最极端的异常值。如果你是一个外星人,从统计数据中
了解到地球成年人身高的极差约为2米(史上最矮成年人的身高不到60厘米,最高的接近2.7米),你可能会在访问地球时失望地发现,在地球
上遇到的几乎都是我们这些身高1.5米到1.8米的普通人。
7. 方差和标准差
标准差可以粗略地告诉你,一组数据中的数据离均值有多远。
计算方法:(1)求数据集的均值;(2)求出每个数据点离均值的距离;(3)求出这些距离的平方;(4)求这些距离的平方的平均值。
这就得到了这组数据中,每个数据与平均数之差的平方的平均数,也就是方差。
把方差开平方根后4,得到的就是标准差。标准差比方差更直观,因为方差的单位带有奇怪的平方,“美元的平方”是什么意思?没有人知
道。
由于方差和标准差经常一起出现,所以我也将这二者放在一块儿讨论。
适用范围:和极差一样,方差和标准差都可以量化数据集的多样性,但是,我得带着慈爱的老父亲的公正态度说一句——它们比极差做得
更好。极差是一种快速的权宜之计,方差则是统计学的中流砥柱。如果说极差是简单的双音符小调,方差就是复杂的交响乐,可以从数据集的
每个成员中提取信息。
方差的计算虽然错综复杂,但经过检视还是可以发现逻辑。它取决于每个数据与均值之差,“方差大”意味着数据分布广泛,“方差小”则是
指数据的集中程度高。
不可信之处:当然,每个数据都对方差有贡献,但具体的贡献大小是体现不出来的。
尤其是当数据中存在极端值时,单个极端值就能极大地提高方差。由于在计算中有求平方这一步,单个极端值(例如,差值为12时,
122=144)比12个与平均值较为接近的数据(例如,差值为3,32=9,十二个这样的数据也只有108)对方差的贡献还大。
方差还有一个让人困惑的特性(不算是缺点,只是违反直觉)。学生们常会认为有很多不同值的数据集(如1、2、3、4、5、6)比有重复
值的数据集(如1、1、1、6、6、6)更“分散”,但其实方差对“多样性”不感兴趣,它关心的只是各个数据到均值的距离。
从方差的角度来看,后一组(重复的、离均值较远的值)的离散度大于前一组(不重复但离均值较近的值)的离散度。
8. 相关系数
计算方法:相关系数用于量化两个变量之间的关系。例如,一个人的身高和体重,或一辆车的价格和销量,或一部电影的预算和票房收
入。
相关系数的最大值为1(“哇,它们是完全正相关的”),中间值为0(“啊,它们之间完全没有联系”),最小值为-1(“嗯,它们是完全负相
关的”)。
好吧,这就是个简单的总结。要了解相关系数实际上是如何工作的,请查看尾注。5
适用范围:富裕国家的人们更幸福吗?大量打击轻罪罪犯能预防犯罪吗?红酒是能延长寿命,还是只能延长晚宴?以上这类问题都涉及变
量对之间的关系,涉及想象的原因和推测的结果之间的关系。理想情况下,你可以通过实验来回答这些问题。给100人提供红酒,100人提供葡
萄汁,看哪一组活得更久。但是这样的研究耗时耗财,而且还不道德——想想那个不能喝酒的对照组有多可怜。
相关系数让我们能够从侧面解决这样的问题。可以找一群人,监测他们的葡萄酒摄入量和寿命,看看这些饮酒者是不是活得更长。诚然,
即使是很强的相关性也不能确定因果关系,也许葡萄酒可以延年益寿,也许人们年纪大了以后会更喜欢喝酒,也许两者都是由第三个变量驱动
的(例如,富人都活得更长,买得起更多的葡萄酒),这些我们都不可能知道。
即便如此,相关系数的研究还是提供了一个很好的起点,求相关系数既省时又省力,而且支持大数据集。尽管结果还不够精确,但已经是
非常有用的线索了。
不可信之处:相关系数是所有统计总结中最强势的,它将数百或数千个数据(每个数据都有两个变量)浓缩成一个介于-1和1之间的数
字,省略了很多信息。这是一个数学上的奇怪概念,被称为安斯库姆四重奏(Anscombe's quartet)。
现在,让我们走进安斯库姆魔法学院,这里的学生已经花了几个星期的时间准备四门课的考试:魔药课、变形课、魔咒课和黑魔法防御术
课。对于每门考试,我们将考虑两个变量,分别为每个学生花在学习上的时间和该学生在考试中的分数(满分13分)。
从汇总的数据来看,你会认为这四个考试没什么不同:
但是……行吧,先看看。(每个点代表一个学生)
首先是魔药课,和我对考试的印象非常符合——多学习就能提高成绩。但这也不是绝对的,也会出现一些干扰相关性的小意外。因此,相
关系数是0.816。
其次是变形课,变形课的分数遵循一个完美的线性关系,每多学习1个小时,考试成绩就会高0.35分——除了一个例外的孩子,他把相关系
数从完美的1降到了0.816。
魔咒课考试遵循的模式更确定些——学习时间变长可以提高分数,但边际收益递减。当学习时数达到10小时后,更长的学习时间就会开始
影响你的成绩(也许是因为影响了你的睡眠)。不过可别忘了,相关系数是用来检测线性关系的,不能体现二次函数的变量关系,因此相关系
数是0.816。
最后,在黑魔法防御术课中,除了一个学生外,其他学生的学习时间都是8个小时,拿到的分数却都不同,这就意味着学习时间不能帮助
预测分数。由于那个例外的勤奋学生在学习时数达到19个小时后,取得了令人难以置信的最好成绩,这个单一的数据把学习时数和分数的相关
系数从0提高到了……
0.816。
每一门课程的考试都遵循自己独特的逻辑和模式,但是相关系数却完全相同,忽略了它们的差异性。
这正是我要说的,统计学的本质:
统计学是一个不完美的目击证人,
它讲述的虽然是事实,但不是全部的事实。
欢迎引用我这句“名言”。或者,如果你喜欢传统的方法,也可以用自己的话转述,但别忘了署我的名字哦。
第17章
最后一位打击率0.400的传奇球员
打击率的兴衰
棒球自诞生以来就一直是一种数字游戏。在维基百科中,足足有122种棒球统计数据,从DICE(defense-independent component ERA(9),纯
粹防御率)到FIP(fielding independent pitching,不考虑守备的投球统计量),再到VORP(value over replacement player,替换球员比较值),
但恐怕这些也不过是冰山一角。我怀疑在棒球中,任意三个随机字母都代表一种数据,都会有人对这些统计数据做了详细的记录。
本章只介绍一项统计数据,从它毫不起眼的诞生到逐渐式微的现状,都将在这一章详细探讨。这个数据就是BA——不是波士顿口音
(Boston accents),也不是被吸收的啤酒(beer absorbed),而是打击率(batting average)。
打击率曾经是棒球场上最重要的数据指标,而今统计学家却认为它庸俗,不屑地把它看作野蛮时代的遗迹。打击率是否到了该退休的时
候?还是说这个“腿脚不灵的老兵”身上仍闪烁着一丝有魔力的火花?
1. 表格中的闪电
1856年,来自英国的亨利·查德威克(Henry Chadwick)——一位《纽约时报》的板球记者,在一次偶然的情况下观看了棒球比赛,并迅速
迷上了这项体育运动。“在棒球赛中,一切都如同闪电般具有冲击力。”1聊起棒球,他就滔滔不绝,只有板球球迷才能做到这一点。查德威克就
像一只被乌龟的活力所吸引的树懒,很快就把自己的一生奉献给了这项美国人的消遣。他加入了棒球规则委员会,撰写了第一本关于这项运动
的书,并编辑了第一份棒球年鉴。但是,查德威克之所以被誉为“棒球之父”,是因为一些更基本的东西:统计数据。
查德威克发明了“技术统计表”,这是一种用来追踪比赛关键事件的表格。通过浏览一栏栏数字——得分、击球数、出局数等,你几乎可以
了解每一局比赛的进展。统计表里的数据与长期预测能力无关,但其中用数字讲述的故事却决定了球员得到的是荣誉还是责骂,被视为英雄还
是恶棍。这些统计表记录了每场比赛的天气状况,突出了关键事件,在广播、动态摄影或职业棒球大联盟网站出现之前,提供了让人们了解赛
况的途径,它们就是19世纪70年代的《体育中心报》。
查德威克关于“打击率”的灵感来自板球,板球只有两个垒,球员每次成功从一个垒到达另一个垒即得一分。板球运动员不停地击球,直到
击球手出局为止,好的击球手在出局前能得好几十分(史上最高纪录是400分2)。
因此,板球的打击率被定义为“出局前平均得分”。一个优秀球员的“出局前平均得分”可以保持在50甚至60分。
然而,在棒球中,击球手本来就只需要击中一次球,所以这个定义并不能体现击球手的能力。查德威克像数学家一样仔细地研究了这些规
则,在确定现在的打击率概念之前,先做了一些别的尝试。
①保送,让打者上垒的通称。包括四坏球(保送一垒)和触身球(保送一垒)。
打击率的设计初衷是用一个简单的分数来衡量成功率:安打(10)数除以安打数加出局数。查德威克称之为“衡量击球水平的真正标准”3。
尽管打击率的理论数值从0.000 (没有一次安打)到1.000(每次都安打)不等,但实际上,几乎所有球员的打击率都集中在0.200到
0.350,这样的差距并不是很大。最强的棒球球员(打击率为0.300)和最弱的球员(打击率为0.275)在每40次尝试中只会有1次安打数的差距,
肉眼是难以分辨他们的区别的。即使在整个赛季中,一个“较差”的球员完全可能靠运气胜过一个“较好”的球员。
因此,这时候就要依靠统计数据来分辨了。球员的打击率就像一段记录了植物从发芽到开花全过程的静态视频,它把超出感官察觉范围的
真相告诉了我们。这不是瓶中闪电,而是表格中的闪电。
统计学就像概率一样,架起了两个世界的桥梁。在现实生活中,每一天的糟糕和幸运都是随机出现的。而在现实之外,还有一个有着稳定
平均值和平稳趋势的长期天堂。概率从长期的世界开始,算计着某个事件可能在某一天发生。统计数据则正好相反,它从日常的混乱开始,努
力推断数据那看不见的长期分布态势。
换句话来说,概率学家是对着一沓背面朝上的牌,描述可能抽到的牌;统计学家则是看着手中抽到的牌,试图推断那一沓牌的性质。
棒球为人们对击球结果的推断提供了足够的数据,这一点也许是体育运动中独一无二的。在每个有162场比赛的赛季中,一个击球手要面
对大约24 000个投球。而其他的运动都几乎不可能提供同样丰富的数据,比如足球——除非在整个赛季中,每5秒就重新开球一次4。棒球更妙
的地方在于,其他团队运动都是多人混战,但每个棒球运动员都单独击球,数据是独立而清晰的。
这是打击率的闪光点,但就像我们之前说的,每一种统计数据都会遗漏些什么——而在这一次,遗漏的信息是至关重要的。
2. 老人和上垒率
1952年,《生活》杂志刊载了海明威《老人与海》的初版5。这期杂志售出500万册,作者也因此获得了诺贝尔奖。
1954年8月2日,《生活》杂志选择将全国性的讨论引向另一个方向:棒球统计数据。匹兹堡海盗队总经理布兰奇·里奇(Branch Rickey)在
题为《告别棒球旧观念》6的文章中提出了一个需要10页纸才能解开的方程式:
这个公式本身几乎不符合语法,其中的等号并不意味着“等于”,减号也不是真正的“减去”。尽管如此,这篇文章还是对一些以打击率为主
的“过时棒球观念”进行了尖锐的批评和攻击。这段批评的主题[归功于里奇,但由加拿大统计学家艾伦·罗斯(Allan Roth)代笔]以两个字母开
头:BB,意为“四坏球”(base on balls),更通俗地说,就是“保送”。
棒球运动在19世纪50年代逐渐成熟,当时在击中球或连续挥棒三次都击球失败之前,击球手都有击球的机会。如果击球手有足够的耐心,
比赛的进程会像冷掉糖浆的流速一样缓慢。1858年,所谓的“好球”(called strikes)诞生了。7当击球手放弃击打看起来可能会被好好击中的球
时,会被视为已经挥棒、算作失误。但此时钟摆摆得太远了,小心谨慎的投手不肯投出可以轻易被击中的球。对此,1863年提出的解决方案是
将击球手认为太远而无法击中的球定义为“坏球”,当坏球足够多时8,击球手可以直接保送到一垒。
保送难倒了查德威克。在板球中,最接近“保送”的概念是“偏球”。偏球通常被认为是投球手的失误,所以在打击率的统计中,保送被直接
忽略了。直到1910年,保送才被列入官方数据统计项目。9
在今天的棒球赛中,最熟练、最有耐心的击球手保送比例往往高达18%或19%10,而那些冲动鲁莽、轻易挥棒的同龄球员保送比例只有2%
或3%11。因此,里奇方程的第一个参数是我们现在称为“上垒率”(on-base percentage,OBP)的复杂表达式。击球手的上垒率包括击球和保送
的数据,换句话来说,就是“没有出局”的比例。
到底哪个统计数据更能预测一支球队的得分呢?是BA还是OBP?从2017年的数据来看,BA和球队得分的相关性不错,系数为0.73;但
OBP和球队得分的相关性更强,系数为0.91。
接下来,里奇(也是罗斯)强调了打击率的另一个缺点。安打有四种情况,从一垒到四垒(全垒打),“垒”数越多,代表球员的水平越
高,但打击率却不能分辨这四种情况。因此,里奇方程中第二项等于在“一垒”的基础上再加上超出的垒数。
今天,我们更喜欢用一个相关性的统计数据:长打率(SLG)。SLG计算的是每一棒的平均垒数,理论上数值最小为0.000,最大为
4.000(每次都是全垒打)。但实际上,没有一个击球手能在整个赛季中击出超过1.000的成绩。
和打击率一样,SLG也忽略了保送,无视了不同垒数间重要的差别。例如,要在15次击球中击出0.800的成绩,垒打数就要达到12(因为
12/15 = 0.8)。很多方式都能实现12的垒打数,但不同的方式反映出的球员水平完全不同:
由于OBP和SLG关注的是比赛的不同方面,人们经常将它们结合起来使用。最常见的用法是将二者直接相加,得到一个名为“上垒加长打
率”(OPS)12的统计数据。在2017年的数据中,OPS与得分的相关性达到了惊人的0.935,比OBP或SLG都要好。
在《生活》杂志刊登《告别棒球旧观念》50周年之际13,《纽约时报》向纽约洋基队总经理布莱恩·凯许曼(Brian Cashman)展示了这个公
式。凯许曼惊叹:“这家伙比他的时代超前了几十年。”他的赞美背后,反映的事实是:就算是洋基队的总经理,也没有读过那篇《告别棒球旧
观念》。这也不难理解,为什么在那篇文章发表之后,打击率还在棒球数据中保持了几十年的统治地位,而OBP和SLG则无人问津,只能相互
取暖。说起来,在《生活》杂志里,或许里奇的研究对棒球发展的影响还不如《老人与海》中关于棒球的对话14呢。
所以,棒球到底还在等什么?
3. 知识推动了曲线
任何事物的变革都有两个必要条件:知识和需求。
对棒球统计的变革而言,这些知识大部分来自作家比尔·詹姆斯。151977年,还是一名夜间保安的他自行出版了第一份《比尔·詹姆斯的棒
球摘要》。这份68页的奇特文档主要由统计数据组成,严谨地回答了一系列诸如“哪位投手和接球手被盗垒最多?”的问题。尽管这本书当时的
销量只有75本,但反响很好。第二年的新版本卖出了250本。五年后,詹姆斯和出版商签订了一份对棒球影响深远的出版协议。2006年,《时
代周刊》将詹姆斯(此时他是波士顿红袜队的职员)评价为“地球上最有影响力的人之一”。
詹姆斯敏锐的分析方法引发了棒球界个人技术统计数据的复兴,他称之为“棒球统计学”。这个统计复兴运动的观点之一是,打击率只能作
为展现实际结果的一个粗略指标16,仅用打击率评价球员就像只用一种原料来推断一顿晚餐的质量一样,不可能面面俱到。如果你真的想评估
这顿饭,你需要品尝所有的食材——当然,更好的是,尝尝这道菜。
正如《生活》杂志的档案管理员可以证明的那样,这些知识都已被尘封了多年。把这些知识推到风口浪尖的不仅是詹姆斯,还有不断变化
的棒球经济环境所带来的需求。直到20世纪70年代初,棒球运动员都生活在“保留条款”的阴影下。这就意味着,即使合同到期,球队仍然保留
着对球员的所有权。除非得到老东家的许可,否则球员不能在其他任何地方签约(甚至连洽谈也不行)。
1975年,仲裁者重新定义了保留条款,开启了“自由代理”的时代。随着闸门打开,球员的薪水开始飙升。17
十年前,球队的老板可以像买杂货一样买球员。而这时,杂货店有了经纪人,这些经纪人都想赚更多的钱。新的财务压力本应促使老板们
放弃BA这类粗糙的衡量标准,转而采用OBP和SLG等更可靠的数据,但众所周知,棒球是一项缓慢发展的运动(除了富有前瞻性的亨利·查德
威克之外)。奥克兰运动家队花了20年的时间才认识到BA的问题,开始用OBP来评估球员。
20世纪90年代初,这些星星之火在奥克兰运动家队的总经理桑迪·奥尔德森(Sandy Alderson)和他的继任者比利·比恩(Billy Beane)的领
导下,开始了燎原之势。很快,奥克兰运动家队通过聪明的统计在球员的购买上取得了惊人的成功。2003年,生活在旧金山的作家迈克尔·刘易
斯写了一本关于比利·比恩的书。这本叫作《魔球》的书除了卖出成百上千万本之外,还做到了《生活》杂志无能为力的事——带领人们向一些
过时的棒球理念“告别”。在刘易斯的帮助下,OBP和SLG从粉丝的自娱自乐一跃成为棒球运动的主流评价标准。
4. 小数点后4位的戏剧
著名的棒球球员泰德·威廉姆斯(Ted Williams)曾经说过:“棒球是最鼓励努力的领域,每个人尝试10次总能成功3次,而且会被认为表现
得很好。”18
1941年,威廉姆斯准备冲击一个更高的目标:10次击球中有4次成功。这叫打击率0.400。这个数字能让他成为一个传奇。在赛季的最后一
周到来前,威廉姆斯的成绩达到了0.406,有望成为11年来第一位打击率达到0.400的球员。
然而,之后他就没那么顺利了。在接下来的四场比赛里,在14次击球中,他只击中了3次,这就使他的打击率降到了令人心碎的
0.3995519。
这个数字看起来有点儿假,仿佛是为了测试学生对小数的掌握程度而编造的数字,最后还会提问学生:它算是0.400吗?但就在第二天,主
流报纸明确地给出了答案:不是0.400了。《纽约时报》的报道称:“威廉姆斯的打击率是0.3996。”《芝加哥论坛报》宣布:“威廉姆斯的打击率
落到了0.400以下。”《费城问询报》则说得更残酷些:“威廉姆斯的打击率跌至0.399。”尽管这不符合四舍五入规则。同时威廉姆斯的家乡报纸
《波士顿环球报》也附和了这一说法:“现在他的打击率只有0.399了。”
你说,我们怎么能拒绝一项对小数点后四位数字都如此认真的运动呢?
1941年的大论战
那个赛季的最后两场比赛都安排在9月28日。前一天晚上,威廉姆斯失眠了,他在费城街头徘徊了十多公里。据一位体育记者说,在第一
场比赛之前,“他坐在板凳上咬指甲,双手颤抖着”。这位记者在后来的报道里描述:“第一次击球时,他抖得像一片树叶。”
但23岁的他坚持了下来。那天下午,他挥棒8次,击中了6次,打击率瞬时提高到0.4057。(头条新闻的作者毫不犹豫地称其为0.406。)从
那以后,将近80年过去了,再也没有人的打击率能达到0.400。20
1856年,亨利·查德威克无意中观看了一场尘土飞扬的、激烈的棒球赛,就这样创造了用于衡量棒球赛标准的数字,这些数字赋予了棒球巨
大的影响力。160多年后的今天,棒球已成为一个繁荣的行业,球队的工资总额高达数亿美元。在21世纪的棒球赛中,19世纪提出的打击率概
念早就落后了,在面对更新换代的新型数据武器时,它就像一个试图赤手空拳接住强劲直球的小男孩。
尽管已经被时代淘汰,但0.400这个数字仍然保持着它神奇的魅力。每年的4月到5月,当一个新赛季才刚开始,样本量还小得像刚萌发的绿
芽时,我们还是经常可以看到一两个球员的打击率在0.400的附近徘徊。尽管不久后,他们的数据就会掉下来,但就在那一周左右的时间里,这
片大地上浮动着一丝希望的气息,人们能感觉到传说中BA为0.400的击球手是真实存在的。相较之下,OBP为0.500和SLG为0.800的数据永远不
会这么让人心跳加速。我们喜欢0.400,不是因为它对比赛结果的预测能力,也不是因为它在数学上的优雅,而是因为它的吸引力,以及它用三
位小数讲故事的方式——如果你想再精确一些,那就是四位小数。
或许未来再也不会有人能达到0.400的打击率,又或许明年就有人达到了。但威廉姆斯对此完全不介意,他在50年后说:“就算我早知道