第23章 正態分布—鍾形曲線的妙用與濫用(1)

把鍾形曲線用在商業領域是不合適的。

—彼得·德魯克

瘋子,就是用錯誤前提進行正確推理的人。

—約翰·洛克

真是令人震驚:鍾形曲線竟然成為風險管理工具,被監管者和穿深色西服、以乏味的方式談論貨幣的中央銀行人員使用。

—尼古拉斯·塔勒布

一棵樹上的果子有大有小,但大部分都是中等的。河裏的石子有圓有扁,但多數屬於不太圓也不太扁的。巨人很少見,侏儒也很稀少,多數人是身高中等的普通人。隻要樣本足夠多,那麽這個樣本群體的情況就會呈現一種規律性。但這種規律卻很可能被濫用……

“數學王子”與鍾形曲線

德國數學家高斯被認為是最重要的數學家,享有“數學王子”的美譽。

高斯的母親是一個貧窮石匠的女兒,雖然十分聰明,卻沒有接受過教育,近似於文盲。高斯的父親曾做過園丁、工頭、商人的助手等。

在整個數學史上,沒有人像高斯那樣早熟,比如高斯三歲時便能夠糾正他父親借債賬目的事情。

高斯自己曾說,他在草堆上學會了計算。能夠在頭腦中進行複雜的計算,是上帝賜予他一生的天賦。

當高斯12歲時,已經開始懷疑元素幾何學中的基礎證明。當他16歲時,預測在歐氏幾何之外必然會產生一門完全不同的幾何學,即非歐幾裏得幾何學。高斯的傳奇、奇聞異事可以寫成厚厚一部故事集。

18歲時,高斯開始專注於曲麵與曲線的計算,並成功得到高斯鍾形曲線(正態分布曲線)。其函數被命名為標準正態分布(或高斯分布),並在概率計算中大量使用。

鍾形曲線是一根兩端低中間高的曲線。高斯用它來描述科學觀察中量度與誤差兩者的分布。

在鍾形曲線上,大部分觀察值都積聚於中間,曲線上的極點對統計結果影響不大。比如,隨機挑選1000個男人進行身高統計,他們之中接近平均值的分布最多,巨人和侏儒分布最少,這種分布就符合正態分布。自然界中的很多隨機變量,可以近似地用鍾形曲線來描述:

一棵蘋果樹上的蘋果有大有小,把這些蘋果一一稱重,會得到一條鍾形曲線。

河床上布滿了鵝卵石,這些石子有圓有扁,把這些鵝卵石的曲度統計出來,也會形成一條鍾形曲線。

茫茫人海,總會有幾個巨人,也會有幾個袖珍人,但大部分人是身高中等的普通人。

同質群體的身高、紅細胞數、血紅蛋白量、膽固醇等,呈現為正態或近似正態分布。

……

隻要樣本足夠多,那麽這個樣本群體的情況就會呈現一種規律性。

數學不會錯,但數學會被用錯

類似這種說法你可能聽說過:

“××效應無處不在!”

“萬事萬物都逃不開××法則!”

說者如此亢奮,仿佛真的發現了一條能解釋宇宙萬物的絕對真理。

就連高斯自己恐怕也沒有想到,自己發現的鍾形曲線,會被泛濫地運用到社會生活的各個方麵。

前麵講過,“統計狂人”高爾頓爵士通過研究豌豆遺傳和人類世代演變,聯想到了均值回歸理論,這個重要理論使得鍾形曲線在很多情況下具有可操作性。

與高爾頓大約同時代,有個數學家叫凱特勒,他號稱:“鍾形曲線無處不在!”

凱特勒要把鍾形曲線用在一切地方,他要把世界納入他的平均哲學中。

凱特勒提出,人的特性均趨向於鍾形曲線的均數或中數,越靠兩極越少。凱特勒從統計學角度出發看人,認為人的成長會依從一套既定的法則。所以,我們可以透過統計數字,去推算一個人的發展。他還發明了通過身高體重比(BMI)來推算一個人的健康狀況。

但凱特勒本人一點也不平均,甚至可以說是個偏執的工作狂。凱特勒對鍾形曲線的癡迷到了走火入魔的境地,他提出了“體質平均人”的概念,通過收集統計數據,他開始製造“平均”的標準。胸圍、身高、新生兒體重……很少有什麽逃過他的標準。

阿道夫·凱特勒又把注意力轉入社會學領域,針對人們的行為模式,提出了“氣質平均人”概念。凱特勒劃定了偏離平均值的範圍,他眼裏的正常人要麽在平均值左邊,要麽在平均值右邊,而那些站在鍾形曲線極左端和極右端的人則屬於另類,需要懲罰。

尼古拉斯·塔勒布在其睥睨群英的作品中,對鍾形曲線進行了深入批判。當然,塔勒布並非對鍾形曲線進行質疑的第一人,他隻是繼承了亨利·龐加萊等人的思想,而這種生搬硬套鍾形曲線的方法論,也被人們稱為“凱特勒謬誤”。

高斯並沒有錯,高爾頓也沒有錯,“凱特勒才是思想史上最具有破壞性的人”。數學不會錯,但數學會被用錯,在凱特勒的“傳染”下,鍾形曲線得以廣泛用於社會領域。

統計歧視

有人調侃,人生就像一個鍾形曲線—

你5歲的時候不尿床就是成功;

10歲的時候你開始有自己的朋友就是成功;

25歲時你有自己的幸福家庭就是成功;

35歲時你依然有自己幸福的家庭就是成功;

65歲時你依然擁有好多朋友就是成功;

85歲時你不尿床就是成功。

類似這種玩笑話並無害處,但有些人卻以科學之名,推銷自己的思想,就變得可怕了。

凱特勒的幽靈還在徘徊,十多年前,曾有一本名為《鍾形曲線》(TheBellCurve)的書熱鬧了一陣子,該書的副標題是《美國生活中的智力和階級結構》。

此書是美國哈佛大學心理學家理查德·J.哈瑞斯坦與政治科學家查爾斯·莫瑞合作完成的。該書主要內容包括四部分:

1.基於智力基礎的社會分層現象日益明顯。

2.智商與各種社會、經濟地位之間存在明顯的相關性。

3.IQ在美國不同種族之間所形成的社會的與經濟的貢獻中的作用。

4.這個了不起的發現對於美國的教育和社會政策會產生哪些影響。

書名之所以稱作“鍾形曲線”,主要是基於IQ得分的鍾形的正態分布。

在書中,作者以大量的智力測量結果論證,人的智力是先天遺傳決定的,不同的種族具有不同的智力水平,這種觀點自然會引起不少爭議。這本嘩眾取寵的作品,為種族歧視提供了理論基礎,也被種族主義者奉為寶典。

將軍裏麵挑瘸子

GE公司前CEO傑克·韋爾奇最值得自我吹噓的管理秘訣就是“活力曲線”,其實質是強製正態分布。

在這個鍾形曲線裏,韋爾奇將業績排在前麵20%的員工劃為A類,中間70%的員工劃為B類,業績排在後麵10%的員工劃為C類。C類是必須裁掉的對象。

韋爾奇以科學的名義進行獎懲,一直以鍾形曲線的法則推行末位淘汰製,從不間歇,所以叫作活力曲線。

這種績效評估的原理,是按照事物“兩頭小、中間大”的正態分布規律,先確定好各等級在被評價員工總數所占的比例,然後按照每個員工績效的優劣程度,強製列入其中的一級。

但問題是,假如低素質員工淘汰完了以後,就要在中等和優良員工裏硬挑一些低素質員工來淘汰了。最極端的情形可能是“將軍裏麵挑瘸子”。就好比滿分是100分,全部成績都在90分以上,也要把90分的那位淘汰下來。

韋爾奇很幸運,他在任的時候GE股票猛漲。但GE的成功,不代表他所有的做法都是對的。當韋爾奇成為明星經理人後,他的辦法得以傳播。強製鍾形曲線管理法,在社會上熱過一陣子後,基本上銷聲匿跡了。

冪率曲線

19世末,“的幽靈,在歐洲徘徊”。

此時,有一位叫帕累托的意大利經濟學家發現,財富分配也是不均的。帕累托被稱作“資本主義的馬克思”,他指出:英格蘭財富的80%,掌握在了20%的人口手裏。許多其他國家和地方也是如此。帕累托由此得出一個結論:財富分配和人口結構之間,存在著一種可以估算的比率。帕累托稱之為“關鍵少數定律”,也就是現在所謂的“二八法則”。

類似帕累托的這種財富曲線,叫作冪律(PowerLaw)曲線。

我們再以圖書銷售為例,把圖書的銷售排名作為橫軸,銷售量作為縱軸,我們就會得到類似下麵這個銷售曲線。

冪律的典型是二八法則,實際上冪律正是從它開始的發現。意大利經濟學家帕累托發現,在財富的分配上存在著冪律分布,即20%的人掌握著80%的社會財富。

有人將這一法則延伸,80%的工作由20%的人完成;或者80%的工作隻產生20%的結果,反之亦然。

“二八法則”也遭遇了驚人的濫用,比如被墨索裏尼拿去,為其法西斯主義作合理化解釋。

分清“中庸先生”與“極端先生”

天氣、豌豆的直徑、身體指標等屬於平均事件,是按照鍾形曲線分布的(姑且稱之為“中庸先生”),所以,就算這輩子你看不到一個身高為5米的家夥,也沒什麽值得稀奇的。

財富數量、圖書銷量、網站訪問量等屬於極端事件,遵從的是所謂的冪律曲線(姑且稱之為“平均先生”)。

比如,屋子裏有100個隨機選取的人,世界上個子最高的人走進去之後,這些人的平均身高並不會發生太大的變化。但如果比爾·蓋茨走了進去,在場所有人的平均財富將會顯著增加。

如果說鍾形曲線是一位性格溫和的“中庸先生”的話,冪率曲線就是一位性格狂野的“極端先生”。

對自然問題,多問問“中庸先生”;對社會問題,尤其是金錢問題,“極端先生”的意見更為靠譜。

“中庸先生”信奉“天之道”,“極端先生”信奉“人之道”。

在“中庸先生”那裏,充滿了金色的平均主義,誰也不會比誰高出多少。

在“極端先生”那裏,一個數字就足以瓦解你所有的平均值,一次虧損就可以抹平你100多年的積累。

我們唯一應記住的是:道可道,非常道。真理隻能證偽,不能證實。麵對這個複雜的世界,沒有任何一個萬能公式,更沒有放之四海而皆準的教條。

鍾形烏托邦

鍾形曲線並非放之四海而皆準,但很多人覺得“鍾形曲線無所不在”。鍾形曲線為何這麽受歡迎?

鍾形曲線的魅力在於它分布得很對稱,很和諧,很中庸,很民主,容易掌握,讓人感覺是溫和又可以預測的。收集了足夠的數據之後,模式就會自動顯現。這符合懶人的胃口,我們不妨把這種理想叫作“鍾形烏托邦”。

理解冪率曲線,可以幫助我們和中庸的鍾形曲線保持距離。但冪率曲線是位“極端先生”,從來就不像鍾形曲線這位“中庸先生”那麽受歡迎。

鍾形曲線是一位溫和的“中庸先生”,冪率曲線是一位狂暴的“極端先生”。

鍾形曲線屬於自然法則,冪率曲線屬於叢林法則。