05 理解概率 Maki ng Sense of Probabi l ities
這裏我會介紹在我們麵對不確定性問題的時候,概率的觀點是如何起作用的,還會描述一些誤解了概率的情況。
賠率?
回憶之前我們說過,概率可以用賠率(odds)的形式來描述,反之亦然:概率是1/5和賠率是4比1是相同的。不幸的是,“賠率”這個術語也已經被賭徒們篡改成了一個相當不同的意思——如果你選擇的馬勝出了,你獲得的賭資。所以當你聽說“海都之星(Sea The Stars)”在2009年德比大賽(Derby)[1]中以11比4的賠率勝出,這隻是說明了對於押在這匹馬上的每4英鎊賭注,它如果贏了收益就是11英鎊。“11比4”沒有與勝利概率之間的必然聯係。這個比例隻依賴於賭徒對於馬勝出概率的主觀評定。對於像“11比4”這類的表達,術語“賠付金額(pay out price)”是一個更準確的語言使用方式,但遺憾的是,我們不得不接受在賭博情境中對於“賠率”一詞的濫用。
如果兩邊都沒有經濟收益上的優勢的話,賠付金額就被稱為“公平的”。也就是說,賭注的平均值是0。從洗好的牌堆中正確地抽出指定花色牌的公平賠付金額是3比1,這也就是抽中的賠率。
因為商業賭博不會在沒有莊家收益(house advantage)的時候運行,就是說,商業賭博都是不公平的。對一家英國賭場的輪盤賭來說,所有的37種結果都是等可能的,賭其中一個數字的賠付比例隻有35比1,而不是公平的36比1。所以一次37英鎊的賭局回報的平均值隻有36英鎊,這就得出莊家收益率——對於任何賭局莊家都預期會贏——為1/37,大約2.7%。
這個優勢對大多數你能想象得到的輪盤賭局都是一樣的:無論你是賭一對數字,還是3個、4個、6個、12個,對於你下注的每37英鎊,你的平均回報總是36英鎊。在拉斯維加斯,標準的莊家收益還會更大一些,因為一個多加的格子,雙零(double zero)會給出38種結果,但是賠付金額和在英國時相同。38美元的平均收益通常是36美元,莊家收益率是2/38,或者說5.3%。
賭馬的另一種形式是通過同注分彩係統。這裏,押在所有的賽馬上的賭注被放入彩池中,以固定比例——常見的是80%——被押了獲勝馬匹的人按照他們下注的比例分享。無論哪匹馬獲勝,分彩收益率就是20%。
賽馬中,賭注登記人(bookies)的收益的大小取決於哪匹馬獲勝了。雖然賭博者在單次比賽中都既可能收益也可能損失,但最近的數據給出了一個令人清醒的事實:在賠付金額為6比4的時候,賭博者預期會損失他們賭本的10%;賠付金額在5比1的時候,預期損失大約13%;在10比1的時候,平均損失超過了23%;如果你投機地定下50比1的賠率,預期你會損失2/3的錢。
這個現象被稱為熱門冷門偏差(favourite-longshot bias)。賭博者在更受歡迎的馬匹上輸錢會比高賠付金額的輸錢更慢。2009年,蒙莫梅(Mon Mome)在英國國家賽馬障礙大賽(the Grand National)中以100比1的賠率獲勝之後,博彩公司都很高興。絕對風險,還是相對風險?
假設在一群特定的人中,未來50年內大腸癌的發病概率是1/1000。我們預期在10 000人中,會有10個人罹患大腸癌。一種新的藥物會將這個概率減小至1/2000:意味著如果藥物投入使用,10 000個人中隻有5個人會因癌症身亡。醫藥公司就會將新聞稿加上“患癌風險降低50%”的大標題。這的確是精確的:對於每個人來說,風險的確會減半。
這個計算方法描述了相對風險的降低,並且經常會因為對數據的過於樂觀的解讀而飽受詬病。假設初始的風險是1/10 000 000:將它減小50%得到新的風險數字1/20 000 000,但是在前後兩種情況中,這個風險是相當的小,以至於在10 000個人中,我們預期兩種情況給出相同的患者數字——0。盡管風險被減半了,藥品也幾乎不會產生什麽作用。
但是假設這群人患癌的風險是比較高的,比如說40%。一種能將概率減少到20%的藥物不但有資格使用那個大標題,甚至會被稱為重大突破,因為在10 000個人中,患癌人數整整減少了2000人。
考察絕對風險而不是相對風險的變化,通常是更有意義的。在上麵的第一個情景中,絕對風險從0.1%變成了0.05%,降低了0.05%;在第二個情景中,降低了一個極小的數字0.000 005%;而在最後一個情景中,降低了令人印象深刻的20%。
一個合理的描述方式是陳述為了阻止一個惡性病例的發生,平均有多少個病人應該使用藥物——需治療人數(the Number Needed to Treat)或者說NNT。這個數字越小越好,它也就是絕對風險的變化的倒數。在上麵的例子中,NNT分別是2000、20 000 000和5。
為了阻止一個惡性病例的發生而去治療20 000 000人,很難說這是正當的。NNT,連同對治療費用和疾病影響的嚴重程度的了解,讓我們能做出關於分配衛生保健資源的合理決策。
組合小概率
在大量均具有微小概率的事件中,有多大可能至少有一個發生?在考慮災難發生概率的時候,這會是一個相關的問題。如果無數組件中的任何一個失效,複雜的係統或者機器就會失效;兩架飛機會相撞嗎?一座核電站的堆芯可能會熔毀嗎?所謂的波萊爾-坎泰利引理[2](Borel-Cantelli Lemmas)給出了一些提示。數學結果告訴我們,在很多情況下,重要的是這些微小的概率的和:如果這個和是無窮大的,那麽災難一定會發生。
結果就是我們永遠不會滿意於當前的安全標準。持續進行改進是必不可少的。因為無論我們的安全標準有多高,在某一個月中,一定會有不為0的失效概率:而且無論這個值多麽小,如果它保持不變(或者它降低得比較慢),大量月份的概率和就會變得無窮大,災難一定會在某一時刻發生。
一個持續改進的充足計劃也不會保證一定能避免災難,但是滿足於現狀就是坐以待斃。
一些誤解
(a)當一個醫生告訴患者一種特定的藥物有30%的概率會引起令人不快的副作用,他的意思是他預期有30%服用了這種藥的患者會遇到副作用。然而,這個患者也許會相信當她服用這種藥物的時候,在30%的次數中有副作用產生。醫生考慮的是他看到的所有患者,這個患者考慮的是她服藥的次數——他們的參照類別(reference class)是不一樣的。
(b)公眾會如何解讀電視天氣播報員說的“明天芝加哥下雨的概率是30%”?播報員們預期他們的聽眾會進行頻率解讀,即長遠地看,如果天氣情況類似於現在看到的那樣,在30%的情況下,第二天會下雨。
但是當被問及此事的時候,即使在那些對於“30%概率”這個說法感到滿意的電視觀眾之中,解讀也是各種各樣的。一些人認為他們被告知城市中的降雨區域超過30%;其他人認為芝加哥會在一天中30%時間中下雨;還有一些認為30%的氣象學家預期會下雨!一小部分人認為一定會下雨,30%這個數字意味著降雨的強度。播報員們提及的事件和聽眾們理解的事件會有很多不匹配。
(c)如果隨機選擇至少23個人聚集在一起,其中有兩個人生日相同的概率就會超過1/2。人們第一次聽說這個事實的時候通常會感到驚訝,但是在計算證明了這個斷言是正確的之後,他們會被說服。然而,一小部分人仍然不會被說服,因為他們以為自己被告知,如果另外22個人被聚集起來,其中的一個和他們生日相同的概率超過1/2。聽仔細!
(d)假設有一枚被認定是公正的硬幣,連續9次投擲中均反麵朝上。或許是受到了某些要求正麵立即摻和到連續出現的反麵之後的“平均法則”的影響,一些人就會宣稱下一次投擲幾乎確定地是正麵朝上。這樣的法則並不存在。大數定律的確會暗示正麵和反麵朝上的比例是相等的,但在長遠的情況下,任何的連續9個反麵的序列都會被前麵或者後麵的1000次投擲抵消。
或者一些人會(正確地)指出出現連續10次反麵朝上的概率小於1/1000,所以當他們看到9次連續的反麵之後,可能就會“推斷”下一次也是反麵是非常不可能的。但是這是偽邏輯。即使我們有連續的9次反麵朝上,第10次反麵朝上的概率也是1/2。這是事件的絕對概率和條件概率之間產生的混亂,它也在1996年的一個著名事件中體現出來:賽馬騎師弗蘭基·戴圖理(Frankie Dettori)在雅士穀(Ascot)贏得了前6場賽馬,因為從來沒有人會贏得一天之中的7場賽馬,戴圖理贏得最後一場幾乎“必須”是不可能的。但是他的確贏了。極少有人會在7場比賽中的前6場均勝利,但是一旦有人做到了這一點,他可能也會贏得最後一場。
問你自己:我是在評估20件事情發生的絕對概率,還是已知前19件事已經發生的情況下,評估第20件的條件概率?
(e)報紙經常會在巨大的時間壓力下出版發行,所以一些文章包含有荒謬的內容也容易理解。但是有3個報道是需要批評的。
當從超市買來的6個雞蛋全都是雙黃蛋,報紙就會宣稱一件令人震驚的事件發生了。1000個雞蛋中,隻有1個有這樣的特性,所以得到一整盒的雙黃蛋的概率就是連乘6次後的一個非常小的值了。這個數字結果是如此小,以至於如果你每秒打開一個盒子,你預期要用300億年才會遇到一個隻裝有雙黃蛋的盒子。
但是這個計算隻有在6個雞蛋都是從雙黃蛋比例是1/1000的大量雞蛋中被獨立選擇而來的時候才有意義。但是事實並不是這樣。在裝入盒中之前,雞蛋都是被按照尺寸分類了的。有些盒子上甚至被標上了裝有雙黃蛋的標簽……
針對某一個英格蘭足球隊長私人生活的指控曝光,一名記者對於球隊經理的4種可能的反應給出了“可能性”數值:
(a)將他從球隊中開除——1/10;
(b)留在球隊中,但是要求他辭職——3/10;
(c)留在球隊中,但是廢除隊長職務——6/10;
(d)不采取行動——8/10。
這4個估計的概率中的任何一個單獨都是貌似可信的。但是因為它們都關聯著互斥的結果,它們的和就不能超過單位1。然而這些“概率”加在一起是1.8。
第3個報道中說,在英國國家彩票中贏得至少50 000英鎊的人的名字,大多包括了約翰(John)、大衛(David)、邁克爾(Michael)、瑪格麗特(Margaret)、蘇珊(Susan)和帕特裏夏(Patricia)。目前為止看起來還好,但是因此應該在購彩票集團中引入有這些名字的人就是很荒謬的了!
描述未知
從一個洗好了的牌堆中抽出一張牌,我預期紅牌和黑牌是等可能的,我可以很自信地將紅牌的概率賦值為“1/2”。使用一個稍微令人費解的方式,我會說我將抽到紅牌的概率的分布百分之百地分配給1/2——百分百顯示了我的信心。如果我確定概率是一個確定的數字,那麽我就將這個數字附加上百分之百。
但是我經常無法選擇單獨一個數字:我對錯過中轉火車的最佳估計可能是3/4,但是2/3和4/5也貌似是可信的,甚至接近於極限值0和單位1的值也不是完全不可能的。我可以用一個0到單位1的連續分布來描述我對這個不確定概率的感覺。
圖8 貝塔分布的一組圖像
完全未知的概率——非常罕見的情況——可以被圖5中的連續均勻分布描述。更常見的情況是,首先有一個中間值,它是你以單個數字對這個概率給出的最佳猜測,然後你會直覺地認為更大和更小的值的分布會降到0。圖8展示了具有這種性質的被稱為貝塔分布(beta distribution)的一組圖像。
圖8a是我們對概率的值知之甚少的情況,我們將1/2當作最可信的值,但是像1/5一樣小和4/5一樣大的值也是很有可能的;在圖8b中,我們對這個值接近於1/2更有信心了,同時也不排除極端值;在圖8c中,我們最相信的值接近於1/3;圖8d中的分布強烈地集中在了2/3周圍,而且對於這個值小於1/2的期望是非常低的。
我的車加了10升油的情況下能開多遠?當預熱之後勻速行駛的情況下,我預期能開90英裏,但如果我在幾周內進行過幾次短程行駛,就更可能是60英裏了。在這兩種情況中,這個距離都會有一些不確定性,可以用連續分布來表示。為了找出是哪種分布,想象一下將這些汽油分成10毫升一杯的小份。一共就會有1000個這種杯,總的距離就會是這1000杯中每一杯行駛的距離之和。回憶中心極限定理,大量隨機量的和趨向於遵循高斯分布。
對於恒定速度的高速公路行駛,我會選擇中心位於90的高斯分布,方差小所以峰很尖。對於在城鎮中的情況不定的行駛,我也會用高斯分布描述,但是中心在60而且分布比較寬來顯示較大的不確定性。
效用
有位仙子讓你進行一次選擇。她給你1英鎊,或者她擲一個硬幣,如果你猜對了正反麵,她就會給你10英鎊,否則你什麽都得不到。你會做出什麽選擇?
備選的選項是確定得到1英鎊或者一個公平的賭局,回報是5英鎊。幾乎所有人都會更喜歡後者,但是將問題中的金額都乘上1 000 000,人們的選擇就必然會變化。比起什麽都得不到與得到500萬英鎊概率對半來說,確定能夠得到100萬英鎊,更有吸引力。這種差別背後是效用(utility)這個概念起作用。
對較小的總金額,翻倍的確意味著翻倍,但是如果100萬英鎊會為你和你的家人帶來相當程度的快樂,將這個值翻倍就不會使快樂翻倍。無論你選用什麽單位來計量貨幣金額的“價值”,通常效用和金額之間的關係曲線的形狀會像圖9所示:圖線總會上升,一開始像一條直線,但後來增長得越來越緩慢了。
圖9 一般的效用曲線的形狀
“效用”解釋了為什麽房主和保險公司會同意總額250英鎊是合理的年度保險費,這筆保費能夠確保你在火災、沉降或者洪水中免受25萬英鎊的房屋損失。保險公司的大額賠款意味著,對於任何單獨一棟房子,這筆賠款可以看作與相關的數目較小的賠款預期的和是相等的。隻要在任意一年中需要賠款的概率小於1/1000,保險公司在這筆交易中的期望值是正的,它就會盈利。另一方麵,沒上保險的房主就需要麵對巨額的負效用,如果房子遇險,損失25萬英鎊,所以對於她來說,主動放棄250英鎊來阻止這種可能性就是一筆合適的交易。
給諸如電視機、微波爐等的損壞上保險通常是壞主意。損失的總額很小,負效用和賠款本質上是相等的,保險公司會收取大額的保險費來保證盈利。應該將假想的保費存入銀行作為修繕基金,而不是買高保費保險。很少有人會因為這麽做而後悔。
如果你能成功地創建你自己的效用函數,你能夠用它在不確定性存在的情況下做出選擇。對於每一項行動,計算各種結果的預期效用(expected utility),即用對應的概率對效用加權,然後選擇預期效用最大的一項行動。
無論具體情況如何,這就是概率論者做選擇時候的通用秘訣。
[1] 全稱Epsom Derby,為每年在英國舉行的賽馬比賽。
[2] 概率論中的一個基本結論。