08 其他應用 Other Appl ications

這一章中我們不關注概率在擲色子、賭場賭博和其他在自然科學中的種種應用。這一章中為了展示概率的普遍存在,我找出了它在法律、社會科學、體育運動和經濟學中的應用。

法律事務

盡管20世紀最著名的英國法官之一——丹寧勳爵(Lord Denning)有一個數學學位,但是很少有律師對概率抱有好感。有關概率這門學科有關的措辭在法庭中被自由使用,這應該是令人震驚的。在民事案件(例如誹謗案件)中,陳述“概率是均衡的”就相當於明確地將分割線設在了50%。但是在刑事案件中,隻有在陪審團“確認”有罪後他們才能定罪。在數字上沒有共識。其中一些人在她們80%確定有罪時定罪,另一些人會在95%或者更高時確定。這些明顯是主觀概率。而且盡管無論在什麽樣的罪行判定中都使用相同的措辭,有些人會對相對較小的罪行采取較低的證明閾值。這也就是為什麽比起逃票,惡性謀殺案更難以定罪。

假設一名專家證人做證說被告的DNA與在案發現場找到的DNA相符,而後者與隨機選取的一個無辜者相符的概率是幾百萬分之一。陪審員們對這個證詞的理解可能存在兩個不同的問題。第一個是他們也許會認為證詞等價於說在犯罪現場發現的DNA不屬於被告的概率是幾百萬分之一。第二個是他們會將所有這些很小的數字等量齊觀,即使一千萬分之一與十億分之一的一百倍是不同的。

第一個問題被稱為“檢察官謬誤”(prosecutor’s fallacy)。很明顯這個錯誤就相當於認為已知DNA相符的情況下無罪的概率,與已知無罪的情況下DNA相符的概率,是相等的。這是個邏輯上的無稽之談。已知輪盤賭輪是公正的時候,轉到0的概率與轉出了0的情況下賭輪公正的概率並不相等。向陪審團提供與犯罪現場DNA相符的市民的數量會避開這個陷阱。在有大約6000萬人口的情況下,如果相符的概率是兩百萬分之一,就會有30人左右相符;如果概率是兩千萬分之一,大約有3個人相符,不太可能超過半打。但是不要忽略了“隨機選取”這句話:與罪犯親緣越近的人,越可能相符,這個證據對被告不利的程度就越弱。

通過考慮到貝葉斯公式計算證據有效性的方法,可以避免第二個錯誤。在這個證據呈遞之前,你對被告是否有罪有一定的看法。如果證據出現的可能性在有罪時是無罪時的10倍,那麽有罪的賠率就會在證據出現之後乘以10;如果證據出現的可能性在無罪的時候是有罪的時候的3倍,那麽有罪的賠率就會減少到原來的1/3,以此類推。在存在DNA證據的情況下,假設有罪時證據出現的概率經常是100%,這就讓證據的影響變得清晰起來:有罪的賠率就應該乘以那個是“幾百萬”的具體數字。

隨機化回答

一名班主任想要查明高年級學生吸食大麻的比例。直接詢問無法得到可信的答案,但是一種稱為隨機化回答(randomized response)的技術是可用的。大意就是負責記錄回答的老師並不知道實際上詢問的問題是什麽,所以大麻使用者就不會擔心被認出而可以誠實地回答問題。

80張卡片每張都寫著“我吸食大麻”,另外20張都寫著“我不吸食大麻”。每張卡片都被裝入完全相同的信封中,這100個信封在一個大袋子中被充分混合。學生們應該看到這些操作,所以他們明白袋子中裝著兩種不同版本的問題和它們的比例。

安吉拉隨機選擇了一個信封,打開了它並自己看了問題,然後僅僅回答“同意”和“不同意”中的一個。然後她將卡片放入信封,將信封返還到袋子中,並搖晃袋子為下一個學生做準備。

假設1/3的回答都是“同意”。因為學生們都是隨機地抽取信封,“同意”來自80%的使用者,與20%的非使用者的誠實回答。幾行代數計算顯示這與2/9的學生是使用者的情況是一致的。班主任得到了他的答案,沒有單獨哪個學生被認出來。

或者,把“我不吸食大麻”替換成一個無關的題目,它被“同意”的比例是已知的。如果一個早期的調查估計有一半學生擁有一隻寵物,而且沒有理由將吸食大麻和擁有寵物聯係在一起,在那20張卡片上的問題就可以是“我擁有一隻寵物”。然後,如果1/3的回答是“同意”,我們估計7/24的學生是大麻使用者。

得出這些答案的計算過程會在附錄中給出。

每次提問時問的是哪個問題的不確定性致使最終估計中存在一些不精確度。裝有敏感問題的信封的占比應該盡可能高,但是要足夠低以使真正的大麻使用者相信給出誠實的回答不會招致麻煩。在高達95%的卡片上設置敏感問題是不會有效果的。

世界反興奮劑機構

世界反興奮劑機構(The World Anti-Doping Agency,WADA)致力於促進體育運動成為一項健康的活動,他們識別使用能提升表現的藥物的運動員,並將之排除在比賽之外。但是無論使用什麽方法,任何檢測程序都可能會給出兩種相反的錯誤:認為一名無罪運動員使用了禁藥,和讓一名禁藥使用者通過檢查。

不幸的是,減少兩種錯誤之一的概率的方法經常會造成另一種錯誤的概率增加。例如,檢測測量睾酮(testosterone)與表睾酮(epitestosterone)的比例。正常情況下肌體產生相等數量的這兩種物質,但是那些通過注射睾酮以作弊的運動員就會有較高的T/E比。T/E比高於某個特殊的值,比如6比1的運動員,將會被禁止參賽。然而,自然情況下T/E比就會變化:它會隨著月經周期(menstrual cycle)變化,如果你得流感了,它也會增加。將T/E比臨界值設定得太高則沒有藥物作弊者會被檢出,設置太低則許多無罪的運動員將會被錯誤地指控。

假設某一次檢測出錯誤的概率是1%。這意味著如果這個運動員是無罪的,那麽他們不通過檢測的概率是1%;如果他們是禁藥使用者,那麽他們通過檢測的概率也是1%。薩姆沒有通過測試:她是無罪的概率是多大?

問題這樣描述,那麽你幾乎會脫口而出認為是“1%”——這個測試每100次出現一次錯誤,所以如果她沒有通過測試,出錯的可能性就是1/100。你要克製這種衝動。唯一的正確答案是:“我不知道,這個概率可能是任何值。我們需要知道在全體受試者中使用禁藥作弊的比例。”

比如,假設這個比例是1%左右。那麽在10 000個運動員中預計有100個禁藥作弊者,和9900個無罪者。在檢測中,我們預計隻有1個禁藥使用者通過了測試,其餘99個都不能通過測試。但是9900名無罪者中的1%,也就是說99名運動員,也會無法通過測試。在那些無法通過測試的運動員中,一半是無罪者:那麽薩姆是無罪者的概率就是50%。

如果禁藥作弊者比例不同於1%,結論就會變化。如果它升高,薩姆無罪的概率就會降低,但如果它降低,她無罪的概率就會升高。禁藥使用者的比例越低,這項測試就會越不令人滿意,盡管它顯然表現出色。

在我們考慮如何檢測出機場中的恐怖分子的時候,相同的邏輯也會奏效。無論什麽篩選設備都不會是完美的,但是假設一名真正的恐怖分子規避掉這些檢測的概率是很低的,比如說1/10 000,同時一名無辜的人被帶進小屋進行嚴密審訊的概率是1/100 000。那麽一個被揪住的人有罪的可能性有多大?

我們在不知道準乘客中恐怖分子的比例的時候沒法回答這個問題。試作1/1 000 000——考慮到希思羅機場(Heathrow Airport)每年客流量為5000萬,這高得恐怖。但是這個數字使我們確信,即使有50名潛在的恐怖分子,他們全被檢測出也是極有可能的。

但不幸的是,500名無辜的乘客也將會被扣押!在那些被檢測係統攔截的人中,隻有少於10%是恐怖分子。而且如果恐怖分子少於50名,被攔截的人確實有罪的概率甚至更低。檢測方法想要有效的話,準確性需要更高。

足球比賽結果(1)

在英國,賭足球比賽的結果會引起人們的極大興趣。無論賭局多麽奇異都會有人捧場——賭第一個球的進球時間、所有進球球員所穿球衣的號碼之和、比賽中判多少次黃牌和紅牌——但最引人注目的是比賽結果是主隊獲勝、平局、客隊獲勝這三種中的哪一種。一個理性的下注者會評估這三種結果各自的概率,而他是否下注、下注大小,還有賭本的賠付金額(payout prices)都會基於這些評估。

但是下注者如何推斷出他對不同結果的可信度呢?2009年5月,統計學家大衛·斯皮格霍特(David Spiegelhalter)接受BBC廣播節目《更多或更少》(More or Less)的挑戰來分析兩天後進行的10場英超聯賽。對每一場比賽,他都基於對每一支隊伍的進攻能力及其對手的防守能力的考察,給出了每支隊伍平均的進球數。例如,一個強勢的主隊,如阿森納(Arsenal)在對陣斯托克城(Stoke City)的比賽中估計平均會進球2.1個。

沒有任何一支球隊會進球2.1個,這個數字隻是假想數量的比賽中進球數的平均值。最重要的步驟是評估在單場比賽中進球數為0、1、2、3……的概率,斯皮格霍特使用了泊鬆分布。多年以來的數據顯示,這是一個描述實際進球數在其平均值附近變化情況的好方法。在阿森納平均進球數為2.1時,沒有進球的概率是12%,進1球是26%,進2球是27%,進3球是19%,等等。

斯托克城的數據顯示他們的平均進球數是0.67。這相當於沒有進球的概率是51%,隻進1球是34%,進2球是11%,等等。我們姑且相信每支隊伍的進球數都是無關的。所以比賽結果為2比1的概率來自主隊進2球的概率乘以客隊進1球的概率——在上述情況中為27%×34%,大約為9%。

在這種方法中,任何可能的比分結果都被估計了。然後主隊獲勝、平局、客隊獲勝各自的概率就可以用加法定理計算得到,即將能得到這三種比賽結果的比分的概率分別加在一起。這就得到了阿森納獲勝的概率是72%,斯托克城獲勝的概率是10%,平局的概率是18%。比分結果2比0的概率最高,是14%。

別得意!10場比賽中最高概率的比分才出現2次,而8場比賽的比分都是已被認定為不是最可能的。賭徒已經把錢押在了每個“最可能的結果”和每個“預測的”確切分數上,即使比賽比分結果未揭曉,他也會笑得很開心。

我們不能讓阿森納進行同一場比賽100次來計算他們獲勝的頻率,那麽我們如何調和阿森納獲勝72%的可信度與概率的頻率觀點呢?回憶我們是如何評價天氣預報的準確性的,播報員說明天下雨的概率是30%。隻有一個明天,明天要麽下雨要麽不下雨。然而,我們可以查看她給出30%降雨概率所對應的所有場合,並計算第二天確實下雨了的頻率。我們應該根據她播報的整體記錄,選擇相信或不相信她對明天天氣的播報。在足球比賽中,我們也可以對於整個賽季中進行的所有比賽做類似的計算。在這些比賽中(也許共有40場),對其中一些比賽我們給出了接近72%的概率——我們可以檢查“預測的”結果真的發生了的頻率是否在72%左右,這可以作為一種驗證我們方法的方式。

一個賭徒通過使用這些方法就能夠贏錢了嗎?賠付金額很大程度上依賴於每種比賽結果被下了多少注,最大的金額通常都會被下注到一支隊伍的獲勝或者另一支隊伍的獲勝。忠誠的粉絲們不會傾向於下注到平局上。如果評估得到的平局概率是25%,而且賠付高於3比1,賺錢的機會就在這裏。

所以不要以為最好的下注方式就是押在有最高預測概率的比賽結果上!

足球比賽結果(2)

在2010年國際足聯世界杯決賽前夕,統計學家伊恩·麥克海爾(Ian McHale)發表了他的計算結果,為32支球隊分別指定了贏得世界杯的非零概率。他認為西班牙隊最有可能獲得世界杯,盡管隻有11.6%的可能性;緊隨其後的是巴西隊,他對其給出的概率是10.3%。

為了計算得到這些結果,麥克海爾使用了與上述計算類似的方法來計算每場比賽的結果。然而,他並未直接計算每場比賽不同結果的概率,他依靠蒙特卡羅模擬。

英格蘭隊每場比賽的平均進球數為1.5,泊鬆分布模型給出沒有進球的概率是22%,進1球的概率是33%,等等。計算機的隨機數生成器選取0、1、2、3……中的某一個值和與其對應的概率,並對英格蘭隊的對手做相同操作,得到一些模擬比分結果例如2比2平局。對每一場預定的比賽都進行類似的模擬,得到模擬分組表格,然後進行淘汰賽階段的比賽直到決賽。這個過程重複了100 000次,每一支隊伍成為總冠軍的模擬數都被記錄下來。西班牙“獲勝了”11 633次,因此有前述的11.6%這一數字。像往常那樣,大數定律是這個方法合理的理由。

那一年西班牙隊的確獲勝了!麥克海爾的概率是“正確的”嗎?我們不知道,如果能進行無限次重複的聯賽,也許西班牙隊會在其中的65%獲勝。但是能證明其方法合理的最好證據就是,莊家們設定初始賠付金額時沿用同樣的方法來吸引下注者。

布萊克-斯科爾斯模型

股票市場上的股價會波動,有些時候沒有明顯的原因。如果今天價格是5英鎊,你不知道下個月會是什麽價格。然而,你可以購買期權(option)——在一個指定的未來時間按照行使價(strike price)5.2英鎊購入(或者出售)的權利。如果在未來的那個時候,市場價少於5.2英鎊,你應該不會行使期權來購買;但是如果市場價高於這個價格,通過行權買入並立即出售你就可以立即獲利。相應的論述也適用於認沽期權。那麽這些期權的合理價格是什麽?

費舍爾·布萊克(Fischer Black)和邁倫·斯科爾斯(Myron Scholes)於1973年解決了這個問題。他們工作的核心是假設股價會隨機變化,但是變化方式是一種與高斯分布有關聯的特定方式。認購期權與認沽期權的合理價格都依賴於當前價、行權價格、幹預時間、現行利率和相關價格的波動性(用一段時間內的標準差來衡量),但是不依賴於平均的價格預期值!

最後一點似乎是令人驚訝的,但這就是現實的運作規律。這也是非常有用的,這意味著我們避免了任何因估計價格趨勢而引入的不確定性。如果你想要知道一些特定期權的合理價格,有免費的軟件可用——隻需要在你最喜歡的搜索引擎中輸入“布萊克-斯科爾斯”。給定當前價格和行權價格,如果時間間隔變長,利率變高,或者價格波動性升高,一份認購期權的合理價格會隨之增加。

剛才那句話與你的直覺相符嗎?第一個情況似乎的確是合理的,因為你等待的時間越長,相關價格上漲的概率就越大,但是另外兩個情況就更加微妙了。波動性的增高會使得價格上漲的概率更高,但同時也會讓價格下跌的概率更高——但是前者的效應更強一些。

通過考察這一年中約250個交易日內價格的變化,可以衡量得到波動性。為了使估計是可靠的,應該向模型提供足夠的數據,但是也不能向過去延伸得太遠,因為那些數據與現在的情況不相關。對於波動性的不良估計會導致對期權合理價格估計的不合理。

隻有在假設合理的情況下一個模型才是有效的。如圖7所示,認為價格波動符合高斯分布就意味著嚴重事件的概率是非常小的,例如價格下降了3或4個標準差。當這些事件的真實概率被嚴重低估的時候,模型就是無效的,而模型導出的結論就根本沒有合理的基礎。在第4章中提到過的極端值分布可以用來解決這個問題。

投資分配

A公司與B公司都預計會盈利。在低利率的情況下,A預計會收益20%, B預計會收益40%;在高利率的情況下,情況反轉——A會盈利40%, B是20%。假設尼克是一名規避風險的投資者,而瑪麗喜歡冒險。

如果高利率和低利率可以被認為是同等可能的,兩個公司看起來都很吸引人,收益平均都是30%。依據兩人對風險的態度,尼克會將資金分成兩等份投給兩家公司,而且一定會獲得30%的收益,無論實際利率是高是低;瑪麗會把所有錢投到其中一家公司,並希望會獲得40%的收益,但也得接受隻獲得20%收益的結果。

假設情境中C公司取代了B公司,其會在低利率的時候有10%的收益,或者在高利率的時候有50%的收益——同樣的平均為30%,這一點與B公司一樣。但是將A與C組合對兩名投資者都沒有意義:尼克隻鍾意於A,瑪麗將所有的錢投入C。

兩種情況的本質區別是,A與B的收益是負相關(negatively correlated)的——在一個比較高的情況下,另一個比較低;但是A與C的收益是正相關(positively correlated)的——它們一同變好或者變壞。“相關性”(Correlation)以一個在-1(完全負相關)和1(完全正相關)之間的值來衡量。如果每家公司的資產波動變化都獨立於另一家,它們的相關性就是0。

規避風險的投資人傾向於分散持股,所以任何損失都會被其他地方的收益所彌補。它們希望持有負相關的資產。但是其中有一個無法避免的邏輯陷阱:如果X與Y負相關,Y與Z負相關,那麽X與Z就似乎是正相關了!

然而,還有一線希望。所羅門·博納(Salomon Bochner)的數學工作結果證明了在很大的投資組合中,每一對投資都是負相關的確是有可能的。但是投資可選的數目越大,兩兩負相關的情形就越難以達到。