相互背叛的囚徒:囚徒困境

1950年,數學家塔克任斯坦福大學客座教授,在給一些心理學家作講演時,講到兩個囚犯的故事——

有兩個小偷甲、乙聯合犯事,私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的選擇是:

A:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年。

B:如果另一個犯罪嫌疑人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。

C:如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私闖民宅的罪名將兩人各判入獄1年。

三種可能,三個選擇,足以讓身在其中的囚徒絞盡腦汁,寢食難安。

如同經濟學中的其他例證,我們需要假設這兩人都是理性的經濟人,他們都尋求最大自身利益,而不關心另一個參與者的利益。

現在,這兩個囚犯該怎麽辦呢?是選擇相互合作還是相互背叛?從表麵上看,他們應該相互合作,保持沉默,因為這樣他們倆將得到對雙方來說都是最好的結果——隻獲刑1年。但是,由於信息被封閉,兩人無法交流,而他們又不得不考慮對方可能采取的選擇。由於甲、乙兩個人都尋求自身最大利益,所以他們都會優先考慮如何才能減少自己的刑期,至於同夥被判多少年已經顧不上了。

甲會這樣推理:假如乙不招,我隻要一招供,馬上就可以獲得自由,而不招卻要坐牢1年,顯然招比不招好;假如乙招了,我若不招,則要坐牢10年,他卻獲得了自由,而我招了也隻坐8年,顯然還是招了好。可見無論乙招與不招,甲的最佳選擇都是招供。所以,甲想:還是招了吧。

於是,甲知道該怎樣做了。但是,別忘了:相同的邏輯對另一個人也是同樣適用的。因此,乙也會毫不猶豫地選擇背叛——也就是招供。

這樣一來,甲、乙兩人都選擇招供,這對他們個人來說都是最佳的決定,即最符合他們個體理性的選擇。而他們各自最理性的選擇,給他們帶來的並非最佳結果(自由),也非較佳結果(1年刑期),而是比最壞結果(10年)要略好的結果(8年刑期)。順便提一下,這兩人都選擇坦白的策略以及因此被判8年的結局被稱作是“納什均衡”(也叫非合作均衡)。所謂納什均衡,指的是參與人的一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處。換句話說,如果在一個策略組合上,當所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。納什均衡是博弈論的一個重要概念,以普林斯頓大學數學博士生約翰·納什命名。

並非一定要觸犯刑法,才會深陷極為被動的囚徒困境中。事實上,在我們工作與生活中,類似的囚徒困境並不少,人為地製造囚徒困境(而自己充當警察)來保證自己利益的事也屢見不鮮。哈佛大學巴羅教授曾提出的著名的“旅行者困境”,可以為我們提供一個視角——

兩個旅行者從一個以出產細瓷花瓶著稱的地方旅行回來,他們都買了花瓶。提取行李的時候,發現花瓶被摔壞了,於是他們向航空公司索賠。航空公司知道花瓶的價格大概在八九十元的價位浮動,但是不知道兩位旅客買的時候的確切價格。於是,航空公司請兩位旅客在100元以內自己寫下花瓶的價格。如果兩人寫的一樣,航空公司將認為他們在講真話,就按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就認定寫得低的旅客講的是真話,並且原則上照這個低的價格賠償,同時,航空公司對講真話的旅客獎勵2元,對講假話的旅客罰款2元。

就為了獲取最大賠償而言,本來甲乙雙方最好的策略,就是都寫100元,這樣兩人都能夠獲賠100元,可是不,甲很聰明,他想:如果我少寫1元變成99元,而乙會寫100元,這樣我將得到101元。何樂而不為?所以他準備寫99元。

可是乙更加聰明,他算計到甲要算計他寫99元,於是他準備寫98元。想不到甲還要更聰明一個層次,估計到乙要寫98元來坑他,於是他準備寫97元——大家知道,下棋的時候,不是說要多“看”幾步嗎,“看”得越遠,勝算越大。

你多看兩步,我比你更強,多看三步,你多看四步,我比你更老謀深算,多看五步。在花瓶索賠的例子中,如果兩個人都“徹底理性”,都能看透十幾步甚至幾十步、上百步,那麽上麵那樣“精明比賽”的結果,最後落到每個人都隻寫一兩元的地步。事實上,在徹底理性的假設之下,這個博弈的結果是:兩人都寫0元。

是的,在博弈中,最好是讓自己當規則的製定者。如果不幸淪為“囚徒”,那就努力讓信息互通,同時建立信任度——唯有如此,才能讓自己利益最大化。比如三四個扒手公然在大巴上連扒帶搶,一車人不敢做聲。本來如果一車人群起而攻之,可以輕鬆製服幾個毛賊,但是因為這一車人彼此不熟悉,都擔心自己一出頭就挨打。最後,雖然沒有挨打,但還是損失了財物。類比囚徒困境中的囚徒,等於大家都被判了“八年”,比挨打的“十年”略好,但本來是可以被“釋放”的。

最後,編者想要說的是:一個畫地為牢、隻考慮自身利益的人,遲早會落入囚徒困境而左右為難。唯有加強合作與溝通,並建立充分的信用度,才能創造出真正的雙贏乃至多贏的局麵。