博弈論的“前生今世”

日常生活中,我們總能見到大大小小的博弈,博弈可以是多人參與的,也可以是在多團隊之間進行的。在博弈中,參與者會受到特定條件的製約,且都希望能使自身得到的利益最大化。參與者往往會根據對手的策略來實施對應的策略。從這個意義上來看,博弈論又可以被稱作對策論,同時它還有一個較為通俗的名字,即賽局理論。博弈具有鬥爭性和競爭性的現象,而博弈論所研究的就是這類現象的理論和方法。

博弈論中總是會運用到數學知識,所以它也被看作應用數學的一個分支,或者是運籌學的一門重要學科。遊戲和博弈中的激烈結構之間有著相互作用,而博弈論正是用數學的方法來研究這種相互作用。

在一個博弈遊戲中,參與者需要考慮對手的實際行為和預測行為,並根據這些行為優化自己的策略。表麵上來看,有些博弈中的相互作用是不同的,但它們在運作時卻可能表現出相似的激勵結構,最具代表性的案例是囚徒困境。

博弈行為通常是競爭性行為,所以這種行為往往會表現出對抗的性質。參與這類行為的人一般都具有各自不同的目標或利益。在博弈過程中,人人都會向著自己的目標努力,他們會充分考慮對手可能采取的行動方案,並製訂自己的合理方案,從而使自身的利益獲得保障,我們在日常生活中進行的遊戲,如下棋、打牌等都屬於博弈行為。

由此不難理解博弈論所要研究的內容:事實上,博弈論就是站在研究者的角度,充分考慮博弈各方所有可能的行動方案,並運用數學方法找出最合理的行動方案的一種理論或方法。由於它的主要工具是數學,所以嚴格來說它是一種數學理論或數學方法。

在中國古代,博弈論思想就已經存在,最具代表性的博弈論研究者是著名軍事家孫武,他的《孫子兵法》既是一本軍事著作,也是一部博弈論專著。人們最初常把博弈論思想用以研究娛樂性質的勝負問題,比如人們在下象棋、打牌或者賭博中都會用到這類思想。但是,在此階段的博弈論是相對粗淺的,人們隻是根據經驗來把握博弈的局勢,努力使自身利益最大化,它還沒有向著理論的方向發展。直到20世紀初,博弈論才正式發展成為一門學科。

最早開始研究博弈論的是策墨洛、波雷爾和約翰·馮·諾伊曼。策墨洛的研究是用數學方法研究博弈現象的第一次嚐試,波雷爾為博弈論的發展起到了巨大的推動作用,約翰·馮·諾伊曼和奧斯卡·摩根斯坦第一次對博弈論進行了係統化和形式化的研究。

此後,約翰·福布斯·納什提出“納什均衡”的概念,他認定博弈中存在著均衡點,並運用不動定理成功證明了該點的存在,這一重要的研究為博弈論的普遍化奠定了重要的基礎。什麽是“納什均衡”呢?它指的是:博弈中的所有人都將麵臨的一種特殊情況,即當對手不改變自己的策略時,他當前的策略是最優選擇,如果參與者改變他當前的策略,他的利益就會受損。隻要博弈參與者都保持理性,那麽他們在納什均衡點上就不會有改變自身策略的衝動。

要證明納什均衡點的存在,就需要提出一個新的概念,即“博弈均衡偶”。“博弈均衡偶”指的是若參與者A在兩人零和博弈中采取最優策略a+,那麽參與者B也會采用其最優策略b+;若參與者A采取策略a,那麽他的損失不會超過他采取策略a+時的損失,這種結果也適用於參與者B。若給“博弈均衡偶”下一個明確的定義,則是:策略集A中的策略a+和策略集B中的策略b+叫作均衡偶,對於策略集A和策略集B形成的成對策略a、b,總是滿足以下條件:偶對(a,b+)≤偶對(a+,b+)≥偶對(a+,b)。若納什均衡點在非零和博弈中,“博弈均衡偶”的定義則為:策略集A中的策略a+和策略集B中的策略b+叫作均衡偶,對於策略集A和策略集B形成的成對策略a、b,總是滿足以下條件:參與者A的偶對(a,b+)≤偶對(a+,b+);參與者B的偶對(a+,b)≤偶對(a+,b+)。根據這兩個定義就可以得到納什定理:在兩人博弈中,隻要參與者的純策略是有限的,其必然存在至少一個均衡偶,也稱為納什均衡點。要證明納什定理必須運用不動點理論,因為這一理論是研究經濟均衡的主要工具。也就是說,找到了博弈的不動點就等於找到了納什均衡點。

作為一種重要的分析工具,納什均衡點能讓博弈研究在特定的結構中找到有意義的結果。但是,由於納什均衡點的定義中規定參與者不會單方麵改變策略,忽略了其他參與者改變自身策略的可能性,所以具有非常大的局限性。納什均衡點的應用在多種情況下缺乏說服力,因此一些博弈研究者將它稱為“天真可愛的納什均衡點”。

除了策墨洛、波雷爾、約翰·馮·諾伊曼、奧斯卡·摩根斯坦、約翰·福布斯·納什外,對博弈論的發展做出推動性貢獻的還有賽爾頓和哈桑尼等人的研究。塞爾頓完善了納什均衡理論,他剔除了一些不合理的均衡點,形成了兩個精煉的均衡新概念,即子博弈完全均衡和顫抖之手完美均衡。

時至今日,博弈論已經發展成一門相對成熟和完善的學科。目前,博弈論在多個學科和領域獲得了廣泛的應用,特別是在生物學、經濟學、計算機科學、數學、政治、軍事等學科和領域的表現尤為出色。

例如,一些生物學家會利用博弈論來預測生物進化的某些結果,或者理解生物進化的原因。1973年,美國《自然》雜誌上刊登了一篇論文,其中便提出了一個有關博弈論的生物學概念,即“進化穩定策略”。此外,我們還能在演化博弈理論、行為生態學等方麵見到博弈論的身影。作為應用數學的一個重要分支,博弈論還被應用於線性規劃、統計學和概率論等方麵。

一般來說,博弈論引入經濟學是由美國著名數學家約翰·馮·諾伊曼和經濟學家奧斯卡·摩根斯坦在20世紀50年代率先完成的。現代經濟博弈論已經成為經濟分析的主要工具,它極大地促進了經濟理論的發展,特別是對信息經濟學、委托代理理論和產業組織理論做出了重要貢獻。

1994年和1996年,以約翰·福布斯·納什為代表的多位從事博弈論研究和應用的經濟學家憑借他們在經濟領域所做出的突出貢獻成功獲得諾貝爾經濟學獎。在博弈論未被應用在經濟領域之前,傳統經濟學分析的思路較為狹隘,而博弈論的引入清晰地呈現出經濟主體之間的辯證關係,使得經濟學的分析有了新的思路,這不僅與現實市場競爭十分貼近,還為現代微觀經濟學和宏觀經濟學奠定了基礎。

博弈論的基礎是建立在眾多現實博弈案例之上的。而博弈這一現象具備了一定的要素,主要有五個方麵:局中人、策略、得失、次序、均衡。

局中人是博弈的參與者,每個參與者都能對自身策略進行決策,但不能改變別人的決策。若博弈中的局中人隻有兩個,這種博弈便稱為“兩人博弈”,若博弈中的局中人超過兩個,則這種博弈便是“多人博弈”。

策略是博弈過程中局中人所做出的實際可行的行動方案,局中人的一個策略不是指他所采取的某一階段的行動方案,而是指他在整個博弈過程中從始至終所采用的一個行動方案。根據可能采取的策略的有限性或無限性,博弈可被分為“有限博弈”和“無限博弈”。在有限博弈中,局中人的策略是有限的;在無限博弈中,局中人的策略則是無限的。

每場博弈中,局中人最後的結果有得有失,因此每局博弈的結果稱為得失。局中人博弈的得失與兩個因素相關:一是其自身所選定的策略,二是其他局中人所選定的策略。每個局中人在博弈結束時的得失可根據所有局中人選定的一組策略函數來判定,人們把這個函數稱為支付函數。

局中人的決策總是有先有後的,與此同時,每個局中人都可能要做多個決策選擇,這些選擇也是有先後順序的,博弈的次序能決定博弈的結果。在其他要素相同的情況下,若局中人決策和選擇的次序不同,博弈也會不同。

每場博弈都會涉及均衡問題,所謂均衡,即指平衡,或者說相關量處於一個穩定值。這是經濟學中的常用術語。例如,若一家商場的商品能夠處於一個均衡值,使得人們想買就能買到這種商品,想賣就能賣出這種商品,那麽這個商品的價格就是這裏的均衡值。有了這個價格做保障,商品的供求就能達到均衡狀態。納什均衡就是這樣的一個穩定的博弈結果。