何為博弈——博弈的分類與基礎構成

對於博弈的分類,有一種方式是這樣表述的:在宣布博弈結束時,所有參與博弈的局中人所獲得報酬的總和是否永遠為零?若總和為零,那麽就相當於支付隻在局中人之間進行,並不產生其他事物的生產與消耗,即我們所接觸到的一切具有娛樂性質的遊戲。這種博弈稱為零和博弈,反之則稱非零和博弈。

首先,如果我們可以建立一套針對零和博弈的理論,那麽就可以借助這一理論幫助我們處理其他一切博弈。我們將會在零和二人博弈的基礎上應對局中人增多的零和n人博弈,零和n+1人博弈。

那麽在零和二人的博弈中,應該注意的根本問題是:博弈中的每個局中人是怎麽策劃其活動的?在博弈的各個階段,他們又有什麽情報信息呢?若其中一個參與者了解到另一個參與者的策略,會對整個博弈產生什麽樣的影響呢?若了解了全部關於博弈論的理論知識,又能起到什麽樣的作用呢?

我們首先要做的就是對博弈進行一個概念的定義。

關於博弈的概念,有很多是比較基本的,但是博弈是一個具有組合型的概念。在日常語言描述中,它的用法經常模棱兩可。對於博弈的解釋,有時表示一種含義,有時又另有所指,甚至會讓人認為對博弈的解釋就是它的近義詞,基於此,我們將會給出專業的術語:

首先,博弈是一個十分抽象的概念,它與某些博弈比賽有著一定的差別。我們必須將博弈的抽象概念與博弈中的賽局進行區分和分辨。前者指的是,那些能夠描寫博弈這個抽象概念的規則全體,是博弈從開始到結束,按照特定的方式進行,整個進行的過程稱為一場博弈。在日常生活中,我們通常會將“一場”稱為一個競賽,諸如,國際象棋、撲克、體育運動等。

其次,“著”(讀作zhao)是博弈的構成元素,我們也應該知道其界定。“著”指的是,在賽局的所有可能選擇中做出抉擇的權利,此項權利可以交給賽局中的某一個人執行,或者采用隨機的方式進行,而這些方式在博弈的具體細則中都有非常明確的規定。因此,“著”不僅代表了博弈中的“決定權”,還是博弈的組成元素。在每一個具體的賽局中,所有的抉擇都是由一種特定的走法決定的。所以,“著”對於選擇而言就相當於局對於博弈。簡言之,一係列的“著”共同組成了博弈,一係列的選擇構成了整個局。

最後,要明確博弈的規則與整個賽局中的人的選擇、策略並不相同。在賽局中,每個人都可以隨意做出自己的選擇,我們將這種選擇的任意性稱為支配個人選擇的一般原則。由於每個人的策略在本質上有著好壞之分,是否采用他們的決策則是每個賽局中的參與者的自由,但是這些都是在博弈的規則下進行的,然而博弈的規則是不允許被打破的。假設博弈規則遭到破壞,那麽整個事件將不再使用最初的規則進行描述了。事實上,在大多數情況中,甚至是在物質基礎上,規則都是不會被破壞的。

簡單說,在國際象棋比賽的規則中,要求所有棋手都不能使用自身的王棋進行“將軍”,這就如同禁止“卒”棋橫走一樣,這些鐵定的規則是不容許遭受違反和破壞的。但是,若是棋手把自己的“將”棋放到了下一步對手就能把他“將”死的位置上,那麽這是一種不聰明的下棋方法,自然就不屬於國際象棋比賽的規則。

假設在一場博弈T中,有n個局中人,為了方便我們了解博弈的基本組成要素,我們將這n個局中人分別標記為1,……,n。根據我們前麵的講述,這個賽局是由一係列的“著”所組成的;假設在賽局進行之前我們便將所有的數目和它們的順序全部設定完了,在進行的過程中,我們便會發現這些設定好的東西並不重要,想要把它們取消是一件非常簡單的事情。此時,在整個博弈局中,我們用字母v表示“著”中特定的數量,而這個v是一個正整數,它表示1,2,……,我們用m1,……,m(v)表示博弈中的“著”,同時假設這便是它們在規定中出現的順序。

在此次博弈中,每一個“著”m(k),k=1,……,v,它們代表了無數種可能出現的走法,這些不同的選擇構成了“著”。此時,我們用a(k)表示賽局中可能出現的不同的走法的數量,用w(1),……,w(k)(ak)表示博弈中所有走法的自身。

在賽局中,可以將“著”分為兩種。假設在局中人中指定任意一人做出選擇,那麽將會依賴他的自由選擇權,其中不摻雜任何其他的因素,這種選擇被稱為“著”中的“第一類的著”,亦或者“局中人的著”。假設在賽局中所做出的選擇是建立在某種機械規則上的,那麽便會依據一個確切的概率來決定它最終的結果,這種選擇方式被稱為“第二類的著”,抑或者“機會的著”。因此,對於前者而言,需要指定任意一個局中人的選擇來確定“著”的結果,即應該明確指出這個“著”是哪個局中人的意誌選擇的。若我們用k(k)來標記這個局中人,即他的序列號碼,由此一來,k(k)=1,……,n。

對於第二種“機會的著”,我們提前設定好,令k(k)=0。在此種情形下,便會出現不同的走法,即w(k),……,w(k)(ak),那麽前提條件是它們的概率必須是已知的,我們用p(k)1,……,p(k)(ak)來表示這些已知的概率。

因此,在任意一個“著”m(k)中的選擇,都是從w(1),……,w(k)(ak)中所得到的。即,隨機挑選出一個數1,……,a(k)。假設我們用θ(k)表示隨即挑選出來的某個數,那麽我們能夠非常清晰地看出,這個數便是從θ(k)=1,……,a(k)中選擇出來的。在此基礎上,我們能夠將所有的“著”所對應的不同選擇表示出來,即m1,……,m(v),那麽整個賽局便能清晰地表示出來。簡單說,這個賽局便能夠用一個直觀的數列表示出來,即θ1,……,θ(v)。

事實上,整個博弈T中的所有規則必須提前明確,若一個賽局是由一個已知數列θ1,……,θ(v)表示,那麽,任何一個局中人k=1,……,n,在此賽局中的結果是什麽,這就說明,在整個賽局結束時,參與博弈的每個人將會獲得怎樣的報酬。假設我們用F(k)表示每個局中人應得的報酬,當k獲得一筆報酬,那麽F(k)>0;假設他在對局中付出了一筆報酬,那麽F(k)<0;若以上兩種情況都不符合,則F(k)=0。因此,對於每個F(k)都應該是由函數θ1,……,θ(v)所得出的,即:

F(k)=F(k)(θ1,……,θ(v)),k=1,……,n。

此時,必須強調博弈T的規則僅表示了F(k)=F(k)(θ1,……,θ(v))是一個函數,這就意味著每一個F(k)所對應的變量θ1,……,θ(v)是一種抽象的依從關係,而且其中的任意一個θ(k)是一個變量,它的取值範圍是1,……,a(k)·θ(k)的特定數值。簡言之,它是從數列θ1,……,θ(v)中選擇的,並不屬於博弈T裏。正如我們前麵所講到的,這便是對一個局的定義。