“配銅錢”升級

我們已經得到了“配銅錢”以及“石頭、剪刀、布”的博弈結果,我們通過這些簡單的遊戲將它擴展到零和二人博弈方麵。

我們利用博弈中比較正規化的形式對其進行簡單的論證,假設參與博弈的兩個局中人可能做出的策略選擇分別為t1和t2,對於博弈賽局中局中人1的結果如何我們不進行嚴格的設定。但是,在這種情況下需要我們想象,參與賽局的局中人所采用的博弈理論不需要對準確的策略做出選擇,而是對賽局中有概率出現的、可能的策略做出選擇,由此一來,局中人1所做出的選擇將不是一個簡單的數字,而是不同策略可能出現的概率,同理,局中人2亦是如此。

在此種情況下,其中的局中人不對自身的策略做出選擇,而是利用一切可能的策略,即采用那些他可能需要的策略的概率,這個較為一般化的方式極大程度上解決了那些非嚴格確定情況下的難題。我們已經比較清晰地看到,這種情況的主要特征是如果其中的一個局中人的意圖被對手猜中了,那就意味著他會遭受一定數量的損失。

假設在博弈賽局中,對手能夠很有經驗地統計出對局中的第一個局中人的“特點”,便有可能對局中人的策略和行為做出合理的預測,因此他有機會掌握不同策略的概率。在這裏我們完全不需要去討論,在博弈賽局中究竟會出現何種情況,或者以何種方式發生,因為各種情況的發生具有隨機性和一定的概率,所以我們難以預測到事情發生的概率,換句話說,在任何一個情形中,將會出現何種結果是無法預判的。

由此一來,我們能夠清晰地看出,在此類型的博弈中,賽局中的任意一個局中人需要盡量保證自己的決策不被對手猜到,為了保證自己的意圖不被對手發現,要在策略的選擇上盡量保證隨機選擇不同的策略,因為能夠確定的隻有若幹策略的概率,而且這是一種十分有效的博弈方式。

其實利用這種方式,在博弈賽局中,對手就很難直接猜出同一對局中的策略選擇究竟是怎樣的,原因是局中人自身也不清楚自己會做出怎樣的選擇,實際上自己不清楚所要做出的決策選擇也是一種對自身安全的保障,因為它在某種程度上避免了消息的泄露。

這樣的闡述,似乎讓讀者覺得是我們讓局中人的自由受到了限製,其實這些情況總是會發生。比如,博弈中的局中人隻願意選擇一種確定的決策,進而放棄了其他可能的決策;抑或者他可能會按照幾種可能發生的概率做出決策,然後放棄了其他可能的決策。

在這種情況中,我們不難發現局中人的這種選擇,在一定程度上增加了被對手看穿意圖的危險。但是,其中的情況可能是這樣的:局中人所選擇的一個或者多個策略對他而言是有利的,這種內在有利的因素能夠促使他做出這樣的選擇。

上述的這些可能性全部包括在我們的方案中,假設博弈中的局中人不願意選擇某種策略,他隻需要將某種策略可能被選擇的概率設定成零即可。假設博弈中的局中人隻願意選擇某個策略,而不願使用其他的策略,隻需要將他想要使用的策略的概率設為一,采用其餘的策略的概率設為零。