博弈論案例分析

博弈論分析

1.經濟學中的“豬的收益”

這個例子講的是:豬圈裏有兩頭豬，壹頭大豬和壹頭小豬。豬圈的壹側有壹個踏板。每踩壹次踏板，就會有少量的食物落在豬圈另壹側遠離踏板的餵食口。如果壹只豬踩了踏板，另壹只豬就有機會先吃掉掉在另壹邊的食物。豬壹踩踏板，大豬剛好會在豬跑到食槽前把所有食物吃完；如果大豬踩了踏板，在小豬吃完掉下來的食物之前，還有機會跑到食槽，爭奪剩下的另壹半。

那麽，兩只豬會采取什麽策略呢？答案是:小豬會選擇“搭便車”策略，即在低谷期舒服地等待；大豬不知疲倦地在踏板和食槽之間跑來跑去，只為了壹點剩菜。

這是什麽原因呢？因為，小豬通過踩踏板什麽也得不到，但不踩踏板卻能吃到食物。對於小豬來說，不管大豬踩不踩踏板，不踩總是壹個不錯的選擇。另壹方面，大豬知道小豬不會踩油門。自己踩油門總比不踩好，所以他得自己來。

“小豬躺著，大豬跑著”的現象是故事裏的遊戲規則造成的。規則的核心指標是:每次落下的東西數量和踏板到餵食口的距離。

如果改變核心指標，豬圈會不會出現同樣的“豬躺著，大豬跑著”的場景？試試吧。

變化方案1:還原方案。餵食只有原來體重的壹半。結果小豬和大豬都不蹬了。小豬會踩，大豬會把食物吃完；如果大豬踩上去，小豬也會把食物吃完。誰蹬就意味著給對方貢獻食物，所以誰也不會有蹬的動力。

如果目的是讓豬多蹬，這個遊戲規則的設計顯然是失敗的。

變化方案二:增量方案。比以前多餵壹倍。結果小豬和大豬都會蹬。誰想吃就蹬。反正對方不會壹次吃完所有的食物。小豬和大豬相當於生活在壹個物質相對豐富的“物欲橫流”的社會，競爭意識不是很強。

對於遊戲規則的設計者來說，這個規則的成本是相當高的(壹次提供雙份食物)；而且因為競爭不強，讓豬多蹬也沒啥效果。

變化方案三:減量加移位方案。只餵原來重量的壹半，但同時要把餵食口移到踏板附近。結果小豬和大豬都拼命蹬。等的人不會吃，努力的人會得到更多。每壹次收獲都只是花。

對於遊戲設計師來說，這是最好的解決方案。成本不高，但收獲最大。

《智豬遊戲》的原著故事，啟發了競爭中的弱者(豬)等待最佳策略。但是對於社會來說，小豬搭便車時的社會資源分配並不是最優的，因為小豬沒能參加比賽。為了使資源得到最有效的配置，規則的設計者不希望看到任何人搭便車，政府也是如此，公司的老板也是如此。能否徹底杜絕“搭便車”現象，取決於遊戲規則的核心指標設置是否得當。

比如公司的激勵制度設計，獎勵太強，而且還是持股和期權。公司的所有員工都成了百萬富翁。且不說成本高，員工的積極性也不壹定高。這相當於《聰明豬遊戲》增量方案中描述的情況。但是，如果獎勵力度不大，觀眾有分成(即使是不幹活的“小豬”)，曾經很努力的大豬們也就沒有動力了——就像《聰明豬遊戲》第壹期縮減計劃中描述的情況。最好的激勵機制設計就好比換第三種方案——減員加換班。獎勵不是人人共享，而是針對個人(如業務比例提成)，既節約了成本(對公司而言)，又杜絕了“搭便車”現象，可以實現有效激勵。

很多人沒看過“聰明豬遊戲”的故事，但都在有意識地使用豬的策略。散戶在股市裏等著莊家上轎；等待產業市場出現有利可圖的新產品，然後大規模復制遊資牟取暴利；公司裏不創造效益但分享成果的人，等等。所以，對於制定經濟管理的各種遊戲規則的人來說，他們必須明白“聰明豬遊戲”的指數變化的原因。

二、囚徒困境博弈

在博弈論中，占優戰略均衡的壹個著名例子是塔克給出的“囚徒困境”。

困境)博弈模型。這個模型以壹種特殊的方式告訴我們壹個警察和壹個小偷的故事。假設甲、乙兩個小偷共同作案，私自入室，被警察抓住。警察把這兩個人放在兩個不同的房間裏審訊。對於每壹個嫌疑人，警方給出的政策是，如果壹個嫌疑人交代了自己的罪行，交出了贓物，證據確鑿，兩人都定罪。如果另壹名嫌疑人也供認不諱，他們各被判處8年徒刑；如果另壹個犯罪嫌疑人在沒有坦白的情況下否認，會以妨礙公務罪(因為有證據證明他有罪)再判兩年有期徒刑，坦白者減刑八年後立即釋放。如果兩人都否認，警方因證據不足不能判他們盜竊罪，但可以以非法侵入罪各判1年有期徒刑。下表給出了這個博弈的收益矩陣。

囚徒困境的遊戲[囚徒困境]

b坦白b否認

告白–8，–80，–10

拒絕-10，0-1，1

讓我們看看這個博弈的可預測均衡是什麽。對於A來說，他雖然不知道B選擇什麽，但是他知道不管B選擇什麽，選擇“表白”永遠是對他最好的。很明顯，根據對稱性，B也會選擇“表白”。結果兩人都被判有期徒刑8年。但如果都選擇“否認”，每人只判1年。在表2.2的四個行動選擇組合中，(拒絕，否認)是帕累托最優的，因為任何偏離這個行動選擇組合的其他行動選擇組合至少會使壹個人的處境更糟。不難看出，“坦白”是任何犯罪嫌疑人的優勢策略，而(坦白，認罪)是壹個優勢戰略均衡。

要理解納什的貢獻，首先要知道什麽是非合作博弈問題。目前幾乎所有的博弈論教材都會講到“囚徒困境”的例子，每本書裏的例子都差不多。

博弈論畢竟是數學，或者說，是運籌學的壹個分支。談論經典和學說，自然少不了數學語言，在外行人看來不過是壹大堆數學公式。好在博弈論關註的是日常經濟生活，不能不吃煙花。這個理論其實是從象棋、撲克、戰爭等帶有競爭、對抗、決策性質的問題中借用來的術語。聽起來有點玄乎，但實際上有著重要的現實意義。博弈論大師看經濟社會問題就像下棋壹樣，往往在博弈中有深刻的道理。所以，從日常生活中的瑣事入手，以身邊的故事為例進行講解，並不枯燥。

壹天，壹個富人在家裏被殺，他的財產被盜。在這起案件的調查過程中，警方抓獲了兩名犯罪嫌疑人斯卡菲和納庫爾斯，並從他們的住處找到了被害人家中的失物。但他們否認自己殺了人，辯稱是先殺了有錢人，然後他們只是偷了東西。於是民警將兩人隔離，分別放在不同的房間審訊。地方檢察官會和每個人單獨談話。

公訴人說，“因為妳有盜竊的確鑿證據，可以判妳壹年有期徒刑。”但是我可以和妳做個交易。如果妳單獨承認謀殺，我只會判妳三個月監禁，但妳的同夥會判十年監禁。如果妳拒絕坦白，被伴侶舉報，妳會被判十年有期徒刑，他只會被判三個月有期徒刑。但是，如果妳們都坦白，那麽妳們都將被判處五年監禁。“Scalfi和Nacoors應該怎麽做？他們面臨著壹個兩難的境地——坦白還是否認。很明顯，最好的策略是雙方都否認，結果大家都只判壹年。但由於兩人處於隔離狀態，無法表白。所以，根據亞當·斯密的理論，每個人都是從利己的目的出發，他們選擇懺悔是最好的策略。因為如果妳坦白，妳可以期待三個月的短期監禁，但前提是妳的伴侶否認，這顯然比妳自己否認的10年監禁要好。這種策略是損人利己的。不僅如此，表白還有更多好處。如果對方坦白否認，就要坐牢10年。太不劃算了！所以，在這種情況下，還是應該選擇坦白。就算兩個人同時坦白，最多也只判五年，總比被判刑好。

10年。好吧。所以兩者合理的選擇是坦白，原本對雙方都有利的策略(否認)和結局(判1年有期徒刑)都不會出現。

這樣兩個人都選擇了弗蘭克策略而被判五年的結果叫做“納什均衡”，也叫非合作均衡。因為，每壹方在選擇策略時，並不存在“共謀”(勾結)，他們只是選擇對自己最有利的策略，而不考慮社會福利或任何其他對手的利益。換句話說，這個策略組合是由所有參與者(也稱為當事人和參與者)的最佳策略組合組成的。沒有人會為了給自己爭取更大的利益而主動改變策略。“囚徒困境”具有廣泛而深刻的意義。個人理性和集體理性的沖突，每個人對自身利益的追求，導致壹個“納什均衡”，這也是壹個對所有人都不利的結局。兩人都是在坦白否認的策略中先想到自己，所以必然要服長刑期。只有都先想到對方，或者互相勾結(勾結)，才能得到最短監禁的結果。納什均衡首先挑戰亞當·斯密的“看不見的手”原理。根據斯密的理論，在市場經濟中，每個人都是從利己的目的出發，最終整個社會達到利他的效果。

讓我們回顧壹下這位經濟聖人在《國富論》中的名言:“通過追求(個人)私利，他常常比他實際想做的更有效地促進社會利益。”從“納什均衡”引出壹個“看不見的手”原理的悖論:從利己出發，結果不是利己，既不是利己，也不是利己。這是兩個囚犯的命運。從這個意義上說，納什均衡提出的悖論實際上動搖了西方經濟學的基石。所以，從納什均衡中，我們也可以悟出壹個道理:合作是有利的“利己策略”。但它必須符合以下黃金律:妳希望別人如何對待妳，妳就如何對待別人，但前提是別人也這樣做。那就是中國人說的，“己所不欲，勿施於人”。但前提是妳不要對我做妳不想讓我做的事。其次，“納什均衡”是非合作博弈均衡。現實中，非合作情況比合作情況更普遍。因此，“納什均衡”是馮·諾依曼和摩根·斯特恩合作博弈論的重大發展，甚至可以說是壹場革命。

從納什均衡的普遍意義上，我們可以深刻理解經濟、社會、政治、國防、管理和日常生活中常見的博弈現象。我們將舉出許多類似於“囚徒困境”的例子

這樣的例子。比如價格戰博弈，軍事競爭博弈，汙染博弈等等。壹般的博弈問題由三個要素組成:玩家，也稱當事人、參與者、策略等的集合。，策略。

(策略)集合以及每個玩家的選擇和收益集合。其中，所謂贏，是指如果選擇特定的戰略關系，每個博弈中的人得到的效用。所有的遊戲問題都會遇到這三個要素。

美國密歇根大學的羅伯特·阿克塞爾羅德。阿克塞爾羅德是壹名政治學家。他組織了壹次電腦競賽。這個比賽的想法很簡單:任何想參加這個電腦比賽的人都將扮演囚徒困境案例中的囚徒。他們把他們的策略輸入電腦程序，然後他們的程序會被配對成不同的組合。分組後，參與者開始玩“囚徒困境”的遊戲。他們每個人都必須在合作和背叛之間做出選擇。關鍵是他們不是只玩壹次遊戲，而是反復玩200次。這就是博弈論專家所說的“重復囚徒困境”。

《重復囚徒困境》更真實地反映了頻繁而長期的人際關系。而且這種重復博弈使得程序在做出合作或背叛的選擇時，可以參考對手程序之前的選擇。如果兩個節目只打了壹輪，背叛顯然是唯壹理性的選擇。但如果兩個節目多次交手，雙方都建立了自己的歷史檔案，記錄與對手的接觸。同時，他們每個人都通過多次打架樹立了或好或壞的名聲。即便如此，要確定對方的程序下壹步要做什麽仍然是極其困難的。其實這也是本次大賽主辦方阿克塞爾羅德希望從本次大賽中學到的東西之壹。壹個節目是不是不管對手做什麽都壹直采取合作的態度？或者，它能壹直采取背叛行動嗎？是否應該用更復雜的措施回應對手的行動？如果有，會是什麽樣的措施？

實際上，第壹輪比賽上交的14方案中包含了各種復雜的策略。但讓阿克塞爾羅德等人大為驚訝的是，競爭的標題屬於壹種最簡單的策略:以牙還牙。我稱之為“以其人之道還治其人之身”。

“以牙還牙”的策略是這樣的:總是從合作開始，但從那以後就采取了以其人之道還治其人之身的策略。換句話說，針鋒相對的策略實行的是胡蘿蔔加大棒的原則。它從不先背叛對方。從這個意義上說，就是“善良”。它會在下壹輪獎勵對手之前的合作(即使對手之前有過背叛)，從這個意義上說，它是“寬容”的。但它會采取背信棄義的行動來懲罰對手之前的背叛。從這個意義上說，它是“堅韌”的。而且它的策略極其簡單，對手程序壹眼就能知道它的意圖。從這個意義上說，就是“簡單明了”。

第三，價格戰遊戲

現在我們經常會遇到各種各樣的家電價格戰，比如彩電戰、冰箱戰、空調戰、微波爐戰...這些戰爭的受益者首先是消費者。每次看到家電價格戰，老百姓都會“沒什麽好偷的。”這裏可以說明，廠商價格戰的結局也是壹個“納什均衡”，價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好為零。競爭的結果是穩定的，也就是壹個“納什均衡”。這個結果可能對消費者有利，但對廠商來說是災難性的。所以，價格戰對廠商來說意味著自殺。從這個案例中，我們可以引出兩個問題。首先，競爭性降價或“納什均衡”的結果可能導致有效率的零利潤結果。第二，如果不采用價格戰作為敵對博弈論。

(萬歲

結果會怎樣？每個企業都會考慮采取正常價格策略或高價策略，形成壟斷價格，盡力獲取壟斷利潤。如果能形成壟斷，博弈雙方的利潤最大。這種情況就是壟斷所為，通常會擡高價格。另壹個極端，如果廠商使用正常價格，雙方都能獲利。從這壹點出發，我們得出另壹條基本規則:“在假設妳的對手會以其最大利益行事的基礎上構建妳自己的戰略。”事實上，完全競爭的均衡就是納什均衡或非合作博弈均衡。在這種狀態下，每個制造商或消費者都根據其他人設定的所有價格做出決策。在這個均衡中，每個企業都應該使其利潤最大化，消費者也應該使其效用最大化，導致零利潤，即價格等於邊際成本。在完全競爭的情況下，非合作行為導致社會所期望的經濟效率狀態。如果制造商采取合作行動，並決定轉向壟斷價格，社會的經濟效率將被摧毀。這就是為什麽WTO和各國政府加強反壟斷具有重要意義。

第四，貿易戰的博弈論

這個問題對於剛剛加入世貿組織的中國尤為重要。任何國家在國際貿易中都面臨著維護貿易自由和實施貿易保護主義的兩難境地。貿易自由和壁壘問題也是壹個“納什均衡”，是貿易雙方非合作博弈的策略，結果雙方都因貿易戰受損。如果X國試圖對Y國進行進口貿易限制，比如提高關稅，那麽Y國肯定會反擊，提高關稅，結果誰也沒有受益。另壹方面，如果X和Y能夠達成壹個合作的平衡，即從互惠互利的原則出發，雙方都將減少關稅限制，結果是每個人都將從貿易自由中獲得最大的利益，全球貿易的總收入也將增加。

博弈論案例分析

案例1:博弈論在企業人力資本投資中的應用[1]

壹.導言

壹個企業能否在市場中獲得經濟優勢，取決於其科技優勢、產品的市場適應能力等等，這些都來源於人才優勢。因此，壹個企業面臨著如何盡可能保持其在人力資源方面的優勢，如何吸引優秀人才加入企業增添新的動力，如何有效培訓現有員工提高技能，如何使員工適應外部環境的變化，如何有效留住公司的核心人才等等。然而，統計調查顯示，中國的培訓現狀並不令人滿意。總體來看，我國企業培訓管理的制度化、規範化程度有待加強，培訓計劃執行不力，培訓效果的跟蹤評估薄弱，培訓在提升員工績效方面的有效性沒有發揮出來，培訓結果對員工晉升影響不大。造成這種情況的原因很多，其中之壹就是人力資本投資收益的滯後性和不確定性，擔心員工“翅膀硬了飛走”得不償失。企業是否加大人力資本投資，員工是否留在企業，這是壹種利益博弈，結果是選擇對自己有利的戰略。本文用博弈論的方法對企業的人力資本投資進行了分析，說明企業應該進行人力資本投資，並采取措施保證投資後人力資本投資收益的獲取。

二。概念和假設

1.概念定義

①人力資本。人力資本是對現有人力資源進行投資而形成的，以復雜勞動為載體，能夠實現價值增值的可變資本。

②企業人力資本投資。企業人力資本投資是指企業通過壹定的投資(貨幣、資本或實物)獲得人力資源，增加員工的知識、技能和健康水平，改善企業的管理、文化水平和企業形象，從而增強企業人力資本存量，提高企業經濟效益的壹種投資行為。

2.基本假設

(1)經濟人。經濟人假設意味著組織和個人都追求自身利益的最大化。

②資料齊全。完全信息是指信息完全通暢，沒有停滯，客觀存在的信息的獲取不需要成本。

③充足的物質資本。商品的生產總是通過物質資本和人力資本的結合來進行的。

為了使生產有效率，物質資本和人力資本必須保持適當的比例。

第三，人力資本投資與員工個體的博弈分析

本文從企業和員工的角度對人力資本投資進行了完全信息靜態博弈分析，重點是企業是否增加人力資本投資以及投資後如何行動。

假設在完全信息條件下，企業和員工都是理性的。企業可以選擇是否培訓員工。根據企業的選擇，員工會選擇留下來或者跳槽到其他企業。假設企業不培訓員工，員工收入為d，企業選擇培訓時，假設分配給員工的培訓費用為C，培訓後支付給員工的工資為e(e可以為零，即員工培訓後工資不會增加)，員工培訓後帶來的效益增加值為B..假設員工離職，去了另壹個單位拿獎勵。這裏為了讓分析更簡單，假設經過培訓和沒有經過培訓的員工離職的收入是壹樣的，都是a，有時候經過培訓後，員工會因為技能的提高而通過跳槽獲得更多的收入，但不影響下面的分析。企業培訓的博弈分析如表1所示:當B-C-E

當b-c-e & gt；0，博弈成立且可能存在兩個均衡:如果員工此時選擇留下獲得的收益d+e大於選擇退出時獲得的收益A，理性員工壹定會留在原企業，企業必然會選擇培訓投資，這也是雙方在此博弈中的最優決策；如果此時選擇留下的員工的收益d+e小於選擇退出時的收益A，理性的員工必然選擇退出，企業的損失為C，是最嚴重的。對於企業來說，如果知道這樣會讓員工跳槽，那麽企業還不如壹開始就不培訓，這樣損失會小壹些。這裏需要指出的是，員工是否跳槽，並不單純取決於對方公司提供的薪酬。影響因素很多，比如員工的性格是否與企業匹配，員工的個人發展前景，員工的興趣與崗位的匹配等等。上表中，如果企業不培訓員工，那麽員工的去留取決於現有的收入D和跳槽企業的工資A。

如果d & gta、員工留下:反之，員工離職。

簡而言之，員工是否留在企業是利益博弈，企業和員工之間存在信息不對稱。企業必須主動發出信號，削弱員工離職的動力。只要企業能留住員工，人力資本投資就會給企業帶來巨大的經濟效益。

[編者]案例二:博弈論在商業活動中的應用策略[2]

哈佛商學院波特教授的五種競爭力量，在我們思考行業市場的競爭態勢和趨勢時，給了我們壹個全面細致的分析方法，其中之壹就是潛在進入者的威脅。

然後，根據市場類型(完全競爭市場、壟斷競爭市場、完全壟斷市場和寡頭壟斷市場)，由於大多數行業市場屬於壟斷競爭市場，現有企業與新進入者之間存在進入與退出博弈，這取決於結構性進入壁壘、對關鍵資源的控制程度、規模經濟以及現有企業的市場優勢。

如果妳在壹定程度上是現有行業的壟斷者和影響者，阻止潛在進入者進入市場或抑制現有企業惡性競爭的博弈策略如下:

1.擴大生產能力的戰略

壟斷者可能會威脅潛在的進入者，以阻止他們進入市場。但是，壟斷者的威脅能否達到阻止進入的目的，取決於其承諾。所謂承諾，是指玩家采取的某種行動，使得他的威脅成為可信的威脅。那麽，在什麽條件下威脅會變得可信呢？壹般來說，只有當參與者不實施這種威脅會遭受更大的損失時，空頭威脅與承諾的行動相比不能有效阻止市場進入的主要原因是它們不需要任何成本。發表聲明很容易，只是聲明自己要做什麽或者標榜自己不妥協的人也缺乏實質性的意義。因此，只有當玩家采取某種行動，並且這種行動需要很高的成本或代價時，威脅才會變得可信。

2.保證最低價格條款的策略

所謂的“保證最低價格”條款策略可以采取限制性定價策略，通過收取低於進入發生時的價格來阻止進入。某店規定，在壹定時間內(如壹個月)其他任何壹家店以更低的價格銷售同壹商品，該店將退還差價，並補償壹定比例的差價(如10%)

)。比如妳在店裏消費5。

000元買了壹臺尼康相機，壹周後妳發現在另壹家店只要4500元，妳可以和店家協商，從550元起退款。

再比如假設會有兩個市場。1期只有壹家廠商，有兩種選擇:

(1)制造壹個壟斷高價60元，可以得到1。

000元利潤，但會讓潛在企業認為該行業有利可圖，於是選擇進入第二階段；這個市場壹旦有兩家企業，市場價格就降到30元，企業利潤降到200元。這樣，兩期總利潤為1000+200=1200元。

(2)低價40元的提法，如果潛在企業進來，價格降到20元，雙方企業利潤都為零。

所以這個時候有潛力的企業是不會進入的。這樣，第二期的價格可以確定壹個壟斷高價60元，那麽總利潤將是600+1000=1600元。

對於消費者來說，保證最低價格條款會讓妳至少壹個月不會因為降價而後悔購買，但這壹條款是對消費者的承諾，也是對競爭對手的警示，這無疑是企業之間的壹種競爭手段。

保證最低價格條款是壹種承諾。由於法律限制，商店在向消費者公布後不得不執行這壹條款，所以絕對可信。這種承諾隱含了企業A向企業B發出的不降價的威脅，並使這種威脅產生了預期的效果。

3.限制進入定價策略

限制進入定價是指現有企業通過收取低於進入價格的價格來阻止進入的策略。潛在進入者看到這個低價後，推測進入後價格會這麽低，甚至更低，所以進入市場無利可圖，放棄進入。

4.掠奪性定價策略

掠奪性定價是指制定低於成本的價格來驅逐其他企業，並期望在新的企業或競爭對手被驅逐出市場後，掠奪性企業可以行使其市場支配力時，由此造成的損失可能得到補償，即在驅逐其他企業後，制定壟斷性高價來彌補之前的損失。這也是壹種價格報復策略。掠奪性定價與限制性定價的區別在於，限制性定價針對的是那些尚未進入市場的企業，是長期維持低價來限制新企業的進入，而掠奪性定價針對的是已經進入或即將進入的企業。如果妳有過剩的產能，可以在新企業進入時擴大產能，大幅降低商品價格，阻止其進入。

5.廣告遊戲

有些商品，用了才知道真正的品質。我們把這類商品稱為體驗產品。只有那些生產高質量體驗產品的企業才會選擇做巨幅廣告，低質量的企業不會做廣告。原因是高質量的體驗產品會有大量的回頭客，而低質量的體驗產品很少再有人光顧。

此外，現有制造商之間產量和價格競爭的博弈可以用古諾模型和伯川德模型來描述。博弈論對企業參與競爭、制定宏觀和微觀層面的競爭戰略具有指導意義。著名營銷專家希頓曾說過，企業家的藝術就是企業的戰略經營和管理。作為壹種戰略，企業在當今激烈的市場競爭中需要遊戲！