這裏在薩維奇(1954)提出的“人與自然博弈”體系下簡要介紹SEU理論的基本內容。
決策者選擇的是行動(或者行動的過程),那麽,如何描述行動(acts)?在Savage的理論中實際上用兩個基本概念——事件(events)和結果(Consequences)來描述行動。事件是世界的狀態(state of the world)的集合,世界實際上是決策者所面對的外部事物,壹個狀態就是對世界的壹個描述。結果實際上被薩維奇描述為對決策者具有價值的任何事情。壹個行動被定義成壹個由世界的狀態空間到結果空間的映射(function)。不同的行動就相當於不同的映射。所有可能的行動就構成了行動空間。我們可以記S為狀態空間,C為結果空間,A為行動空間。這樣,壹個行動可以定義為C=a(s)。或者采用人與自然的博弈的方式,表述為C=f(a,S)。從狀態和結果之間關系的角度講,決策者選擇行動相當於在各種可能發生的事件上押賭結果,因此,壹個行動相當於壹種彩票。
經濟學分析的基本內容是人與自然的生存關系以及在這種關系中形成的人與人的關系。這兩種關系可以用人與自然的博弈(game with nature)以及人與人的博弈來描述。如上對行動的描述也相當於人與自然的博弈。決策者選擇行動(押賭),而自然選擇狀態,人與自然的選擇最終決定了決策者得到的結果。
主觀期望效用理論的主要結論(道德期望效用存在定理)是:在壹定的假設(公理)條件下,在狀態空間上存在著惟壹的概率分布(滿足概率公理),在結果空間上存在壹個實值的效用函數(具有正線形變換性)。如果a>b,當且僅當u(a)>u(b)。其中,U(a)是行動a的期望效用,U(b)是行動b的期望效用。
此時,決策者可以通過期望效用最大化來做出理性的(Rational)選擇。在理論體系中,壹般認為概率分布描述了世界狀態的不確定性,而效用函數描述了決策者的風險偏好。Amcombe和Aumann(1963)對概率的主觀性質進行了分析。Pratt(1964)、阿羅(1965)對效用函數中蘊涵的風險偏好性質進行了分析(絕對風險度量)。這樣,概率和效用將決定決策者對行動的偏好。期望效用存在定理是建立在壹系列假設(公理)基礎上的。這些假設可以概括為三類,我們分別加以說明。 :壹個理論總是在壹個空間的觀念體系中描述所要描述的事物,例如德布魯的壹般均衡論就是在商品空間中描述經濟行為。SEU理論實際上假設了決策者的空間觀念已經窮盡了所有的可能性,例如狀態空間窮盡了世界所有可能的狀態等。進壹步,決策者的選擇對象實際上是彩票,SEU理論假設彩票空間具有壹定的連續性(例如概率是連續的)和凸性(兩個彩票的復合而成的彩票仍然屬於彩票空間),連續性假設和凸假設實際上是對空間性質的判定,即關於事物異質性和同質性性質的判定。需要指出的是,從哲學的角度講,空間假設屬於理念或者觀念問題,同樣也是古典哲學中的基本問題。
總之,主觀期望效用理論表述了決策者理性的(Rationa1)的決策原則(具有期望效用的形式)和人的認知能力(1e bon sens)、主客觀世界之間的相互獨立性以及決策者表達主觀世界、客觀世界以及選擇對象的觀念(空間)性質之間的聯系,這種聯系構成了客觀世界(狀態空間)、主觀世界(結果空間)、以及行動空間之間的壹種完備的、無矛盾並且是優化的邏輯體系。我們稱生活在這樣的邏輯體系中的決策者具有完全理性(Complete Rationa1)。必須指出的是,我們說決策者具有完全理性並不是指決策者具有做出任何意義上的最優決策的完全信息,這是對完全理性壹個十分通常的誤解。實際上,不確定條件下的決策在壹定意義上就是不完全信息條件下的決策,從信息的角度講,說決策者具有完全理性是指決策者的決策在壹定層次上具有超越任何具體經驗信息(知識)的“壹般性”或者“萬能性”(Onmipotence)。了解完全理性的這種性質對了解不確定經濟學的現代發展十分重要。
在人與自然的博弈中,自然的狀態隨時間序列發生。決策者在事先對這些狀態不能觀測而只能推測。簡單地講,觀測到的是經驗知識,而推測到的是邏輯知識。那麽,經驗知識和邏輯知識在決策中的作用是什麽?我們可以分別從時間和空間的角度簡要解釋完全理性的性質。
首先,我們從策略選擇說明完全理性的時間性質。決策者不僅選擇行動,實際上需要選擇關於行動的策略,也就是在各種可能關於世界狀態信息條件下的行動完整的計劃。在人與自然的動態博弈過程中,決策者可以使用逆向歸納法在決策的第壹階段選擇以後所有階段的都可以執行的最優策略。決策者的這種能力也可以稱為策略理性(Strategic Rationality)。因此,事後觀測到的經驗信息(知識)對行動的選擇是有價值的,但是對策略選擇並無價值。這樣,從行動的層面上講,人對行動的選擇具有時間特征,能夠在明天做出的選擇就沒有必要今天做出。但是,從策略的層面上講,人對策略的選擇不具時間特征,完全理性的決策者可以在現在就做出直到未來的壹系列依狀態信息決定的行動計劃,並且隨著時間的推移,計劃無須改變。獨立性假設實際上還意味著,世界狀態過程的發生順序都是無所謂的。
其次,我們說明完全理性的空間性質,哪些決策者在哪些問題上在何種情況下可以使用SEU的決策原則?在任何情況下,任何決策者在任何決策問題上都可以使用期望效用理論的原則。因此,SEU的決策原則具有無時不能、無處不在,超越壹切時間與空間的性質,或者具有超越壹切經驗的性質。這個決策原則可以說是壹種絕對的、終極的原則,在這個原則下決策者“按照最充分的理由完美地行動”,因此也就達到了萊布尼茲所說的神聖的“最高自由”。SEU決策原則的這種性質可以說是壹種絕對的壹般性,也可以說是壹種萬能性。必須指出的是,這種完全理性的決策性質正是新古典經濟學行為分析最本質的理論基礎,也是壹些經濟學家試圖說明他們所構建的經濟學原理具有超越個人、民族、歷史與國界壹般性的壹個基本原因。 顯然,現實生活中的人不是如上所描述的完全理性的人。西蒙指出人的認知能力是有限的,由此提出了有限理性(bounded rationality)的概念。不確定性經濟學的現代發展更為具體和全面地擴展了我們對SEU理論局限性的認識。
首先,不確定經濟學對SEU理論局限性的認識大致起源於兩個方面,壹個方面是由阿萊悖論和埃爾斯伯格悖論引發的各種實驗說明存在著對SEU理論中效用函數(風險偏好)和概率性質(不確定性)背離以及多種新理論的建立。例如前景理論(Kahnneman & Tversky,1979)、遺憾理論(Loomes & Sugden。1982)等。另壹個方面是依狀態的效用偏好和道德風險問題引發的對SEU理論的質疑以及新理論的建立,這個方面的工作以DIi 的工作為代表。這些理論主要有加權的期望效用理論(如Allais,1979;Chew & McCrimmon,1979;Fishbum,1983)、非線性的期望效用理論(如Machina,1982)、Dreze(1987)引入的包含道德風險和依狀態偏好時的期望效用理論、依序期望效用理論(Rank—dependent Expected Utility,Quiggin,1982;Yaari,1987)、非可加期望效用理論(Non—additive Expected Utility,Shackle,1949)等。
其次,主觀期望效用理論不再成立的壹個重要的意義在於,在多階段的動態決策的性質將不同於SEU理論,可能更加具有有限理性的特征。例如逆向歸納的方式不壹定適用,貝葉斯決策方式不壹定適用等,決策將變得更加具有經驗性和時間性。
再次,在動態決策中,SEU決策原則未必能夠處處保持壹致。Dreze(1972)開創了動態決策中效用導出性分析的方法,Kreps & Porteus(1979)顯示決策者在消費決策上可以是SEU的,但是在由消費決策導致的財富決策就未必是SEU的。
最後,經濟學通過研究人的選擇來分析和描經濟現象。不確定經濟學將選擇對象描述為由狀態到支付的彩票,這在壹定程度上對描述選擇的本質具有意義。但是,必須指出的是,人的選擇具有層次性和過程(階段)性,例如對行動、策略、博弈以及決策規則的選擇。許多社會現象需要在不同層次和不同階段加以解釋,這是博弈論思維方式的壹個基本內容。雖然不同層次以及階段的決策在不同空間壹時間中的可變性是不同的,反映了經驗知識和邏知識在這些不同層次以及階段選擇中的作用不同。但是,沒有什麽層次和階段的決策是永恒不變的,因為人們的邏輯知識不具有穿越無窮時間壹空間的能力,也是需要不斷通過新的經驗加以調整。客觀世界本身也不存在什麽穿越無窮時間壹空間的規律。主觀期望效用理論的完全理性(萬能性)並不適用於現實社會,對主觀期望理論的批判是經濟學現代發展的壹個極為重要的方向。正是在這種發展中顯示出了主觀期望效用理論的價值,它為經濟學的發展提供了壹個很好的出發點。
標準理論和現實的背離激勵著經濟學家們正在構建大量新的理論。這些新的理論試圖對標準理論進行擴展,建立對現實更具分析和解釋力的理論,因此,也被稱為壹般化的期望效用理論(但是,這並不壹定意味著決策原則必然具有期望效用的形式)。經濟學家在構建這些新理論的時候,必然涉及到對主觀期望效用理論的三類假設的進壹步認識。這三類假設不僅涉及到經濟學的壹些根本性的問題,實際上也涉及到科學中更為深刻的、也更為壹般性的問題。正如Hey(1997)所說,對不確定性的分析不僅僅是技術性的,同時也是哲學性的。 除圍繞概率和期望效用理論的討論之外,不確定性下的決策的重要方法還包括“狀態—偏好”方法(State—Preference)以及風險厭惡(Risk—Aversion)理論。這三種方法在壹定意義上有某些相似性。不確定性下的狀態偏好方法由阿羅(1953)提出,德布魯(1959)進行了進壹步的闡述。因為Hirsh—leifer(1965,1966)將其應用於投資理論,Radner等人將其運用於金融理論和壹般均衡理論而聲名鵲起。狀態偏好方法的主要原理是通過恰當地改變商品空間結構而將不確定性下的決策問題轉化為常規的選擇問題。這不同於期望效用法則,不需要任何(主觀)概率,而是將偏好建立在狀態依存的商品組合之上。狀態壹偏好方法認為,商品的差異不僅在於其物理特征和時間、空間所在,而且在於其所處的“狀態”。例如,下雨狀態時的冰淇淋和天晴時的冰淇淋是不同的,對消費者來說會要求不同的價格。因此,13種商品,s類自然狀態,則商品有ns種價格,商品空間是Rns的子集。相對於主觀期望效用理論而言,經濟中的決策者面對這樣的優化問題:
S.t.
其中,Xs代表狀態s下的商品組合(xls,x2s,...,Xns),es代表初始的稟賦向量。通過拉格朗日方法可以求得優化條件及風險承擔基本定理。
風險厭惡理論由弗裏德曼和薩維奇(Friedman & Savage,1948)提出,Markowitz(1952)對此進行了分析。Pratt(1964)和阿羅(1965)討論了對風險偏好的度量,後來Ross(1981)對此作了改進。弗裏德曼和薩維奇(1948)試圖以風險厭惡的概念來解釋人們為什麽進行小概率大收益的賭博(買彩券)的同時,又會購買某些保險。他們用期望效用函數的形狀變化解釋這似乎的悖論。Pratt(1964)和阿羅(1965)則對風險厭惡作了這樣的度量定理:>U比>v具有更強的風險厭惡如果對於所有的,有。其中U:R→R和v:R→R是偏好在M上的兩個基本的效用函數。他們還對這樣的度量方式進行了證明。