北望经济学园阅读区经典常谈 弗里德曼__實証經濟學的方法論

1  /  1  页   1 跳转 查看:2761

弗里德曼__實証經濟學的方法論

弗里德曼__實証經濟學的方法論

實証經濟學的方法論

    在凱恩斯的名著《政治經濟學的范圍與方法》一書中,約翰. 梅納德﹒凱恩斯對實証科學及規范科學作了區分。他認為:“一門實証科學……是關于什么是這一類問題的系統的知識體系﹔而一門規范科學(或稱為管理科學)……是關于什么應該是這一類問題的標准的系統的知識體系……﹔是一門藝朮……是為達到某一特定目標而設立的原則體系”﹔他指出:“這二者之間的混淆帶有很大的普遍性,并成為很多殆害大分之謬誤的根源”﹔他還強調了“創立一門准確無誤的政治經濟學的實証科學的重要性。”

    本文將主要對某些方法論問題加以闡述,這些問題產生于人們為創立凱恩斯所倡導的“准確無誤的實証科學”所作的努力,其中特別涉及的是,如何確定某一被提出的假說或理論,是否應被暫時地接受為“關于什么是這一類問題的系統的知識體系”的一部分。但是,凱恩斯所悲嘆的這種混淆仍然如此之普遍,并極大地妨害了人們對經濟學可以是──而且部分地確實是──一門實証科學的認可。所以,我們最好在本文的開頭先論述一下實証經濟學與規范經濟學之間的關系。

1.實証經濟學與規范經濟學之間的關系

    在某種程度上,實証經濟學與規范經濟學之間的混淆是不可避免的。在几乎每一個人看來,經濟學所研究的問題與其自身是極為攸關的,而且是困于他們自己的經歷與能力的范圍之內﹔這一現象便是不斷的廣泛的分歧的根源,并成了頻繁立法的契機。那些自許為“專家”的人們意見遲異,而且我們很難保証他們都是毫無偏見的。無論如何,在那些事關重大的問題上,即使這些“專家”們几乎一口同聲而且毫無偏見,我們也很難完全不加考慮地接受他們的觀點。實証經濟學的結論似乎是,而且確實是與重要的規范問題密切相關的,是與應該做什么及如何取得某一既定目標等問題密切相關的。門外漢與專家一樣,都在無一避免地試圖改造實証結論以適應為他們所極力堅持的規范性的先入之見,并當這些實証結論的規范性含義──或所謂的這些實証結論的規范性含義──不合他們的口味時就否定這些實証結論。

    從原則上說,實証經濟學是獨立于任何特別的倫理觀念或規范判斷的。正如凱恩斯所說,它要解決的是“什么是”,而不是“什么應該是”一類的問題。它的任務是提供一套一般化體系,這個一般化體系可以被用來對環境發生變化所產生的影響作以正確的預測。這一體系的運行狀況可以通過它所取得的預測與實際情況相比的精確度、覆蓋率及一致性等指標來加以考察。簡而言之,實証經濟學是,或者說可以是一門“客觀的”科學,這里“客觀”一詞的含義完全等同于任一自然科學上的定義。當然,經濟學所涉及的是人與人之間的關系,而且調查研究者本身就是被調查研究的事物的一部分。與自然科學相比,調查研究者與被調查研究的事物之間更具有本質上的聯系。上述事實在使社會科學家得到了一系列自然科學家無法得到的數據的同時,也使社會科學家在實現客觀性的目標上遇到了特有的困難,但是在我看來,這些都不是這兩類科學之間的根本差異之所在。

    另一方面,規范經濟學及經濟學的技朮也不可能獨立于實証經濟學。任何政策結論都不可避免地要基于對采取某一種而不是另外一種行動將產生的影響所作的預測,而預測則必須明確或不明確地基于實証經濟學。當然。在政策結論與實証經濟結論之間并不存在著─一對應的關系﹔如果有的話,那么則不必另外再創立一門規范經濟學了。兩個不同的個體可能在對某一個別立法的結果問題上意見一致。但其中的一個可能認為這些結果有利于平衡,進而擁護這項立法﹔而另外一個卻可能認為這些結果是不合意的,進而反對這項立法。

    然而,我對這樣一種看法提出疑義:這種看法認為,在目前的西方世界,特別是美國,在毫無偏見的公民之間所存在的有關經濟政策的分歧,主要地來源于人們對所采取的行動將帶來的經濟影響的不同預測。而這些分歧從原則上說是可以通過實証經濟學的發展而予以消除的。持這種看法的人不認為人們關于經濟政策的分歧是來源于人們在基本的行為准則方面的根本性分歧,來源于人們在最終可能出現的矛盾雙方問題上的分歧。一個明顯的而且并非不重要的事例就是最低工資限制問題。盡管在形式上存在著對這一立法的褒貶紛爭,但人們在為所有的人爭取到一個“生存工資”這一政策目標上卻形成了根本一致的意見。而且“生存工資”這一含義模糊的概念在這一類問題的討論中得到了廣泛的運用。人們的意見分歧主要產生于人們在預測方面的隱含的或明確的分歧。這一預測涉及的是最低工資限制這一特殊手段在實現目標中的功效問題。該項立法的支持者們認為(即預測),法定的最低工資通過提高那些工資收入在最低工資線之下的勞動者的收入,及提高那些工資收入在最低工資線之上的勞動者的收入,進而消除了貧困。而且與此同時并不存在完全失業人數增加及就業條件因該立法的實行而惡化一類的消極作用。而該項立法的反對者們認為(即預測),法定的最低工資通過失業人數的增加及就業條件的惡化而加重了貧困現象。而且這一消極作用不僅抵消了該項立法給在業者工資收入所帶來的有益影響,市且還可能使之狀況更加惡化。人們在該項立法的經濟影響問題上的看法一致,并不能使人們在該項立法的合意性問題上看法一致。這是因為仍然存在著人們在該項立法的政治或社會影響等問題上的分歧。但是,在目標一致的情況下,人們一定會經過漫長的道路而趨于一致的。

    人們在工會的適當作用及地位的問題上的各種不同意見,及人們對直接的價格與工資控制的合意性及關稅的合意性等問題的各種不同看法,都是以實証分析中的一些密切關稅的分歧為依據的。人們對所謂的規模經濟的重要性的不同預測,在很大程度上說明了人們在工業部門中政府的全面控制的合意性及必要性,甚至在社會主義(而不是私人企業)的合意性及必要性等問題上的不同看法。而且關于這一方面問題的事例舉不勝舉。當然,我的這一主張──即在西方社會中人們在經濟政策問題上的主要分歧具有如上所述的性質──其本身就是一種“實証”闡述,它的正確與否還有待于經驗証據的檢驗。

    如果這一主張是合理的,那么它意味著。人們在“正確的”經濟政策問題上的一致意見較少地取決于規范經濟學的進步,而更多地是取決于這樣一種實証經濟學的發展:它所得出的結論不僅而且值得受到廣泛的贊同。它還意味著:對實証經濟學與規范經濟學加以嚴格的區分的主要原因就在于這樣一種貢獻,即這一區分促進了人們在政策問題上的意見一致。

2.實証經濟學

      實証科學的終極目的就是要發展這樣一種“理論”或”假說”,使之能夠對尚未觀察到的現象作出合理的、有意義的(而不是老生常談的)預測。總體說來,這樣一種理論是一個由兩種元素構成的復雜的混合體。部分地說,它是一種‘語言”,旨在促進“系統的、有組織的推論方法”。部分地說,它是一系列假說的綜合體,旨在從紛繁復雜的現實中抽象出事物的本質特征。

    作為一種語言,理論不具有任何實質性的內容﹔它是一系列同義反復的詞語的綜合體。它的作用在于為經驗材料的組織及對經驗材料的理解提供文牘服務﹔而且用以檢驗這一服務質量的標准也是那些適合于文牘體系的標准。對這些事物的種類所下的定義清楚而准確嗎?對這些事物種類的划分窮盡了嗎?我們知道每一單個項目都應歸于哪一類嗎?或者,在這其中是否存在著相當的似是而非現象呢?人們對大標題及次標題體系的划分是否已達到這樣的完備程度,從而使我們能夠迅速地找到我們所要的條目呢?還是由于混亂不清而使得我們不得不一處一處地加以涉獵呢?我們將要研究的條目是否都已編排到一起了呢?條目的編排系統是否已避免了交叉重復呢?

    對上述這些問題的回答部分地取決于邏輯上的考慮,部分地取決于事實上的考慮。標准的邏輯准則本身可以說明某一特殊語言是否是完全的及連續的,即這一語言中的命題是“正確的”還是“錯誤的”。事實上的証據本身可以說明“邏輯編排系統”的種類能否在實際中找到有意義的對應物,即在分析具體問題中的某一特殊種類時,這些條目划分是否能起到一定的作用。“供給”與“需求”這一簡單的事例既說明了這一點也說明了前面所談到的一系列邏輯分析問題。作為經濟理論這種語言的構成要素,供給與需求是兩大主要類別,影響產品的相對價格的因素及影響生產的因素都被划到這兩大類別中來。這種二分法的實用性取決于“它在經驗資料方面的高度概括性,即如果我們把任一問題中影響需求的力量與影響供給的力量分別開列出來的話,那么我們將會得到這樣兩類資料:它們之間很少有哪些項目是共同的。”現在,這樣一種概括對于象消費品終極市場一樣的市場來說是合理的。在這一類市場中,可以被看作是需求產品的經濟單位與可以被看作是供給產品的經濟單位之間存在著明確的、嚴格的區分。很少存在這樣的混亂現象:從某一方面看來,某一特殊因素應被划歸影響供給的項目之類,而從另一方面看來,又應被划歸影響需求的項目之類。而且也很少有必要考慮兩個類別之間的交叉效應(即交叉重復)。在這類問題中,在標題“供給”與╴“需求”下對有關因素進行編排所需要采取的步驟既簡單又明了,從而極大地簡化了我們所面臨的問題,而且這種簡單明了的方法還防止了在其它情況下可能出現的差錯。但是,這種概括并不是在任何情況下都是合理的。例如,在一個主要是投機性的市場中,對于價格的每日波動來說,這一概括就是不合理的。例如,一則關于增加超額利潤稅的謠傳,對于股票市場來說,是應當看作是主要對今天的公司股票供給發生影響的因素呢,還是應當看作是主要對今天的公司股票需求發生影響的因素呢?在類似的情況下,几乎對于每一因素來說,將其划歸“供給”標題之下的理由大約與將其划歸“需求”標題之下的理由一樣多。這些概念仍然可以使用而且不可能是毫無意義的﹔它們仍然是“正確的”,但與在第一個例子中的情況相比它們的用處則明顯地要小得多,這是因為它們沒有有意義的實証對應物。

    作為一種實証假說體系,理論應該通過其對它意在加以“解釋”的那一類現象的預測能力來檢驗。唯有實際証據才能表明該理論是“正確的”還是“錯誤的”。或者更為准確地說,唯有實際証據才能表明該理論是被作為合理因素而暫時地得到“接受”呢,還是遭到了“拒絕”。正如我下面將更為詳細地闡述的那樣,對某一假說的合理性的唯一有關的檢驗,是將其預測與實際情況所作的比較。郊果該假說的預測(“頻繁地”或比來自于另一假說的預測更為經常地)與實踐相抵觸,那么該假說則遭到了否定﹔如果該假說的預測沒有與實踐相抵觸,那么它則為人們所認可﹔如果該假說業已多次成功地避免了可能出現的抵觸現象,那么它則具有極大的可信賴程度。實際証據永遠也不可能“証實”某一假說的正確性,它只能通過無法將該假說駁倒來顯示該假說的正確性。當我們說到某一假說已經在實踐中得到了確認時(并不十分准確),我們通常所指的就是這個意思。

    為了避免誤解,可能有必要明確一下:我們用來檢驗某一假說的合理性的“預測”,并不一定非得是對尚未發生的現象所作的預測,也就是說,不一定非得是對將來事件的預見。它可以是對業已發生了的現象所作的預測,但前提條件是對這一現象所作的觀察尚未進行,或者是雖然對這一現象的觀察業已作出。但進行預測的人尚不知曉。例如,在其它一些情況已知的情況下,某一假說預測在1906年將會有某些情況發生。如果對這一時期的史料記載所作的研究表明,在1906年某些情況確實發生了,那么該預測則得到了實踐的確認。反之,如果研究表明在1906年某些情況并沒有發生,那么該預測則與實際情況發生了抵觸。

    從這種意義上講,某一假說的合理性本身并不足以作為對其它假說進行取舍的標准。人們可以觀察到的事實在數量上必然是十分有限的,但可能的假說卻是無限的。如果存在某一種假說與可得証據相一致,那么一定還有無數的假設也與這一可得証據相一致。例如,假設對某一特殊消費品所征收的一種特別貨物稅,導致了價格的上漲,其上漲幅度完全等同于稅收的數量。這與競爭情況下穩定的需求曲線、水平的且穩定的供給曲線是一致的﹔但它也與競爭情況下需求曲線或供給曲線發生必要的相應移動后的斜率為正或為負的供給曲線相一致:它也與壟斷情況下常邊際成本及穩定的需求曲線相一致,只是為了取得上述結果要求后者具有某一特定的形狀﹔等等,等等,無窮無盡。這一假說所適應的另外一種証據可以起到剔除上述某些可能情況的作用﹔但它絕不可能把這些可能性削減為一種,而獨自地與這一有限的証據相一致。對那些與可得証據同等一致的假說所進行的選擇,在某種程度上是任意的。雖然我們一致同意這樣的觀點:對選擇所進行的考慮應以“簡潔性”與“成效性”為出發點,但這二條標准的本身就意味著否定完全的有目的的簡化。一理論越是“簡單明了”,在某一既定領域內對現象進行預測所需要的初始知識也就越少﹔一理論越是“富有成效”,它對現象所作的預測也就越精確,而且該理論進行預測所依據的范圍也就越大,同時,為了進一步研究的需要,它所要加以說明的東西也就越多。邏輯上的完整性與一致性雖然也與評判的標准有關,但只起一個輔助作用﹔二者的作用在于確保該假說能夠正確地闡明宗旨,而且做到使每一個研究該假說的人的理解都准確無誤──在這里,它們與統計計算中對數字精確度的檢驗所起的作用是一樣的。

    不過,我們對社會科學中某一特殊預測所作的檢驗,很少能夠通過這樣一種實踐來進行:這種實踐是經過專門設計的,意在消除被認為是最重要的干擾因素。通常,我們不得不依賴于偶然發生的“實際情況”所提供的証據來進行我們的檢驗、在我看來,社會科學中無法進行所謂的”有所控制”的實驗,這并不能反映社會科學與自然科學之間的根本區別。這既是因為“無法控制”的實驗并非為社會科學所特有(自然科學中的天文學就是一例),又是因為有控制的實驗與無控制的實驗之間的差異充其量不過是一個程度上的差異。沒有哪一種實驗是可以完全控制的,同時每一種實驗中又都存在著部分的控制,這是因為某些干擾因素在整個實驗過程中應保持相對的穩定.

    實踐所提供的証據是大量的,而且常常是確定性的,猶如經過了設計的實驗一般。所以,無法指導實際情況并不是通過預測的成功來檢驗假設的根本性障礙。但如此得到的証據在解釋上卻要比前種情況困難得多。它常常是復雜的,而且總是間接的和不完全的。對這種証據的收集常常是困難的,而且對這些証據的解釋通常需要進行細致入微的分析工作,同時還涉及到一系列的推理判斷,而這些很少能夠真正做到把握事物的真諦。“具有決定性意義”的實驗所帶來的大量的直接証據與經濟學之無緣,的確妨礙了檢驗假說工作的順利進行。但與這一情況在取得合理的結論,及在由可得証據所証明了的結論上取得一致意見等方面所帶來的巨大困難相比,前一種妨礙則顯得微不足道了。它使得人們對失敗的假說的摒除工作進展緩慢且困難重重。這些失敗的假說很少永遠告別經濟舞台,相反卻總是一再出現。

    當然,這些方面的問題并不是整齊划一的。有時,實踐所提供的証據與有控制的實驗所能提供的証據几乎一樣地直接、大量與確定。也許,最明顯的重要例証要數通貨膨脹問題。這種通貨膨脹証據是服務于這樣一種假說的:在一個較短的時期里,貨幣數量的大量增加必然伴隨著價格的大幅度上升。這里,這方面的証據是大量的,且為對這些証據加以解釋所需要的推理判斷較少。然而,盡管存在著大量的價格大幅度上漲的事例,但這些事例與貨幣存量的大量增加之間的本質上的─一對應關系,及在其它相關的情況下的變異程度等,決定了每一次新的通貨膨脹體驗都必將帶來激烈的爭論,而且這種爭論不僅僅是來源于非職業經濟學家的人民大眾。反對原假說的觀點認為:貨幣存量的增加或者是來源于由其它因素所導致的價格上漲的偶然性影響,或者是價格上漲的一個完全偶然且不必要的附帶物。

    檢驗大量的經濟假說的困難性所造成的一種影響就是:它使得我們的檢驗工作退回到純粹的正統或繁瑣分析中去。正如我們業已闡述的那樣,繁瑣重復在經濟學及其它科學中,作為一種專門的語言或“分析編排體系”而占有極為重要的地位。此外,同樣是同義反復的正統邏輯學與數學又成了這些問題的重要工具:檢驗判斷推理的正確性﹔發現假說的深刻含義﹔確定是否一系列被假定為不同的假說的確不可能是等價的,或者在它們之間存在著差異等。

    但是,如果一經濟理論想保能夠預測未來,而不僅僅是描繪行動的結果,那么僅作為一個同義重復的體系是遠遠不夠的。同樣,如果一經濟理論想要有別于模糊數學時,那么僅作為一個同義重復的體系也是遠遠不夠的。而且如我們前面所提到的那樣,這些同義反復的實用性本身還將最終地取決于關于將某一棘手的實際問題划歸某一種類的那些假說的可接受性。

    通過預測而對經濟假說加以檢驗所具有的困難造成了另一個更為深刻的影響,那就是它使人們對經驗証據在理論著作中的作用產生了誤解。在下述兩個雖聯系緊密但并不相同的階段中,經驗証據起到了至關重要的作用:一是構造假說的階段,二是檢驗假說的合理性的階段。完整且詳盡的經驗資料,作為我們將通過假說而予以概括總結或“加以解釋”的實際現象的代表,除在提出新假說時所具有的重大作用外,還被用來驗証一假說確實說明了它旨在說明的問題──即該假說對某一現象所作的闡述并不與人們業已觀察到的實際情況相矛盾。在某一假說與人們掌握的實際資料相一致的情況下,人們對該假說所作的進一步檢驗,是要將那些事先并不知道然而卻可以從實踐中觀察到的新因素從假說中剔除出去,同時還要對這些被剔除的因素加以檢驗,以了解這些因素與其它的經驗証據之間的背離情況。為了使后一種檢驗同前一種檢驗密切相關,那些被剔除的因素必須與該假說旨在說明的問題同屬一類現象﹔而且對這些被剔除的因素所作的限定必須足夠地准確,從而使得人們所作的觀察能夠証明這些因素是不正確的。

    構造假說與檢驗其合理性這兩個階段之間的相互聯系可以從兩個方面表現出來。第一,在某種程度上可以這樣說:進入每一階段的那些特定的因素,是由資料的收集及某一特定的調查者的知識水平所決定的一個偶然現象。被用來檢驗某一假說的內涵的那些因素可能同樣適當地屬于被用來構造假說的那些原始資料,反之亦然。第二,創立一假說的過程從來都不是從零開始的。所謂的最初階段本身也總是要涉及到對一系列早些時候提出的、以實際觀察為依據的假說所進行的比較。這些假說的涵義之間的相互矛盾,成了促進人們構造新假說或修改原有假說的始動力。所以,這兩個在方法上截然不同的階段,在實際進程中又總是相輔相成、互為前提的。

    人們對這一簡潔明了的過程所產生的誤解,主要在于下面這一表述:“該假說是為解釋這一類現象而提出的。”社會科學中,對這一類現象的新証據的獲得十分困難,而且對這些新証據與該假說的含義之間的一致性的判斷也十分困難,這些情況使得社會科學試圖作出這樣的假設:其它的、更為可得的証據與該假說的合理性是同樣相關的。這就等于說假定假說不僅具有“含義”,而且還具有”“假設”﹔這些“假設”與“現實”之間的一致性是檢驗該假說的合理性的標准──這一標准或者不同于通過含義所進行的檢驗,或者是對通過含義所進行的檢驗的一種補充。這一為人們所廣泛持有的觀點不僅是根本錯誤的,而且還成了更多的繆誤產生的根源。它不僅沒有為不合理的假說向合理的假說的轉化提供捷徑,相反卻混淆了是非,造成了人們對經驗証據在經濟理論中的重要性的誤解,使得人們為促進實証經濟學的發展所作的智睿的探索迷失了方向,而且阻礙了實証經濟學中人們在試驗性的假說上一致意見的取得。

    即使在一理論可以被說成是具有“假設”的限度內,即使在這些‘假設”的”真實性”可以獨立于預測的合理性而接受檢驗的限度內,該理論的重要性與它的“假設”的“真實性”之間的相互關系,也完全不同于我們前面所批評的那種觀點所提出的內容,甚至几乎是后者的反面。那些真正重要且偉大的假說所具有的“假設”,是對現實的一種粗略的、不十分精確的、描述性的表述.而且,一般說來,某一理論越是杰出,那么它的“假設”(在上述意義上)就越是超脫現實。這其中的原因是非常簡單的。如果一假說能夠通過極為有限的資料而進行大量的“闡述”,即如果一假說能夠從它旨在解釋的那一現象周圍的大量復雜且詳盡的情況中,抽象出共同且關鍵的因素,并能保証僅在這些有限資料的基礎上作出合理的預測,那么,這一假說就是意義重大的。所以,為了意義重大,一個假說在其假設方面必須運用一些描述性的技巧﹔既然該假說的偉大成功將証明其它許多的有關情況與該假說旨在闡明的現象是毫不相關的,那么該假說也就不必考慮并說明這些情況。

    為了使這一點不那么難于理解,我們所要問的另一個與一理論的“假設”有關的問題,不是這些假設是否在描述上是“現實主義的”,因為它們從來就不是,而是這些設想對于我們已有的目標來說,是否是一個足夠好的近似物。而對這一問題的回答唯有道過考察該理論是否應驗,即該理論是否取得了足夠精確的預測水平來進行。這樣,這兩種原假設為獨立的檢驗方法合二為一。

    壟斷的與不完全的競爭理論,就是在經濟理論中忽視上述主張的一個例子。被說成是構成新古典經濟理論的基礎的“完全競爭”或“完全壟斷”假設,是現實生活的一幅虛假的圖象這樣一種觀點,明確地促進了壟斷與不完全競爭分析的發展,而且也大致地說明了該分析得到廣泛的接受與贊同的原因。而這一觀點本身,几乎全部地以這些假設的這種直接可見的不精確性為基礎,而不是以從新古典經濟理論中導出的預測的任何得到認可的矛盾點為基礎的。許多年以前,《美國經濟評論》對邊際分析問題所進行的長篇累牘的討論,是另一個雖不如前一個例子重要,但比前者更為明確的例子。爭論雙方的文章,在很大程度上都忽略了在我看來似乎是關鍵性的問題──即邊際分析原理與實踐經驗的一致性問題,而注重于商人是否確實地通過考察代表邊際成本與邊際收益的表格、或曲線、或多變量函數,來制定他們的決策這樣一個几乎毫不相關的問題。也許這兩個例子及它們所業已揭示的其它許多事例,可以對所涉及的方法論原則問題的討論起到判別作用,而且通過這兩個例子所說明的問題也許要比其它似乎是適當的方法所能說明的問題要廣泛得多.

3.可以通過一假說的假設的真實性來檢驗該假說嗎?

    我們先從自由落體法則這樣一個簡單的自然事例開始來進行我們的討論。在真空中,一落體的加速度是一個常數──g,在地球上是每平方秒大約32□──而且落體的加速度與該物體的形狀、投擲方法等因素無關,這一假說已得到了人們的廣泛接受。這就等于說一落體在任一特定的時間范圍內所下落的距離可以用S=1/2 gt2這一公式來算出。這里, S是該落體下落的距離,單位是□,t是物體下落的時間,單位是秒。將這一公式應用到一個從樓頂下拋的實心球上,就等于說這樣拋下的那個球的運行情況就如用它在真空中被拋下時的運行情況。通過這一假說的假設來對其進行檢驗,可能意味著對實際氣壓進行測量,并確定它是否接近于零。在海平面上,氣壓大約是每平方時15磅。為了使這一氣壓差別被判定為可忽略不計的,15是否是足夠趨近于零的呢?因為這一實心球從樓頂降落到地面實際所需的時間與這一公式所給出的時間非常接近,所以很明顯,這一15之差足夠趨近于零。然而,假定現在拋下的是一根羽毛而不是一個實心球。那么這一公式所得出的結果則是非常之不精確的.很明顯,對于一根羽毛(而不是對于一個實心球)來說,每平方時 15磅完全不同于零。或者,我們再假定這一公式的應用對象是從3萬□高的飛機上拋下的一個球。在這一高度,氣壓絕對地小于每平方□15磅。然而,從3萬□降到2萬□(在這一點上的氣壓仍然大大小于海平面上的水平)所用的實際時間卻完全不同于上述公式所預測的時間──大大地高于實心球從樓頂落到地面所需的時間。按照上述公式,該球的速度應為gt,而且還應該穩定地增長。事實上,一個從3萬□降落的球是在它碰到地面以前達到它的最高速度的。而且上述公式的其它含義也都與此類同。

    為了使氣壓差別能夠被判定為是可以忽略不計的,15是否足夠地趨近千零這一初始問題本身就是明顯地愚不可及的。每平方□15磅等價于每平方□2160磅,也等價于每平方□0.0075噸。如果沒有一些外在的比較標准,則不存在對這些數字評判大小的依據。而這唯一相關的比較標准就是在一系列既定的情況下,該公式可以應用或不可以應用的氣壓水平。但這又在另一個層次上帶來了同樣的問題。“可以應用或不可以應用”的含義是什么?即使我們可以消除測量上的誤差,但物體降落的實際測得時間與公式計算所得的時間,很少(如果曾經有過的話)完全相等。為了能夠判定自由落體理論之“不可以應用”,這二者之間的差異必須要多大呢?下面將是進行比較的兩條重要的外在標准。一個是與該理論進行比較、且在所有其它方面與該理論是同等地可接受的另一理論所能達到的精確度。另一個是這樣一種標准,它只有在存在著某一業已為人們所知道的、具有更好的預測水平,然而其預測成本較高的理論的前提下,才會存在。而且更高的精確度所帶來的效益(這取決于人們的使用目的),一定能夠彌補取得這一精確度所需要的成本。

    這一例子既証明了通過一理論的假設來檢驗該理論的不可能性,也証明了“某一理論的假設”這一概念的模糊性。S=1/2 gt2這一公式對于真空中的落體來說是正確的,而且可以通過對這一類物體的運行情況的分析而推導出來。所以,可以這樣闡述:在多種情況下,在實際大氣中降落的物體,其運行情況如同在真空中所進行的降落。如果用我們經濟學中最常用的話來表述,那么上述文字立刻會被表述成:這一公式假設存在著一個真空。然而很明顯上述表述并沒有作任何諸如此類的假設。上述表述的真正意思是:在許多情況下,氣壓的存在,物體的形狀,投擲物體者的姓名,投擲物體所采用的方法及許多其它的附加條件,對于該物體在一定時間內所下降的距離并無可估計的影響。我們完全可以對該假說重新進行表述,從而完全不再提及真空因素:在許多情況下,一物體在一給定的時間內所下降的距離由公式s=1/2 gt2給出。如果我們撇開該公式的歷史不談,撇開與之相聯的其它自然科學理論不談,那么說該公式假設存在著一個真空還有意義嗎?就我所知,還可能存在著其它的假設體系,而能夠取得這同樣的公式。這一公式之所以被接受是因為它與現實相符,而不是因為我們生活在一個大致的真空里──不管這種大致的真空指的是什么。

    與這一假說相聯系的一個重要的問題,是要限定該公式可以應用的條件,或者更為准確地說,是要限定在各種情況下該公式預測的總的誤差范圍。的確,正如上述對該假說的重新表述中所蓄含的那樣,這樣的限定與該假說并不是截然不同的兩件事。限定本身就是該假說的一個重要組成部分,而且它是這樣一個組成部分:隨著實踐的不斷增加,它是特別有可能被修改與擴展的部分。

    在落體這一特殊情況中,還存在著另一雖仍不完善但更為一般化的理論。這一理論主要來自于人們為解釋前一種簡單理論中存在的誤差而進行的探索﹔而且在這一理論中,人們可以對某些可能存在的干擾因素的影響加以衡量﹔而且在這一理論中,前一種簡單理論只是作為一種特例而存在。然而,這一更為一般化的理論并不總是能夠得到應用。這是因為,它所取得的精確度的增加可能不能彌補使用這一理論所帶來的成本的增加。所以,在何種情況下前一種較簡單的理論可以“充分完善地”反映現實,這仍然是一個事關重要的問題。氣壓是限定該理論可應用的情況的那些變量中的一個,但只是其中之一﹔物體的形狀,使達到的速度,及其它變量也都是與限定有關的。對氣壓以外的這些變量加以闡述的方法之一,就是將這些變量視為決定對真空“假設”的某種背離是否是事關重大的。例如,每平方□15磅的氣壓對于一支羽毛來說是截然不同于零的﹔但對于從一高度不大的地方下拋的實心球來說,卻是可以視為趨近于零的,這些都是物體的形狀所帶來的差別。然而,這樣的表述絕然區別于下面這種不同的表述:該理論不能應用于羽毛落體,因為該理論的假設是錯誤的。然而它們之間的相互關系卻完全是另一種情況:對于羽毛來說,這些假設是錯誤的,原因在于該理論不能應用于羽毛落體。這一點需要引起大家的重視。這是因為,在限定某一理論可以成立的條件的過程中,“假設”的完全正確的運用通常錯誤地被理解為假設可以被用來確定某一理論可以成立的條件,而且,這一誤解成了理論可以通過其假設而進行檢驗這一觀點的主要根源。

    下面我們再來看另一個例子。這一次是一個臆造的事例,旨在使之成為社會科學中的許多假說的同類物。讓我們來考慮一下一棵樹上葉子的密度。我提出的假說是:這些葉子的位置是這樣確定的:在其周圍的葉子位置一定的條件下,每一片葉子都好象有意地使它所能得到的陽光數量最大化﹔每一片葉子都好象知曉決定在不同的位置上可得陽光數量的自然法則,并且能夠迅速地(或曰即刻地)由任一位置移到任一其它合意的且尚未被占據的位置。現在,該假說的某些更為明確的含義明顯地與實際情況相一致:例如,一般來說,樹南側的葉子密于樹北側的葉子,但如本假說所意含的那樣,在山的北坡,或當樹的南側為其它東西所遮蓋的情況下,樹的南北兩側葉子密度的差異就不會那么明顯。或完全不是原來的那種情況。就我們所知,葉子不能“有計划地行事”,或者說不能有意識地“追求”什么,它們沒有進過學校并學會為計算“最佳”位置所必需的科學或數學的有關法則,難道我們可以據此認為該假說是不可接受的或曰不合理的嗎?很明顯,該假說的這些與事實相矛盾的情況中,沒有一個是至關重要的。這里所涉及的現象不在“該假說旨在闡述的那一類現象”的范圍之內。該假說并沒有宣稱葉子可以做到上述事情,它只是認為:這些葉子的密度是同一的,就猶如它們可以做上述事情一般.盡管該根說的“假設”中存在著明顯的非現實性,但由于該假說的含義與實際觀察的一致性,使得該假說具有極大的合理性。我們傾向于在下述意義上“闡述”該假說的合理性:由于陽光促進了葉子的生長,所以,在陽光較多的地方葉子將生長得更加茂密,或者說將有更多的假定存在的葉子能夠得以生存下來。所以,完全被動地將這一假說應用到更為廣泛的情況中去所得到的這一結果,與通過將某些特定環境附加其上所得到的結果是完全相同的。這后一種說法比前面造的那一種假說更為引人入勝,這不是因為后一種假說的“假設”更具“現實性”,而且因為后一種假說的“假設”本身就是一個更為一般化的理論的一部分。這種更為一般化的理論所能應用的現象種類更為廣大,而且在這一更為一般化的理論中,一棵樹上葉子的具體位置不過是該理論的一個特例。這一更為一般化的理論有著更多的可能招致異議的含義,但由于該理論可適用的范圍更為廣泛從而使得這些含義避開了可能發生的任何抵觸。這樣一來,葉子生長的直接証據為來自于這一更為一般化的理論所適用的其它現象的間接証據所加強。

    我們所臆造的這一假說大致說來是正確的,也就是說,僅對于某些現象來說,該假說關于葉子密度的預測達到了“足夠的”精確水平。我不知道這某些現象是什么,也不知道如何去定義它們。然而,有一點似乎是明確的,那就是:在這一例子中,該理論的這些“假設”并不屬于該理論的假設范圍:也就是說,樹的種類,土地的性質等都是可能影響到該理論的合理性所存在的范圍的變量種類,而葉子進行復雜的數學計算,或從一個位置移到另一個位置的可能性問題,卻與該理論合理性的范圍限制無關。一個與人類行為有關的例子大致類似于我們剛才所舉的那個例子。這個例子我與薩維奇已在別處引用過。現在,讓我們來考慮一下一位台球行家對擊球情況進行預測的問題。下述假設似乎并非毫無道理:絕妙的預測通常都是通過這樣的假說來取得。這種假說認為,這位台球行家的擊球活動就猶如他知曉將會給出最佳運行方向的那個復雜的數學公式一般。而且這一數學公式可以通過眼睛對角度的觀察,并確定該球所在的位置等而精確地進行計算。這位台球行家通過該公式而進行閃電般的計算。然后使球按該公式所指定的方向運行。我們對這一假說的信賴并不是基于這樣一種觀點:台球手(即使是台球行家)可以而且確實經歷過前面所描述過的過程﹔相反,我們對該假說的信賴是緣于這樣一種觀點:除非這些台球手可以通過這樣或那樣的方法而取得與上述過程同樣的結果,否則的話,他們事實上就不是台球行家。

    由這些例子進而引申出下面這個經濟原說,這似乎是很容易做到的。這一經濟假說認為,在許多情況下,單個企業常常是如此行事,猶如他們在有計划地使其預期成果(通常,如果理解有誤的話,則稱之為‘利潤”)最大化,而且掌握著為成功地實現這一目的所必需的全部數據資料﹔也就是說,猶如他們知曉相關的成本與需求函數,可以通過他們所掌握的所有情況來計算邊際成本與邊際收益,并使得他們所采取的每一個行動都恰到好處地符合邊際成本與邊際收益相等的原則。當然,現在的商人實際上并不完全按照經濟數學家所發現的方便途徑來解這一聯立方程體系。只不過他們這樣做的可能性比葉子或台球手明確地完成復雜的數學計算,或落體決定創造一個真空的可能性要大一些。如果台球手被問到他是如何確定擊球方向的,那么他可能回答說他“恰好算了出來”,但此外他還要摩擦一下兔后腿來証實一下。而如果一位商人被問到他是如何決策的,那么他可能回答說他是以平均成本來定價的,而且當市場情況發生了變化時,當然也會出現一些微小的偏差。這一表述與前一個表述几乎是同樣有幫助的,但它們之中沒有一個與對有關假說所進行的檢驗有聯系。

    人們對上述成果最大化假說的信賴是由一非同尋常的特征証據所証明的。在某種程度上,這一証據與關于台球手行為的假說中所引証的証據是非常相似的──也就是說,除非商人可以通過這種或那種方法而使其行為近似于與成果最大化相一致的行為,否則,他們似乎不可能長久地維持他們的生意。這里不管明顯地、直接地決定商業行為的因素是什么──習慣性的反應,隨機性的機遇,或難于歸類的一些東西──其結果都是一樣的。不論什么時候,只要這一決定因素碰巧導致了與合理的、有實際根據的成果最大化相符合的行為,則生意使會興隆,并進而需求資源以擴大經營﹔反之,只要這一決定因素不能帶來與合理的、有實際根據的成果最大化相符合的行為,則生意將會虧損,且只有從外部引入新資源才能維持存在。這樣一來,“自然選擇”過程促進了該假說合理化的實現,或者說在自然選擇既定的情況下,人們對該假說恰當地概括了生存條件這一判定,成了人們接受該假說的主要依據。

    該成果最大化假說的另一更為重要的証據,來自于該假說在特殊問題中的無數次應用,及在這多次應用中,該假說的含義與實際情況并沒有發生抵觸這一事實。然而,如果要讓這一証據提供佐証那是極為困難的。這是因為它散落在無數的商業便函中、文章中,及專題著作中,而這一切主要地是與特殊的具體問題相聯系,而與對該假說的檢驗并不相關。然而,在很長時期內人們對該假說的持續使用與接受,及未能創立一種邏輯嚴密、自圓其說的假說來取而代之并得到廣泛的接受這一情況,間接地有力地証明了該假說的存在價值。任一假說的証據都總是由人們試圖証明它與實際情況相抵觸而遭到的多次失敗所組成。只要該假說仍在繼續使用,那么這一証據就會繼續增加。而且,由于該証據的特殊性質,讓該証據提供完全充分的証明是十分困難的。這已開始變成某一科學的傳統及傳說的一部分,后者反映在人們持有假說的堅定性方面,而不是反映在教科書中對那些未能証明該假說與實際情況相抵觸的事例所進行的羅列上面。

4.理論“假設”的重要性與作用

    到現在為止。我們對一理論的‘假設”的重要性問題所作的結論几乎全都是否定的:我們已經証明了一理論是不能用其“假設”的“真實性”來加以檢驗的,而且,一理論的“假設”這一概念充滿了可疑之點。但是,如果這就是問題的全部,那么我們將很難對這一概念的廣泛應用作出解釋。同時我們也很難說明這樣一種較強的傾向:我們每個人都常常身不由已地談到一理論的假設,并對各種理論的假設加以比較。有煙就有火。

    在方法論當中(如同在實証科學中一樣),作出否定性的結論通常要比作出肯定性的結論更有把握。所以,與前面的評述相比,我對下面這些有關“假設”的重要性及作用的評述的把握性較小。就我所能認識到的,一理論的“假設”具有三種雖則緊密相連但卻完全不同的實証作用:(1)它們是對一理論進行描述或表述的一種簡便形式﹔(2)它們有時會促進通過假說的含義而對假說所作的間接檢驗﹔而且(3)如我們前面已經提到過的,它們有時是對一理論預期的合理性的存在條件加以限定的方便途徑。前兩個方面還需要作進一步的討論。

      1.“假設”在表達一種理論中的作用

    葉子的例子証明了假說的第一個作用。不采用葉子力圖使它們所得到的陽光最大化這一說法,我們同樣可以在沒有任何明顯的假設的情況下來表述這一假說。我們的表述是以預測葉子的密度所須遵循的一系列原則的形式來進行的:如果一棵樹生長在一處平地上,且沒有別的樹木或其它物體來阻擋陽光的照射,那么,這棵樹上葉子的密度將是如何如何。……相反,如果一棵樹是生長在山的北坡,且位于由同樣樹木所形成的森林的中央,那么,這棵樹上葉子的密度將是如何如何……等等。很明顯,與葉子力求使它們所能得到的陽光最大化這種表述相比,剛才的那一種表述遠不是這一假說的簡便形式。事實上,由于前一種較簡便的表述既指出了如何確定對本問題來說是非常重要的環境特點,又指出了如何對它們的影響加以評價,所以,前一種表述是對上述一系列原則的簡單概括──即使這一原則系列被擴展到無窮大。前一種表述更為精悍而又不失全面。

    更廣泛地說,一假說或理論通常都含有這樣的斷言:某些力量(言外之意就是別的力量不是這樣)對于某一特定種類的現象來說是重要的﹔并通常對它所斷言的重要力量的行為方式加以限定。我們可以把這一假說看作是由兩部分組成的:第一部分是一個概念性的世界,或者說是一個與“現實世界”相比較為簡單的抽象模型。這一世界只包含該假說認為是重要的各種力量。第二部分是一系列原則。這些原則定義了這樣一類現象──它們使得上述模型得以成為“現實世界”的一個適當的代表,同時,這些原則還對模型中的變量或實體與可觀測的現象之間的對應關系作了限定。

    從本質上看,這兩個部分是截然不同的。模型是抽象的、完整的,它是一種“代數學”或“邏輯學”。在檢驗模型的一致性與完整性,探究模型的含義方面,數學與正統的邏輯學回歸它們的老本行。在模型當中,“大概”、“可能”、或“近似于”這一類東西根本沒有存在的余地,而且也不起任何作用。對于真空來說,氣壓是零,而不是“較小”﹔對于競爭性市場上的產品生產者來說,需求曲線是水平的(斜率為零),而不是“几乎是水平的。”

    另一方面,使用模型的原則卻又不可能是抽象的和完整的。它們必然是具體的,從而也就必然是不完整的。這是因為,不論人們如何定義“現實世界”,完整性只有在概念性的世界里才會存在,而不可能存在于”現實世界”中。模型是“在太陽之下不存在任何新的東西”這一只有部分真實性的欺人表述的邏輯體現﹔然而,在應用模型的原則中卻不能忽略具有同等重要性的另一個只有部分真實性的欺人表述:“歷史永遠不會重新開始。”當一理論是一明顯地更為一般的理論的一部分時(如落體這一例子中的真空理論一樣),在相當程度上,我們可以把模型的應用原則明確地、系統地闡述出來。盡管這時的闡述仍不完整,但卻是最容易進行的。為了使一科學盡可能地具有“客觀性”。我們的目標應當是盡其所能地對這些原則作以明確、系統的闡述。并不斷地擴大可以進行如此闡述的現象范圍。但是,不論在這一努力上面我們取得了多么大的成功,總是不可避免地要在實行這些原則時出現新的問題。每一種情況都有其獨特之處.而這是那些明文規定的原則所不能─一囊括的。對這些特殊情況加以判斷,并對這些特殊情況是否應影響到可觀測現象與模型中的實體之間的對應關系加以判斷,這需要具備這樣一種能力:這種能力不能靠別人的傳授來獲得。它只能通過實踐并置身于一種“正確的”科學氛圍中來掌握,而不能機械照搬。正是在這一點上,出現了業余愛好者與專職人員之間的分水嶺,這對所有的科學來說都是一樣的。也正是在這一點上,體現了怪誕者與科學家之間的微妙差異。  下面這個簡單的例子可能會有助于弄清這一點。歐几里得几何學是一個抽象的模型。從邏輯上看它是完整的和一致的。模型中的實體(或稱變量)都經過了嚴格的定義。如一條直線的定義不是一個其長度要比其寬度或深度“大得多”的几何圖形,而是一個其寬度與深度為零的圖形。它同時也是非常“非現實主義的。”在“現實”中不存在如歐几里得之點、之線、或之面一樣的東西。讓我們將歐几里得這一抽象模型應用到我們用粉筆在黑板上所作的一個記號上面。這一記號是與歐几里得之線,還是與歐几里得之面,還是與歐几里得之體相一致呢?很明顯,如果這一記號正在被用來表示(比如說)一條需求曲線,那么它完全與一直線相一致。但是,如果這一記號正在被用來為(比如說)地圖上的國家著色,那么它就不能與直線相一致了,這是因為那將意味著該地圖永遠也不會具有顏色。為了實現這一目的,這同一記號必須與面相一致。但是,對于粉筆的生產者來說,它卻不能與面相一致,因為如果是這樣的話,那么粉筆將永遠也用不完。出于這種考慮,這同一記號必須與體相一致。在這一簡單例子中,上面所提到的那些判斷將取得廣泛的一致意見。然而,似乎很明確,雖然我們可以對指導這些判斷的一般性原則作一系統的闡述,但這些原則永遠也不會真正作到包羅萬象,囊括每一種可能出現的情況。它們并不具有歐几里得几何學本身所具有的自圓其說、自成體系的特點.

    我認為,在談到一理論的“至關重要的假設”時,我們是在試圖對這一抽象模型的關鍵因素加以闡述。通常,可以用許多不同的方法來對這一模型加以完整的描述。也就是說,存在著許多不同的“基本原理”體系﹔作為一個整體,它們既包含了模型的□容又為模型的內容所包含。從邏輯學的角度上看它們是等價的:從某一角度來說可以視為一模型的公理或曰基本原理的東西。從另一角度來說也可以視為一模型的定理。反之亦然.被稱為是至關重要的那些特定的“假設”是以下述因素為依據選擇出來的:這些‘假設”在闡述模型方面的簡潔性或經濟性,直觀的合理性,及提出假設的能力等.如果僅僅從含義上來看,也就是與人們判斷或應用模型有關的那些原則的一部分。

2.“假設”作為理論的間接檢驗標准所起的作用

    在任一假說的表述中通常存在著這樣一種情況:用來闡述該假說的那些論段中,哪一些與假設有關,哪一些與含義有關似乎是涇渭分明的。然而,這二者之間的區別卻難以准確定義。我認為,這不是由這類假說本身的特點所決定的,而是由該類假說將被用于的對象的特征所決定的。如果確實是這樣,那么要想使對這些論述的划分易于進行,就必須確保該假說旨在服務的目的的明確性。在一抽象模型中定理和公理之間互換的可能性,意味著在與這一抽象模型相對應的那個獨立的假說中,也存在著“含義”與“假設”之間互換的可能性。但這并不是說任一含義都可以與任一假設互換,而是說那種可以包含其它論述的論述體系可能不止一個。

    例如,讓我們來看一下寡頭行為理論中的一特殊主張,如果我們假定:(1)企業通過各種方法來使其成果最大化,甚至不惜獲得或擴大壟斷力量。這將意味著,(2)當對某一“產品”的需求存在著地區性的不穩定,運輸費用極高,公開的價格協議不合法,且該種產品的生產者為數極少時,他們將會試圖建立基點定價體系。由于我們已將市場行為預測接受為本分析的目的,所以我們將論述(1)視作該理論的假設,而將論述(2)視作該理論的內容。如果我們發現(2)中所描述的情況通常與基點定價法結合在一起,那么我們將認為假設(1)是可以接受的﹔反之亦然。現在讓我們將該分析的目的改為:按照謝爾曼反托拉斯法對控制貿易同盟的禁止,確定哪些情況應予上訴。如果我們現在假定:(3)基點定價方法是在(2)中所限定的條件下蓄意產生的一種手段,以利于協同一致.那么這將意味著,(4)參加墓點定價的企業參與了“控制貿易同盟”。先前作為假設的東西現在變成了內容﹔同樣,先前作為內容的東西現在變成了假設。現在,如果我們發現企業參與了基點定價,那么我們將現假設(3)為合理的。當一企業參與基點定價時,通常還會存在其它的証據,如書信、便函等.這些材料將被法庭視為“控制貿易同盟”的証據。

    假定該像說服務于第一種目的,即預測市場行為。很清楚,這并不等于說該假說將服務于第二種目的,即預測是否存在足夠的証據來証實“控制貿易同盟”的存在,從而確定法院所應采取的行動。反之,如果該假設服務于第二個目的,這同樣不等于說它將服務于第一個目的。然而,在缺乏其它証據的情況下,該假設服務于一種目的所取得的成功(在解釋一類現象方面所取得的成功),與該假說服務于另一種目的所可能取得的成功相比(即在解釋另一類現象方面所取得的成功),前者將給我們帶來更大的信心。要想具體說明前者所証實的把握性比后者到底大多少,將更為困難。這是因為這取決于我們對這二類現象之間相互聯系的緊密程度的判斷﹔而這本身又將通過復雜的途徑而取決于某些同種的間接証據──即在通過單純的理論現象進行解釋時我們所具有的在其它方面的經歷。而這些單純的理論現象在某種程度上又是同樣紛呈復雜的。

    為了更進一步地闡述這一觀點,我們可以通過那些被稱作一假說的假設的東西,來取得一些間接証據。這些間接証據是關于一假說的可接受性的。上述結論僅在如下意義上才能成立:假設本身可以被視作等同于該假說的含義。因為這樣一來,假設與現實的一致性就可以被視作等同于人們在試圖証明某些含義與現實相抵觸時所遭到的失敗。或者說上述結論僅在如下意義上才能成立:這些假設可能使人們想起該假說中另外一些易受偶然的實際觀察所影響的含義。之所以說這一証據是間接的,是因為這些假設或該假說的各種含義所指的那一類現象,通常不同于該假說旨在說明的那一類現象。的確,如我們前面所講的那樣,這一點似乎是我們在確定哪些論述應冠之以“假設”,而哪些論斷應冠之以“含義”時所依據的主要標准。這一間接証據所具有的重要性,取決于我們對這兩類現象之間相互聯系的緊密程度的判斷。

    一假說的“假設”為該假說提供間接檢驗的另一種途徑是:找出該假說與其它假說之間的相互關系,從而使得正待接受檢驗的該假說的合理性與其它假說的合理性的証據聯系起來。例如,一假說正在對某一特殊種類的行為作出解釋。同以前一樣,我們也可以不限定任何“假設”而對該假說加以闡述.但是,假定我們能夠証明該假說與某一假設體系是等價的,并且這一假設體系中還包括了人人都在追求自己的利益這一假設,那么,這一假說就可以通過與它具有同樣假設的那些假說在其它種類現象上的成功,而間接地獲得其合理性﹔即使不能的話,我們這里所作的探索也不會完全是前無古人后無來者的,至少不會是在任何方面都一無所獲。實際上﹔為引出表面上互不相同的假說之間的相互關系而對假設所作的這番研究,正是我們在通向一個更為一般化假說的道路上邁出的一步。

    從相關的假說中導出的這種間接証據,在很大程度上說明了持有不同背景的人,在對某一特定假說的信任程度上的差異。例如,讓我們來考慮這樣一個假說:在某一特定地區或行業內,在就業問題上所存在的種族或宗教歧視,與該地區或該行業中的壟斷程度密切相關。也就是說,如果該行業不是壟斷性質的而是競爭性的,那么,只有在就業者的種族或宗教影響到其它就業者與他們一起工作的情愿性,或影響到消費者對他們所生產的產品的接受性,而與雇主的偏見毫不相關時,才可能存在較為嚴重的種族歧視。這一假說對于經濟學家所具有的吸引力將遠遠大于它對于社會學家所具有的吸引力。這一假說可能被說成是“假定”在競爭性的行業里,雇主一門心思地追求其在金錢方向的利益﹔而且,這一“假設”適用于許多經濟假說。這些經濟假說,涉及的是經濟學所要研究的許多大宗現象。所以,在經濟學家看來,這一假設同樣地也適合于我們所講的這一情況,似乎是合情合理的。另一方面,為社會學家所熟悉的那些假說其模型或曰理想世界與此是截然不同的。在他們的模型或理想世界中,一門心思地對金錢方面的個人利益的追求只起到非常小的作用。對于社會學家來說,在這一假說問題上可得的間接証據,對于該假說并不十分有利﹔而對于經濟學家來說,在這一假說問題上可得的間接証據,對于該假說的有利程度與前者相比則要大得多。所以,社會學家對該假說可能持有較大的懷疑態度。

    當然,一經濟學家的証據與社會學家的証據都不是決定性的。該假說對于它旨在說明的現象來說是合起作用這才是決定性的檢驗。但是,在做出任何令人滿意的決定性檢驗之前,還需要作出一種判斷。而且,很有可能,如果這種檢驗不能很快地作出時,在這種情況下,這一判斷將不得不以可得到的不充分的証據為依據來進行。此外,即使這樣的檢驗可以作出,科學家們的背景情況對于他們所取得的判斷來說也不是完全不相干的.在科學中永遠不存在一定的東西.証據對一假說所起的肯定的或否定的作用,永遠不能說是完全“客觀的”。在判斷假說的含義與實際情況的一致性方面,經濟學家要比社會學家更為“寬容”,而且較少的几個“一致性”事例就可以促使他暫時地接受假說。

5.經濟學中的某些含義問題

    我們一直在進行討論的這些抽象的方法論問題,與人們對“正統的”經濟理論作為一種“非現實主義的”理論所進行的曠日持久的批評,及人們對為迎合這一批評的要求而重新構造理論的種種嘗試所進行的曠日持久的批評之間,有些直接的聯系。經濟學是一種“沉悶無趣的”科學,因為它假定人是自私的和唯利是圖的,人是“歡樂與痛苦的計算器,且其計算速度如閃電一般。人這架計算器,就象一粒充滿著幸福渴望的水珠一樣,在某些使他游離于幸福與痛苦之間的動因的作用下,振蕩不已,但在這當中人是不變的。”說經濟學是一門“沉悶無趣的”科學,還因為經濟學是建立在舊心理學的基礎之上的,從而必須隨著心理學的新發展而同步改進。第三點原因在于經濟學假定人(至少對于商人來說是這樣)總是處于“一種連續的警覺狀態”,一旦他們那敏感的直覺嗅察到了供給與需求狀況的變化,他們將立即改變價格或改變定價原則。第四點原因在于,經濟學假定市場是完美的,競爭是純粹的,而且商品、勞動力與資本等都是同質的。

    正如我們所看到的,除非這一類的批評得到了下面這一証據的補充說明,否則的話將主要集中在其它方面。這一証據就是:存在著某一種假說,它與正在受到批評的理論在上述那些方面中的某一方面上并不相同的,然而該假說在較大范圍的現象的預測上取得了較好的成果.然而大部分的此類批評都沒有這種証據作為補充﹔它們几乎全部地取決于“假設”與“現實世界”之間所謂的直接可見的差異。最近一段時間人們對成果最大化假說所作的批評,為說明上述問題提供了明顯的例証.這一批評的理論依據就是商人沒有,而且確實也不可能象該理論所“假設”的那樣去做。被用來作為該論斷的佐証的証據,通常來自于兩個方面。或者是來自于商人對影響其決策的因素問題的回答──這是檢驗經濟理論的一種程序,這種程序與通過向80歲的老人詢問長壽的祕訣來檢驗長壽理論的作法別無二致。或者是來自于對單個企業的決策活動所作的描述性研究。一方面,人們很少(如果曾有過的話)能夠提供這樣的佐証:這里的証據是關于商人的實際行為與正在受到批評的假說的含義之間的一致性問題的,即是關于商人的所作而不是關于商人的所說的証據。另一方面,人們也很少(如果曾有過的話)能夠提供這樣的佐証:這里的証據是關于商人的實際行為與另一假說的含義之間的一致性問題的。

    就人們時常對一理論或其“假設”所賦予的直接描述性而言,一理論或其“假設”不可能是完全“現實主義的”。關于麥子市場的一個完全“現實主義的”理論,不僅需要包括直接決定麥子的供給與需求的那些情況,而且還需要包括用于交易的現金或信用工具的種類。此外還有:交易者的頭發與眼睛的顏色,他的祖先及受教育程度,他的家庭人數,他家庭成員的特征,祖先,受教育程度等個人特征﹔種植麥子的土壤種類,土壤的物理及化學屬性,在生長期內的主要天氣情況﹔種植小麥的農民及最終食用小麥的消費者的個人特征,等等,等等,無窮無盡。為達到這樣一種“真實”而作的過分努力,都只會使該理論失去真實有用的作用。

    當然,部分地說,完全現實的理論這一想法不過是一個稻草人。沒有哪位理論批評家會以這一邏輯極端作為目標。任何一種理論批評都可能這樣說:正受到批評的這一理論的“假設”“太”脫離現實了﹔而它的目標是這樣一種假設體系:盡管不是完全地毫無創造性地追求真實,但要比正受到批評的這些假設“更為”真實一些。但是,只要“真實性”的檢驗標准是“假設”的直接可見的描述准確度,則不存在進行上述區分的依據,那永遠也不會存在前一段所描述的那個稻草人。例如,“真實性”的檢驗標准可能是這樣一些實際觀察:“商人似乎并不象邊際理論所描繪的那么貪婪,那么精悍,那么富有邏輯性”﹔或者,“在當前的情況下,對于多工序工廠的管理者來說,試圖算出每一生產要素的邊際成本與邊際收益,并使二者相等這將是絕對不可行的。”判斷某一特定的偏離現實情況是否可以接受的標准是什么呢?在分析商業行為時,為什么忽視商人的成本大小比忽視商人的眼睛的顏色更為“不現實”呢?答案很明確,這是因為對于商業行為來說,省略前者會比省略后者帶來更大的偏差。但是,簡單地通過商人之間確實存在著成本大小的不同及眼睛顏色的差別這一觀察,并不能使我們知道這一點。很清楚,將一種因素考慮進來與將另一種因素考慮進來將會對偏差產生不同的影響。而我們唯有通過它們對實際行為與預測行為之間的偏差的影響的比較,才能知道上述答案。這樣一來,即使是真實性假設的最極端的擁護者,當他們對各種假設按真實程度大小加以划分時,也必然要被迫放棄他們的標准,而接受通過預測的檢驗標准。

    描述方面的准確性與分析方面的相關性之間的根本性混淆,構成了大部分經濟理論批評的主要內容。這些經濟理論批評是關于理論假設的非現實性的。這一根本性的混淆及導致這一混淆的那些觀點的正確性問題,都在一篇關于商業循環的文章中得到了充分的說明。這一篇文章中有這樣一段似乎是無害的評述:“經濟現象是變幻莫測、紛繁復雜的,所以,任何一種能與現實緊密地結合起來的關于商業循環的綜合性理論,都必定是極為復雜的。”科學的一個基本的假說就是:現象是具有欺騙性的,而且我們可以通過某種方法而對証據加以考察、解釋或組織。從這些証據中我們將發現那些表面上直不相關、各不相同的現象事實上卻是一種更為基本且相當簡單的結構的表現形式。而且,對這一假說加以檢驗的標准,同其它假說的檢驗標准一樣,是它所取得的成果──即迄今為止科學所取得的巨大成就。如果某類‘經濟現象”看起來好象是變幻莫測、紛繁復雜的,那么我們只好這樣假定:這是因為我們沒有適當的理論來對它們作出解釋。我們決不可能把已知的事實放在這一邊而把“與現實緊密結合的”理論放在另一邊。理論是我們“透視”事實的橋梁,而且如果沒有理論,我們將不能透視事實。“經濟現象是變幻莫測、紛繁復雜的”這種主張,否定了知識的試驗性狀態,殊不知這種狀態本身也可以使科學活動富有意義﹔這種主張與約翰﹒斯圖爾特﹒穆勒的以下完全荒謬的觀點同屬一類。穆勒認為:“很幸運,在價值法則中不存在任何有待于現在(1848年)或將來的作者來加以澄清的東西﹔關于這一問題的理論是完美的。”

    描述方面的准確性與分析方面的相關性之間的混淆,不僅導致了在許多不相關的方面對經濟理論所作的批評,而且還導致了對經濟理論的誤解及在彌補所謂的缺陷的努力中方向性錯誤。由經濟理論家們提出的抽象模型中的“理想類別”,已經被視為嚴格的描述性的分類。這些描述性的分類將直接地、完全地與現實世界中的現象實體相對應,而獨立于該模型的使用目的。而描述性的分類與現實世界中的現象實體之間存在的明顯的偏差,導致了在構造理論的努力上的不可避免的失敗,這是因為,重新構造理論的努力是以這些意在具有充分的描述性的分類為基礎的。

    人們對“完全競爭”與“壟斷”概念所作的解釋,及“壟斷性的”或“不完全競爭的”理論的發展,可能再清楚不過地說明了這種傾向。據說,馬歇爾假定存在“完全競爭”﹔可能曾經有過這種消沉。但是,很明顯,現在已經不再存在這種情況了。所以,我們必須放棄馬歇爾的理論。讀者可能將不辭勞苦地到處搜尋(我預言這將是徒勞的),試圖在馬歇爾的著作中找到關于完全競爭的明確假設,或任何這樣的主張:從描述的角度來說,世界是由參與完全競爭的基本單位──企業所組成的。然而,讀者將發現馬歇爾的如下論述:“在一個極端上,存在著這樣的世界市場,在這個世界市場里,競爭直接地從地球的每一部分展開﹔而在另一個極端上。存在著這樣的封閉市場,在這個封閉性的市場里,所有來自遠方的直接競爭都被排斥在外,然而即使在這樣的市場中,人們仍然可以感覺到間接競爭與傳導性的競爭之存在。而且在這兩個極端之間還存在著大量的其它種類的市場,這種市場的情況還有待于經濟學家和商人的進一步研究。”馬歇爾按照世界的本來面目來描述世界﹔他所追求的是為分析世界開辟道路,而不是使現實世界得到攝影般精確的再現。

    在按照世界的本來面目而對世界進行的分析中,馬歇爾構造了這樣一個假說:在很多問題中,眾多的企業將被組合成“部門”,這樣做的目的是使得每一集團中各企業之間的相同之處遠遠勝于它們之間的差異。這些問題通常都具有這樣的特點,即下述情況對于它們來說同樣是重要的:企業集團也將受到某些變動的影響,如對它們的產品的需求方面的變動。或者生產要素供給方面的變動。但是,并不是所有的問題中都存在這種情況,也就是說,上述重要情況可能是只作用于某些特殊企業的個別影響。

    與這一假說相對應的抽象模型,包含著兩種“理想的”企業類型:作為基本單位的競爭性企業(這些企業將組合成部門)與壟斷性企業。在所有其它企業的價格一定的條件下,如果對該企業產品的需求曲線相對于該企業的產品價格來說具有無限彈性的話(這適用于某些價格及全部產量),那么該企業則是競爭性的。它隸屬于某一“部門”,這種部門的定義是生產單一“產品”的企業集團。這里“產品”的定義是那些對于購買者來說具有完全的替代性的產品的集合。所以,某一企業的產品相對于同部門中另一企業的價格的需求彈性,對于某些價格和某些產量來說是無限的。囫如果某企業產品的需求曲線對其所有產品的某種價格皆不具有無限彈性,那么該企業則是壟斷性的。對于壟斷性的企業來說,企業就是部門。

    同往常一樣,作為一個整體該假說不僅包含了這一抽象模型及其理想的企業類別,而且還包含了一系列原則──這些原則大部分是含蓄的且通過例証來體現。這些原則系列是為使實際生活中的企業與這種或那種理想類型相一致,及為將企業划歸部門而設立的。這些理想類型本來并不是描述性的﹔它們最初的使命是對那些對某一特定問題來說極為重要的特征加以區分。即使我們可以對某企業的產品需求曲線作出直接的、准確的估計,我們也不可能立即進行如下划分:按照需求曲線的無限彈性及非無限彈性來划分完全競爭企業與壟斷企業。我們實際觀察到的那些需求曲線沒有哪一個是絕對水平的。所以,我們所能估算出的彈性永遠也不會是無限的。所以,真正相關的永遠是這樣一個問題:某一彈性是否“足夠”大,從而可以被看作是無限的。但是,對于這一問題,我們不能簡單地通過彈性數值本身來作出一勞永逸的回答。正如我們不能永久性地斷言:對于公式S=1/2 gt 2的應用來說,每平方□15磅的氣壓是否是“足夠地”趨近千零。同樣,我們也無法計算出需求的交叉彈性,進而按照‘需求的交叉彈性之間的差異”來將企業划歸部門。正如馬歇爾所述:“不同產品(即不同部門)之間的區分應如何確定這一問題,必須從便于某種討論的角度來加以解決。這決定了所有的問題﹔同一企業在一種問題中被當作完全競爭者來看待,而在另一種問題中又被當作壟斷者來看待,在這當中并不存在任何不一致的地方。

    正如同一個粉筆記號在一種問題中被看作是歐几里得直線,在另一種問題中被看作是歐几里得面,而在第三種問題中被看作是歐几里得體一樣,這當中并不存在任何不一致的地方。需求的彈性與需求的交叉彈性的大小。生產物理性能相同的產品的企業的數量,等等,都與問題密切相關。這是因為,這些因素屬于(或者說可以屬于)下述變量的一部分。這些變量將被用來確定某一特定問題中理想實體與實際實體之間的相互關系﹔并限定該理論得以充分成立的前提條件。但是,這些變量并不能一勞永逸地確定企業在完全競爭與壟斷之間類型的划分,

    下面這個例子可能會有助于說明這一點.假定現在有這樣一個問題:要確定聯邦香煙稅的增加(被預期為永久性的增加)對香煙零售價格的影響。我冒昧地提出這樣的預見:如果想得到大致正確的結果,就必須這樣來看待香煙企業,即好象它們正在生產一種沒有差別的產品且正處于完全競爭之中。當然,在這種情況下,“必須建立某些協議”,如對切斯特菲爾德香煙的數量加以限定。這里,“切斯特菲爾德香煙被看作是與馬爾巴勒香煙等價的。”

    另一方面,香煙企業將猶如完全競爭企業一般行動這一假說,對于二次世界大戰中香煙企業對于價格控制的反應來說,應該是一個錯誤的指導,而且毫無疑問,在此之前人們一定已經認識到了這一點。戰爭期間,香煙企業的成本一定會上升。在這種情況下,完全競爭者一定會減少原有價格下的銷售量。但是,戰時公眾收入的增加又會增加那一價格下的需求量。在完全競爭的情況下,嚴格固有法定價格將意味著“短缺”的出現及香煙生產數量的絕對下降。這里“短缺”的含義是需求數量超過了供給數量。事實否定了這一特定含義:人們將很好地、合理地堅持最大化香煙價格﹔而生產數量將大幅度地增加。成本上升這一共同性力量,大概不如每一企業對保住其市場份額及商標名望與價值這種愿望的破壞性力量來得強烈。特別是當超額所得稅將這一類廣告成本的很大份額轉嫁到了政府頭上時,則更為如此。對于這一問題來說,我們不能把香煙企業假設為完全的競爭者,并以此來對待它們。

    小麥的種植常常被用來作為完全競爭的例証。然而,雖然對于某些問題來說,假設香煙企業組成了一個完全競爭的部門,并以此來對待它們是適當的﹔但是,對于某些問題來說,假設小麥的生產者是完全的競爭者并以此來對待他們則是不適當的。例如,如果現在所要考慮的問題是當地的谷物加工者所支付的麥價之間的差異,那么上述假說則是不適當的。

    在那些某一企業集團受到共同因素的影響,及企業可以被假設為完全競爭者并以此來對待的問題中,馬歇爾的理論分析被証明是最為有用的。從某種描述性的意義上說,這就是歇爾“假定”完全競爭這一誤解的根源。如果能夠創立一種比馬歇爾的假說更為一般化的理論,即能同時對下述兩種情況加以考慮的理論,那將是極為理想的。在一種情況中,產品的差別及企業數量的稀少會帶來本質上的不同﹔而在另一種情況中,產品的差別及企業數量的稀少則不會帶來本質上的不同。這樣一種理論將使得我們能夠解決那些目前尚不能解決的問題。此外還將使得我們能夠更好地確定前一種較為簡單的理論的適用范圍,即在哪些情況下該理論才能被看作是現實世界的一個足夠好的近似。為了能夠起到這兩方面的作用,這一更為一般化的理論必須具有要義與實質﹔它必須使其含義接受實踐的考驗,并具有極大的影響力與重耍性。

    由張伯倫、魯賓遜二人所提出的不完全競爭或稱壟斷性競爭理論,就是為創立這樣一種更為一般化的理論所作的嘗試。不幸的是,他們所提出的這一理論不具備成為真正有價值的一般化理論所必須的特征。他們的理論貢獻主要局限于如下几個方面:完善了人們對單個企業經濟學所作的闡述,從而完善了人們對馬歇爾模型含義的推導﹔完善了馬歇爾的壟斷分析,并丰富了可用來描繪部門情況的詞匯構成。

    這一理論的不完善之處特別明顯地表現在它對涉及到企業集團(即馬歇爾部門)的問題的處理上,或者說它在這類問題上無能為力。只要堅持認為產品之間的差異是實質性的,并堅持認為該理論對這一點的堅持正是該理論的卓越之所在,那么,通過生產同一產品的企業而對部門所下的定義則不再適于應用。按照這個定義,每一企業都是一個獨立的部門。而通過“緊密的”替代品或交叉彈性之間“較大的”差異這些詞語所下的定義,則避開了這一問題。同時,這種定義將一些含糊不清、無法限定的東西引入抽象模型,而在其中找不到可與之相對應的類型。這種定義的唯一作用就是使得該理論在分析上毫無意義──這是因為“緊密的”與“較大的”這種表述與“較小的”氣壓同屬一類。在某一情況下,張伯倫不明確地將部門定義為具有相同的成本曲線與需求曲線的企業集團。但是,同樣,只要產品之間的差異是(如他們所主張的那樣)實質性的且不能置之不理,那么這種定義在邏輯上也是毫無意義的。“生產推土機的企業的成本與需求曲線,同生產發夾的企業的成本與需求曲線相一致”這句話的含義是什么呢。而且,如果它對于推土機與發夾來說是毫無意義的,那么,只要人們仍堅持認為兩種牌子的牙膏之間的差異是非常重要的。則它對于這兩種牌子的牙膏來說同樣也是毫無意義的。

    壟斷性競爭這一理論,對干部門分析來說沒有提供任何幫助,而且沒有提出任何中間情況以介于企業(在一個極端上)與總均衡(在另一個極端上)之間。所以。它沒能推進對許多重要問題所進行的分析。第一種極端情況面太窄從而無法具有較大的實用性﹔第二種極端情況面太寬從而無法確保有意義的概括性。

6.結論

    經濟學作為一門實証科學,是一種暫時被接受的、關于經濟現象的概括體系。這一概括體系可以被用來對情況變動的影響作出預測。人類在擴展這一概括體系,增強我們對其合理性的信賴,及改進其預測的精確程度等方面所取得的進步,受到了下述兩種因素的阻礙:一是所有知識探索的人類能力方面的有限性,二是社會科學中所存在的種種桎梏。這些桎梏對于一般性的社會科學來說影響極大,而且對于作為社會科學的一種的經濟學來說也特別重要。上述說法中絕無過分挑剔的成分。人們對經濟學課題的熟悉,促成了人們對關于這一方面的專門知識的輕視。經濟學的中心議題對日常生活的重要性及對公共政策中大部分問題的重要性,妨礙了經濟學的客觀性,并造成了科學分析與規范判斷之間的混淆。依據未經控制的實踐而不是依據受到控制的實踐的必要性,使得為証明試驗性假說的可接受性而創造大量的、准確的証據成為困難。雖然對未經控制的實踐的依賴并不影響這一基本的方法論原則:一假說唯有通過它的含義或預測與可觀測的現象之間的一致性才能夠得到檢驗﹔但是,這種依賴確實使得檢驗假說的任務更為艱巨,且使得在所涉及的方法論原則方面出現了更大程度的混亂。與其他科學家相比,社會科學家在其方法論方面需要具有更強烈的自我意識。

    一種業已流行甚廣且危害甚大的混淆現象就是人們在關于“假設”在經濟分析中的作用問題上的混淆。任何一種有意義的科學假說或理論都將一無例外地作出這樣的聲明:某些力量在理解某一特定種類的現象中是重要的,而另外一些力量則是不重要的。通過下述方法來表述這樣一種假說通常是非常便利的:聲言該假說旨在預測的這種現象在進行實際觀測的世界中的行為方式,就猶如它們在一假設的、高度簡化了的世界中的行為方式一般。這一高度簡化了的世界只包含該假說認為是重要的那些力量。一般說來,進行這樣一種描述的方法不止一種──即對這種理論進行表述所憂助的“假設”體系不止一種。對這樣一些假設所作的選擇,通常是出于下述兩個方面的考慮:一是它們在表述該假說方面的簡便性、清晰性及准確性﹔二是它們帶來間接証據的能力。假設可以為假說的合理性帶來間接証據這一說法,是出于下面几種考慮:假設可以使人們聯想到該假說的某些含義已經可以為觀察所檢驗﹔假設可以導出該假說與其它一些解決相關問題的假說之間的相互聯系,等等。

    這樣一種理論不能通過直接地將其“假設”與“現實”加以比較來進行檢驗。的確,不存在任何一種進行該種檢驗的有效方法。完全的“真實性”是明顯地無法達到的﹔而某一理論是否“足夠”真實這一問題,只有通過考察該理論所取得的預測,對于我們所要解決的問題來說,是否是足夠令人滿意的,或者是否是比來自于其它假說的預測更令人滿意來作出回答。然而,一理論可以通過其假設的真實性來檢驗,而不必考慮其預測的准確性這種看法,已經廠為流傳,并成為經濟理論因其非現實性而遭受的曠日持久的批評的根源所在。這些批評大多是不相關的。從而,由這種批評所促動的經濟理論改革也大多是不成功的。

    當然,如此眾多的經濟理論批評的不相關性并不意味著現存經濟理論的高度可信性。這些批評可能無的放矢,但也可能存在著放矢之的。從小的方面來看當然明顯地存在著這種可能性。任何一種理論都必然是暫時性的,且將隨著知識的進步而置于變化之中。即使撇開這種老生常談不論,我們也有必要使“現存經濟理論”的內容更為特定,并對經濟理論的各種分枝加以區分﹔經濟理論的某些部分明顯地要比其它部分具有更高的可信度。如果確實可能的話,那么,對實証經濟學的現狀作出綜合性的評價,對與實証經濟學的合理性相關的証據加以概括,及對實証經濟學每一部分所應具有的相對可信度加以估計等項工作,將是一部專著或一系列專著才能完成的任務,而絕非一篇方法論的短文所能勝任。

    在這里,我所能做到的只是概略地表述一下我個人的觀點。在我看來,現有的相對價格理論極富成果,而且對于具有西方國家特色的這種經濟體系來說又享有很高的可信程度。這一相對價格理論的主要任務是解釋資源在各種最終用途之間的分配問題,及生產成果在相互聯系的各種資源之間的划分問題。馬歇爾的《經濟學原理》一書基本上奠定了相對價格理論的現有結構。盡管似乎存在著相當的分歧,但在我看來,現有的靜態貨幣理論也同樣地極富成果,并享有很高的可信程度。現有的靜態貨幣理論的主要任務,是解釋絕對價格、總產量及其它變量對于經濟總體來說所具有的結構性或長期性水平。現有的靜態貨幣理論是以貨幣數量理論的形式為核心,并經歷了從戴維﹒休姆到劍橋學派,到歐文﹒費雪,到約翰﹒梅納德﹒凱恩斯的一系列重大演變過程。在我看來,目前經濟理論中最薄弱、最不令人滿意的環節在于貨幣的動態分析。貨幣的動態分析所涉及的是經濟整體對于情況的變動所采取的調整過程問題,亦即涉及的是總體活動的短期波動問題。在這一領域內,我們甚至還沒有形成一種可適當地稱作現有的貨幣動態分析的理論。

    當然,即使在相對價格理論與靜態貨幣理論中,也仍然存在著擴展現有理論的范圍與改進現有理論的准確性等方面的余地,而且這種余地是相當大的。特別地,對“假設”的描述真實性問題的不適當的重視,已經導致了人們對決定各種假說的合理性限制條件的關鍵問題的忽略。而上述各種假說又共同地構成了這些領域內的現有經濟理論。與這些假說相對應的抽象模型,也已經得到了相當的完善與深化,并且在嚴格性與准確性方面也有了巨大的進展。關于我們的經濟體制及其運行方面的描述性材料也已經以前所未有的規模得到了極大的丰富。這些成就都大有□益。但是,如果我們想要實際地使用這些抽象模型與描述性材料,則還需要作相當的探索。我們需要探索的問題在于進行下述判斷的標准問題,即如何確定:對于某種特定的問題來說,使用哪一種抽象模型才是最好的,一抽象模型中的哪些類型將與可觀測的實際類型相一致﹔該問題或該種情況的哪些特征對預測的精確度影響最大──這里的預測是由某一特定假說或理論作出的。

    實証經濟學的進步不僅要求對現有假說進行驗証并加以完善,而且還要求不斷地創立新的假說。對于這一問題我們尚缺乏正式的結論。假說的創立是一項精神、直觀與發明的創造性活動﹔其實質就是要在眾所熟知的材料中發掘新意。這一過程必須歸在心理學當中進行討論,而不應列在邏輯學當中進行研究。這一過程必須借助于自傳與傳記來研究,而不應從科學方法的專著中尋找答案﹔這一過程必須經由公理與事例所推動,而不應由定理或原則所導出。

    版權:芝加哥大學,1953年。

    有部分來源于密爾頓﹒弗里德曼的著作:《政治經濟學論文集》(芝加哥﹔芝加哥大學出版社,1953年)。

    在這一篇里,我全面地溶入了我的那篇簡短的‘綜述”文章的內容,而并沒有作特別的提及。我的《綜述》一文見于B﹒F﹒海雷編輯的《當代經濟學考察》,第五冊(芝加哥:理查德﹒D﹒歐文有限公司,1952年),第455-457頁。

我很感激多蘿西﹒S﹒布雷迪,阿瑟﹒F﹒伯恩斯,及喬治﹒J﹒斯蒂格勒對本篇編纂工作所提出的寶貴意見與批評。
 

K兄,老弗此文有简体中文的,为何要上这篇繁体,看起来很是吃力。
 

临时找的.
 

找不到英文原文,简繁互勘也不错啊,简体中文版原载北京经济学院版《费里德曼文萃》,颇难理解,现有重译本,由原出版社出版,改名为首都经济贸易大学出版社。
 

M·弗里得曼


实证经济学的方法论(中文简体)

在凯恩斯的名著《政治经济学的范围与方法》一书中,约翰. 梅纳德·凯恩斯对实证科学及规范科学作了区分。他认为:“一门实证科学……是关于什么是这一类问题的系统的知识体系;而一门规范科学(或称为管理科学)……是关于什么应该是这一类问题的标准的系统的知识体系……;是一门艺术……是为达到某一特定目标而设立的原则体系”;他指出:“这二者之间的混淆带有很大的普遍性,并成为很多殆害大分之谬误的根源”;他还强调了“创立一门准确无误的政治经济学的实证科学的重要性。”

本文将主要对某些方法论问题加以阐述,这些问题产生于人们为创立凯恩斯所倡导的“准确无误的实证科学”所作的努力,其中特别涉及的是,如何确定某一被提出的假说或理论,是否应被暂时地接受为“关于什么是这一类问题的系统的知识体系”的一部分。但是,凯恩斯所悲叹的这种混淆仍然如此之普遍,并极大地妨害了人们对经济学可以是——而且部分地确实是——一门实证科学的认可。所以,我们最好在本文的开头先论述一下实证经济学与规范经济学之间的关系。

1.实证经济学与规范经济学之间的关系

在某种程度上,实证经济学与规范经济学之间的混淆是不可避免的。在几乎每一个人看来,经济学所研究的问题与其自身是极为攸关的,而且是困于他们自己的经历与能力的范围之内;这一现象便是不断的广泛的分歧的根源,并成了频繁立法的契机。那些自许为“专家”的人们意见迟异,而且我们很难保证他们都是毫无偏见的。无论如何,在那些事关重大的问题上,即使这些“专家”们几乎一口同声而且毫无偏见,我们也很难完全不加考虑地接受他们的观点。实证经济学的结论似乎是,而且确实是与重要的规范问题密切相关的,是与应该做什么及如何取得某一既定目标等问题密切相关的。门外汉与专家一样,都在无一避免地试图改造实证结论以适应为他们所极力坚持的规范性的先入之见,并当这些实证结论的规范性含义——或所谓的这些实证结论的规范性含义——不合他们的口味时就否定这些实证结论。

从原则上说,实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说,它要解决的是“什么是”,而不是“什么应该是”一类的问题。它的任务是提供一套一般化体系,这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。这一体系的运行状况可以通过它所取得的预测与实际情况相比的精确度、覆盖率及一致性等指标来加以考察。简而言之,实证经济学是,或者说可以是一门“客观的”科学,这里“客观”一词的含义完全等同于任一自然科学上的定义。当然,经济学所涉及的是人与人之间的关系,而且调查研究者本身就是被调查研究的事物的一部分。与自然科学相比,调查研究者与被调查研究的事物之间更具有本质上的联系。上述事实在使社会科学家得到了一系列自然科学家无法得到的数据的同时,也使社会科学家在实现客观性的目标上遇到了特有的困难,但是在我看来,这些都不是这两类科学之间的根本差异之所在。

另一方面,规范经济学及经济学的技术也不可能独立于实证经济学。任何政策结论都不可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测,而预测则必须明确或不明确地基于实证经济学。当然。在政策结论与实证经济结论之间并不存在着—一对应的关系;如果有的话,那么则不必另外再创立一门规范经济学了。两个不同的个体可能在对某一个别立法的结果问题上意见一致。但其中的一个可能认为这些结果有利于平衡,进而拥护这项立法;而另外一个却可能认为这些结果是不合意的,进而反对这项立法。

然而,我对这样一种看法提出疑义:这种看法认为,在目前的西方世界,特别是美国,在毫无偏见的公民之间所存在的有关经济政策的分歧,主要地来源于人们对所采取的行动将带来的经济影响的不同预测。而这些分歧从原则上说是可以通过实证经济学的发展而予以消除的。持这种看法的人不认为人们关于经济政策的分歧是来源于人们在基本的行为准则方面的根本性分歧,来源于人们在最终可能出现的矛盾双方问题上的分歧。一个明显的而且并非不重要的事例就是最低工资限制问题。尽管在形式上存在着对这一立法的褒贬纷争,但人们在为所有的人争取到一个“生存工资”这一政策目标上却形成了根本一致的意见。而且“生存工资”这一含义模糊的概念在这一类问题的讨论中得到了广泛的运用。人们的意见分歧主要产生于人们在预测方面的隐含的或明确的分歧。这一预测涉及的是最低工资限制这一特殊手段在实现目标中的功效问题。该项立法的支持者们认为(即预测),法定的最低工资通过提高那些工资收入在最低工资线之下的劳动者的收入,及提高那些工资收入在最低工资线之上的劳动者的收入,进而消除了贫困。而且与此同时并不存在完全失业人数增加及就业条件因该立法的实行而恶化一类的消极作用。而该项立法的反对者们认为(即预测),法定的最低工资通过失业人数的增加及就业条件的恶化而加重了贫困现象。而且这一消极作用不仅抵消了该项立法给在业者工资收入所带来的有益影响,市且还可能使之状况更加恶化。人们在该项立法的经济影响问题上的看法一致,并不能使人们在该项立法的合意性问题上看法一致。这是因为仍然存在着人们在该项立法的政治或社会影响等问题上的分歧。但是,在目标一致的情况下,人们一定会经过漫长的道路而趋于一致的。

人们在工会的适当作用及地位的问题上的各种不同意见,及人们对直接的价格与工资控制的合意性及关税的合意性等问题的各种不同看法,都是以实证分析中的一些密切关税的分歧为依据的。人们对所谓的规模经济的重要性的不同预测,在很大程度上说明了人们在工业部门中政府的全面控制的合意性及必要性,甚至在社会主义(而不是私人企业)的合意性及必要性等问题上的不同看法。而且关于这一方面问题的事例举不胜举。当然,我的这一主张——即在西方社会中人们在经济政策问题上的主要分歧具有如上所述的性质——其本身就是一种“实证”阐述,它的正确与否还有待于经验证据的检验。

如果这一主张是合理的,那么它意味着。人们在“正确的”经济政策问题上的一致意见较少地取决于规范经济学的进步,而更多地是取决于这样一种实证经济学的发展:它所得出的结论不仅而且值得受到广泛的赞同。它还意味着:对实证经济学与规范经济学加以严格的区分的主要原因就在于这样一种贡献,即这一区分促进了人们在政策问题上的意见一致。

2.实证经济学

实证科学的终极目的就是要发展这样一种“理论”或”假说”,使之能够对尚未观察到的现象作出合理的、有意义的(而不是老生常谈的)预测。总体说来,这样一种理论是一个由两种元素构成的复杂的混合体。部分地说,它是一种‘语言”,旨在促进“系统的、有组织的推论方法”。部分地说,它是一系列假说的综合体,旨在从纷繁复杂的现实中抽象出事物的本质特征。

作为一种语言,理论不具有任何实质性的内容;它是一系列同义反复的词语的综合体。它的作用在于为经验材料的组织及对经验材料的理解提供文牍服务;而且用以检验这一服务质量的标准也是那些适合于文牍体系的标准。对这些事物的种类所下的定义清楚而准确吗?对这些事物种类的划分穷尽了吗?我们知道每一单个项目都应归于哪一类吗?或者,在这其中是否存在着相当的似是而非现象呢?人们对大标题及次标题体系的划分是否已达到这样的完备程度,从而使我们能够迅速地找到我们所要的条目呢?还是由于混乱不清而使得我们不得不一处一处地加以涉猎呢?我们将要研究的条目是否都已编排到一起了呢?条目的编排系统是否已避免了交叉重复呢?

对上述这些问题的回答部分地取决于逻辑上的考虑,部分地取决于事实上的考虑。标准的逻辑准则本身可以说明某一特殊语言是否是完全的及连续的,即这一语言中的命题是“正确的”还是“错误的”。事实上的证据本身可以说明“逻辑编排系统”的种类能否在实际中找到有意义的对应物,即在分析具体问题中的某一特殊种类时,这些条目划分是否能起到一定的作用。“供给”与“需求”这一简单的事例既说明了这一点也说明了前面所谈到的一系列逻辑分析问题。作为经济理论这种语言的构成要素,供给与需求是两大主要类别,影响产品的相对价格的因素及影响生产的因素都被划到这两大类别中来。这种二分法的实用性取决于“它在经验资料方面的高度概括性,即如果我们把任一问题中影响需求的力量与影响供给的力量分别开列出来的话,那么我们将会得到这样两类资料:它们之间很少有哪些项目是共同的。”现在,这样一种概括对于象消费品终极市场一样的市场来说是合理的。在这一类市场中,可以被看作是需求产品的经济单位与可以被看作是供给产品的经济单位之间存在着明确的、严格的区分。很少存在这样的混乱现象:从某一方面看来,某一特殊因素应被划归影响供给的项目之类,而从另一方面看来,又应被划归影响需求的项目之类。而且也很少有必要考虑两个类别之间的交叉效应(即交叉重复)。在这类问题中,在标题“供给”与_“需求”下对有关因素进行编排所需要采取的步骤既简单又明了,从而极大地简化了我们所面临的问题,而且这种简单明了的方法还防止了在其它情况下可能出现的差错。但是,这种概括并不是在任何情况下都是合理的。例如,在一个主要是投机性的市场中,对于价格的每日波动来说,这一概括就是不合理的。例如,一则关于增加超额利润税的谣传,对于股票市场来说,是应当看作是主要对今天的公司股票供给发生影响的因素呢,还是应当看作是主要对今天的公司股票需求发生影响的因素呢?在类似的情况下,几乎对于每一因素来说,将其划归“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。这些概念仍然可以使用而且不可能是毫无意义的;它们仍然是“正确的”,但与在第一个例子中的情况相比它们的用处则明显地要小得多,这是因为它们没有有意义的实证对应物。

作为一种实证假说体系,理论应该通过其对它意在加以“解释”的那一类现象的预测能力来检验。唯有实际证据才能表明该理论是“正确的”还是“错误的”。或者更为准确地说,唯有实际证据才能表明该理论是被作为合理因素而暂时地得到“接受”呢,还是遭到了“拒绝”。正如我下面将更为详细地阐述的那样,对某一假说的合理性的唯一有关的检验,是将其预测与实际情况所作的比较。郊果该假说的预测(“频繁地”或比来自于另一假说的预测更为经常地)与实践相抵触,那么该假说则遭到了否定;如果该假说的预测没有与实践相抵触,那么它则为人们所认可;如果该假说业已多次成功地避免了可能出现的抵触现象,那么它则具有极大的可信赖程度。实际证据永远也不可能“证实”某一假说的正确性,它只能通过无法将该假说驳倒来显示该假说的正确性。当我们说到某一假说已经在实践中得到了确认时(并不十分准确),我们通常所指的就是这个意思。

为了避免误解,可能有必要明确一下:我们用来检验某一假说的合理性的“预测”,并不一定非得是对尚未发生的现象所作的预测,也就是说,不一定非得是对将来事件的预见。它可以是对业已发生了的现象所作的预测,但前提条件是对这一现象所作的观察尚未进行,或者是虽然对这一现象的观察业已作出。但进行预测的人尚不知晓。例如,在其它一些情况已知的情况下,某一假说预测在1906年将会有某些情况发生。如果对这一时期的史料记载所作的研究表明,在1906年某些情况确实发生了,那么该预测则得到了实践的确认。反之,如果研究表明在1906年某些情况并没有发生,那么该预测则与实际情况发生了抵触。

从这种意义上讲,某一假说的合理性本身并不足以作为对其它假说进行取舍的标准。人们可以观察到的事实在数量上必然是十分有限的,但可能的假说却是无限的。如果存在某一种假说与可得证据相一致,那么一定还有无数的假设也与这一可得证据相一致。例如,假设对某一特殊消费品所征收的一种特别货物税,导致了价格的上涨,其上涨幅度完全等同于税收的数量。这与竞争情况下稳定的需求曲线、水平的且稳定的供给曲线是一致的;但它也与竞争情况下需求曲线或供给曲线发生必要的相应移动后的斜率为正或为负的供给曲线相一致:它也与垄断情况下常边际成本及稳定的需求曲线相一致,只是为了取得上述结果要求后者具有某一特定的形状;等等,等等,无穷无尽。这一假说所适应的另外一种证据可以起到剔除上述某些可能情况的作用;但它绝不可能把这些可能性削减为一种,而独自地与这一有限的证据相一致。对那些与可得证据同等一致的假说所进行的选择,在某种程度上是任意的。虽然我们一致同意这样的观点:对选择所进行的考虑应以“简洁性”与“成效性”为出发点,但这二条标准的本身就意味着否定完全的有目的的简化。一理论越是“简单明了”,在某一既定领域内对现象进行预测所需要的初始知识也就越少;一理论越是“富有成效”,它对现象所作的预测也就越精确,而且该理论进行预测所依据的范围也就越大,同时,为了进一步研究的需要,它所要加以说明的东西也就越多。逻辑上的完整性与一致性虽然也与评判的标准有关,但只起一个辅助作用;二者的作用在于确保该假说能够正确地阐明宗旨,而且做到使每一个研究该假说的人的理解都准确无误——在这里,它们与统计计算中对数字精确度的检验所起的作用是一样的。

不过,我们对社会科学中某一特殊预测所作的检验,很少能够通过这样一种实践来进行:这种实践是经过专门设计的,意在消除被认为是最重要的干扰因素。通常,我们不得不依赖于偶然发生的“实际情况”所提供的证据来进行我们的检验、在我看来,社会科学中无法进行所谓的”有所控制”的实验,这并不能反映社会科学与自然科学之间的根本区别。这既是因为“无法控制”的实验并非为社会科学所特有(自然科学中的天文学就是一例),又是因为有控制的实验与无控制的实验之间的差异充其量不过是一个程度上的差异。没有哪一种实验是可以完全控制的,同时每一种实验中又都存在着部分的控制,这是因为某些干扰因素在整个实验过程中应保持相对的稳定.

实践所提供的证据是大量的,而且常常是确定性的,犹如经过了设计的实验一般。所以,无法指导实际情况并不是通过预测的成功来检验假设的根本性障碍。但如此得到的证据在解释上却要比前种情况困难得多。它常常是复杂的,而且总是间接的和不完全的。对这种证据的收集常常是困难的,而且对这些证据的解释通常需要进行细致入微的分析工作,同时还涉及到一系列的推理判断,而这些很少能够真正做到把握事物的真谛。“具有决定性意义”的实验所带来的大量的直接证据与经济学之无缘,的确妨碍了检验假说工作的顺利进行。但与这一情况在取得合理的结论,及在由可得证据所证明了的结论上取得一致意见等方面所带来的巨大困难相比,前一种妨碍则显得微不足道了。它使得人们对失败的假说的摒除工作进展缓慢且困难重重。这些失败的假说很少永远告别经济舞台,相反却总是一再出现。

当然,这些方面的问题并不是整齐划一的。有时,实践所提供的证据与有控制的实验所能提供的证据几乎一样地直接、大量与确定。也许,最明显的重要例证要数通货膨胀问题。这种通货膨胀证据是服务于这样一种假说的:在一个较短的时期里,货币数量的大量增加必然伴随着价格的大幅度上升。这里,这方面的证据是大量的,且为对这些证据加以解释所需要的推理判断较少。然而,尽管存在着大量的价格大幅度上涨的事例,但这些事例与货币存量的大量增加之间的本质上的—一对应关系,及在其它相关的情况下的变异程度等,决定了每一次新的通货膨胀体验都必将带来激烈的争论,而且这种争论不仅仅是来源于非职业经济学家的人民大众。反对原假说的观点认为:货币存量的增加或者是来源于由其它因素所导致的价格上涨的偶然性影响,或者是价格上涨的一个完全偶然且不必要的附带物。

检验大量的经济假说的困难性所造成的一种影响就是:它使得我们的检验工作退回到纯粹的正统或繁琐分析中去。正如我们业已阐述的那样,繁琐重复在经济学及其它科学中,作为一种专门的语言或“分析编排体系”而占有极为重要的地位。此外,同样是同义反复的正统逻辑学与数学又成了这些问题的重要工具:检验判断推理的正确性;发现假说的深刻含义;确定是否一系列被假定为不同的假说的确不可能是等价的,或者在它们之间存在着差异等。

但是,如果一经济理论想保能够预测未来,而不仅仅是描绘行动的结果,那么仅作为一个同义重复的体系是远远不够的。同样,如果一经济理论想要有别于模糊数学时,那么仅作为一个同义重复的体系也是远远不够的。而且如我们前面所提到的那样,这些同义反复的实用性本身还将最终地取决于关于将某一棘手的实际问题划归某一种类的那些假说的可接受性。

通过预测而对经济假说加以检验所具有的困难造成了另一个更为深刻的影响,那就是它使人们对经验证据在理论著作中的作用产生了误解。在下述两个虽联系紧密但并不相同的阶段中,经验证据起到了至关重要的作用:一是构造假说的阶段,二是检验假说的合理性的阶段。完整且详尽的经验资料,作为我们将通过假说而予以概括总结或“加以解释”的实际现象的代表,除在提出新假说时所具有的重大作用外,还被用来验证一假说确实说明了它旨在说明的问题——即该假说对某一现象所作的阐述并不与人们业已观察到的实际情况相矛盾。在某一假说与人们掌握的实际资料相一致的情况下,人们对该假说所作的进一步检验,是要将那些事先并不知道然而却可以从实践中观察到的新因素从假说中剔除出去,同时还要对这些被剔除的因素加以检验,以了解这些因素与其它的经验证据之间的背离情况。为了使后一种检验同前一种检验密切相关,那些被剔除的因素必须与该假说旨在说明的问题同属一类现象;而且对这些被剔除的因素所作的限定必须足够地准确,从而使得人们所作的观察能够证明这些因素是不正确的。

构造假说与检验其合理性这两个阶段之间的相互联系可以从两个方面表现出来。第一,在某种程度上可以这样说:进入每一阶段的那些特定的因素,是由资料的收集及某一特定的调查者的知识水平所决定的一个偶然现象。被用来检验某一假说的内涵的那些因素可能同样适当地属于被用来构造假说的那些原始资料,反之亦然。第二,创立一假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及到对一系列早些时候提出的、以实际观察为依据的假说所进行的比较。这些假说的涵义之间的相互矛盾,成了促进人们构造新假说或修改原有假说的始动力。所以,这两个在方法上截然不同的阶段,在实际进程中又总是相辅相成、互为前提的。

人们对这一简洁明了的过程所产生的误解,主要在于下面这一表述:“该假说是为解释这一类现象而提出的。”社会科学中,对这一类现象的新证据的获得十分困难,而且对这些新证据与该假说的含义之间的一致性的判断也十分困难,这些情况使得社会科学试图作出这样的假设:其它的、更为可得的证据与该假说的合理性是同样相关的。这就等于说假定假说不仅具有“含义”,而且还具有”“假设”;这些“假设”与“现实”之间的一致性是检验该假说的合理性的标准——这一标准或者不同于通过含义所进行的检验,或者是对通过含义所进行的检验的一种补充。这一为人们所广泛持有的观点不仅是根本错误的,而且还成了更多的缪误产生的根源。它不仅没有为不合理的假说向合理的假说的转化提供捷径,相反却混淆了是非,造成了人们对经验证据在经济理论中的重要性的误解,使得人们为促进实证经济学的发展所作的智睿的探索迷失了方向,而且阻碍了实证经济学中人们在试验性的假说上一致意见的取得。

即使在一理论可以被说成是具有“假设”的限度内,即使在这些‘假设”的”真实性”可以独立于预测的合理性而接受检验的限度内,该理论的重要性与它的“假设”的“真实性”之间的相互关系,也完全不同于我们前面所批评的那种观点所提出的内容,甚至几乎是后者的反面。那些真正重要且伟大的假说所具有的“假设”,是对现实的一种粗略的、不十分精确的、描述性的表述.而且,一般说来,某一理论越是杰出,那么它的“假设”(在上述意义上)就越是超脱现实。这其中的原因是非常简单的。如果一假说能够通过极为有限的资料而进行大量的“阐述”,即如果一假说能够从它旨在解释的那一现象周围的大量复杂且详尽的情况中,抽象出共同且关键的因素,并能保证仅在这些有限资料的基础上作出合理的预测,那么,这一假说就是意义重大的。所以,为了意义重大,一个假说在其假设方面必须运用一些描述性的技巧;既然该假说的伟大成功将证明其它许多的有关情况与该假说旨在阐明的现象是毫不相关的,那么该假说也就不必考虑并说明这些情况。

为了使这一点不那么难于理解,我们所要问的另一个与一理论的“假设”有关的问题,不是这些假设是否在描述上是“现实主义的”,因为它们从来就不是,而是这些设想对于我们已有的目标来说,是否是一个足够好的近似物。而对这一问题的回答唯有道过考察该理论是否应验,即该理论是否取得了足够精确的预测水平来进行。这样,这两种原假设为独立的检验方法合二为一。

垄断的与不完全的竞争理论,就是在经济理论中忽视上述主张的一个例子。被说成是构成新古典经济理论的基础的“完全竞争”或“完全垄断”假设,是现实生活的一幅虚假的图象这样一种观点,明确地促进了垄断与不完全竞争分析的发展,而且也大致地说明了该分析得到广泛的接受与赞同的原因。而这一观点本身,几乎全部地以这些假设的这种直接可见的不精确性为基础,而不是以从新古典经济理论中导出的预测的任何得到认可的矛盾点为基础的。许多年以前,《美国经济评论》对边际分析问题所进行的长篇累牍的讨论,是另一个虽不如前一个例子重要,但比前者更为明确的例子。争论双方的文章,在很大程度上都忽略了在我看来似乎是关键性的问题——即边际分析原理与实践经验的一致性问题,而注重于商人是否确实地通过考察代表边际成本与边际收益的表格、或曲线、或多变量函数,来制定他们的决策这样一个几乎毫不相关的问题。也许这两个例子及它们所业已揭示的其它许多事例,可以对所涉及的方法论原则问题的讨论起到判别作用,而且通过这两个例子所说明的问题也许要比其它似乎是适当的方法所能说明的问题要广泛得多.

3.可以通过一假说的假设的真实性来检验该假说吗?

我们先从自由落体法则这样一个简单的自然事例开始来进行我们的讨论。在真空中,一落体的加速度是一个常数——g,在地球上是每平方秒大约32呎——而且落体的加速度与该物体的形状、投掷方法等因素无关,这一假说已得到了人们的广泛接受。这就等于说一落体在任一特定的时间范围内所下落的距离可以用S=1/2 gt2这一公式来算出。这里, S是该落体下落的距离,单位是呎,t是物体下落的时间,单位是秒。将这一公式应用到一个从楼顶下抛的实心球上,就等于说这样抛下的那个球的运行情况就如用它在真空中被抛下时的运行情况。通过这一假说的假设来对其进行检验,可能意味着对实际气压进行测量,并确定它是否接近于零。在海平面上,气压大约是每平方时15磅。为了使这一气压差别被判定为可忽略不计的,15是否是足够趋近于零的呢?因为这一实心球从楼顶降落到地面实际所需的时间与这一公式所给出的时间非常接近,所以很明显,这一15之差足够趋近于零。然而,假定现在抛下的是一根羽毛而不是一个实心球。那么这一公式所得出的结果则是非常之不精确的.很明显,对于一根羽毛(而不是对于一个实心球)来说,每平方时 15磅完全不同于零。或者,我们再假定这一公式的应用对象是从3万呎高的飞机上抛下的一个球。在这一高度,气压绝对地小于每平方吋15磅。然而,从3万呎降到2万呎(在这一点上的气压仍然大大小于海平面上的水平)所用的实际时间却完全不同于上述公式所预测的时间——大大地高于实心球从楼顶落到地面所需的时间。按照上述公式,该球的速度应为gt,而且还应该稳定地增长。事实上,一个从3万呎降落的球是在它碰到地面以前达到它的最高速度的。而且上述公式的其它含义也都与此类同。

为了使气压差别能够被判定为是可以忽略不计的,15是否足够地趋近千零这一初始问题本身就是明显地愚不可及的。每平方吋15磅等价于每平方呎2160磅,也等价于每平方吋0.0075吨。如果没有一些外在的比较标准,则不存在对这些数字评判大小的依据。而这唯一相关的比较标准就是在一系列既定的情况下,该公式可以应用或不可以应用的气压水平。但这又在另一个层次上带来了同样的问题。“可以应用或不可以应用”的含义是什么?即使我们可以消除测量上的误差,但物体降落的实际测得时间与公式计算所得的时间,很少(如果曾经有过的话)完全相等。为了能够判定自由落体理论之“不可以应用”,这二者之间的差异必须要多大呢?下面将是进行比较的两条重要的外在标准。一个是与该理论进行比较、且在所有其它方面与该理论是同等地可接受的另一理论所能达到的精确度。另一个是这样一种标准,它只有在存在着某一业已为人们所知道的、具有更好的预测水平,然而其预测成本较高的理论的前提下,才会存在。而且更高的精确度所带来的效益(这取决于人们的使用目的),一定能够弥补取得这一精确度所需要的成本。

这一例子既证明了通过一理论的假设来检验该理论的不可能性,也证明了“某一理论的假设”这一概念的模糊性。S=1/2 gt2这一公式对于真空中的落体来说是正确的,而且可以通过对这一类物体的运行情况的分析而推导出来。所以,可以这样阐述:在多种情况下,在实际大气中降落的物体,其运行情况如同在真空中所进行的降落。如果用我们经济学中最常用的话来表述,那么上述文字立刻会被表述成:这一公式假设存在着一个真空。然而很明显上述表述并没有作任何诸如此类的假设。上述表述的真正意思是:在许多情况下,气压的存在,物体的形状,投掷物体者的姓名,投掷物体所采用的方法及许多其它的附加条件,对于该物体在一定时间内所下降的距离并无可估计的影响。我们完全可以对该假说重新进行表述,从而完全不再提及真空因素:在许多情况下,一物体在一给定的时间内所下降的距离由公式s=1/2 gt2给出。如果我们撇开该公式的历史不谈,撇开与之相联的其它自然科学理论不谈,那么说该公式假设存在着一个真空还有意义吗?就我所知,还可能存在着其它的假设体系,而能够取得这同样的公式。这一公式之所以被接受是因为它与现实相符,而不是因为我们生活在一个大致的真空里——不管这种大致的真空指的是什么。

与这一假说相联系的一个重要的问题,是要限定该公式可以应用的条件,或者更为准确地说,是要限定在各种情况下该公式预测的总的误差范围。的确,正如上述对该假说的重新表述中所蓄含的那样,这样的限定与该假说并不是截然不同的两件事。限定本身就是该假说的一个重要组成部分,而且它是这样一个组成部分:随着实践的不断增加,它是特别有可能被修改与扩展的部分。

在落体这一特殊情况中,还存在着另一虽仍不完善但更为一般化的理论。这一理论主要来自于人们为解释前一种简单理论中存在的误差而进行的探索;而且在这一理论中,人们可以对某些可能存在的干扰因素的影响加以衡量;而且在这一理论中,前一种简单理论只是作为一种特例而存在。然而,这一更为一般化的理论并不总是能够得到应用。这是因为,它所取得的精确度的增加可能不能弥补使用这一理论所带来的成本的增加。所以,在何种情况下前一种较简单的理论可以“充分完善地”反映现实,这仍然是一个事关重要的问题。气压是限定该理论可应用的情况的那些变量中的一个,但只是其中之一;物体的形状,使达到的速度,及其它变量也都是与限定有关的。对气压以外的这些变量加以阐述的方法之一,就是将这些变量视为决定对真空“假设”的某种背离是否是事关重大的。例如,每平方吋15磅的气压对于一支羽毛来说是截然不同于零的;但对于从一高度不大的地方下抛的实心球来说,却是可以视为趋近于零的,这些都是物体的形状所带来的差别。然而,这样的表述绝然区别于下面这种不同的表述:该理论不能应用于羽毛落体,因为该理论的假设是错误的。然而它们之间的相互关系却完全是另一种情况:对于羽毛来说,这些假设是错误的,原因在于该理论不能应用于羽毛落体。这一点需要引起大家的重视。这是因为,在限定某一理论可以成立的条件的过程中,“假设”的完全正确的运用通常错误地被理解为假设可以被用来确定某一理论可以成立的条件,而且,这一误解成了理论可以通过其假设而进行检验这一观点的主要根源。

下面我们再来看另一个例子。这一次是一个臆造的事例,旨在使之成为社会科学中的许多假说的同类物。让我们来考虑一下一棵树上叶子的密度。我提出的假说是:这些叶子的位置是这样确定的:在其周围的叶子位置一定的条件下,每一片叶子都好象有意地使它所能得到的阳光数量最大化;每一片叶子都好象知晓决定在不同的位置上可得阳光数量的自然法则,并且能够迅速地(或曰即刻地)由任一位置移到任一其它合意的且尚未被占据的位置。现在,该假说的某些更为明确的含义明显地与实际情况相一致:例如,一般来说,树南侧的叶子密于树北侧的叶子,但如本假说所意含的那样,在山的北坡,或当树的南侧为其它东西所遮盖的情况下,树的南北两侧叶子密度的差异就不会那么明显。或完全不是原来的那种情况。就我们所知,叶子不能“有计划地行事”,或者说不能有意识地“追求”什么,它们没有进过学校并学会为计算“最佳”位置所必需的科学或数学的有关法则,难道我们可以据此认为该假说是不可接受的或曰不合理的吗?很明显,该假说的这些与事实相矛盾的情况中,没有一个是至关重要的。这里所涉及的现象不在“该假说旨在阐述的那一类现象”的范围之内。该假说并没有宣称叶子可以做到上述事情,它只是认为:这些叶子的密度是同一的,就犹如它们可以做上述事情一般.尽管该根说的“假设”中存在着明显的非现实性,但由于该假说的含义与实际观察的一致性,使得该假说具有极大的合理性。我们倾向于在下述意义上“阐述”该假说的合理性:由于阳光促进了叶子的生长,所以,在阳光较多的地方叶子将生长得更加茂密,或者说将有更多的假定存在的叶子能够得以生存下来。所以,完全被动地将这一假说应用到更为广泛的情况中去所得到的这一结果,与通过将某些特定环境附加其上所得到的结果是完全相同的。这后一种说法比前面造的那一种假说更为引人入胜,这不是因为后一种假说的“假设”更具“现实性”,而且因为后一种假说的“假设”本身就是一个更为一般化的理论的一部分。这种更为一般化的理论所能应用的现象种类更为广大,而且在这一更为一般化的理论中,一棵树上叶子的具体位置不过是该理论的一个特例。这一更为一般化的理论有着更多的可能招致异议的含义,但由于该理论可适用的范围更为广泛从而使得这些含义避开了可能发生的任何抵触。这样一来,叶子生长的直接证据为来自于这一更为一般化的理论所适用的其它现象的间接证据所加强。

我们所臆造的这一假说大致说来是正确的,也就是说,仅对于某些现象来说,该假说关于叶子密度的预测达到了“足够的”精确水平。我不知道这某些现象是什么,也不知道如何去定义它们。然而,有一点似乎是明确的,那就是:在这一例子中,该理论的这些“假设”并不属于该理论的假设范围:也就是说,树的种类,土地的性质等都是可能影响到该理论的合理性所存在的范围的变量种类,而叶子进行复杂的数学计算,或从一个位置移到另一个位置的可能性问题,却与该理论合理性的范围限制无关。一个与人类行为有关的例子大致类似于我们刚才所举的那个例子。这个例子我与萨维奇已在别处引用过。现在,让我们来考虑一下一位台球行家对击球情况进行预测的问题。下述假设似乎并非毫无道理:绝妙的预测通常都是通过这样的假说来取得。这种假说认为,这位台球行家的击球活动就犹如他知晓将会给出最佳运行方向的那个复杂的数学公式一般。而且这一数学公式可以通过眼睛对角度的观察,并确定该球所在的位置等而精确地进行计算。这位台球行家通过该公式而进行闪电般的计算。然后使球按该公式所指定的方向运行。我们对这一假说的信赖并不是基于这样一种观点:台球手(即使是台球行家)可以而且确实经历过前面所描述过的过程;相反,我们对该假说的信赖是缘于这样一种观点:除非这些台球手可以通过这样或那样的方法而取得与上述过程同样的结果,否则的话,他们事实上就不是台球行家。

由这些例子进而引申出下面这个经济原说,这似乎是很容易做到的。这一经济假说认为,在许多情况下,单个企业常常是如此行事,犹如他们在有计划地使其预期成果(通常,如果理解有误的话,则称之为‘利润”)最大化,而且掌握着为成功地实现这一目的所必需的全部数据资料;也就是说,犹如他们知晓相关的成本与需求函数,可以通过他们所掌握的所有情况来计算边际成本与边际收益,并使得他们所采取的每一个行动都恰到好处地符合边际成本与边际收益相等的原则。当然,现在的商人实际上并不完全按照经济数学家所发现的方便途径来解这一联立方程体系。只不过他们这样做的可能性比叶子或台球手明确地完成复杂的数学计算,或落体决定创造一个真空的可能性要大一些。如果台球手被问到他是如何确定击球方向的,那么他可能回答说他“恰好算了出来”,但此外他还要摩擦一下兔后腿来证实一下。而如果一位商人被问到他是如何决策的,那么他可能回答说他是以平均成本来定价的,而且当市场情况发生了变化时,当然也会出现一些微小的偏差。这一表述与前一个表述几乎是同样有帮助的,但它们之中没有一个与对有关假说所进行的检验有联系。

人们对上述成果最大化假说的信赖是由一非同寻常的特征证据所证明的。在某种程度上,这一证据与关于台球手行为的假说中所引证的证据是非常相似的——也就是说,除非商人可以通过这种或那种方法而使其行为近似于与成果最大化相一致的行为,否则,他们似乎不可能长久地维持他们的生意。这里不管明显地、直接地决定商业行为的因素是什么——习惯性的反应,随机性的机遇,或难于归类的一些东西——其结果都是一样的。不论什么时候,只要这一决定因素碰巧导致了与合理的、有实际根据的成果最大化相符合的行为,则生意使会兴隆,并进而需求资源以扩大经营;反之,只要这一决定因素不能带来与合理的、有实际根据的成果最大化相符合的行为,则生意将会亏损,且只有从外部引入新资源才能维持存在。这样一来,“自然选择”过程促进了该假说合理化的实现,或者说在自然选择既定的情况下,人们对该假说恰当地概括了生存条件这一判定,成了人们接受该假说的主要依据。

该成果最大化假说的另一更为重要的证据,来自于该假说在特殊问题中的无数次应用,及在这多次应用中,该假说的含义与实际情况并没有发生抵触这一事实。然而,如果要让这一证据提供佐证那是极为困难的。这是因为它散落在无数的商业便函中、文章中,及专题著作中,而这一切主要地是与特殊的具体问题相联系,而与对该假说的检验并不相关。然而,在很长时期内人们对该假说的持续使用与接受,及未能创立一种逻辑严密、自圆其说的假说来取而代之并得到广泛的接受这一情况,间接地有力地证明了该假说的存在价值。任一假说的证据都总是由人们试图证明它与实际情况相抵触而遭到的多次失败所组成。只要该假说仍在继续使用,那么这一证据就会继续增加。而且,由于该证据的特殊性质,让该证据提供完全充分的证明是十分困难的。这已开始变成某一科学的传统及传说的一部分,后者反映在人们持有假说的坚定性方面,而不是反映在教科书中对那些未能证明该假说与实际情况相抵触的事例所进行的罗列上面。

4.理论“假设”的重要性与作用

到现在为止。我们对一理论的‘假设”的重要性问题所作的结论几乎全都是否定的:我们已经证明了一理论是不能用其“假设”的“真实性”来加以检验的,而且,一理论的“假设”这一概念充满了可疑之点。但是,如果这就是问题的全部,那么我们将很难对这一概念的广泛应用作出解释。同时我们也很难说明这样一种较强的倾向:我们每个人都常常身不由已地谈到一理论的假设,并对各种理论的假设加以比较。有烟就有火。

在方法论当中(如同在实证科学中一样),作出否定性的结论通常要比作出肯定性的结论更有把握。所以,与前面的评述相比,我对下面这些有关“假设”的重要性及作用的评述的把握性较小。就我所能认识到的,一理论的“假设”具有三种虽则紧密相连但却完全不同的实证作用:(1)它们是对一理论进行描述或表述的一种简便形式;(2)它们有时会促进通过假说的含义而对假说所作的间接检验;而且(3)如我们前面已经提到过的,它们有时是对一理论预期的合理性的存在条件加以限定的方便途径。前两个方面还需要作进一步的讨论。

1.“假设”在表达一种理论中的作用

叶子的例子证明了假说的第一个作用。不采用叶子力图使它们所得到的阳光最大化这一说法,我们同样可以在没有任何明显的假设的情况下来表述这一假说。我们的表述是以预测叶子的密度所须遵循的一系列原则的形式来进行的:如果一棵树生长在一处平地上,且没有别的树木或其它物体来阻挡阳光的照射,那么,这棵树上叶子的密度将是如何如何。……相反,如果一棵树是生长在山的北坡,且位于由同样树木所形成的森林的中央,那么,这棵树上叶子的密度将是如何如何……等等。很明显,与叶子力求使它们所能得到的阳光最大化这种表述相比,刚才的那一种表述远不是这一假说的简便形式。事实上,由于前一种较简便的表述既指出了如何确定对本问题来说是非常重要的环境特点,又指出了如何对它们的影响加以评价,所以,前一种表述是对上述一系列原则的简单概括——即使这一原则系列被扩展到无穷大。前一种表述更为精悍而又不失全面。

更广泛地说,一假说或理论通常都含有这样的断言:某些力量(言外之意就是别的力量不是这样)对于某一特定种类的现象来说是重要的;并通常对它所断言的重要力量的行为方式加以限定。我们可以把这一假说看作是由两部分组成的:第一部分是一个概念性的世界,或者说是一个与“现实世界”相比较为简单的抽象模型。这一世界只包含该假说认为是重要的各种力量。第二部分是一系列原则。这些原则定义了这样一类现象——它们使得上述模型得以成为“现实世界”的一个适当的代表,同时,这些原则还对模型中的变量或实体与可观测的现象之间的对应关系作了限定。

从本质上看,这两个部分是截然不同的。模型是抽象的、完整的,它是一种“代数学”或“逻辑学”。在检验模型的一致性与完整性,探究模型的含义方面,数学与正统的逻辑学回归它们的老本行。在模型当中,“大概”、“可能”、或“近似于”这一类东西根本没有存在的余地,而且也不起任何作用。对于真空来说,气压是零,而不是“较小”;对于竞争性市场上的产品生产者来说,需求曲线是水平的(斜率为零),而不是“几乎是水平的。”

另一方面,使用模型的原则却又不可能是抽象的和完整的。它们必然是具体的,从而也就必然是不完整的。这是因为,不论人们如何定义“现实世界”,完整性只有在概念性的世界里才会存在,而不可能存在于”现实世界”中。模型是“在太阳之下不存在任何新的东西”这一只有部分真实性的欺人表述的逻辑体现;然而,在应用模型的原则中却不能忽略具有同等重要性的另一个只有部分真实性的欺人表述:“历史永远不会重新开始。”当一理论是一明显地更为一般的理论的一部分时(如落体这一例子中的真空理论一样),在相当程度上,我们可以把模型的应用原则明确地、系统地阐述出来。尽管这时的阐述仍不完整,但却是最容易进行的。为了使一科学尽可能地具有“客观性”。我们的目标应当是尽其所能地对这些原则作以明确、系统的阐述。并不断地扩大可以进行如此阐述的现象范围。但是,不论在这一努力上面我们取得了多么大的成功,总是不可避免地要在实行这些原则时出现新的问题。每一种情况都有其独特之处.而这是那些明文规定的原则所不能—一囊括的。对这些特殊情况加以判断,并对这些特殊情况是否应影响到可观测现象与模型中的实体之间的对应关系加以判断,这需要具备这样一种能力:这种能力不能靠别人的传授来获得。它只能通过实践并置身于一种“正确的”科学氛围中来掌握,而不能机械照搬。正是在这一点上,出现了业余爱好者与专职人员之间的分水岭,这对所有的科学来说都是一样的。也正是在这一点上,体现了怪诞者与科学家之间的微妙差异。 下面这个简单的例子可能会有助于弄清这一点。欧几里得几何学是一个抽象的模型。从逻辑上看它是完整的和一致的。模型中的实体(或称变量)都经过了严格的定义。如一条直线的定义不是一个其长度要比其宽度或深度“大得多”的几何图形,而是一个其宽度与深度为零的图形。它同时也是非常“非现实主义的。”在“现实”中不存在如欧几里得之点、之线、或之面一样的东西。让我们将欧几里得这一抽象模型应用到我们用粉笔在黑板上所作的一个记号上面。这一记号是与欧几里得之线,还是与欧几里得之面,还是与欧几里得之体相一致呢?很明显,如果这一记号正在被用来表示(比如说)一条需求曲线,那么它完全与一直线相一致。但是,如果这一记号正在被用来为(比如说)地图上的国家着色,那么它就不能与直线相一致了,这是因为那将意味着该地图永远也不会具有颜色。为了实现这一目的,这同一记号必须与面相一致。但是,对于粉笔的生产者来说,它却不能与面相一致,因为如果是这样的话,那么粉笔将永远也用不完。出于这种考虑,这同一记号必须与体相一致。在这一简单例子中,上面所提到的那些判断将取得广泛的一致意见。然而,似乎很明确,虽然我们可以对指导这些判断的一般性原则作一系统的阐述,但这些原则永远也不会真正作到包罗万象,囊括每一种可能出现的情况。它们并不具有欧几里得几何学本身所具有的自圆其说、自成体系的特点.

我认为,在谈到一理论的“至关重要的假设”时,我们是在试图对这一抽象模型的关键因素加以阐述。通常,可以用许多不同的方法来对这一模型加以完整的描述。也就是说,存在着许多不同的“基本原理”体系;作为一个整体,它们既包含了模型的內容又为模型的内容所包含。从逻辑学的角度上看它们是等价的:从某一角度来说可以视为一模型的公理或曰基本原理的东西。从另一角度来说也可以视为一模型的定理。反之亦然.被称为是至关重要的那些特定的“假设”是以下述因素为依据选择出来的:这些‘假设”在阐述模型方面的简洁性或经济性,直观的合理性,及提出假设的能力等.如果仅仅从含义上来看,也就是与人们判断或应用模型有关的那些原则的一部分。

2.“假设”作为理论的间接检验标准所起的作用

在任一假说的表述中通常存在着这样一种情况:用来阐述该假说的那些论段中,哪一些与假设有关,哪一些与含义有关似乎是泾渭分明的。然而,这二者之间的区别却难以准确定义。我认为,这不是由这类假说本身的特点所决定的,而是由该类假说将被用于的对象的特征所决定的。如果确实是这样,那么要想使对这些论述的划分易于进行,就必须确保该假说旨在服务的目的的明确性。在一抽象模型中定理和公理之间互换的可能性,意味着在与这一抽象模型相对应的那个独立的假说中,也存在着“含义”与“假设”之间互换的可能性。但这并不是说任一含义都可以与任一假设互换,而是说那种可以包含其它论述的论述体系可能不止一个。

例如,让我们来看一下寡头行为理论中的一特殊主张,如果我们假定:(1)企业通过各种方法来使其成果最大化,甚至不惜获得或扩大垄断力量。这将意味着,(2)当对某一“产品”的需求存在着地区性的不稳定,运输费用极高,公开的价格协议不合法,且该种产品的生产者为数极少时,他们将会试图建立基点定价体系。由于我们已将市场行为预测接受为本分析的目的,所以我们将论述(1)视作该理论的假设,而将论述(2)视作该理论的内容。如果我们发现(2)中所描述的情况通常与基点定价法结合在一起,那么我们将认为假设(1)是可以接受的;反之亦然。现在让我们将该分析的目的改为:按照谢尔曼反托拉斯法对控制贸易同盟的禁止,确定哪些情况应予上诉。如果我们现在假定:(3)基点定价方法是在(2)中所限定的条件下蓄意产生的一种手段,以利于协同一致.那么这将意味着,(4)参加墓点定价的企业参与了“控制贸易同盟”。先前作为假设的东西现在变成了内容;同样,先前作为内容的东西现在变成了假设。现在,如果我们发现企业参与了基点定价,那么我们将现假设(3)为合理的。当一企业参与基点定价时,通常还会存在其它的证据,如书信、便函等.这些材料将被法庭视为“控制贸易同盟”的证据。

假定该像说服务于第一种目的,即预测市场行为。很清楚,这并不等于说该假说将服务于第二种目的,即预测是否存在足够的证据来证实“控制贸易同盟”的存在,从而确定法院所应采取的行动。反之,如果该假设服务于第二个目的,这同样不等于说它将服务于第一个目的。然而,在缺乏其它证据的情况下,该假设服务于一种目的所取得的成功(在解释一类现象方面所取得的成功),与该假说服务于另一种目的所可能取得的成功相比(即在解释另一类现象方面所取得的成功),前者将给我们带来更大的信心。要想具体说明前者所证实的把握性比后者到底大多少,将更为困难。这是因为这取决于我们对这二类现象之间相互联系的紧密程度的判断;而这本身又将通过复杂的途径而取决于某些同种的间接证据——即在通过单纯的理论现象进行解释时我们所具有的在其它方面的经历。而这些单纯的理论现象在某种程度上又是同样纷呈复杂的。

为了更进一步地阐述这一观点,我们可以通过那些被称作一假说的假设的东西,来取得一些间接证据。这些间接证据是关于一假说的可接受性的。上述结论仅在如下意义上才能成立:假设本身可以被视作等同于该假说的含义。因为这样一来,假设与现实的一致性就可以被视作等同于人们在试图证明某些含义与现实相抵触时所遭到的失败。或者说上述结论仅在如下意义上才能成立:这些假设可能使人们想起该假说中另外一些易受偶然的实际观察所影响的含义。之所以说这一证据是间接的,是因为这些假设或该假说的各种含义所指的那一类现象,通常不同于该假说旨在说明的那一类现象。的确,如我们前面所讲的那样,这一点似乎是我们在确定哪些论述应冠之以“假设”,而哪些论断应冠之以“含义”时所依据的主要标准。这一间接证据所具有的重要性,取决于我们对这两类现象之间相互联系的紧密程度的判断。

一假说的“假设”为该假说提供间接检验的另一种途径是:找出该假说与其它假说之间的相互关系,从而使得正待接受检验的该假说的合理性与其它假说的合理性的证据联系起来。例如,一假说正在对某一特殊种类的行为作出解释。同以前一样,我们也可以不限定任何“假设”而对该假说加以阐述.但是,假定我们能够证明该假说与某一假设体系是等价的,并且这一假设体系中还包括了人人都在追求自己的利益这一假设,那么,这一假说就可以通过与它具有同样假设的那些假说在其它种类现象上的成功,而间接地获得其合理性;即使不能的话,我们这里所作的探索也不会完全是前无古人后无来者的,至少不会是在任何方面都一无所获。实际上;为引出表面上互不相同的假说之间的相互关系而对假设所作的这番研究,正是我们在通向一个更为一般化假说的道路上迈出的一步。

从相关的假说中导出的这种间接证据,在很大程度上说明了持有不同背景的人,在对某一特定假说的信任程度上的差异。例如,让我们来考虑这样一个假说:在某一特定地区或行业内,在就业问题上所存在的种族或宗教歧视,与该地区或该行业中的垄断程度密切相关。也就是说,如果该行业不是垄断性质的而是竞争性的,那么,只有在就业者的种族或宗教影响到其它就业者与他们一起工作的情愿性,或影响到消费者对他们所生产的产品的接受性,而与雇主的偏见毫不相关时,才可能存在较为严重的种族歧视。这一假说对于经济学家所具有的吸引力将远远大于它对于社会学家所具有的吸引力。这一假说可能被说成是“假定”在竞争性的行业里,雇主一门心思地追求其在金钱方向的利益;而且,这一“假设”适用于许多经济假说。这些经济假说,涉及的是经济学所要研究的许多大宗现象。所以,在经济学家看来,这一假设同样地也适合于我们所讲的这一情况,似乎是合情合理的。另一方面,为社会学家所熟悉的那些假说其模型或曰理想世界与此是截然不同的。在他们的模型或理想世界中,一门心思地对金钱方面的个人利益的追求只起到非常小的作用。对于社会学家来说,在这一假说问题上可得的间接证据,对于该假说并不十分有利;而对于经济学家来说,在这一假说问题上可得的间接证据,对于该假说的有利程度与前者相比则要大得多。所以,社会学家对该假说可能持有较大的怀疑态度。

当然,一经济学家的证据与社会学家的证据都不是决定性的。该假说对于它旨在说明的现象来说是合起作用这才是决定性的检验。但是,在做出任何令人满意的决定性检验之前,还需要作出一种判断。而且,很有可能,如果这种检验不能很快地作出时,在这种情况下,这一判断将不得不以可得到的不充分的证据为依据来进行。此外,即使这样的检验可以作出,科学家们的背景情况对于他们所取得的判断来说也不是完全不相干的.在科学中永远不存在一定的东西.证据对一假说所起的肯定的或否定的作用,永远不能说是完全“客观的”。在判断假说的含义与实际情况的一致性方面,经济学家要比社会学家更为“宽容”,而且较少的几个“一致性”事例就可以促使他暂时地接受假说。

5.经济学中的某些含义问题

我们一直在进行讨论的这些抽象的方法论问题,与人们对“正统的”经济理论作为一种“非现实主义的”理论所进行的旷日持久的批评,及人们对为迎合这一批评的要求而重新构造理论的种种尝试所进行的旷日持久的批评之间,有些直接的联系。经济学是一种“沉闷无趣的”科学,因为它假定人是自私的和唯利是图的,人是“欢乐与痛苦的计算器,且其计算速度如闪电一般。人这架计算器,就象一粒充满着幸福渴望的水珠一样,在某些使他游离于幸福与痛苦之间的动因的作用下,振荡不已,但在这当中人是不变的。”说经济学是一门“沉闷无趣的”科学,还因为经济学是建立在旧心理学的基础之上的,从而必须随着心理学的新发展而同步改进。第三点原因在于经济学假定人(至少对于商人来说是这样)总是处于“一种连续的警觉状态”,一旦他们那敏感的直觉嗅察到了供给与需求状况的变化,他们将立即改变价格或改变定价原则。第四点原因在于,经济学假定市场是完美的,竞争是纯粹的,而且商品、劳动力与资本等都是同质的。

正如我们所看到的,除非这一类的批评得到了下面这一证据的补充说明,否则的话将主要集中在其它方面。这一证据就是:存在着某一种假说,它与正在受到批评的理论在上述那些方面中的某一方面上并不相同的,然而该假说在较大范围的现象的预测上取得了较好的成果.然而大部分的此类批评都没有这种证据作为补充;它们几乎全部地取决于“假设”与“现实世界”之间所谓的直接可见的差异。最近一段时间人们对成果最大化假说所作的批评,为说明上述问题提供了明显的例证.这一批评的理论依据就是商人没有,而且确实也不可能象该理论所“假设”的那样去做。被用来作为该论断的佐证的证据,通常来自于两个方面。或者是来自于商人对影响其决策的因素问题的回答——这是检验经济理论的一种程序,这种程序与通过向80岁的老人询问长寿的秘诀来检验长寿理论的作法别无二致。或者是来自于对单个企业的决策活动所作的描述性研究。一方面,人们很少(如果曾有过的话)能够提供这样的佐证:这里的证据是关于商人的实际行为与正在受到批评的假说的含义之间的一致性问题的,即是关于商人的所作而不是关于商人的所说的证据。另一方面,人们也很少(如果曾有过的话)能够提供这样的佐证:这里的证据是关于商人的实际行为与另一假说的含义之间的一致性问题的。

就人们时常对一理论或其“假设”所赋予的直接描述性而言,一理论或其“假设”不可能是完全“现实主义的”。关于麦子市场的一个完全“现实主义的”理论,不仅需要包括直接决定麦子的供给与需求的那些情况,而且还需要包括用于交易的现金或信用工具的种类。此外还有:交易者的头发与眼睛的颜色,他的祖先及受教育程度,他的家庭人数,他家庭成员的特征,祖先,受教育程度等个人特征;种植麦子的土壤种类,土壤的物理及化学属性,在生长期内的主要天气情况;种植小麦的农民及最终食用小麦的消费者的个人特征,等等,等等,无穷无尽。为达到这样一种“真实”而作的过分努力,都只会使该理论失去真实有用的作用。

当然,部分地说,完全现实的理论这一想法不过是一个稻草人。没有哪位理论批评家会以这一逻辑极端作为目标。任何一种理论批评都可能这样说:正受到批评的这一理论的“假设”“太”脱离现实了;而它的目标是这样一种假设体系:尽管不是完全地毫无创造性地追求真实,但要比正受到批评的这些假设“更为”真实一些。但是,只要“真实性”的检验标准是“假设”的直接可见的描述准确度,则不存在进行上述区分的依据,那永远也不会存在前一段所描述的那个稻草人。例如,“真实性”的检验标准可能是这样一些实际观察:“商人似乎并不象边际理论所描绘的那么贪婪,那么精悍,那么富有逻辑性”;或者,“在当前的情况下,对于多工序工厂的管理者来说,试图算出每一生产要素的边际成本与边际收益,并使二者相等这将是绝对不可行的。”判断某一特定的偏离现实情况是否可以接受的标准是什么呢?在分析商业行为时,为什么忽视商人的成本大小比忽视商人的眼睛的颜色更为“不现实”呢?答案很明确,这是因为对于商业行为来说,省略前者会比省略后者带来更大的偏差。但是,简单地通过商人之间确实存在着成本大小的不同及眼睛颜色的差别这一观察,并不能使我们知道这一点。很清楚,将一种因素考虑进来与将另一种因素考虑进来将会对偏差产生不同的影响。而我们唯有通过它们对实际行为与预测行为之间的偏差的影响的比较,才能知道上述答案。这样一来,即使是真实性假设的最极端的拥护者,当他们对各种假设按真实程度大小加以划分时,也必然要被迫放弃他们的标准,而接受通过预测的检验标准。

描述方面的准确性与分析方面的相关性之间的根本性混淆,构成了大部分经济理论批评的主要内容。这些经济理论批评是关于理论假设的非现实性的。这一根本性的混淆及导致这一混淆的那些观点的正确性问题,都在一篇关于商业循环的文章中得到了充分的说明。这一篇文章中有这样一段似乎是无害的评述:“经济现象是变幻莫测、纷繁复杂的,所以,任何一种能与现实紧密地结合起来的关于商业循环的综合性理论,都必定是极为复杂的。”科学的一个基本的假说就是:现象是具有欺骗性的,而且我们可以通过某种方法而对证据加以考察、解释或组织。从这些证据中我们将发现那些表面上直不相关、各不相同的现象事实上却是一种更为基本且相当简单的结构的表现形式。而且,对这一假说加以检验的标准,同其它假说的检验标准一样,是它所取得的成果——即迄今为止科学所取得的巨大成就。如果某类‘经济现象”看起来好象是变幻莫测、纷繁复杂的,那么我们只好这样假定:这是因为我们没有适当的理论来对它们作出解释。我们决不可能把已知的事实放在这一边而把“与现实紧密结合的”理论放在另一边。理论是我们“透视”事实的桥梁,而且如果没有理论,我们将不能透视事实。“经济现象是变幻莫测、纷繁复杂的”这种主张,否定了知识的试验性状态,殊不知这种状态本身也可以使科学活动富有意义;这种主张与约翰·斯图尔特·穆勒的以下完全荒谬的观点同属一类。穆勒认为:“很幸运,在价值法则中不存在任何有待于现在(1848年)或将来的作者来加以澄清的东西;关于这一问题的理论是完美的。”

描述方面的准确性与分析方面的相关性之间的混淆,不仅导致了在许多不相关的方面对经济理论所作的批评,而且还导致了对经济理论的误解及在弥补所谓的缺陷的努力中方向性错误。由经济理论家们提出的抽象模型中的“理想类别”,已经被视为严格的描述性的分类。这些描述性的分类将直接地、完全地与现实世界中的现象实体相对应,而独立于该模型的使用目的。而描述性的分类与现实世界中的现象实体之间存在的明显的偏差,导致了在构造理论的努力上的不可避免的失败,这是因为,重新构造理论的努力是以这些意在具有充分的描述性的分类为基础的。

人们对“完全竞争”与“垄断”概念所作的解释,及“垄断性的”或“不完全竞争的”理论的发展,可能再清楚不过地说明了这种倾向。据说,马歇尔假定存在“完全竞争”;可能曾经有过这种消沉。但是,很明显,现在已经不再存在这种情况了。所以,我们必须放弃马歇尔的理论。读者可能将不辞劳苦地到处搜寻(我预言这将是徒劳的),试图在马歇尔的著作中找到关于完全竞争的明确假设,或任何这样的主张:从描述的角度来说,世界是由参与完全竞争的基本单位——企业所组成的。然而,读者将发现马歇尔的如下论述:“在一个极端上,存在着这样的世界市场,在这个世界市场里,竞争直接地从地球的每一部分展开;而在另一个极端上。存在着这样的封闭市场,在这个封闭性的市场里,所有来自远方的直接竞争都被排斥在外,然而即使在这样的市场中,人们仍然可以感觉到间接竞争与传导性的竞争之存在。而且在这两个极端之间还存在着大量的其它种类的市场,这种市场的情况还有待于经济学家和商人的进一步研究。”马歇尔按照世界的本来面目来描述世界;他所追求的是为分析世界开辟道路,而不是使现实世界得到摄影般精确的再现。

在按照世界的本来面目而对世界进行的分析中,马歇尔构造了这样一个假说:在很多问题中,众多的企业将被组合成“部门”,这样做的目的是使得每一集团中各企业之间的相同之处远远胜于它们之间的差异。这些问题通常都具有这样的特点,即下述情况对于它们来说同样是重要的:企业集团也将受到某些变动的影响,如对它们的产品的需求方面的变动。或者生产要素供给方面的变动。但是,并不是所有的问题中都存在这种情况,也就是说,上述重要情况可能是只作用于某些特殊企业的个别影响。

与这一假说相对应的抽象模型,包含着两种“理想的”企业类型:作为基本单位的竞争性企业(这些企业将组合成部门)与垄断性企业。在所有其它企业的价格一定的条件下,如果对该企业产品的需求曲线相对于该企业的产品价格来说具有无限弹性的话(这适用于某些价格及全部产量),那么该企业则是竞争性的。它隶属于某一“部门”,这种部门的定义是生产单一“产品”的企业集团。这里“产品”的定义是那些对于购买者来说具有完全的替代性的产品的集合。所以,某一企业的产品相对于同部门中另一企业的价格的需求弹性,对于某些价格和某些产量来说是无限的。囫如果某企业产品的需求曲线对其所有产品的某种价格皆不具有无限弹性,那么该企业则是垄断性的。对于垄断性的企业来说,企业就是部门。

同往常一样,作为一个整体该假说不仅包含了这一抽象模型及其理想的企业类别,而且还包含了一系列原则——这些原则大部分是含蓄的且通过例证来体现。这些原则系列是为使实际生活中的企业与这种或那种理想类型相一致,及为将企业划归部门而设立的。这些理想类型本来并不是描述性的;它们最初的使命是对那些对某一特定问题来说极为重要的特征加以区分。即使我们可以对某企业的产品需求曲线作出直接的、准确的估计,我们也不可能立即进行如下划分:按照需求曲线的无限弹性及非无限弹性来划分完全竞争企业与垄断企业。我们实际观察到的那些需求曲线没有哪一个是绝对水平的。所以,我们所能估算出的弹性永远也不会是无限的。所以,真正相关的永远是这样一个问题:某一弹性是否“足够”大,从而可以被看作是无限的。但是,对于这一问题,我们不能简单地通过弹性数值本身来作出一劳永逸的回答。正如我们不能永久性地断言:对于公式S=1/2 gt 2的应用来说,每平方吋15磅的气压是否是“足够地”趋近千零。同样,我们也无法计算出需求的交叉弹性,进而按照‘需求的交叉弹性之间的差异”来将企业划归部门。正如马歇尔所述:“不同产品(即不同部门)之间的区分应如何确定这一问题,必须从便于某种讨论的角度来加以解决。这决定了所有的问题;同一企业在一种问题中被当作完全竞争者来看待,而在另一种问题中又被当作垄断者来看待,在这当中并不存在任何不一致的地方。

正如同一个粉笔记号在一种问题中被看作是欧几里得直线,在另一种问题中被看作是欧几里得面,而在第三种问题中被看作是欧几里得体一样,这当中并不存在任何不一致的地方。需求的弹性与需求的交叉弹性的大小。生产物理性能相同的产品的企业的数量,等等,都与问题密切相关。这是因为,这些因素属于(或者说可以属于)下述变量的一部分。这些变量将被用来确定某一特定问题中理想实体与实际实体之间的相互关系;并限定该理论得以充分成立的前提条件。但是,这些变量并不能一劳永逸地确定企业在完全竞争与垄断之间类型的划分,

下面这个例子可能会有助于说明这一点.假定现在有这样一个问题:要确定联邦香烟税的增加(被预期为永久性的增加)对香烟零售价格的影响。我冒昧地提出这样的预见:如果想得到大致正确的结果,就必须这样来看待香烟企业,即好象它们正在生产一种没有差别的产品且正处于完全竞争之中。当然,在这种情况下,“必须建立某些协议”,如对切斯特菲尔德香烟的数量加以限定。这里,“切斯特菲尔德香烟被看作是与马尔巴勒香烟等价的。”

另一方面,香烟企业将犹如完全竞争企业一般行动这一假说,对于二次世界大战中香烟企业对于价格控制的反应来说,应该是一个错误的指导,而且毫无疑问,在此之前人们一定已经认识到了这一点。战争期间,香烟企业的成本一定会上升。在这种情况下,完全竞争者一定会减少原有价格下的销售量。但是,战时公众收入的增加又会增加那一价格下的需求量。在完全竞争的情况下,严格固有法定价格将意味着“短缺”的出现及香烟生产数量的绝对下降。这里“短缺”的含义是需求数量超过了供给数量。事实否定了这一特定含义:人们将很好地、合理地坚持最大化香烟价格;而生产数量将大幅度地增加。成本上升这一共同性力量,大概不如每一企业对保住其市场份额及商标名望与价值这种愿望的破坏性力量来得强烈。特别是当超额所得税将这一类广告成本的很大份额转嫁到了政府头上时,则更为如此。对于这一问题来说,我们不能把香烟企业假设为完全的竞争者,并以此来对待它们。

小麦的种植常常被用来作为完全竞争的例证。然而,虽然对于某些问题来说,假设香烟企业组成了一个完全竞争的部门,并以此来对待它们是适当的;但是,对于某些问题来说,假设小麦的生产者是完全的竞争者并以此来对待他们则是不适当的。例如,如果现在所要考虑的问题是当地的谷物加工者所支付的麦价之间的差异,那么上述假说则是不适当的。

在那些某一企业集团受到共同因素的影响,及企业可以被假设为完全竞争者并以此来对待的问题中,马歇尔的理论分析被证明是最为有用的。从某种描述性的意义上说,这就是歇尔“假定”完全竞争这一误解的根源。如果能够创立一种比马歇尔的假说更为一般化的理论,即能同时对下述两种情况加以考虑的理论,那将是极为理想的。在一种情况中,产品的差别及企业数量的稀少会带来本质上的不同;而在另一种情况中,产品的差别及企业数量的稀少则不会带来本质上的不同。这样一种理论将使得我们能够解决那些目前尚不能解决的问题。此外还将使得我们能够更好地确定前一种较为简单的理论的适用范围,即在哪些情况下该理论才能被看作是现实世界的一个足够好的近似。为了能够起到这两方面的作用,这一更为一般化的理论必须具有要义与实质;它必须使其含义接受实践的考验,并具有极大的影响力与重耍性。

由张伯伦、鲁宾逊二人所提出的不完全竞争或称垄断性竞争理论,就是为创立这样一种更为一般化的理论所作的尝试。不幸的是,他们所提出的这一理论不具备成为真正有价值的一般化理论所必须的特征。他们的理论贡献主要局限于如下几个方面:完善了人们对单个企业经济学所作的阐述,从而完善了人们对马歇尔模型含义的推导;完善了马歇尔的垄断分析,并丰富了可用来描绘部门情况的词汇构成。

这一理论的不完善之处特别明显地表现在它对涉及到企业集团(即马歇尔部门)的问题的处理上,或者说它在这类问题上无能为力。只要坚持认为产品之间的差异是实质性的,并坚持认为该理论对这一点的坚持正是该理论的卓越之所在,那么,通过生产同一产品的企业而对部门所下的定义则不再适于应用。按照这个定义,每一企业都是一个独立的部门。而通过“紧密的”替代品或交叉弹性之间“较大的”差异这些词语所下的定义,则避开了这一问题。同时,这种定义将一些含糊不清、无法限定的东西引入抽象模型,而在其中找不到可与之相对应的类型。这种定义的唯一作用就是使得该理论在分析上毫无意义——这是因为“紧密的”与“较大的”这种表述与“较小的”气压同属一类。在某一情况下,张伯伦不明确地将部门定义为具有相同的成本曲线与需求曲线的企业集团。但是,同样,只要产品之间的差异是(如他们所主张的那样)实质性的且不能置之不理,那么这种定义在逻辑上也是毫无意义的。“生产推土机的企业的成本与需求曲线,同生产发夹的企业的成本与需求曲线相一致”这句话的含义是什么呢。而且,如果它对于推土机与发夹来说是毫无意义的,那么,只要人们仍坚持认为两种牌子的牙膏之间的差异是非常重要的。则它对于这两种牌子的牙膏来说同样也是毫无意义的。

垄断性竞争这一理论,对干部门分析来说没有提供任何帮助,而且没有提出任何中间情况以介于企业(在一个极端上)与总均衡(在另一个极端上)之间。所以。它没能推进对许多重要问题所进行的分析。第一种极端情况面太窄从而无法具有较大的实用性;第二种极端情况面太宽从而无法确保有意义的概括性。

6.结论

经济学作为一门实证科学,是一种暂时被接受的、关于经济现象的概括体系。这一概括体系可以被用来对情况变动的影响作出预测。人类在扩展这一概括体系,增强我们对其合理性的信赖,及改进其预测的精确程度等方面所取得的进步,受到了下述两种因素的阻碍:一是所有知识探索的人类能力方面的有限性,二是社会科学中所存在的种种桎梏。这些桎梏对于一般性的社会科学来说影响极大,而且对于作为社会科学的一种的经济学来说也特别重要。上述说法中绝无过分挑剔的成分。人们对经济学课题的熟悉,促成了人们对关于这一方面的专门知识的轻视。经济学的中心议题对日常生活的重要性及对公共政策中大部分问题的重要性,妨碍了经济学的客观性,并造成了科学分析与规范判断之间的混淆。依据未经控制的实践而不是依据受到控制的实践的必要性,使得为证明试验性假说的可接受性而创造大量的、准确的证据成为困难。虽然对未经控制的实践的依赖并不影响这一基本的方法论原则:一假说唯有通过它的含义或预测与可观测的现象之间的一致性才能够得到检验;但是,这种依赖确实使得检验假说的任务更为艰巨,且使得在所涉及的方法论原则方面出现了更大程度的混乱。与其他科学家相比,社会科学家在其方法论方面需要具有更强烈的自我意识。

一种业已流行甚广且危害甚大的混淆现象就是人们在关于“假设”在经济分析中的作用问题上的混淆。任何一种有意义的科学假说或理论都将一无例外地作出这样的声明:某些力量在理解某一特定种类的现象中是重要的,而另外一些力量则是不重要的。通过下述方法来表述这样一种假说通常是非常便利的:声言该假说旨在预测的这种现象在进行实际观测的世界中的行为方式,就犹如它们在一假设的、高度简化了的世界中的行为方式一般。这一高度简化了的世界只包含该假说认为是重要的那些力量。一般说来,进行这样一种描述的方法不止一种——即对这种理论进行表述所忧助的“假设”体系不止一种。对这样一些假设所作的选择,通常是出于下述两个方面的考虑:一是它们在表述该假说方面的简便性、清晰性及准确性;二是它们带来间接证据的能力。假设可以为假说的合理性带来间接证据这一说法,是出于下面几种考虑:假设可以使人们联想到该假说的某些含义已经可以为观察所检验;假设可以导出该假说与其它一些解决相关问题的假说之间的相互联系,等等。

这样一种理论不能通过直接地将其“假设”与“现实”加以比较来进行检验。的确,不存在任何一种进行该种检验的有效方法。完全的“真实性”是明显地无法达到的;而某一理论是否“足够”真实这一问题,只有通过考察该理论所取得的预测,对于我们所要解决的问题来说,是否是足够令人满意的,或者是否是比来自于其它假说的预测更令人满意来作出回答。然而,一理论可以通过其假设的真实性来检验,而不必考虑其预测的准确性这种看法,已经厂为流传,并成为经济理论因其非现实性而遭受的旷日持久的批评的根源所在。这些批评大多是不相关的。从而,由这种批评所促动的经济理论改革也大多是不成功的。

当然,如此众多的经济理论批评的不相关性并不意味着现存经济理论的高度可信性。这些批评可能无的放矢,但也可能存在着放矢之的。从小的方面来看当然明显地存在着这种可能性。任何一种理论都必然是暂时性的,且将随着知识的进步而置于变化之中。即使撇开这种老生常谈不论,我们也有必要使“现存经济理论”的内容更为特定,并对经济理论的各种分枝加以区分;经济理论的某些部分明显地要比其它部分具有更高的可信度。如果确实可能的话,那么,对实证经济学的现状作出综合性的评价,对与实证经济学的合理性相关的证据加以概括,及对实证经济学每一部分所应具有的相对可信度加以估计等项工作,将是一部专著或一系列专著才能完成的任务,而绝非一篇方法论的短文所能胜任。

在这里,我所能做到的只是概略地表述一下我个人的观点。在我看来,现有的相对价格理论极富成果,而且对于具有西方国家特色的这种经济体系来说又享有很高的可信程度。这一相对价格理论的主要任务是解释资源在各种最终用途之间的分配问题,及生产成果在相互联系的各种资源之间的划分问题。马歇尔的《经济学原理》一书基本上奠定了相对价格理论的现有结构。尽管似乎存在着相当的分歧,但在我看来,现有的静态货币理论也同样地极富成果,并享有很高的可信程度。现有的静态货币理论的主要任务,是解释绝对价格、总产量及其它变量对于经济总体来说所具有的结构性或长期性水平。现有的静态货币理论是以货币数量理论的形式为核心,并经历了从戴维·休姆到剑桥学派,到欧文·费雪,到约翰·梅纳德·凯恩斯的一系列重大演变过程。在我看来,目前经济理论中最薄弱、最不令人满意的环节在于货币的动态分析。货币的动态分析所涉及的是经济整体对于情况的变动所采取的调整过程问题,亦即涉及的是总体活动的短期波动问题。在这一领域内,我们甚至还没有形成一种可适当地称作现有的货币动态分析的理论。

当然,即使在相对价格理论与静态货币理论中,也仍然存在着扩展现有理论的范围与改进现有理论的准确性等方面的余地,而且这种余地是相当大的。特别地,对“假设”的描述真实性问题的不适当的重视,已经导致了人们对决定各种假说的合理性限制条件的关键问题的忽略。而上述各种假说又共同地构成了这些领域内的现有经济理论。与这些假说相对应的抽象模型,也已经得到了相当的完善与深化,并且在严格性与准确性方面也有了巨大的进展。关于我们的经济体制及其运行方面的描述性材料也已经以前所未有的规模得到了极大的丰富。这些成就都大有禆益。但是,如果我们想要实际地使用这些抽象模型与描述性材料,则还需要作相当的探索。我们需要探索的问题在于进行下述判断的标准问题,即如何确定:对于某种特定的问题来说,使用哪一种抽象模型才是最好的,一抽象模型中的哪些类型将与可观测的实际类型相一致;该问题或该种情况的哪些特征对预测的精确度影响最大——这里的预测是由某一特定假说或理论作出的。

实证经济学的进步不仅要求对现有假说进行验证并加以完善,而且还要求不断地创立新的假说。对于这一问题我们尚缺乏正式的结论。假说的创立是一项精神、直观与发明的创造性活动;其实质就是要在众所熟知的材料中发掘新意。这一过程必须归在心理学当中进行讨论,而不应列在逻辑学当中进行研究。这一过程必须借助于自传与传记来研究,而不应从科学方法的专著中寻找答案;这一过程必须经由公理与事例所推动,而不应由定理或原则所导出。

版权:芝加哥大学,1953年。

有部分来源于密尔顿·弗里德曼的著作:《政治经济学论文集》(芝加哥;芝加哥大学出版社,1953年)。

在这一篇里,我全面地溶入了我的那篇简短的‘综述”文章的内容,而并没有作特别的提及。我的《综述》一文见于B·F·海雷编辑的《当代经济学考察》,第五册(芝加哥:理查德·D·欧文有限公司,1952年),第455-457页。

我很感激多萝西·S·布雷迪,阿瑟·F·伯恩斯,及乔治·J·斯蒂格勒对本篇编纂工作所提出的宝贵意见与批评。

是从DNKM的学习园地里找的。
 

繁体与简体的完全一样,我还以为繁体是台湾人译的。
 

感谢DNKMD的学习园地。可以下载pdf文件。

Milton Friedman
"The Methodology of Positive Economics"
In Essays In Positive Economics
(Chicago: Univ. of Chicago Press, 1966), pp. 3-16, 30-43.

The Methodology of Positive Economics*
In his admirable book on The Scope and Method of Political
Economy, John Neville Keynes distinguishes among "a positive
science . . . a body of systematized knowledge concerning what is; a
normative or regulative science ... a body of systematized knowledge
discussing criteria of what ought to be . . . ; an art ... a system of
rules for the attainment of a given end"; comments that "confusion
between them is common and has been the source of many
mischievous errors"; and urges the importance of "recognizing a
distinct positive science of political economy."1
This paper is concerned primarily with certain methodological
problems that arise in constructing the "distinct positive science"
Keynes called for - in particular, the problem how to decide whether
a suggested hypothesis or theory should be tentatively accepted as
part of the "body of systematized knowledge concerning what is." But
the confusion Keynes laments is still so rife and so much of a
hindrance to the recognition that economics can be, and in part is, a
positive science that it seems well to preface the main body of the
paper with a few remarks about the relation, between positive and
normative economics.
1. THE RELATION BETWEEN POSITIVE AND NORMATIVE
ECONOMICS
Confusion between positive and normative economics is to some
extent inevitable. The subject matter of economics is regarded by
almost everyone as vitally important to himself and within the range
of his own experience and competence; it is
* I have incorporated bodily in this article without special reference
most of my brief "Comment" in A Survey of Contemporary Economics,
Vol. II (B. F. Haley, ed.) (Chicago: Richard D. Irwin, Inc., 1952), pp.
455-57.
I am indebted to Dorothy S. Brady, Arthur F. Burns, and George J.
Stigler for helpful comments and criticism.
1. (London: Macmillan 4 Co., 1891), pp. 34-35 and 46.
3
4
the source of continuous and extensive controversy and the occasion
for frequent legislation. Self-proclaimed "experts" speak with many
voices and can hardly all be regarded as disinterested; in any event,
on questions that matter so much, "expert" opinion could hardly be
accepted solely on faith even if the "experts" were nearly unanimous
and clearly disinterested.2
The conclusions of positive economics
seem to be, and are, immediately relevant to important normative
problems, to questions of what ought to be done and how any given
goal can be attained. Laymen and experts alike are inevitably
tempted to shape positive conclusions to fit strongly held normative
preconceptions and to reject positive conclusions if their normative,
implications - or what are said to be their normative implications -
are unpalatable.
Positive economics is in principle independent of any particular
ethical position or normative judgments. As Keynes says, it deals with
"what is," not with "what ought to be." Its task is to provide a system
of generalizations that can be used to make correct predictions about
the consequences of any change in circumstances. Its performance is
to be judged by the precision, scope, and conformity with experience
of the predictions it yields. In short, positive economics is, or can be,
an "objective" science, in precisely the same sense as any of the
physical sciences. Of course, the fact that economics deals with the
interrelations of human beings, and that the investigator is himself
part of the subject matter being investigated in a more intimate sense
than in the physical sciences, raises special difficulties in achieving
objectivity at the same time that it provides the social scientist with a
class of data not available to the physical
2. Social science or economics is by no means peculiar in this respect -
witness the importance of personal beliefs and of "home" remedies in
medicine wherever obviously convincing evidence for "expert" opinion is
lacking. The current prestige and acceptance of the views of physical
scientists in their fields of specialization - and,, all too often, in other
fields as well - derives, not from faith alone, but from the evidence of
their works, the success of their predictions, and the dramatic
achievements from applying, their results. When economics seemed to
provide such evidence of its worth, in Great Britain in the first half of the
nineteenth century, the prestige and acceptance of "scientific economics"
rivaled the current prestige of the physical sciences.
5
scientist. But neither the one nor the other is, in my view, a fundamental
distinction between the two groups of sciences.3
Normative economics and the art of economics, on the other hand,
cannot be independent of positive economics. Any policy conclusion
necessarily rests on a prediction about the consequences of doing one
thing rather than another, a prediction that must be based - implicitly
or explicitly - on positive economics. There is not, of course, a
one-to-one relation between policy conclusions and the conclusions
of positive economics; if there were, there would be no separate
normative science. Two individuals may agree on the consequences
of a particular piece of legislation. One may regard them as desirable
on balance and so favor the legislation; the other, as undesirable and
so oppose the legislation.
I venture the judgment, however, that currently in the Western
world, and especially in the United States, differences about
economic policy among disinterested citizens derive predominantly
from different predictions about the economic consequences of taking
action - differences that in principle can be eliminated by the
progress of positive economics - rather than from fundamental
differences in basic values, differences about which men can
ultimately only fight. An obvious and not unimportant example is
minimum-wage legislation. Underneath the welter of arguments
offered for and against such legislation there is an underlying
consensus on the objective of achieving a "living wage" for all, to use
the ambiguous phrase so common in such discussions. The difference
of opinion is largely grounded on an implicit or explicit difference in
predictions about the efficacy of this particular means in furthering
the agreed-on end. Proponents believe (predict) that legal minimum
wages diminish poverty by raising the wages of those receiving less
than the minimum wage as well as of some receiving more than the
3. The interaction between the observer and the process observed that is
so prominent a feature of the social sciences, besides its more obvious
parallel in the physical sciences, has a more subtle counterpart in the
indeterminacy principle arising out of the interaction between the process
of measurement and the phenomena being measured. And both have a
counterpart in pure logic in Godel's theorem, asserting the impossibility
of a comprehensive self-contained logic. It is an open question whether
all three can be regarded as different formulations of an even more
general principle.
6
minimum wage without any counterbalancing increase in the number
of people entirely unemployed or employed less advantageously than
they otherwise would be. Opponents believe (predict) that legal
minimum wages increase poverty by increasing the number of people
who are unemployed or employed less advantageously and that this
more than offsets any favorable effect on the wages of those who
remain employed. Agreement about the economic consequences of the
legislation might not produce complete agreement about its
desirability, for differences might still remain about its political or
social consequences; but, given agreement on objectives, it would
certainly go a long way toward producing consensus.
Closely related differences in positive analysis underlie divergent
views about the appropriate role and place of trade-unions and the
desirability of direct price and wage controls and of tariffs. Different
predictions about the importance of so-called "economies of scale"
account very largely for divergent views about the desirability or
necessity of detailed government regulation of industry and even of
socialism rather than private enterprise. And this list could be
extended indefinitely.4 Of course, my judgment that the major
differences about economic policy in the Western world are of this
kind is itself a "positive" statement to be accepted or rejected on the
basis of empirical evidence.
If this judgment is valid, it means that a consensus on "correct"
economic policy depends much less on the progress of normative
economics proper than, on the progress of a positive economics
yielding conclusions that are, and deserve to be, widely accepted. It
means also that a major reason for
4. One rather more complex example is stabilization policy.
Superficially, divergent views on this question seem to reflect differences
in objectives; but I believe that this impression is misleading and that at
bottom the different views reflect primarily different judgments about the
source of fluctuations in economic activity and the effect of alternative
countercyclical action. For one major positive consideration that accounts
for much of the divergence see "The Effects of a Full-Employment Policy
on Economic Stability: A Formal Analysis," infra, pp. 117-32. For a
summary of the present state of professional views on this question see
"The Problem of Economic Instability," a report of a subcommittee of the
Committee on Public Issues of the American Economic Association,
American Economic Review, XL (September, 1950), 501-38.
7
distinguishing positive. economics sharply from normative economics
is precisely the contribution that can thereby be made to
agreement about policy.
II. POSITIVE ECONOMICS
The ultimate goal of a positive science is the development of a
"theory" or, "hypothesis" that yields valid and meaningful (i.e., not
truistic) predictions about phenomena not yet observed. Such a theory
is, in general, a complex intermixture of two elements. In part, it is a
"language" designed to promote "systematic and organized methods
of reasoning."5 In part, it is a body of substantive hypotheses
designed to abstract essential features of complex reality.
Viewed as a language, theory has no substantive content; it is a set
of tautologies. Its function is to serve as a filing system for
organizing empirical material and facilitating our understanding of it;
and the criteria by which it is to be judged are those appropriate to a
filing system. Are, the categories clearly and precisely defined? Are
they exhaustive? Do we know where to file each individual, item, or
is there considerable ambiguity? Is the system of headings and
subheadings so designed that we can quickly find an item we want, or
must we hunt from place to place? Are the items we shall want to
consider jointly filed together? Does the filing system avoid elaborate
cross-references?
The answers to these questions depend partly on logical, partly on
factual, considerations. The canons 'of formal logic alone can show
whether a particular language is complete and consistent, that is,
whether propositions in the language are "right" or "wrong." Factual
evidence alone can show whether the categories of the "analytical
filing system" have a meaningful empirical counterpart, that is,
whether they are useful in analyzing a particular class of concrete
problems.6 The simple example of "supply" and "demand" illustrates
both this point and the
5. Final quoted phrase from Alfred Marshall, "The Present Position of
Economics" (1885), reprinted in Memorials of Alfred Marshall, ed. A. C.
Pigou (London: Macmillan & Co., 1925), p. 164. See also "The
Marshallian Demand Curve," infra, pp. 56-57, 90-91.
6. See 'Lange on Price Flexibility and Employment: A Methodological
Criticism," infra, pp. 282-89.
8
preceding list of analogical questions. Viewed as elements of the
language of economic theory, these are the two major categories into
which factors affecting the relative prices of products or factors of
production are classified. The usefulness of the dichotomy depends on
the "empirical generalization that an enumeration of the forces
affecting demand in any problem and of the forces affecting supply
will yield two lists that contain few items in common.7 Now this
generalization is valid for markets like the final market for a
consumer good. In such a market there is a clear and sharp distinction
between the economic units that can be regarded as demanding the
product and those that can be regarded as supplying it. There is
seldom much doubt whether a particular factor should be classified as
affecting supply, on the one hand, or demand, on the other; and there
is seldom much necessity for considering cross-effects
(cross-references) between the two categories. In these cases the
simple and even obvious step of filing the relevant factors under the
headings of "supply" and "demand" effects a great simplification of
the problem and is an effective safeguard against fallacies that,
otherwise tend to occur. But the generalization is not always valid.
For example, it is not valid for the day-to-day fluctuations of prices in
a primarily speculative market, Is a rumor of an increased
excess-profits tax, for example, to be regarded as a factor operating
primarily on today's supply of corporate equities in the stock market
or on today's demand for them? In similar fashion, almost every
factor can with about as much justification be classified under the
heading "supply" as under the heading "demand." These concepts can
still be used and may not be entirely pointless; they are still "right"
but clearly less useful than in the first example because they have no
meaningful empirical counterpart.
Viewed as a body of substantive hypotheses, theory is to be
judged by its predictive power for the class of phenomena which it is
intended to "explain." Only factual evidence can show whether it is
"right" or "wrong" or, better, tentatively "accepted" as valid or
"rejected." As I shall argue at greater length below, the only relevant
test of the validity of a hypothesis is
7. "The Marshallian Demand Curve," infra, p. 57.
9
comparison I of its predictions with experience. The hypothesis
is rejected if its predictions are contradicted ("frequently" or
more often than predictions from an alternative hypothesis);
it is accepted if its predictions are not contradicted; great
confidence is attached to it if it has survived many opportunities
for contradiction. Factual evidence can never "prove" a hypothesis;
it can only fail to disprove it, which is what we generally
mean when we say, somewhat inexactly, that the hypothesis has
been "confirmed" by experience.
To avoid confusion, it should perhaps be noted explicitly that the
"predictions" by which the validity of a hypothesis is tested need not
be about phenomena that have not yet occurred, that is, need not be
forecasts of future events; they may be about phenomena that have
occurred but observations on which have not yet been made or are
not known to the person making the prediction. For example, a
hypothesis may imply that such and such must have happened in
1906, given some other known circumstances. If a search of the
records reveals that such and such did happen, the prediction is
confirmed; if it reveals that such and such did not happen, the
prediction is contradicted.
The validity of a hypothesis in this sense is not by itself a
sufficient criterion for choosing among alternative hypotheses.
Observed facts are necessarily finite in number; possible hypotheses,
infinite. If there is one hypothesis that is consistent with the available
evidence, there are always an infinite number that are.8 For example,
suppose a specific excise tax on a particular commodity produces a
rise in price equal to the amount of the tax. This is consistent with
competitive conditions, a stable demand curve, and a horizontal and
stable supply curve. But it is also consistent with competitive
conditions and a positively or negatively sloping supply curve with
the required compensating shift in the demand curve or the supply
curve; with monopolistic conditions, constant marginal costs, and
stable demand curve, of the particular shape required to produce this
result; and so on indefinitely. Additional evidence with which the
8. The qualification is necessary because the "evidence" may be
internally contradictory, so there may be no hypothesis consistent with it.
See also "Lange on Price Flexibility and Employment," infra, pp.
282-83.
10
hypothesis is to be consistent may rule out some of these possibilities;
it can never reduce them to a single possibility alone capable
of being consistent with the finite evidence. The choice among
alternative hypotheses equally consistent with the available evidence
must to some extent be arbitrary, though there is general agreement
that relevant considerations are suggested by the criteria "simplicity"
and "fruitfulness," themselves notions that defy completely objective
specification. A theory is "simpler" the less the initial knowledge
needed to make a prediction within a given field of phenomena; it is
more "fruitful" the more precise the resulting prediction, the wider
the area within which the theory yields predictions, and the more
additional lines for further research it suggests. Logical completeness
and consistency are relevant but play a subsidiary role; their function
is to assure that the hypothesis says what it is intended to say and
does so alike for all users-they play the same role here as checks for
arithmetical accuracy do in statistical computations.
Unfortunately, we can seldom test particular predictions in the
social sciences by experiments explicitly designed to eliminate what
are judged to be the most important disturbing influences. Generally,
we must rely on evidence cast up by the "experiments" that happen to
occur. The inability to conduct so-called "controlled experiments"
does not, in my view, reflect a basic difference between the social
and physical sciences both because it is not peculiar to the social
sciences - witness astronomy and because the distinction between a
controlled experiment and uncontrolled experience is at best one of
degree. No experiment can be completely controlled, and every
experience is partly controlled, in the sense that some disturbing
influences are relatively constant in the course of it.
Evidence cast up by experience is abundant and frequently as
conclusive as that from contrived experiments; thus the inability to
conduct experiments is not a fundamental obstacle to testing
hypotheses by the success of their predictions. But such evidence is
far more difficult to interpret. It is frequently complex and always
indirect and incomplete. Its collection is often arduous, and its
interpretation generally requires subtle
11
analysis and involved chains of reasoning, which seldom carry real
conviction. The denial to economics of the dramatic and direct
evidence of the "crucial" experiment does hinder the adequate testing
of hypotheses; but this is much less significant than the difficulty it
places in the way of achieving a reasonably prompt and wide
consensus on the conclusions justified by the available evidence. It
renders the weeding-out of unsuccessful hypotheses slow and
difficult. They are seldom downed for good and are always cropping
up again.
There is, of course, considerable variation in these respects.
Occasionally, experience casts up evidence that is about as direct,
dramatic, and convincing as any that could be provided by
controlled experiments. Perhaps the most obviously important
example is the evidence from inflation on the hypothesis that a
substantial increase in the quantity of money within a relatively
short period is accompanied by a substantial increase in prices.
Here the evidence is dramatic, and the chain of reasoning
required to interpret it is relatively short. Yet, despite numerous
instances of substantial rises in prices, their essentially one-to
one correspondence with substantial rises in the stock of money,
and, the wide variation in other circumstances that might appear
to be relevant, each new experience of inflation brings forth
vigorous contentions, and not only by the lay public, that the
rise in the stock of money is either an incidental effect of a rise
in prices produced by other factors or a purely fortuitous and
unnecessary concomitant of the price rise.
One effect of the difficulty of testing substantive economic
hypotheses has been to foster a retreat into purely formal or
tautological analysis.9 As already, noted, tautologies have an
extremely important place in economics and other sciences as a
specialized language or "analytical filing system." Beyond this,
formal logic and mathematics, which are both tautologies, are
essential aids in checking the correctness of reasoning, discovering
the implications of hypotheses, and determining whether supposedly
different hypotheses may not really be equivalent or wherein the
differences lie..
But economic theory must be more than a structure of tautologies
9. See "Lange on Price Flexibility and Employment," infra, passim.
12 Essays in Positive Economics
if it is to be able to predict and not merely describe the consequences
of action; if it is to be something different from disguised
mathematics.10 And the usefulness of the tautologies themselves
ultimately depends, as noted above, on the acceptability of the
substantive hypotheses that suggest the particular categories into
which they organize the refractory empirical phenomena.
A more serious effect of the difficulty of testing economic
hypotheses by their predictions is to foster misunderstanding of the
role of empirical evidence in theoretical work. Empirical evidence is
vital at two different, though closely related, stages: in constructing
hypotheses and in testing their validity. Full and comprehensive
evidence on the phenomena to be generalized or "explained" by a
hypothesis, besides its obvious value in suggesting new hypotheses,
is needed to assure that a hypothesis explains what it sets out to
explain - that its implications for such phenomena are not
contradicted in advance by experience that has already been
observed.11 Given that the hypothesis is
10. See also Milton Friedman and L. J. Savage, "The Expected-Utility
Hypothesis and the Measurability of Utility," Journal of Political
Economy, LX (December, 1952), 463-74, esp. pp. 465-67.
11. In recent years some economists, particularly a group connected
with the Cowles Commission for Research in Economics at the University
of Chicago, have placed great emphasis on a division of this step of
selecting a hypothesis consistent with known evidence into two substeps:
first, the selection of a class of admissible hypotheses from all possible
hypotheses (the choice of a "Model" in their terminology) ; second, the
selection, of one hypothesis from this class (the choice of a "structure").
This subdivision may be heuristically valuable in some kinds of work,
particularly in promoting a systematic use of available statistical evidence
and theory. From a methodological point of view, however, it'is an
entirely arbitrary subdivision of the process of deciding on a particular
hypothesis that is on a par with many other subdivisions that may be
convenient for one purpose or another or that may suit the psychological
needs of particular investigators.
One consequence of this particular subdivision has been to give rise to
the so-called "identification" problem. As noted above, if one hypothesis
is consistent with available evidence, an infinite number are. But, while
this is true for the class of hypotheses as a whole, it may not be true of the
subclass obtained in the first of the above two steps-the "model." It may be
that the evidence to be used to select the final hypothesis from the subclass
can be consistent with at most one hypothesis in it, in which case the
"model" is said to be "identified"; otherwise it is said to be "unidentified."
As is clear from this way of describing the concept of "identification," it is
essentially a special case of the more general
13
consistent with the evidence at hand, its further testing involves
deducing from it new facts capable of being observed but not
previously known and checking these deduced facts against additional
empirical evidence. For this test to be relevant, the deduced
facts must be about the class of phenomena the hypothesis is
designed to explain; and they must be well enough defined so that
observation can show them to be wrong.
The two stages of constructing hypotheses and testing their
validity are related in two different respects. In the first place, the
particular facts that enter at each stage are partly an accident of the
collection of data and the knowledge of the particular investigator.
The facts that serve as a test of the implications of a hypothesis
might equally well have been among the raw material used to
construct it, and conversely. In the second place, the process never
begins from scratch; the so-called "initial stage" itself always
involves comparison of the implications of an earlier set of
hypotheses with observation; the contradiction of these implications
is the stimulus to the construction of new
problem of selecting among the alternative hypotheses equally consistent
with the evidence-a problem that must be decided by some such arbitrary
principle as Occam's razor. The introduction of two substeps in selecting a
hypothesis' makes this problem arise at the two corresponding stages and
gives it a special cast. While the class of all hypotheses is always
unidentified, the subclass in a "model" need not be, so the problem arises
of conditions that a "model" must satisfy to be identified. However useful
the two substeps may be in some contexts, their introduction raises the
danger that different criteria will unwittingly be used in making the same
kind-of choice among alternative hypotheses at two different stages.
On the general methodological approach discussed in this footnote see
Tryvge Haavelmo, "The Probability Approach in Econometrics,"
Econometrica, Vol. XII (1944), Supplement; Jacob Marschak, "Economic
Structure, Path, Policy, and Prediction," American Economic Review,
XXXVII, (May, 1947), 81-84, and "Statistical Inference in Economics: An
Introduction," in T. C. Koopmans (ed.), Statistical Inference in Dynamic
Economic Models (New York: John Wiley & Sons, 1950); T. C,
Koopmans, "Statistical Estimation of Simultaneous Economic Relations,"
Journal of the American Statistical Association, XL (December, 1945),
448-66; Gershon Cooper, "The Role of Economic Theory in Econometric
Models," Journal of Farm Economics, XXX (February, 1948), 101-16. On
the identification problem see Koopmans, "Identification Problems in
Econometric Model Construction," Econometrica, XVII (April, 1949),
125-44; Leonid Hurwicz, "Generalization of the Concept of
Identification," in Koopmans (ed.), Statistical Inference in Dynamic
Economic Models.
14
hypotheses or revision of old ones. So the two methodologically distinct
stages are always proceeding jointly.
Misunderstanding about this apparently straightforward process
centers on the phrase "the class of phenomena the hypothesis is
designed to explain." The difficulty in the social sciences of getting
new evidence for this class of phenomena and of judging its
conformity with the implications of the hypothesis makes it tempting
to suppose that other, more readily available, evidence is equally
relevant to the validity of the hypothesis-to suppose that hypotheses
have not only "implications" but also "assumptions" and that the
conformity of these "assumptions" to "reality" is a test of the validity
of the hypothesis different from or additional to the test by
implications. This widely held view is fundamentally wrong and
productive of much mischief. Far from, providing an easier means
for sifting valid from invalid hypotheses, it only confuses the issue,
promotes misunderstanding about the significance of empirical
evidence for economic theory, produces a misdirection of much
intellectual effort devoted to the development of positive economics,
and impedes the attainment of consensus on tentative hypotheses in
positive economics.
In so far as a theory can be said to have "assumptions" at all, and in
so far as their "realism" can be judged independently of the validity of
predictions, the relation between the significance of a theory and the
"realism" of its "assumptions" is almost the opposite of that suggested by
the view under criticism. Truly important and significant hypotheses will
be found to have "assumptions" that are wildly inaccurate descriptive
representations of reality, and, in general, the more significant the
theory, the more unrealistic the assumptions (in this sense).12 The reason
is simple. A hypothesis is important if it "explains" much by little, that
is, if it abstracts the common and crucial elements from the mass of
complex and detailed circumstances surrounding the phenomena to be
explained and permits valid predictions on the basis of them alone. To be
important, therefore, a hypothesis must be descriptively false in its
assumptions; it
12. The converse of the proposition does not- of course hold:
assumptions that are unrealistic (in this sense) do not guarantee a
significant theory.
15
takes account of, and accounts for, none of the many other attendant
circumstances, since its very success shows them to be irrelevant for
the phenomena to be explained.
To put this point less paradoxically, the relevant question to ask
about the "assumptions" of a theory is not whether they are
descriptively "realistic," for they never are, but whether they are
sufficiently good approximations for the purpose in hand. And this
question can be answered only by seeing whether the theory works,
which means whether it yields sufficiently accurate predictions. The
two supposedly independent tests thus reduce to one test.
The theory of monopolistic and imperfect competition is one
example of the neglect in economic theory of these propositions. The
development of this analysis was explicitly motivated, and its wide
acceptance and approval largely explained, by the belief that the
assumptions of "perfect competition" or, "perfect monopoly" said to
underlie neoclassical economic theory are a false image of reality.
And this belief was itself based almost entirely on the directly
perceived descriptive inaccuracy of the assumptions rather than on
any recognized contradiction of predictions derived from neoclassical
economic theory. The lengthy discussion on marginal analysis in the
American Economic Review some years ago is an even clearer,
though much less important, example. The articles on both sides of
the controversy largely neglect what seems to me clearly the main
issue - the conformity to experience of the implications of, the
marginal analysis - and concentrate on the largely irrelevant question
whether businessmen do or do not in fact reach their decisions by
consulting schedules, or curves, or multivariable functions showing
marginal cost and marginal revenue.13 Perhaps these
13. See R. A. Lester, "Shortcomings of Marginal Analysis for
Wage-Employment Problems," American Economic Review, XXXVI
(March, 1946), 62-82; Fritz Machlup, "Marginal Analysis and Empirical
Research," American Economic Review, XXXVI (September, 1946),
519-54; R. A. Lester, "Marginalism, Minimum Wages, and Labor
Markets," American Economic Review, XXXVII (March, 1947), 135-48;
Fritz Machlup, "Rejoinder to an Antimarginalist," American Economic
Review, XXXVII (March, 1947), 148-54; G. J. Stigler, "Professor Lester
and the Marginalists," American Economic Review, XXXVII (March,
1947), 154-57; H. M. Oliver, Jr., "Marginal Theory and Business
Behavior," American Economic Review,, XXXVII (June, 1947), 375-83;
R. A. Gordon,
16
two examples, and the many others they readily suggest, will
serve to justify a more extensive discussion of the methodological
principles involved than might otherwise seem appropriate.
"Short-Period Price Determination in Theory and Practice," American
Economic Review, XXXVIII (June, 1948), 265-88.
It should be noted that, along with much material purportedly
bearing on the validity of the "assumptions" of marginal theory, Lester
does refer to evidence on the conformity of experience with the
implications of the theory, citing the reactions of employment in
Germany to the Papen plan and in the United States to changes in
minimum-wage legislation as examples of lack of conformity.
However, Stigler's brief comment is the only one of the other papers
that refers to this evidence. It should also be noted that Machlup's
thorough and careful exposition of the logical structure and meaning
of marginal analysis is called for by the misunderstandings on this
score that mar Lester's paper and almost conceal the evidence he
presents that is relevant to the key issue he raises. But, in Machlup's
emphasis on the logical structure, he comes perilously close to presenting
the theory as a pure tautology, though it is evident at a number
of points that he is aware of this danger and anxious to avoid it. The
papers by Oliver and Gordon are the most extreme in the exclusive
concentration on the conformity of the behavior of businessmen with
the "assumptions" of the theory.
30
V. SOME IMPLICATIONS FOR ECONOMIC ISSUES
The abstract methodological issues we have been discussing have
a direct bearing on the perennial criticism of "orthodox" economic
theory as "unrealistic" as well as on the attempts that have been
made to reformulate theory to meet this charge. Economics is a
"dismal" science because it assumes man to be selfish and
money-grubbing, "a lightning calculator of pleasures and pains, who
oscillates like a homogeneous globule of desire of happiness under
the impulse of stimuli that shift him about the area, but leave him
intact"20; it rests on outmoded psychology and must be reconstructed
in line with each new development in psychology; it assumes men, or
at least businessmen, to be "in a continuous state of 'alert,' ready to
change prices and/or pricing rules whenever their sensitive intuitions
. . . detect a change in demand and supply conditions";21 it
20. Thorstein Veblen, "Why Is Economics Not an Evolutionary
Science?" (1898), reprinted in The Place of Science in Modern
Civilization (New York, 1919), p. 73.
21. Oliver, op. cit, p. 381.
31
assumes markets to be perfect, competition to be pure, and
commodities, labor, and capital to be homogeneous.
As we have seen, criticism of this type is largely beside the point
unless supplemented by evidence that a hypothesis differing in one or
another of these respects from the theory being criticized yields
better predictions for as wide a range of phenomena. Yet most such
criticism is not so supplemented; it is based almost entirely on
supposedly directly perceived discrepancies between the
"assumptions" and the "real world." A particularly clear example is
furnished by the recent criticisms of the maximization-of-returns
hypothesis on the grounds that businessmen do not and indeed cannot
behave as the theory "assumes" they do. The evidence cited to
support this assertion is generally taken either from the answers
given by businessmen to questions about the factors affecting their
decisions - a procedure for testing economic theories that is about on
a par with testing theories of longevity by asking octogenarians how
they account for their long life - or from descriptive studies of the
decision-making activities of individual firms.22 Little if any evidence
is ever cited on the conformity of businessmen's actual market
behavior - what they do rather than what they say they do - with the
implications of the hypothesis being criticized, on the one hand, and
of an alternative hypothesis, on the other.
22. See H. D. Henderson, "The Significance of the Rate of Interest,"
Oxford Economic Papers, No. I (October, 1938), pp. 1-13; J. E. Meade
and P. W. S. Andrews, "Summary of Replies to Questions on Effects of
Interest Rates," Oxford Economic Papers, No. I (October, 1938), pp.
14-31; R. F. Harrod, "Price, and Cost in Entrepreneurs' Policy," Oxford
Economic Papers, No. 2 (May, 1939), pp. 1-11; and R. J. Hall and C. J.
Hitch, "Price Theory and Business Behavior," Oxford Economic Papers,
No. 2 (May, 1939), pp. 12-45; Lester, "Shortcomings of Marginal
Analysis for Wage-Employment Problems," op. cit.; Gordon, op. cit. See
Fritz Machlup, "Marginal Analysis and Empirical Research," op. cit.,
esp. Sec. II, for detailed criticisms of questionnaire methods.
I do not mean to imply that questionnaire studies of businessmen's or
others' motives or beliefs about the forces affecting their behavior are
useless for all purposes in economics. They may be extremely valuable in
suggesting leads to follow in accounting for divergencies between
predicted and observed results; that is, in constructing new hypotheses or
revising old ones. Whatever their suggestive value in this respect, they
seem to me almost entirely useless as a means. of testing the validity of
economic hypotheses. See my comment on Albert G. Hart's paper,
"Liquidity and Uncertainty," American Economic Review, XXXIX (May,
1949), 198-99.
32
A theory or its "assumptions" cannot possibly be thoroughly
"realistic" in the immediate descriptive sense so often assigned, to
this term. A completely "realistic" theory of the wheat market. would
have to include not only the conditions directly underlying the supply
and demand for wheat but also the kind of coins or credit instruments
used to make exchanges; the personal characteristics of
wheat-traders such as the color of each trader's hair and eyes, his
antecedents and education, the number of members of his family,
their characteristics, antecedents, and education, etc.; the kind of soil
on which the wheat was grown, its physical and chemical
characteristics, the weather prevailing during the growing season; the
personal characteristics of the farmers growing the wheat and of the
consumers who will ultimately use it; and so on indefinitely. Any
attempt to move very far in achieving this kind of "'realism" is certain
to render a theory utterly useless.
Of course, the notion of a completely realistic theory is in part a
straw man. No. critic of a theory would accept this logical extreme
as his objective; he would say that the "assumptions" of the theory
being criticized were "too" unrealistic and that his objective was a set
of assumptions that were "more" realistic though still not completely
and slavishly so. But so long as the test of "realism" is the directly
perceived descriptive accuracy of the "assumptions" - for example,
the observation that "businessmen do not appear to be either as
avaricious or as dynamic or as logical as marginal theory portrays
them,"23
or that "it would be utterly impractical under present
conditions for the manager of a multi-process plant to attempt . . . to
work out and equate marginal costs and marginal revenues for each
productive factor"24 there is no basis for making such a distinction,
that is, for stopping short of the straw man depicted in the preceding
paragraph. What is the criterion by which to judge whether a
particular departure from realism is or is not acceptable? Why is it
more "unrealistic" in analyzing business behavior to neglect the
magnitude of businessmen's costs than the
23. Oliver, op. cit, p. 382.
24. Lester, "Shortcomings of Marginal Analysis for Wage-Employment
Problems," op. cit., P. 75.
33
color of their eyes? The obvious answer is because the first makes
more difference to business behavior than the second; but there is no
way of knowing that this is so simply by observing that businessmen
do have costs of different magnitudes and eyes of different color.
Clearly it can only be known by comparing the effect on the
discrepancy between actual and predicted behavior of taking the one
factor or the other into account. Even the most extreme proponents
of realistic assumptions are thus necessarily driven to reject their
own criterion and to accept the test by prediction when they classify
alternative assumptions as more or less realistic.25
The basic confusion between descriptive accuracy and analytical
relevance that underlies most criticisms of economic theory on the
grounds that its assumptions are unrealistic as well as the
plausibility of the views that lead to this confusion are both
strikingly illustrated by a seemingly innocuous remark in an article
on business-cycle theory that "economic phenomena are varied and
complex, so any comprehensive theory of the business cycle that
can apply closely to reality must be very complicated."26 A
fundamental hypothesis of science is that appearances are deceptive
and that there is a way of looking at or interpreting or, organizing
the evidence that will reveal superficially disconnected and diverse
phenomena to be manifestations of a more fundamental and
relatively simple structure. And the test of this hypothesis, as of any
other, is its fruits - a test that science has
25. E.g., Gordon's direct examination of the "assumptions" leads him to
formulate the alternative hypothesis generally favored by the critics of the
maximization-of-returns hypothesis as follows: "There is an irresistible
tendency to price on the basis of average total costs for some 'normal'
level of output. This is the yardstick, the short-cut, that businessmen and
accountants use, and their aim is more to earn satisfactory profits and
play safe than to maximize profits" (op. cit., p. 275). Yet he essentially
abandons this hypothesis, or converts it into a tautology, and in the
process implicitly accepts the test by prediction when he later remarks:
"Full cost and satisfactory profits may continue to be the objectives even
when total costs are shaded to meet competition or exceeded to take
advantage of a sellers' market" (ibid, p. 284). Where here is the
"irresistible tendency"? What kind of evidence could contradict this
assertion?
26. Sidney S. Alexander, "Issues of Business Cycle Theory Raised by
Mr. Hicks," American Economic Review, XLI (December, 1951), 872.
34
so far met with dramatic success. If a class of "economic phenomena"
appears varied and complex, it is, we must suppose,
because we have no adequate theory to explain them. Known facts
cannot be set on one side; a theory to apply "closely to reality," on
the other. A theory is the way we perceive "facts," and we cannot
perceive "facts" without a theory. Any assertion that economic
phenomena are varied and complex denies the tentative state of
knowledge that alone makes scientific activity meaningful; it is in a
class with John Stuart Mill's justly ridiculed statement that "happily,
there is nothing in the laws of value which remains [1848] for the
present or any future writer to clear up; the theory of the subject is
complete."27
The confusion between descriptive accuracy and analytical
relevance has led not only to criticisms of economic theory on
largely irrelevant grounds but also to misunderstanding of economic
theory and misdirection of efforts to repair supposed defects. "Ideal
types" in the abstract model developed by economic theorists have
been regarded as strictly descriptive categories intended to
correspond directly and fully to entities- in the real world
independently of the purpose for which the model is being used. The
obvious discrepancies have led to necessarily, unsuccesful attempts
to construct theories on the basis of categories intended to be fully
descriptive.
This tendency' is perhaps most clearly illustrated by the interpretation
given to the concepts of "perfect competition" and
"monopoly" and the development of the theory of "monopolistic" or
"imperfect competition." Marshall, it is said, assumed "perfect
competition"; perhaps there once was such a thing. But clearly there
is no longer, and we must therefore discard his theories. The reader
will search long and hard - and I predict unsuccessfully - to find in
Marshall any explicit assumption about perfect competition or any
assertion that in a descriptive sense the world is composed of
atomistic firms engaged in perfect competition. Rather, he will find
Marshall saying: "At one extreme are world markets in which
competition acts directly from all parts of the globe; and at the other
those secluded
27. Principles of Political Economy (Ashley ed.; Longmans, Green &
Co., 1929), p. 436.
35
markets in which all direct competition from afar is shut out, though
indirect and transmitted competition may make itself felt even in
these; and about midway between these extremes lie the great
majority of the markets which the economist and the business man
have to study."28 Marshall took the world as it is; he sought to
construct an "engine" to analyze it, not a photographic reproduction
of it.
In analyzing the world as it is, Marshall constructed the hypothesis
that, for many problems, firms could be grouped into "industries"
such that the similarities among the firms in each group were more
important than the differences among them. These are problems in
which the important element is that a group of firms is affected alike
by some stimulus - a common change in the demand for their
products, say, or in the supply of factors. But this will not do for all
problems: the important element for these ni~ be the differential
effect on particular firms.
The abstract model corresponding to this hypothesis contains two
"ideal" types of firms: atomistically competitive firms, grouped into
industries, and monopolistic firms. A firm is competitive if the
demand curve for its output is infinitely elastic with respect to its
own price for some price and all outputs, given the prices charged by
all other firms; it belongs to an "industry" defined as a group of firms
producing a single "product." A "product" is defined as a collection
of units that are perfect substitutes to purchasers So the elasticity of
demand for the output of one firm with respect to the price of another
firm in the same industry is infinite for some price and some outputs.
A firm is monopolistic if the demand curve for its output is not
infinitely elastic at some price for all outputs.29 If it is a monopolist,
the firm is the industry.30
As always, the hypothesis as a whole consists not only of this
abstract model and its ideal types but also of a set of rules, mostly
28. Principles, p. 329; see also pp. 35, 100, 341, 347, 375, 546.
29. This ideal type can be divided into two types: the oligopolistic firm,
if the demand curve for its output is infinitely elastic at some price for
some but not all outputs; the monopolistic firm proper, if the demand
curve is nowhere infinitely elastic (except possibly at an output of zero).
30. For the oligopolist of the preceding note an industry can be defined
as a group of firms producing the same product.
36
implicit and suggested by example, for identifying actual firms with
one or the other ideal type and for classifying firms into industries.
The ideal types are not intended to be descriptive; they are designed
to isolate the features that are crucial for a particular problem. Even
if we could estimate directly and accurately the demand curve for a
firm's product, we could not proceed immediately to classify the firm
as perfectly competitive or monopolistic according as the elasticity of
the demand curve is or is not infinite. No observed demand curve will
ever be precisely horizontal, so the estimated elasticity will always be
finite. The relevant question always is whether the elasticity is
"sufficiently" large to be regarded as infinite, but this is a question
that cannot be answered, once for all, simply in terms of the
numerical value of the elasticity itself, any more than we can say,
once for all, whether an air pressure of 15 pounds per square inch is
"sufficiently" close to zero to use the formula S = 1/2gt2 Similarly,
we cannot compute cross-elasticities of demand, and then classify
firms into industries according as there is a "substantial gap in the
cross-elasticities of demand." As
Marshall says, "The question where the lines of division between
different commodities [i.e., industries] should be drawn
must be settled by convenience of the particular discussion."31
Everything depends on the problem; there is no inconsistency in
regarding the same firm as if it were a perfect competitor for
one problem, and a monopolist for another, just as there is none
in regarding the same chalk mark as a Euclidean line for one
problem, a Euclidean surface for a second, and a Euclidean
solid for a third. The size of the elasticity and cross-elasticity of
demand, the number of firms producing physically similar products,
etc., are all relevant because they are or may be among the
variables used to define the correspondence between the ideal and
real entities in a particular problem and to specify the circumstances
under which the theory holds sufficiently well; but they
do not provide, once for all, a classification of firms as competitive or
monopolistic.
An example may help to clarify this point. Suppose the problem is
to determine the effect on retail prices of cigarettes of an
31. Principles, p. 100.
37
increase, expected to be permanent, in the federal cigarette tax. I
venture to predict that broadly correct results will be obtained by
treating cigarette firms as if they were producing an identical
product and were in perfect competition. Of course, in such a case,
"some convention must be made as to the" number of Chesterfield
cigarettes "which are taken as equivalent" to a Marlborough.32
On the other hand, the hypothesis that cigarette firms would
behave as if they were perfectly competitive would have been a
false guide to their reactions to price control in World War II, and
this would doubtless have been recognized before the event. Costs
of the cigarette firms must have risen during the war. Under such
circumstances perfect competitors would have reduced the
quantity offered for sale at the previously existing price. But, at
that price, the wartime rise in the income of the public presumably
increased the quantity demanded. Under conditions of perfect
competition strict adherence to the legal price would therefore
imply not only a "shortage" in the sense that quantity demanded
exceeded quantity supplied but also an absolute decline in the
number of cigarettes produced. The facts contradict this particular
implication: there was reasonably good adherence to maximum
cigarette prices, yet the quantities produced increased
substantially. The common force of increased costs presumably
operated less strongly than the disruptive force of the desire by
each firm to keep its share of the market, to maintain the value
and prestige of its brand name, especially when the excess-profits
tax shifted a large share of the costs of this kind of advertising to
the government. For this problem the cigarette firms cannot be
treated as if they were perfect competitors.
Wheat farming is frequently taken to exemplify perfect competition.
Yet, while for some problems it is appropriate to treat
cigarette producers as if they comprised a perfectly competitive
industry, for some it is not appropriate to treat wheat producers as
if they did. For example, it may not be if the problem is the
differential in prices paid by local elevator operators for wheat.
Marshall's apparatus turned out to be most useful for
problems in which a group of firms is affected by common
stimuli,
32. Quoted parts from ibid.
38
and in which the firms can be treated as if they were perfect
competitors. This is the source of the misconception that Marshall
"assumed" perfect competition in some descriptive sense. It would be
highly desirable to have a more general theory than Marshall's, one
that would cover at the same time both those cases in which
differentiation of product or fewness of numbers makes an essential
difference and those in which it does not. Such a theory would enable
us to handle problems we now cannot and, in addition, facilitate
determination of the range of circumstances under which the simpler
theory can be regarded as a good enough approximation. To perform
this function, the more general theory must have content and
substance; it must have implications susceptible to empirical
contradiction and of substantive interest and importance.
The theory of imperfect or monopolistic competition developed by
Chamberlin and Robinson is an attempt to construct such a more
general theory.33 Unfortunately, it possesses none of the attributes
that would make it a truly useful general theory. Its contribution has
been limited largely to improving the exposition of the economics of
the individual firm and thereby the derivation of implications of the
Marshallian model, refining, Marshall's monopoly analysis, and
enriching the vocabulary, available for describing industrial
experience.
The deficiencies of the theory are revealed most clearly in its
treatment of, or inability to treat, problems involving groups of
firms-Marshallian "industries." So long as it is insisted that,
differentiation of product is essential - and it is the distinguishing
feature of the theory that it does insist on this point - the definition of
an industry in terms of firms producing an identical product cannot
be used. By that definition each firm is a separate industry. Definition
in terms of "close" substitutes or a "substantial" gap in
cross-elasticities evades the issue, introduces fuzziness and
undefinable terms into the abstract model where they have no place,
and serves only to make the theory analytically meaningless - "close"
and "substantial" are in the same category
33. E. H. Chamberlin, The Theory of Monopolistic Competition (6tb
e.d.; Cambridge: Harvard University. Press, 1950); Joan Robinson, The
Economics of Imperfect Competition (London: Macmillan & Co., 1933).
39
as a "small" air pressure.34
In one connection Chamberlin implicitly defines an industry as a
group of firms having identical cost and demand curves." But this, too,
is logically meaningless so " long as differentiation of product is, as
claimed, essential and not to be put aside. What does it mean to say
that the cost and demand curves of a firm producing bulldozers are
identical with those of a firm producing hairpins?36 And if it is
meaningless for bulldozers and hairpins, it is meaningless also for two
brands of toothpaste - so long as it is insisted that the difference
between the two brands is fundamentally important.
The theory of monopolistic competition offers no tools for the
analysis of an industry and so no stopping place between the firm at
one extreme and general equilibrium at the other.37 It is therefore
incompetent to contribute to the analysis of a host of important
problems: the one extreme is too narrow to be of great interest; the
other, too broad to permit meaningful generalizations.38
VI. CONCLUSION
Economics as a positive science is a body of tentatively accepted
generalizations about economic phenomena that can be used to
predict the consequences of changes in circumstances.
34. See R. L. Bishop, "Elasticities, Cross-elasticities, and. Market
Relationships," American Economic Review, XLII (December, 1952),
779-803, for a recent attempt to construct a rigorous classification of
market relationships along these lines. Despite its ingenuity and
sophistication, the result seems to me thoroughly unsatisfactory. It rests
basically on certain numbers being 'classified as "large" or "small," yet
there is no discussion at all of how to decide whether a particular number
is "large" or "small," as of course there cannot be on a purely abstract
level.
35. Op. cit., p. 82.
36. There always exists a transformation of quantities that will make
either the cost curves or the demand curves identical; this transformation
need not, however, be linear, in which case it will involve different-sized
units of one product at different levels of output. There does not
necessarily exist a transformation that will make both pairs of curves
identical.
37. See Robert Triffin, Monopolistic Competition and General
Equilibrium Theory (Cambridge: Harvard University Press, 1940), esp.
pp. 188-89.
38. For a detailed critique see George J. Stigler, "Monopolistic
Competition in Retrospect," in Five Lectures on Economic Problems
(London: Macmillan & Co., 1949), pp. 12-24.
40
Progress in expanding this body of generalizations, strengthening
our confidence in their validity, and improving the accuracy of the
predictions they yield is hindered not only by the limitations of
human ability that impede all search for knowledge but also by
obstacles that are especially important for the social sciences in
general and economics in particular, though by no means peculiar to
them. Familiarity with the subject matter of economics breeds
contempt for special knowledge about it. The importance of its
subject matter to everyday life and to major issues of public policy
impedes objectivity and promotes confusion between scientific
analysis and normative judgment. The necessity of relying on
uncontrolled experience rather than on controlled experiment makes
it difficult to produce dramatic and clear-cut evidence to justify the
acceptance of tentative hypotheses. Reliance on uncontrolled
experience does not affect the fundamental methodological principle
that a hypothesis can be tested only by the conformity of its
implications or predictions with observable phenomena; but it does
render the task of testing hypotheses more difficult and gives greater
scope for confusion about the methodological principles involved.
More than other scientists, social scientists need to be self-conscious
about their methodology.
One confusion that has been particularly rife and has done
much damage is confusion about the role of "assumptions" in
economic analysis. A meaningful scientific hypothesis or theory
typically asserts that certain forces are, and other forces are not,
important in understanding a particular class of phenomena.
It is frequently convenient to present such a hypothesis by
stating that the phenomena it is desired to predict behave in
the world of observation as if they occurred in a hypothetical and
highly simplified world containing only the forces that the
hypothesis asserts to be important. In general, there is more
than one way to formulate such a description - more than one
set of "assumptions" in terms of which the theory can be presented.
The choice among such alternative assumptions is made
on the grounds of the resulting economy, clarity, and precision
in presenting the hypothesis; their capacity to bring indirect
evidence to bear on the validity of the hypothesis by suggesting
41
some of its implications that can be readily checked with observation
or by bringing out its connection with other hypotheses dealing with
related phenomena; and similar considerations.
Such a theory cannot be tested by comparing its "assumptions"
directly with "reality,." Indeed, there is no meaningful way in which
this can be done. Complete "realism" is clearly unattainable, and the
question whether a theory is realistic "enough" can be settled only by
seeing whether it yields predictions that are good enough for the
purpose in hand or that are better than predictions from alternative
theories. Yet the belief that a theory can be tested by the realism of
its assumptions independently of the accuracy of its predictions is
widespread and the source of much of the perennial criticism of
economic theory as unrealistic. Such criticism is largely irrelevant,
and, in consequence, most attempts to reform economic theory that it
has stimulated have been unsuccessful.
The irrelevance of so much criticism of economic theory does not
of course imply that existing economic theory deserves any high
degree of confidence. These criticisms may miss the target yet there
may be a target for criticism. In a trivial sense, of course, there
obviously is. Any theory is necessarily provisional and subject to
change with the advance of knowledge. To go beyond this platitude, it
is necessary to be more specific about the content of "existing
economic theory" and to distinguish among its different branches;
some parts of economic theory clearly deserve more confidence than
others. A comprehensive evaluation of the present state of positive
economics, summary of the evidence bearing on its validity, and
assessment of the relative confidence that each part deserves is clearly
a task for a treatise or a set of treatises, if it be possible at all, not for
a brief paper on methodology.
About all that is possible here is the cursory expression of
personal view. Existing relative price theory, which is designed to
explain the allocation of resources among alternative ends and the
division of the product among the co-operating resources, and which
reached almost its present form in Marshall's Principles of
Economics, seems to me both extremely fruitful and deserving of
much confidence for the kind of economic system
42
that characterizes Western nations. Despite the appearance of
considerable controversy, this is true equally of existing static, monetary
theory, which is designed to explain the structural or secular level of
absolute prices, aggregate output, and other variables for the economy
as a whole and which has had a form of the quantity theory of money as
its basic core in all of its major variants from David Hume to the
Cambridge School to Irving Fisher to John Maynard Keynes. The
weakest and least satisfactory part of current economic theory seems to
me to be in the field of monetary dynamics, which is concerned with the
process of adaptation of the economy as a whole to changes in conditions
and so with short-period fluctuations in aggregate activity. In this
field we do not even have a theory that can appropriately be called "the"
existing theory of monetary dynamics.
Of course, even in relative price and static monetary theory there is
enormous room for extending the scope and improving the accuracy of
existing theory. In particular, undue emphasis on the descriptive realism
of "assumptions" has. contributed to neglect of the critical problem of
determining the limits of validity of the various hypotheses that together
constitute the existing economic theory in these areas. The abstract
models corresponding to these hypotheses have been elaborated in considerable
detail and greatly improved in rigor and precision. Descriptive
material on the characteristics of our economic system and its
operations have been amassed on an unprecedented scale, This is all to
the good. But, if we are to use effectively, these abstract models and
this descriptive material, we must have a comparable exploration of the
criteria for determining what abstract model it is best to use for
particular kinds of problems, what entities in the abstract model are to
be identified with what observable entities, and what features of the
problem or of the circumstances have the greatest effect on the accuracy
of the predictions yielded by a particular model or theory.
Progress in positive economics will require not only the testing and
elaboration of existing hypotheses but also the construction of new
hypotheses. On this problem there is little to say on a
43
formal level. The construction of hypotheses is a creative act of
inspiration, intuition, invention; its essence is the vision of something
new in familiar material. The process must be discussed in
psychological, not logical, categories; studied in autobiographies and
biographies, not treatises on scientific method; and promoted by maxim
and example, not syllogism or theorem.
 
1  /  1  页   1 跳转

版权所有 北望经济学园  北望博客  Sitemap

Powered by Discuz!NT 2.1.202    Copyright © 2001-2012 Comsenz Inc.
Processed in 0.28125 second(s) , 4 queries. 京ICP备05006035号
返顶部