范文一:实证经济学的方法论
实证经济学的方法论 / M?弗里得曼
M?弗里得曼
实证经济学的方法论 第11篇
在凯恩斯的名著《政治经济学的范围与方法》一书中,约翰. 梅纳德?凯恩斯对实证科学及规范科学作了区分。他认为:“一门实证科学??是关于什么是这一类问题的系统的知识体系;而一门规范科学(或称为管理科学)??是关于什么应该是这一类问题的标准的系统的知识体系??;是一门艺术??是为达到某一特定目标而设立的原则体系”;他指出:“这二者之间的混淆带有很大的普遍性,并成为很多殆害大分之谬误的根源”;他还强调了“创立一门准确无误的政治经济学的实证科学的重要性。”
本文将主要对某些方法论问题加以阐述,这些问题产生于人们为创立凯恩斯所倡导的“准确无误的实证科学”所作的努力,其中特别涉及的是,如何确定某一被提出的假说或理论,是否应被暂时地接受为“关于什么是这一类问题的系统的知识体系”的一部分。但是,凯恩斯所悲叹的这种混淆仍然如此之普遍,并极大地妨害了人们对经济学可以是——而且部分地确实是——一门实证科学的认可。所以,我们最好在本文的开头先论述一下实证经济学与规范经济学之间的关系。
1(实证经济学与规范经济学之间的关系
在某种程度上,实证经济学与规范经济学之间的混淆是不可避免的。在几乎每一个人看来,经济学所研究的问题与其自身是极为攸关的,而且是困于他们自己的经历与能力的范围之内;这一现象便是不断的广泛的分歧的根源,并成了频繁立法的契机。那些自许为“专家”的人们意见迟异,而且我们很难保证他们都是毫无偏见的。无论如何,在那些事关重大的问题上,即使这些“专家”们几乎一口同声而且毫无偏见,我们也很难完全不加考虑地接受他们的观点。实证经济学的结论似乎是,而且确实是与重要的规范问题密切相关的,是与应该做什么及如何取得某一既定目标等问题密切相关的。门外汉与专家一样,都在无一避免地试图改造实证结论以适应为他们所极力坚持的规范性的先入之见,并当这些实证结论的规范性含义——或所谓的这些实证结论的规范性含义——不合他们的口味时就否定这些实证结论。
从原则上说,实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说,它要解决的是“什么是”,而不是“什么应该是”一类的问题。它的任务是提供一套一般化体系,这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。这一体系的运行状况可以通过它所取得的预测与实际情况相比的精确度、覆盖率及一致性等指标来加以考察。简而言之,实证经济学是,或者说可以是一门“客观的”科学,这里“客观”一词的含义完全等同于任一自然科学上的定义。当然,经济学所涉及的是人与人之间的关系,而且调查研究者本身就是被调查研究的事物的一部分。与自然科学相比,调查研究者与被调查研究的事物之间更具有本质上的联系。上述事实在使社会科学家得到了一系列自然科学家无法得到的数据的同时,也使社会科学家在实现客观性的目标上遇到了特有的困难,但是在我看来,这些都不是这两类科学之间的根本差异之所在。
另一方面,规范经济学及经济学的技术也不可能独立于实证经济学。任何政策结论都不可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测,而预测则必须明确或不明确地基于实证经济学。当然。在政策结论与实证经济结论之间并不存在着—一对应的关系;如果有的话,那么则不必另外再创立一门规范经济学了。两个不同的个体可能在对某一个别立法的结果问题上意见一致。但其中的一个可能认
为这些结果有利于平衡,进而拥护这项立法;而另外一个却可能认为这些结果是不合意的,进而反对这项立法。
然而,我对这样一种看法提出疑义:这种看法认为,在目前的西方世界,特别是美国,在毫无偏见的公民之间所存在的有关经济政策的分歧,主要地来源于人们对所采取的行动将带来的经济影响的不同预测。而这些分歧从原则上说是可以通过实证经济学的发展而予以消除的。持这种看法的人不认为人们关于经济政策的分歧是来源于人们在基本的行为准则方面的根本性分歧,来源于人们在最终可能出现的矛盾双方问题上的分歧。一个明显的而且并非不重要的事例就是最低工资限制问题。尽管在形式上存在着对这一立法的褒贬纷争,但人们在为所有的人争取到一个“生存工资”这一政策目标上却形成了根本一致的意见。而且“生存工资”这一含义模糊的概念在这一类问题的讨论中得到了广泛的运用。人们的意见分歧主要产生于人们在预测方面的隐含的或明确的分歧。这一预测涉及的是最低工资限制这一特殊手段在实现目标中的功效问题。该项立法的支持者们认为(即预测),法定的最低工资通过提高那些工资收入在最低工资线之下的劳动者的收入,及提高那些工资收入在最低工资线之上的劳动者的收入,进而消除了贫困。而且与此同时并不存在完全失业人数增加及就业条件因该立法的实行而恶化一类的消极作用。而该项立法的反对者们认为(即预测),法定的最低工资通过失业人数的增加及就业条件的恶化而加重了贫困现象。而且这一消极作用不仅抵消了该项立法给在业者工资收入所带来的有益影响,市且还可能使之状况更加恶化。人们在该项立法的经济影响问题上的看法一致,并不能使人们在该项立法的合意性问题上看法一致。这是因为仍然存在着人们在该项立法的政治或社会影响等问题上的分歧。但是,在目标一致的情况下,人们一定会经过漫长的道路而趋于一致的。
人们在工会的适当作用及地位的问题上的各种不同意见,及人们对直接的价格与工资控制的合意性及关税的合意性等问题的各种不同看法,都是以实证分析中的一些密切关税的分歧为依据的。人们对所谓的规模经济的重要性的不同预测,在很大程度上说明了人们在工业部门中政府的全面控制的合意性及必要性,甚至在社会主义(而不是私人企业)的合意性及必要性等问题上的不同看法。而且关于这一方面问题的事例举不胜举。当然,我的这一主张——即在西方社会中人们在经济政策问题上的主要分歧具有如上所述的性质——其本身就是一种“实证”阐述,它的正确与否还有待于经验证据的检验。
如果这一主张是合理的,那么它意味着。人们在“正确的”经济政策问题上的一致意见较少地取决于规范经济学的进步,而更多地是取决于这样一种实证经济学的发展:它所得出的结论不仅而且值得受到广泛的赞同。它还意味着:对实证经济学与规范经济学加以严格的区分的主要原因就在于这样一种贡献,即这一区分促进了人们在政策问题上的意见一致。
2(实证经济学
实证科学的终极目的就是要发展这样一种“理论”或”假说”,使之能够对尚未观察到的现象作出合理的、有意义的(而不是老生常谈的)预测。总体说来,这样一种理论是一个由两种元素构成的复杂的混合体。部分地说,它是一种‘语言”,旨在促进“系统的、有组织的推论方法”。部分地说,它是一系列假说的综合体,旨在从纷繁复杂的现实中抽象出事物的本质特征。
作为一种语言,理论不具有任何实质性的内容;它是一系列同义反复的词语的综合体。它的作用在于为经验材料的组织及对经验材料的理解提供文牍服务;而且用以检验这一服务质量的标准也是那些适合于文牍体系的标准。对这些事物的种类所下的定义清楚而准确吗,对这些事物种类的划分穷尽了吗,我们知道每一单个项目都应归于哪一类吗,或者,在这其中是否存在着相当的似是而非现象呢,人们对大标题及次标题体系的划分是否已达到这样的完备程度,从而使我们能够迅速地找到我们所要的条目呢,还是由于混乱
不清而使得我们不得不一处一处地加以涉猎呢,我们将要研究的条目是否都已编排到一起了呢,条目的编排系统是否已避免了交叉重复呢,
对上述这些问题的回答部分地取决于逻辑上的考虑,部分地取决于事实上的考虑。标准的逻辑准则本身可以说明某一特殊语言是否是完全的及连续的,即这一语言中的命题是“正确的”还是“错误的”。事实上的证据本身可以说明“逻辑编排系统”的种类能否在实际中找到有意义的对应物,即在分析具体问题中的某一特殊种类时,这些条目划分是否能起到一定的作用。“供给”与“需求”这一简单的事例既说明了这一点也说明了前面所谈到的一系列逻辑分析问题。作为经济理论这种语言的构成要素,供给与需求是两大主要类别,影响产品的相对价格的因素及影响生产的因素都被划到这两大类别中来。这种二分法的实用性取决于“它在经验资料方面的高度概括性,即如果我们把任一问题中影响需求的力量与影响供给的力量分别开列出来的话,那么我们将会得到这样两类资料:它们之间很少有哪些项目是共同的。”现在,这样一种概括对于象消费品终极市场一样的市场来说是合理的。在这一类市场中,可以被看作是需求产品的经济单位与可以被看作是供给产品的经济单位之间存在着明确的、严格的区分。很少存在这样的混乱现象:从某一方面看来,某一特殊因素应被划归影响供给的项目之类,而从另一方面看来,又应被划归影响需求的项目之类。而且也很少有必要考虑两个类别之间的交叉效应(即交叉重复)。在这类问题中,在标题“供给”与,“需求”下对有关因素进行编排所需要采取的步骤既简单又明了,从而极大地简化了我们所面临的问题,而且这种简单明了的方法还防止了在其它情况下可能出现的差错。但是,这种概括并不是在任何情况下都是合理的。例如,在一个主要是投机性的市场中,对于价格的每日波动来说,这一概括就是不合理的。例如,一则关于增加超额利润税的谣传,对于股票市场来说,是应当看作是主要对今天的公司股票供给发生影响的因素呢,还是应当看作是主要对今天的公司股票需求发生影响的因素呢,在类似的情况下,几乎对于每一因素来说,将其划归“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。这些概念仍然可以使用而且不可能是毫无意义的;它们仍然是“正确的”,但与在第一个例子中的情况相比它们的用处则明显地要小得多,这是因为它们没有有意义的实证对应物。
作为一种实证假说体系,理论应该通过其对它意在加以“解释”的那一类现象的预测能力来检验。唯有实际证据才能表明该理论是“正确的”还是“错误的”。或者更为准确地说,唯有实际证据才能表明该理论是被作为合理因素而暂时地得到“接受”呢,还是遭到了“拒绝”。正如我下面将更为详细地阐述的那样,对某一假说的合理性的唯一有关的检验,是将其预测与实际情况所作的比较。郊果该假说的预测(“频繁地”或比来自于另一假说的预测更为经常地)与实践相抵触,那么该假说则遭到了否定;如果该假说的预测没有与实践相抵触,那么它则为人们所认可;如果该假说业已多次成功地避免了可能出现的抵触现象,那么它则具有极大的可信赖程度。实际证据永远也不可能“证实”某一假说的正确性,它只能通过无法将该假说驳倒来显示该假说的正确性。当我们说到某一假说已经在实践中得到了确认时(并不十分准确),我们通常所指的就是这个意思。
为了避免误解,可能有必要明确一下:我们用来检验某一假说的合理性的“预测”,并不一定非得是对尚未发生的现象所作的预测,也就是说,不一定非得是对将来事件的预见。它可以是对业已发生了的现象所作的预测,但前提条件是对这一现象所作的观察尚未进行,或者是虽然对这一现象的观察业已作出。但进行预测的人尚不知晓。例如,在其它一些情况已知的情况下,某一假说预测在1906年将会有某些情况发生。如果对这一时期的史料记载所作的研究表明,在1906年某些情况确实发生了,那么该预测则得到了实践的确认。反之,如果研究表明在1906年某些情况并没有发生,那么该预测则与实际情况发生了抵触。
从这种意义上讲,某一假说的合理性本身并不足以作为对其它假说进行取舍的标准。人们可以观察到的事实在数量上必然是十分有限的,但可能的假说却是无限的。如果存在某一种假说与可得证据相一致,那么一定还有无数的假设也与这一可得证据相一致。例如,假设对某一特殊消费品所征收的一种特别货物税,
导致了价格的上涨,其上涨幅度完全等同于税收的数量。这与竞争情况下稳定的需求曲线、水平的且稳定的供给曲线是一致的;但它也与竞争情况下需求曲线或供给曲线发生必要的相应移动后的斜率为正或为负的供给曲线相一致:它也与垄断情况下常边际成本及稳定的需求曲线相一致,只是为了取得上述结果要求后者具有某一特定的形状;等等,等等,无穷无尽。这一假说所适应的另外一种证据可以起到剔除上述某些可能情况的作用;但它绝不可能把这些可能性削减为一种,而独自地与这一有限的证据相一致。对那些与可得证据同等一致的假说所进行的选择,在某种程度上是任意的。虽然我们一致同意这样的观点:对选择所进行的考虑应以“简洁性”与“成效性”为出发点,但这二条标准的本身就意味着否定完全的有目的的简化。一理论越是“简单明了”,在某一既定领域内对现象进行预测所需要的初始知识也就越少;一理论越是“富有成效”,它对现象所作的预测也就越精确,而且该理论进行预测所依据的范围也就越大,同时,为了进一步研究的需要,它所要加以说明的东西也就越多。逻辑上的完整性与一致性虽然也与评判的标准有关,但只起一个辅助作用;二者的作用在于确保该假说能够正确地阐明宗旨,而且做到使每一个研究该假说的人的理解都准确无误——在这里,它们与统计计算中对数字精确度的检验所起的作用是一样的。
不过,我们对社会科学中某一特殊预测所作的检验,很少能够通过这样一种实践来进行:这种实践是经过专门设计的,意在消除被认为是最重要的干扰因素。通常,我们不得不依赖于偶然发生的“实际情况”所提供的证据来进行我们的检验、在我看来,社会科学中无法进行所谓的”有所控制”的实验,这并不能反映社会科学与自然科学之间的根本区别。这既是因为“无法控制”的实验并非为社会科学所特有(自然科学中的天文学就是一例),又是因为有控制的实验与无控制的实验之间的差异充其量不过是一个程度上的差异。没有哪一种实验是可以完全控制的,同时每一种实验中又都存在着部分的控制,这是因为某些干扰因素在整个实验过程中应保持相对的稳定(
实践所提供的证据是大量的,而且常常是确定性的,犹如经过了设计的实验一般。所以,无法指导实际情况并不是通过预测的成功来检验假设的根本性障碍。但如此得到的证据在解释上却要比前种情况困难得多。它常常是复杂的,而且总是间接的和不完全的。对这种证据的收集常常是困难的,而且对这些证据的解释通常需要进行细致入微的分析工作,同时还涉及到一系列的推理判断,而这些很少能够真正做到把握事物的真谛。“具有决定性意义”的实验所带来的大量的直接证据与经济学之无缘,的确妨碍了检验假说工作的顺利进行。但与这一情况在取得合理的结论,及在由可得证据所证明了的结论上取得一致意见等方面所带来的巨大困难相比,前一种妨碍则显得微不足道了。它使得人们对失败的假说的摒除工作进展缓慢且困难重重。这些失败的假说很少永远告别经济舞台,相反却总是一再出现。
当然,这些方面的问题并不是整齐划一的。有时,实践所提供的证据与有控制的实验所能提供的证据几乎一样地直接、大量与确定。也许,最明显的重要例证要数通货膨胀问题。这种通货膨胀证据是服务于这样一种假说的:在一个较短的时期里,货币数量的大量增加必然伴随着价格的大幅度上升。这里,这方面的证据是大量的,且为对这些证据加以解释所需要的推理判断较少。然而,尽管存在着大量的价格大幅度上涨的事例,但这些事例与货币存量的大量增加之间的本质上的—一对应关系,及在其它相关的情况下的变异程度等,决定了每一次新的通货膨胀体验都必将带来激烈的争论,而且这种争论不仅仅是来源于非职业经济学家的人民大众。反对原假说的观点认为:货币存量的增加或者是来源于由其它因素所导致的价格上涨的偶然性影响,或者是价格上涨的一个完全偶然且不必要的附带物。
检验大量的经济假说的困难性所造成的一种影响就是:它使得我们的检验工作退回到纯粹的正统或繁琐分析中去。正如我们业已阐述的那样,繁琐重复在经济学及其它科学中,作为一种专门的语言或“分析编排体系”而占有极为重要的地位。此外,同样是同义反复的正统逻辑学与数学又成了这些问题的重要工具:检验判断推理的正确性;发现假说的深刻含义;确定是否一系列被假定为不同的假说的确不可能是等价的,或者在它们之间存在着差异等。
但是,如果一经济理论想保能够预测未来,而不仅仅是描绘行动的结果,那么仅作为一个同义重复的体系是远远不够的。同样,如果一经济理论想要有别于模糊数学时,那么仅作为一个同义重复的体系也是远远不够的。而且如我们前面所提到的那样,这些同义反复的实用性本身还将最终地取决于关于将某一棘手的实际问题划归某一种类的那些假说的可接受性。
通过预测而对经济假说加以检验所具有的困难造成了另一个更为深刻的影响,那就是它使人们对经验证据在理论著作中的作用产生了误解。在下述两个虽联系紧密但并不相同的阶段中,经验证据起到了至关重要的作用:一是构造假说的阶段,二是检验假说的合理性的阶段。完整且详尽的经验资料,作为我们将通过假说而予以概括总结或“加以解释”的实际现象的代表,除在提出新假说时所具有的重大作用外,还被用来验证一假说确实说明了它旨在说明的问题——即该假说对某一现象所作的阐述并不与人们业已观察到的实际情况相矛盾。在某一假说与人们掌握的实际资料相一致的情况下,人们对该假说所作的进一步检验,是要将那些事先并不知道然而却可以从实践中观察到的新因素从假说中剔除出去,同时还要对这些被剔除的因素加以检验,以了解这些因素与其它的经验证据之间的背离情况。为了使后一种检验同前一种检验密切相关,那些被剔除的因素必须与该假说旨在说明的问题同属一类现象;而且对这些被剔除的因素所作的限定必须足够地准确,从而使得人们所作的观察能够证明这些因素是不正确的。
构造假说与检验其合理性这两个阶段之间的相互联系可以从两个方面表现出来。第一,在某种程度上可以这样说:进入每一阶段的那些特定的因素,是由资料的收集及某一特定的调查者的知识水平所决定的一个偶然现象。被用来检验某一假说的内涵的那些因素可能同样适当地属于被用来构造假说的那些原始资料,反之亦然。第二,创立一假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及到对一系列早些时候提出的、以实际观察为依据的假说所进行的比较。这些假说的涵义之间的相互矛盾,成了促进人们构造新假说或修改原有假说的始动力。所以,这两个在方法上截然不同的阶段,在实际进程中又总是相辅相成、互为前提的。
人们对这一简洁明了的过程所产生的误解,主要在于下面这一表述:“该假说是为解释这一类现象而提出的。”社会科学中,对这一类现象的新证据的获得十分困难,而且对这些新证据与该假说的含义之间的一致性的判断也十分困难,这些情况使得社会科学试图作出这样的假设:其它的、更为可得的证据与该假说的合理性是同样相关的。这就等于说假定假说不仅具有“含义”,而且还具有”“假设”;这些“假设”与“现实”之间的一致性是检验该假说的合理性的标准——这一标准或者不同于通过含义所进行的检验,或者是对通过含义所进行的检验的一种补充。这一为人们所广泛持有的观点不仅是根本错误的,而且还成了更多的缪误产生的根源。它不仅没有为不合理的假说向合理的假说的转化提供捷径,相反却混淆了是非,造成了人们对经验证据在经济理论中的重要性的误解,使得人们为促进实证经济学的发展所作的智睿的探索迷失了方向,而且阻碍了实证经济学中人们在试验性的假说上一致意见的取得。
即使在一理论可以被说成是具有“假设”的限度内,即使在这些‘假设”的”真实性”可以独立于预测的合理性而接受检验的限度内,该理论的重要性与它的“假设”的“真实性”之间的相互关系,也完全不同于我们前面所批评的那种观点所提出的内容,甚至几乎是后者的反面。那些真正重要且伟大的假说所具有的“假设”,是对现实的一种粗略的、不十分精确的、描述性的表述(而且,一般说来,某一理论越是杰出,那么它的“假设”(在上述意义上)就越是超脱现实。这其中的原因是非常简单的。如果一假说能够通过极为有限的资料而进行大量的“阐述”,即如果一假说能够从它旨在解释的那一现象周围的大量复杂且详尽的情况中,抽象出共同且关键的因素,并能保证仅在这些有限资料的基础上作出合理的预测,那么,这一假说就是意义重大的。所以,为了意义重大,一个假说在其假设方面必须运用一些描述性的技巧;既然该假说的伟大成功将证明其它许多的有关情况与该假说旨在阐明的现象是毫不相关的,那么该假说也就不必考
虑并说明这些情况。
为了使这一点不那么难于理解,我们所要问的另一个与一理论的“假设”有关的问题,不是这些假设是否在描述上是“现实主义的”,因为它们从来就不是,而是这些设想对于我们已有的目标来说,是否是一个足够好的近似物。而对这一问题的回答唯有道过考察该理论是否应验,即该理论是否取得了足够精确的预测水平来进行。这样,这两种原假设为独立的检验方法合二为一。
垄断的与不完全的竞争理论,就是在经济理论中忽视上述主张的一个例子。被说成是构成新古典经济理论的基础的“完全竞争”或“完全垄断”假设,是现实生活的一幅虚假的图象这样一种观点,明确地促进了垄断与不完全竞争分析的发展,而且也大致地说明了该分析得到广泛的接受与赞同的原因。而这一观点本身,几乎全部地以这些假设的这种直接可见的不精确性为基础,而不是以从新古典经济理论中导出的预测的任何得到认可的矛盾点为基础的。许多年以前,《美国经济评论》对边际分析问题所进行的长篇累牍的讨论,是另一个虽不如前一个例子重要,但比前者更为明确的例子。争论双方的文章,在很大程度上都忽略了在我看来似乎是关键性的问题——即边际分析原理与实践经验的一致性问题,而注重于商人是否确实地通过考察代表边际成本与边际收益的表格、或曲线、或多变量函数,来制定他们的决策这样一个几乎毫不相关的问题。也许这两个例子及它们所业已揭示的其它许多事例,可以对所涉及的方法论原则问题的讨论起到判别作用,而且通过这两个例子所说明的问题也许要比其它似乎是适当的方法所能说明的问题要广泛得多(
3(可以通过一假说的假设的真实性来检验该假说吗,
我们先从自由落体法则这样一个简单的自然事例开始来进行我们的讨论。在真空中,一落体的加速度是一个常数——g,在地球上是每平方秒大约32呎——而且落体的加速度与该物体的形状、投掷方法等因素无关,这一假说已得到了人们的广泛接受。这就等于说一落体在任一特定的时间范围内所下落的距离可以用S=1,2 gt2这一公式来算出。这里, S是该落体下落的距离,单位是呎,t是物体下落的时间,单位是秒。将这一公式应用到一个从楼顶下抛的实心球上,就等于说这样抛下的那个球的运行情况就如用它在真空中被抛下时的运行情况。通过这一假说的假设来对其进行检验,可能意味着对实际气压进行测量,并确定它是否接近于零。在海平面上,气压大约是每平方时15磅。为了使这一气压差别被判定为可忽略不计的,15是否是足够趋近于零的呢,因为这一实心球从楼顶降落到地面实际所需的时间与这一公式所给出的时间非常接近,所以很明显,这一15之差足够趋近于零。然而,假定现在抛下的是一根羽毛而不是一个实心球。那么这一公式所得出的结果则是非常之不精确的(很明显,对于一根羽毛(而不是对于一个实心球)来说,每平方时 15磅完全不同于零。或者,我们再假定这一公式的应用对象是从3万呎高的飞机上抛下的一个球。在这一高度,气压绝对地小于每平方吋15磅。然而,从3万呎降到2万呎(在这一点上的气压仍然大大小于海平面上的水平)所用的实际时间却完全不同于上述公式所预测的时间——大大地高于实心球从楼顶落到地面所需的时间。按照上述公式,该球的速度应为gt,而且还应该稳定地增长。事实上,一个从3万呎降落的球是在它碰到地面以前达到它的最高速度的。而且上述公式的其它含义也都与此类同。
为了使气压差别能够被判定为是可以忽略不计的,15是否足够地趋近千零这一初始问题本身就是明显地愚不可及的。每平方吋15磅等价于每平方呎2160磅,也等价于每平方吋0(0075吨。如果没有一些外在的比较标准,则不存在对这些数字评判大小的依据。而这唯一相关的比较标准就是在一系列既定的情况下,该公式可以应用或不可以应用的气压水平。但这又在另一个层次上带来了同样的问题。“可以应用或不可以应用”的含义是什么,即使我们可以消除测量上的误差,但物体降落的实际测得时间与公式计算所得的时间,很少(如果曾经有过的话)完全相等。为了能够判定自由落体理论之“不可以应用”,这二者之间的差异必须要多大呢,下面将是进行比较的两条重要的外在标准。一个是与该理论进行比较、且在所有其它方
面与该理论是同等地可接受的另一理论所能达到的精确度。另一个是这样一种标准,它只有在存在着某一业已为人们所知道的、具有更好的预测水平,然而其预测成本较高的理论的前提下,才会存在。而且更高的精确度所带来的效益(这取决于人们的使用目的),一定能够弥补取得这一精确度所需要的成本。
这一例子既证明了通过一理论的假设来检验该理论的不可能性,也证明了“某一理论的假设”这一概念的模糊性。S=1,2 gt2这一公式对于真空中的落体来说是正确的,而且可以通过对这一类物体的运行情况的分析而推导出来。所以,可以这样阐述:在多种情况下,在实际大气中降落的物体,其运行情况如同在真空中所进行的降落。如果用我们经济学中最常用的话来表述,那么上述文字立刻会被表述成:这一公式假设存在着一个真空。然而很明显上述表述并没有作任何诸如此类的假设。上述表述的真正意思是:在许多情况下,气压的存在,物体的形状,投掷物体者的姓名,投掷物体所采用的方法及许多其它的附加条件,对于该物体在一定时间内所下降的距离并无可估计的影响。我们完全可以对该假说重新进行表述,从而完全不再提及真空因素:在许多情况下,一物体在一给定的时间内所下降的距离由公式s=1/2 gt2给出。如果我们撇开该公式的历史不谈,撇开与之相联的其它自然科学理论不谈,那么说该公式假设存在着一个真空还有意义吗,就我所知,还可能存在着其它的假设体系,而能够取得这同样的公式。这一公式之所以被接受是因为它与现实相符,而不是因为我们生活在一个大致的真空里——不管这种大致的真空指的是什么。
与这一假说相联系的一个重要的问题,是要限定该公式可以应用的条件,或者更为准确地说,是要限定在各种情况下该公式预测的总的误差范围。的确,正如上述对该假说的重新表述中所蓄含的那样,这样的限定与该假说并不是截然不同的两件事。限定本身就是该假说的一个重要组成部分,而且它是这样一个组成部分:随着实践的不断增加,它是特别有可能被修改与扩展的部分。
在落体这一特殊情况中,还存在着另一虽仍不完善但更为一般化的理论。这一理论主要来自于人们为解释前一种简单理论中存在的误差而进行的探索;而且在这一理论中,人们可以对某些可能存在的干扰因素的影响加以衡量;而且在这一理论中,前一种简单理论只是作为一种特例而存在。然而,这一更为一般化的理论并不总是能够得到应用。这是因为,它所取得的精确度的增加可能不能弥补使用这一理论所带来的成本的增加。所以,在何种情况下前一种较简单的理论可以“充分完善地”反映现实,这仍然是一个事关重要的问题。气压是限定该理论可应用的情况的那些变量中的一个,但只是其中之一;物体的形状,使达到的速度,及其它变量也都是与限定有关的。对气压以外的这些变量加以阐述的方法之一,就是将这些变量视为决定对真空“假设”的某种背离是否是事关重大的。例如,每平方吋15磅的气压对于一支羽毛来说是截然不同于零的;但对于从一高度不大的地方下抛的实心球来说,却是可以视为趋近于零的,这些都是物体的形状所带来的差别。然而,这样的表述绝然区别于下面这种不同的表述:该理论不能应用于羽毛落体,因为该理论的假设是错误的。然而它们之间的相互关系却完全是另一种情况:对于羽毛来说,这些假设是错误的,原因在于该理论不能应用于羽毛落体。这一点需要引起大家的重视。这是因为,在限定某一理论可以成立的条件的过程中,“假设”的完全正确的运用通常错误地被理解为假设可以被用来确定某一理论可以成立的条件,而且,这一误解成了理论可以通过其假设而进行检验这一观点的主要根源。
下面我们再来看另一个例子。这一次是一个臆造的事例,旨在使之成为社会科学中的许多假说的同类物。让我们来考虑一下一棵树上叶子的密度。我提出的假说是:这些叶子的位置是这样确定的:在其周围的叶子位置一定的条件下,每一片叶子都好象有意地使它所能得到的阳光数量最大化;每一片叶子都好象知晓决定在不同的位置上可得阳光数量的自然法则,并且能够迅速地(或曰即刻地)由任一位置移到任一其它合意的且尚未被占据的位置。现在,该假说的某些更为明确的含义明显地与实际情况相一致:例如,一般来说,树南侧的叶子密于树北侧的叶子,但如本假说所意含的那样,在山的北坡,或当树的南侧为其它东西所遮盖的情况下,树的南北两侧叶子密度的差异就不会那么明显。或完全不是原来的那种情况。就我们所知,叶子不能“有计划地行事”,或者说不能有意识地“追求”什么,它们没有进过学校并学会为计算“最
佳”位置所必需的科学或数学的有关法则,难道我们可以据此认为该假说是不可接受的或曰不合理的吗,很明显,该假说的这些与事实相矛盾的情况中,没有一个是至关重要的。这里所涉及的现象不在“该假说旨在阐述的那一类现象”的范围之内。该假说并没有宣称叶子可以做到上述事情,它只是认为:这些叶子的密度是同一的,就犹如它们可以做上述事情一般(尽管该根说的“假设”中存在着明显的非现实性,但由于该假说的含义与实际观察的一致性,使得该假说具有极大的合理性。我们倾向于在下述意义上“阐述”该假说的合理性:由于阳光促进了叶子的生长,所以,在阳光较多的地方叶子将生长得更加茂密,或者说将有更多的假定存在的叶子能够得以生存下来。所以,完全被动地将这一假说应用到更为广泛的情况中去所得到的这一结果,与通过将某些特定环境附加其上所得到的结果是完全相同的。这后一种说法比前面造的那一种假说更为引人入胜,这不是因为后一种假说的“假设”更具“现实性”,而且因为后一种假说的“假设”本身就是一个更为一般化的理论的一部分。这种更为一般化的理论所能应用的现象种类更为广大,而且在这一更为一般化的理论中,一棵树上叶子的具体位置不过是该理论的一个特例。这一更为一般化的理论有着更多的可能招致异议的含义,但由于该理论可适用的范围更为广泛从而使得这些含义避开了可能发生的任何抵触。这样一来,叶子生长的直接证据为来自于这一更为一般化的理论所适用的其它现象的间接证据所加强。
我们所臆造的这一假说大致说来是正确的,也就是说,仅对于某些现象来说,该假说关于叶子密度的预测达到了“足够的”精确水平。我不知道这某些现象是什么,也不知道如何去定义它们。然而,有一点似乎是明确的,那就是:在这一例子中,该理论的这些“假设”并不属于该理论的假设范围:也就是说,树的种类,土地的性质等都是可能影响到该理论的合理性所存在的范围的变量种类,而叶子进行复杂的数学计算,或从一个位置移到另一个位置的可能性问题,却与该理论合理性的范围限制无关。一个与人类行为有关的例子大致类似于我们刚才所举的那个例子。这个例子我与萨维奇已在别处引用过。现在,让我们来考虑一下一位台球行家对击球情况进行预测的问题。下述假设似乎并非毫无道理:绝妙的预测通常都是通过这样的假说来取得。这种假说认为,这位台球行家的击球活动就犹如他知晓将会给出最佳运行方向的那个复杂的数学公式一般。而且这一数学公式可以通过眼睛对角度的观察,并确定该球所在的位置等而精确地进行计算。这位台球行家通过该公式而进行闪电般的计算。然后使球按该公式所指定的方向运行。我们对这一假说的信赖并不是基于这样一种观点:台球手(即使是台球行家)可以而且确实经历过前面所描述过的过程;相反,我们对该假说的信赖是缘于这样一种观点:除非这些台球手可以通过这样或那样的方法而取得与上述过程同样的结果,否则的话,他们事实上就不是台球行家。
由这些例子进而引申出下面这个经济原说,这似乎是很容易做到的。这一经济假说认为,在许多情况下,单个企业常常是如此行事,犹如他们在有计划地使其预期成果(通常,如果理解有误的话,则称之为‘利润”)最大化,而且掌握着为成功地实现这一目的所必需的全部数据资料;也就是说,犹如他们知晓相关的成本与需求函数,可以通过他们所掌握的所有情况来计算边际成本与边际收益,并使得他们所采取的每一个行动都恰到好处地符合边际成本与边际收益相等的原则。当然,现在的商人实际上并不完全按照经济数学家所发现的方便途径来解这一联立方程体系。只不过他们这样做的可能性比叶子或台球手明确地完成复杂的数学计算,或落体决定创造一个真空的可能性要大一些。如果台球手被问到他是如何确定击球方向的,那么他可能回答说他“恰好算了出来”,但此外他还要摩擦一下兔后腿来证实一下。而如果一位商人被问到他是如何决策的,那么他可能回答说他是以平均成本来定价的,而且当市场情况发生了变化时,当然也会出现一些微小的偏差。这一表述与前一个表述几乎是同样有帮助的,但它们之中没有一个与对有关假说所进行的检验有联系。
人们对上述成果最大化假说的信赖是由一非同寻常的特征证据所证明的。在某种程度上,这一证据与关于台球手行为的假说中所引证的证据是非常相似的——也就是说,除非商人可以通过这种或那种方法而使其行为近似于与成果最大化相一致的行为,否则,他们似乎不可能长久地维持他们的生意。这里不管明显地、
直接地决定商业行为的因素是什么——习惯性的反应,随机性的机遇,或难于归类的一些东西——其结果都是一样的。不论什么时候,只要这一决定因素碰巧导致了与合理的、有实际根据的成果最大化相符合的行为,则生意使会兴隆,并进而需求资源以扩大经营;反之,只要这一决定因素不能带来与合理的、有实际根据的成果最大化相符合的行为,则生意将会亏损,且只有从外部引入新资源才能维持存在。这样一来,“自然选择”过程促进了该假说合理化的实现,或者说在自然选择既定的情况下,人们对该假说恰当地概括了生存条件这一判定,成了人们接受该假说的主要依据。
该成果最大化假说的另一更为重要的证据,来自于该假说在特殊问题中的无数次应用,及在这多次应用中,该假说的含义与实际情况并没有发生抵触这一事实。然而,如果要让这一证据提供佐证那是极为困难的。这是因为它散落在无数的商业便函中、文章中,及专题著作中,而这一切主要地是与特殊的具体问题相联系,而与对该假说的检验并不相关。然而,在很长时期内人们对该假说的持续使用与接受,及未能创立一种逻辑严密、自圆其说的假说来取而代之并得到广泛的接受这一情况,间接地有力地证明了该假说的存在价值。任一假说的证据都总是由人们试图证明它与实际情况相抵触而遭到的多次失败所组成。只要该假说仍在继续使用,那么这一证据就会继续增加。而且,由于该证据的特殊性质,让该证据提供完全充分的证明是十分困难的。这已开始变成某一科学的传统及传说的一部分,后者反映在人们持有假说的坚定性方面,而不是反映在教科书中对那些未能证明该假说与实际情况相抵触的事例所进行的罗列上面。
4(理论“假设”的重要性与作用
到现在为止。我们对一理论的‘假设”的重要性问题所作的结论几乎全都是否定的:我们已经证明了一理论是不能用其“假设”的“真实性”来加以检验的,而且,一理论的“假设”这一概念充满了可疑之点。但是,如果这就是问题的全部,那么我们将很难对这一概念的广泛应用作出解释。同时我们也很难说明这样一种较强的倾向:我们每个人都常常身不由已地谈到一理论的假设,并对各种理论的假设加以比较。有烟就有火。
在方法论当中(如同在实证科学中一样),作出否定性的结论通常要比作出肯定性的结论更有把握。所以,与前面的评述相比,我对下面这些有关“假设”的重要性及作用的评述的把握性较小。就我所能认识到的,一理论的“假设”具有三种虽则紧密相连但却完全不同的实证作用:(1)它们是对一理论进行描述或表述的一种简便形式;(2)它们有时会促进通过假说的含义而对假说所作的间接检验;而且(3)如我们前面已经提到过的,它们有时是对一理论预期的合理性的存在条件加以限定的方便途径。前两个方面还需要作进一步的讨论。
1(“假设”在表达一种理论中的作用
叶子的例子证明了假说的第一个作用。不采用叶子力图使它们所得到的阳光最大化这一说法,我们同样可以在没有任何明显的假设的情况下来表述这一假说。我们的表述是以预测叶子的密度所须遵循的一系列原则的形式来进行的:如果一棵树生长在一处平地上,且没有别的树木或其它物体来阻挡阳光的照射,那么,这棵树上叶子的密度将是如何如何。??相反,如果一棵树是生长在山的北坡,且位于由同样树木所形成的森林的中央,那么,这棵树上叶子的密度将是如何如何??等等。很明显,与叶子力求使它们所能得到的阳光最大化这种表述相比,刚才的那一种表述远不是这一假说的简便形式。事实上,由于前一种较简便的表述既指出了如何确定对本问题来说是非常重要的环境特点,又指出了如何对它们的影响加以评价,所以,前一种表述是对上述一系列原则的简单概括——即使这一原则系列被扩展到无穷大。前一种表述更为精悍而又不失全面。
更广泛地说,一假说或理论通常都含有这样的断言:某些力量(言外之意就是别的力量不是这样)对于某一特定种类的现象来说是重要的;并通常对它所断言的重要力量的行为方式加以限定。我们可以把这一假说看作是由两部分组成的:第一部分是一个概念性的世界,或者说是一个与“现实世界”相比较为简单的抽象模型。这一世界只包含该假说认为是重要的各种力量。第二部分是一系列原则。这些原则定义了这样一类现象——它们使得上述模型得以成为“现实世界”的一个适当的代表,同时,这些原则还对模型中的变量或实体与可观测的现象之间的对应关系作了限定。
从本质上看,这两个部分是截然不同的。模型是抽象的、完整的,它是一种“代数学”或“逻辑学”。在检验模型的一致性与完整性,探究模型的含义方面,数学与正统的逻辑学回归它们的老本行。在模型当中,“大概”、“可能”、或“近似于”这一类东西根本没有存在的余地,而且也不起任何作用。对于真空来说,气压是零,而不是“较小”;对于竞争性市场上的产品生产者来说,需求曲线是水平的(斜率为零),而不是“几乎是水平的。”
另一方面,使用模型的原则却又不可能是抽象的和完整的。它们必然是具体的,从而也就必然是不完整的。这是因为,不论人们如何定义“现实世界”,完整性只有在概念性的世界里才会存在,而不可能存在于”现实世界”中。模型是“在太阳之下不存在任何新的东西”这一只有部分真实性的欺人表述的逻辑体现;然而,在应用模型的原则中却不能忽略具有同等重要性的另一个只有部分真实性的欺人表述:“历史永远不会重新开始。”当一理论是一明显地更为一般的理论的一部分时(如落体这一例子中的真空理论一样),在相当程度上,我们可以把模型的应用原则明确地、系统地阐述出来。尽管这时的阐述仍不完整,但却是最容易进行的。为了使一科学尽可能地具有“客观性”。我们的目标应当是尽其所能地对这些原则作以明确、系统的阐述。并不断地扩大可以进行如此阐述的现象范围。但是,不论在这一努力上面我们取得了多么大的成功,总是不可避免地要在实行这些原则时出现新的问题。每一种情况都有其独特之处(而这是那些明文规定的原则所不能—一囊括的。对这些特殊情况加以判断,并对这些特殊情况是否应影响到可观测现象与模型中的实体之间的对应关系加以判断,这需要具备这样一种能力:这种能力不能靠别人的传授来获得。它只能通过实践并置身于一种“正确的”科学氛围中来掌握,而不能机械照搬。正是在这一点上,出现了业余爱好者与专职人员之间的分水岭,这对所有的科学来说都是一样的。也正是在这一点上,体现了怪诞者与科学家之间的微妙差异。 下面这个简单的例子可能会有助于弄清这一点。欧几里得几何学是一个抽象的模型。从逻辑上看它是完整的和一致的。模型中的实体(或称变量)都经过了严格的定义。如一条直线的定义不是一个其长度要比其宽度或深度“大得多”的几何图形,而是一个其宽度与深度为零的图形。它同时也是非常“非现实主义的。”在“现实”中不存在如欧几里得之点、之线、或之面一样的东西。让我们将欧几里得这一抽象模型应用到我们用粉笔在黑板上所作的一个记号上面。这一记号是与欧几里得之线,还是与欧几里得之面,还是与欧几里得之体相一致呢,很明显,如果这一记号正在被用来表示(比如说)一条需求曲线,那么它完全与一直线相一致。但是,如果这一记号正在被用来为(比如说)地图上的国家着色,那么它就不能与直线相一致了,这是因为那将意味着该地图永远也不会具有颜色。为了实现这一目的,这同一记号必须与面相一致。但是,对于粉笔的生产者来说,它却不能与面相一致,因为如果是这样的话,那么粉笔将永远也用不完。出于这种考虑,这同一记号必须与体相一致。在这一简单例子中,上面所提到的那些判断将取得广泛的一致意见。然而,似乎很明确,虽然我们可以对指导这些判断的一般性原则作一系统的阐述,但这些原则永远也不会真正作到包罗万象,囊括每一种可能出现的情况。它们并不具有欧几里得几何学本身所具有的自圆其说、自成体系的特点(
我认为,在谈到一理论的“至关重要的假设”时,我们是在试图对这一抽象模型的关键因素加以阐述。通常,可以用许多不同的方法来对这一模型加以完整的描述。也就是说,存在着许多不同的“基本原理”体系;作为一个整体,它们既包含了模型的內容又为模型的内容所包含。从逻辑学的角度上看它们是等价的:从某一角度来说可以视为一模型的公理或曰基本原理的东西。从另一角度来说也可以视为一模型的定理。
反之亦然(被称为是至关重要的那些特定的“假设”是以下述因素为依据选择出来的:这些‘假设”在阐述模型方面的简洁性或经济性,直观的合理性,及提出假设的能力等(如果仅仅从含义上来看,也就是与人们判断或应用模型有关的那些原则的一部分。
2(“假设”作为理论的间接检验标准所起的作用
在任一假说的表述中通常存在着这样一种情况:用来阐述该假说的那些论段中,哪一些与假设有关,哪一些与含义有关似乎是泾渭分明的。然而,这二者之间的区别却难以准确定义。我认为,这不是由这类假说本身的特点所决定的,而是由该类假说将被用于的对象的特征所决定的。如果确实是这样,那么要想使对这些论述的划分易于进行,就必须确保该假说旨在服务的目的的明确性。在一抽象模型中定理和公理之间互换的可能性,意味着在与这一抽象模型相对应的那个独立的假说中,也存在着“含义”与“假设”之间互换的可能性。但这并不是说任一含义都可以与任一假设互换,而是说那种可以包含其它论述的论述体系可能不止一个。
例如,让我们来看一下寡头行为理论中的一特殊主张,如果我们假定:(1)企业通过各种方法来使其成果最大化,甚至不惜获得或扩大垄断力量。这将意味着,(2)当对某一“产品”的需求存在着地区性的不稳定,运输费用极高,公开的价格协议不合法,且该种产品的生产者为数极少时,他们将会试图建立基点定价体系。由于我们已将市场行为预测接受为本分析的目的,所以我们将论述(1)视作该理论的假设,而将论述(2)视作该理论的内容。如果我们发现(2)中所描述的情况通常与基点定价法结合在一起,那么我们将认为假设(1)是可以接受的;反之亦然。现在让我们将该分析的目的改为:按照谢尔曼反托拉斯法对控制贸易同盟的禁止,确定哪些情况应予上诉。如果我们现在假定:(3)基点定价方法是在(2)中所限定的条件下蓄意产生的一种手段,以利于协同一致(那么这将意味着,(4)参加墓点定价的企业参与了“控制贸易同盟”。先前作为假设的东西现在变成了内容;同样,先前作为内容的东西现在变成了假设。现在,如果我们发现企业参与了基点定价,那么我们将现假设(3)为合理的。当一企业参与基点定价时,通常还会存在其它的证据,如书信、便函等(这些材料将被法庭视为“控制贸易同盟”的证据。
假定该像说服务于第一种目的,即预测市场行为。很清楚,这并不等于说该假说将服务于第二种目的,即预测是否存在足够的证据来证实“控制贸易同盟”的存在,从而确定法院所应采取的行动。反之,如果该假设服务于第二个目的,这同样不等于说它将服务于第一个目的。然而,在缺乏其它证据的情况下,该假设服务于一种目的所取得的成功(在解释一类现象方面所取得的成功),与该假说服务于另一种目的所可能取得的成功相比(即在解释另一类现象方面所取得的成功),前者将给我们带来更大的信心。要想具体说明前者所证实的把握性比后者到底大多少,将更为困难。这是因为这取决于我们对这二类现象之间相互联系的紧密程度的判断;而这本身又将通过复杂的途径而取决于某些同种的间接证据——即在通过单纯的理论现象进行解释时我们所具有的在其它方面的经历。而这些单纯的理论现象在某种程度上又是同样纷呈复杂的。
为了更进一步地阐述这一观点,我们可以通过那些被称作一假说的假设的东西,来取得一些间接证据。这些间接证据是关于一假说的可接受性的。上述结论仅在如下意义上才能成立:假设本身可以被视作等同于该假说的含义。因为这样一来,假设与现实的一致性就可以被视作等同于人们在试图证明某些含义与现实相抵触时所遭到的失败。或者说上述结论仅在如下意义上才能成立:这些假设可能使人们想起该假说中另外一些易受偶然的实际观察所影响的含义。之所以说这一证据是间接的,是因为这些假设或该假说的各种含义所指的那一类现象,通常不同于该假说旨在说明的那一类现象。的确,如我们前面所讲的那样,这一点似乎是我们在确定哪些论述应冠之以“假设”,而哪些论断应冠之以“含义”时所依据的主要标准。这一间接证据所具有的重要性,取决于我们对这两类现象之间相互联系的紧密程度的判断。
一假说的“假设”为该假说提供间接检验的另一种途径是:找出该假说与其它假说之间的相互关系,从而使得正待接受检验的该假说的合理性与其它假说的合理性的证据联系起来。例如,一假说正在对某一特殊种类的行为作出解释。同以前一样,我们也可以不限定任何“假设”而对该假说加以阐述(但是,假定我们能够证明该假说与某一假设体系是等价的,并且这一假设体系中还包括了人人都在追求自己的利益这一假设,那么,这一假说就可以通过与它具有同样假设的那些假说在其它种类现象上的成功,而间接地获得其合理性;即使不能的话,我们这里所作的探索也不会完全是前无古人后无来者的,至少不会是在任何方面都一无所获。实际上;为引出表面上互不相同的假说之间的相互关系而对假设所作的这番研究,正是我们在通向一个更为一般化假说的道路上迈出的一步。
从相关的假说中导出的这种间接证据,在很大程度上说明了持有不同背景的人,在对某一特定假说的信任程度上的差异。例如,让我们来考虑这样一个假说:在某一特定地区或行业内,在就业问题上所存在的种族或宗教歧视,与该地区或该行业中的垄断程度密切相关。也就是说,如果该行业不是垄断性质的而是竞争性的,那么,只有在就业者的种族或宗教影响到其它就业者与他们一起工作的情愿性,或影响到消费者对他们所生产的产品的接受性,而与雇主的偏见毫不相关时,才可能存在较为严重的种族歧视。这一假说对于经济学家所具有的吸引力将远远大于它对于社会学家所具有的吸引力。这一假说可能被说成是“假定”在竞争性的行业里,雇主一门心思地追求其在金钱方向的利益;而且,这一“假设”适用于许多经济假说。这些经济假说,涉及的是经济学所要研究的许多大宗现象。所以,在经济学家看来,这一假设同样地也适合于我们所讲的这一情况,似乎是合情合理的。另一方面,为社会学家所熟悉的那些假说其模型或曰理想世界与此是截然不同的。在他们的模型或理想世界中,一门心思地对金钱方面的个人利益的追求只起到非常小的作用。对于社会学家来说,在这一假说问题上可得的间接证据,对于该假说并不十分有利;而对于经济学家来说,在这一假说问题上可得的间接证据,对于该假说的有利程度与前者相比则要大得多。所以,社会学家对该假说可能持有较大的怀疑态度。
当然,一经济学家的证据与社会学家的证据都不是决定性的。该假说对于它旨在说明的现象来说是合起作用这才是决定性的检验。但是,在做出任何令人满意的决定性检验之前,还需要作出一种判断。而且,很有可能,如果这种检验不能很快地作出时,在这种情况下,这一判断将不得不以可得到的不充分的证据为依据来进行。此外,即使这样的检验可以作出,科学家们的背景情况对于他们所取得的判断来说也不是完全不相干的(在科学中永远不存在一定的东西(证据对一假说所起的肯定的或否定的作用,永远不能说是完全“客观的”。在判断假说的含义与实际情况的一致性方面,经济学家要比社会学家更为“宽容”,而且较少的几个“一致性”事例就可以促使他暂时地接受假说。
5(经济学中的某些含义问题
我们一直在进行讨论的这些抽象的方法论问题,与人们对“正统的”经济理论作为一种“非现实主义的”理论所进行的旷日持久的批评,及人们对为迎合这一批评的要求而重新构造理论的种种尝试所进行的旷日持久的批评之间,有些直接的联系。经济学是一种“沉闷无趣的”科学,因为它假定人是自私的和唯利是图的,人是“欢乐与痛苦的计算器,且其计算速度如闪电一般。人这架计算器,就象一粒充满着幸福渴望的水珠一样,在某些使他游离于幸福与痛苦之间的动因的作用下,振荡不已,但在这当中人是不变的。”说经济学是一门“沉闷无趣的”科学,还因为经济学是建立在旧心理学的基础之上的,从而必须随着心理学的新发展而同步改进。第三点原因在于经济学假定人(至少对于商人来说是这样)总是处于“一种连续的警觉状态”,一旦他们那敏感的直觉嗅察到了供给与需求状况的变化,他们将立即改变价格或改变定价原则。第四点原因在于,经济学假定市场是完美的,竞争是纯粹的,而且商品、劳动力与资本等都是同质的。
正如我们所看到的,除非这一类的批评得到了下面这一证据的补充说明,否则的话将主要集中在其它方面。这一证据就是:存在着某一种假说,它与正在受到批评的理论在上述那些方面中的某一方面上并不相同的,然而该假说在较大范围的现象的预测上取得了较好的成果(然而大部分的此类批评都没有这种证据作为补充;它们几乎全部地取决于“假设”与“现实世界”之间所谓的直接可见的差异。最近一段时间人们对成果最大化假说所作的批评,为说明上述问题提供了明显的例证(这一批评的理论依据就是商人没有,而且确实也不可能象该理论所“假设”的那样去做。被用来作为该论断的佐证的证据,通常来自于两个方面。或者是来自于商人对影响其决策的因素问题的回答——这是检验经济理论的一种程序,这种程序与通过向80岁的老人询问长寿的秘诀来检验长寿理论的作法别无二致。或者是来自于对单个企业的决策活动所作的描述性研究。一方面,人们很少(如果曾有过的话)能够提供这样的佐证:这里的证据是关于商人的实际行为与正在受到批评的假说的含义之间的一致性问题的,即是关于商人的所作而不是关于商人的所说的证据。另一方面,人们也很少(如果曾有过的话)能够提供这样的佐证:这里的证据是关于商人的实际行为与另一假说的含义之间的一致性问题的。
就人们时常对一理论或其“假设”所赋予的直接描述性而言,一理论或其“假设”不可能是完全“现实主义的”。关于麦子市场的一个完全“现实主义的”理论,不仅需要包括直接决定麦子的供给与需求的那些情况,而且还需要包括用于交易的现金或信用工具的种类。此外还有:交易者的头发与眼睛的颜色,他的祖先及受教育程度,他的家庭人数,他家庭成员的特征,祖先,受教育程度等个人特征;种植麦子的土壤种类,土壤的物理及化学属性,在生长期内的主要天气情况;种植小麦的农民及最终食用小麦的消费者的个人特征,等等,等等,无穷无尽。为达到这样一种“真实”而作的过分努力,都只会使该理论失去真实有用的作用。
当然,部分地说,完全现实的理论这一想法不过是一个稻草人。没有哪位理论批评家会以这一逻辑极端作为目标。任何一种理论批评都可能这样说:正受到批评的这一理论的“假设”“太”脱离现实了;而它的目标是这样一种假设体系:尽管不是完全地毫无创造性地追求真实,但要比正受到批评的这些假设“更为”真实一些。但是,只要“真实性”的检验标准是“假设”的直接可见的描述准确度,则不存在进行上述区分的依据,那永远也不会存在前一段所描述的那个稻草人。例如,“真实性”的检验标准可能是这样一些实际观察:“商人似乎并不象边际理论所描绘的那么贪婪,那么精悍,那么富有逻辑性”;或者,“在当前的情况下,对于多工序工厂的管理者来说,试图算出每一生产要素的边际成本与边际收益,并使二者相等这将是绝对不可行的。”判断某一特定的偏离现实情况是否可以接受的标准是什么呢,在分析商业行为时,为什么忽视商人的成本大小比忽视商人的眼睛的颜色更为“不现实”呢,答案很明确,这是因为对于商业行为来说,省略前者会比省略后者带来更大的偏差。但是,简单地通过商人之间确实存在着成本大小的不同及眼睛颜色的差别这一观察,并不能使我们知道这一点。很清楚,将一种因素考虑进来与将另一种因素考虑进来将会对偏差产生不同的影响。而我们唯有通过它们对实际行为与预测行为之间的偏差的影响的比较,才能知道上述答案。这样一来,即使是真实性假设的最极端的拥护者,当他们对各种假设按真实程度大小加以划分时,也必然要被迫放弃他们的标准,而接受通过预测的检验标准。
描述方面的准确性与分析方面的相关性之间的根本性混淆,构成了大部分经济理论批评的主要内容。这些经济理论批评是关于理论假设的非现实性的。这一根本性的混淆及导致这一混淆的那些观点的正确性问题,都在一篇关于商业循环的文章中得到了充分的说明。这一篇文章中有这样一段似乎是无害的评述:“经济现象是变幻莫测、纷繁复杂的,所以,任何一种能与现实紧密地结合起来的关于商业循环的综合性理论,都必定是极为复杂的。”科学的一个基本的假说就是:现象是具有欺骗性的,而且我们可以通过某种方法而对证据加以考察、解释或组织。从这些证据中我们将发现那些表面上直不相关、各不相同的现象事实上却是一种更为基本且相当简单的结构的表现形式。而且,对这一假说加以检验的标准,同其它假说的检验标准一样,是它所取得的成果——即迄今为止科学所取得的巨大成就。如果某类‘经济现象”看起来好象是变
幻莫测、纷繁复杂的,那么我们只好这样假定:这是因为我们没有适当的理论来对它们作出解释。我们决不可能把已知的事实放在这一边而把“与现实紧密结合的”理论放在另一边。理论是我们“透视”事实的桥梁,而且如果没有理论,我们将不能透视事实。“经济现象是变幻莫测、纷繁复杂的”这种主张,否定了知识的试验性状态,殊不知这种状态本身也可以使科学活动富有意义;这种主张与约翰?斯图尔特?穆勒的以下完全荒谬的观点同属一类。穆勒认为:“很幸运,在价值法则中不存在任何有待于现在(1848年)或将来的作者来加以澄清的东西;关于这一问题的理论是完美的。”
描述方面的准确性与分析方面的相关性之间的混淆,不仅导致了在许多不相关的方面对经济理论所作的批评,而且还导致了对经济理论的误解及在弥补所谓的缺陷的努力中方向性错误。由经济理论家们提出的抽象模型中的“理想类别”,已经被视为严格的描述性的分类。这些描述性的分类将直接地、完全地与现实世界中的现象实体相对应,而独立于该模型的使用目的。而描述性的分类与现实世界中的现象实体之间存在的明显的偏差,导致了在构造理论的努力上的不可避免的失败,这是因为,重新构造理论的努力是以这些意在具有充分的描述性的分类为基础的。
人们对“完全竞争”与“垄断”概念所作的解释,及“垄断性的”或“不完全竞争的”理论的发展,可能再清楚不过地说明了这种倾向。据说,马歇尔假定存在“完全竞争”;可能曾经有过这种消沉。但是,很明显,现在已经不再存在这种情况了。所以,我们必须放弃马歇尔的理论。读者可能将不辞劳苦地到处搜寻(我预言这将是徒劳的),试图在马歇尔的著作中找到关于完全竞争的明确假设,或任何这样的主张:从描述的角度来说,世界是由参与完全竞争的基本单位——企业所组成的。然而,读者将发现马歇尔的如下论述:“在一个极端上,存在着这样的世界市场,在这个世界市场里,竞争直接地从地球的每一部分展开;而在另一个极端上。存在着这样的封闭市场,在这个封闭性的市场里,所有来自远方的直接竞争都被排斥在外,然而即使在这样的市场中,人们仍然可以感觉到间接竞争与传导性的竞争之存在。而且在这两个极端之间还存在着大量的其它种类的市场,这种市场的情况还有待于经济学家和商人的进一步研究。”马歇尔按照世界的本来面目来描述世界;他所追求的是为分析世界开辟道路,而不是使现实世界得到摄影般精确的再现。
在按照世界的本来面目而对世界进行的分析中,马歇尔构造了这样一个假说:在很多问题中,众多的企业将被组合成“部门”,这样做的目的是使得每一集团中各企业之间的相同之处远远胜于它们之间的差异。这些问题通常都具有这样的特点,即下述情况对于它们来说同样是重要的:企业集团也将受到某些变动的影响,如对它们的产品的需求方面的变动。或者生产要素供给方面的变动。但是,并不是所有的问题中都存在这种情况,也就是说,上述重要情况可能是只作用于某些特殊企业的个别影响。
与这一假说相对应的抽象模型,包含着两种“理想的”企业类型:作为基本单位的竞争性企业(这些企业将组合成部门)与垄断性企业。在所有其它企业的价格一定的条件下,如果对该企业产品的需求曲线相对于该企业的产品价格来说具有无限弹性的话(这适用于某些价格及全部产量),那么该企业则是竞争性的。它隶属于某一“部门”,这种部门的定义是生产单一“产品”的企业集团。这里“产品”的定义是那些对于购买者来说具有完全的替代性的产品的集合。所以,某一企业的产品相对于同部门中另一企业的价格的需求弹性,对于某些价格和某些产量来说是无限的。囫如果某企业产品的需求曲线对其所有产品的某种价格皆不具有无限弹性,那么该企业则是垄断性的。对于垄断性的企业来说,企业就是部门。
同往常一样,作为一个整体该假说不仅包含了这一抽象模型及其理想的企业类别,而且还包含了一系列原则——这些原则大部分是含蓄的且通过例证来体现。这些原则系列是为使实际生活中的企业与这种或那种理想类型相一致,及为将企业划归部门而设立的。这些理想类型本来并不是描述性的;它们最初的使命是对那些对某一特定问题来说极为重要的特征加以区分。即使我们可以对某企业的产品需求曲线作出直接的、
准确的估计,我们也不可能立即进行如下划分:按照需求曲线的无限弹性及非无限弹性来划分完全竞争企业与垄断企业。我们实际观察到的那些需求曲线没有哪一个是绝对水平的。所以,我们所能估算出的弹性永远也不会是无限的。所以,真正相关的永远是这样一个问题:某一弹性是否“足够”大,从而可以被看作是无限的。但是,对于这一问题,我们不能简单地通过弹性数值本身来作出一劳永逸的回答。正如我们不能永久性地断言:对于公式S=1/2 gt 2的应用来说,每平方吋15磅的气压是否是“足够地”趋近千零。同样,我们也无法计算出需求的交叉弹性,进而按照?需求的交叉弹性之间的差异”来将企业划归部门。正如马歇尔所述:“不同产品(即不同部门)之间的区分应如何确定这一问题,必须从便于某种讨论的角度来加以解决。这决定了所有的问题;同一企业在一种问题中被当作完全竞争者来看待,而在另一种问题中又被当作垄断者来看待,在这当中并不存在任何不一致的地方。
正如同一个粉笔记号在一种问题中被看作是欧几里得直线,在另一种问题中被看作是欧几里得面,而在第三种问题中被看作是欧几里得体一样,这当中并不存在任何不一致的地方。需求的弹性与需求的交叉弹性的大小。生产物理性能相同的产品的企业的数量,等等,都与问题密切相关。这是因为,这些因素属于(或者说可以属于)下述变量的一部分。这些变量将被用来确定某一特定问题中理想实体与实际实体之间的相互关系;并限定该理论得以充分成立的前提条件。但是,这些变量并不能一劳永逸地确定企业在完全竞争与垄断之间类型的划分,
下面这个例子可能会有助于说明这一点(假定现在有这样一个问题:要确定联邦香烟税的增加(被预期为永久性的增加)对香烟零售价格的影响。我冒昧地提出这样的预见:如果想得到大致正确的结果,就必须这样来看待香烟企业,即好象它们正在生产一种没有差别的产品且正处于完全竞争之中。当然,在这种情况下,“必须建立某些协议”,如对切斯特菲尔德香烟的数量加以限定。这里,“切斯特菲尔德香烟被看作是与马尔巴勒香烟等价的。”
另一方面,香烟企业将犹如完全竞争企业一般行动这一假说,对于二次世界大战中香烟企业对于价格控制的反应来说,应该是一个错误的指导,而且毫无疑问,在此之前人们一定已经认识到了这一点。战争期间,香烟企业的成本一定会上升。在这种情况下,完全竞争者一定会减少原有价格下的销售量。但是,战时公众收入的增加又会增加那一价格下的需求量。在完全竞争的情况下,严格固有法定价格将意味着“短缺”的出现及香烟生产数量的绝对下降。这里“短缺”的含义是需求数量超过了供给数量。事实否定了这一特定含义:人们将很好地、合理地坚持最大化香烟价格;而生产数量将大幅度地增加。成本上升这一共同性力量,大概不如每一企业对保住其市场份额及商标名望与价值这种愿望的破坏性力量来得强烈。特别是当超额所得税将这一类广告成本的很大份额转嫁到了政府头上时,则更为如此。对于这一问题来说,我们不能把香烟企业假设为完全的竞争者,并以此来对待它们。
小麦的种植常常被用来作为完全竞争的例证。然而,虽然对于某些问题来说,假设香烟企业组成了一个完全竞争的部门,并以此来对待它们是适当的;但是,对于某些问题来说,假设小麦的生产者是完全的竞争者并以此来对待他们则是不适当的。例如,如果现在所要考虑的问题是当地的谷物加工者所支付的麦价之间的差异,那么上述假说则是不适当的。
在那些某一企业集团受到共同因素的影响,及企业可以被假设为完全竞争者并以此来对待的问题中,马歇尔的理论分析被证明是最为有用的。从某种描述性的意义上说,这就是歇尔“假定”完全竞争这一误解的根源。如果能够创立一种比马歇尔的假说更为一般化的理论,即能同时对下述两种情况加以考虑的理论,那将是极为理想的。在一种情况中,产品的差别及企业数量的稀少会带来本质上的不同;而在另一种情况中,产品的差别及企业数量的稀少则不会带来本质上的不同。这样一种理论将使得我们能够解决那些目前尚不能解决的问题。此外还将使得我们能够更好地确定前一种较为简单的理论的适用范围,即在哪些情况
下该理论才能被看作是现实世界的一个足够好的近似。为了能够起到这两方面的作用,这一更为一般化的理论必须具有要义与实质;它必须使其含义接受实践的考验,并具有极大的影响力与重耍性。
由张伯伦、鲁宾逊二人所提出的不完全竞争或称垄断性竞争理论,就是为创立这样一种更为一般化的理论所作的尝试。不幸的是,他们所提出的这一理论不具备成为真正有价值的一般化理论所必须的特征。他们的理论贡献主要局限于如下几个方面:完善了人们对单个企业经济学所作的阐述,从而完善了人们对马歇尔模型含义的推导;完善了马歇尔的垄断分析,并丰富了可用来描绘部门情况的词汇构成。
这一理论的不完善之处特别明显地表现在它对涉及到企业集团(即马歇尔部门)的问题的处理上,或者说它在这类问题上无能为力。只要坚持认为产品之间的差异是实质性的,并坚持认为该理论对这一点的坚持正是该理论的卓越之所在,那么,通过生产同一产品的企业而对部门所下的定义则不再适于应用。按照这个定义,每一企业都是一个独立的部门。而通过“紧密的”替代品或交叉弹性之间“较大的”差异这些词语所下的定义,则避开了这一问题。同时,这种定义将一些含糊不清、无法限定的东西引入抽象模型,而在其中找不到可与之相对应的类型。这种定义的唯一作用就是使得该理论在分析上毫无意义——这是因为“紧密的”与“较大的”这种表述与“较小的”气压同属一类。在某一情况下,张伯伦不明确地将部门定义为具有相同的成本曲线与需求曲线的企业集团。但是,同样,只要产品之间的差异是(如他们所主张的那样)实质性的且不能置之不理,那么这种定义在逻辑上也是毫无意义的。“生产推土机的企业的成本与需求曲线,同生产发夹的企业的成本与需求曲线相一致”这句话的含义是什么呢。而且,如果它对于推土机与发夹来说是毫无意义的,那么,只要人们仍坚持认为两种牌子的牙膏之间的差异是非常重要的。则它对于这两种牌子的牙膏来说同样也是毫无意义的。
垄断性竞争这一理论,对干部门分析来说没有提供任何帮助,而且没有提出任何中间情况以介于企业(在一个极端上)与总均衡(在另一个极端上)之间。所以。它没能推进对许多重要问题所进行的分析。第一种极端情况面太窄从而无法具有较大的实用性;第二种极端情况面太宽从而无法确保有意义的概括性。
6(结论
经济学作为一门实证科学,是一种暂时被接受的、关于经济现象的概括体系。这一概括体系可以被用来对情况变动的影响作出预测。人类在扩展这一概括体系,增强我们对其合理性的信赖,及改进其预测的精确程度等方面所取得的进步,受到了下述两种因素的阻碍:一是所有知识探索的人类能力方面的有限性,二是社会科学中所存在的种种桎梏。这些桎梏对于一般性的社会科学来说影响极大,而且对于作为社会科学的一种的经济学来说也特别重要。上述说法中绝无过分挑剔的成分。人们对经济学课题的熟悉,促成了人们对关于这一方面的专门知识的轻视。经济学的中心议题对日常生活的重要性及对公共政策中大部分问题的重要性,妨碍了经济学的客观性,并造成了科学分析与规范判断之间的混淆。依据未经控制的实践而不是依据受到控制的实践的必要性,使得为证明试验性假说的可接受性而创造大量的、准确的证据成为困难。虽然对未经控制的实践的依赖并不影响这一基本的方法论原则:一假说唯有通过它的含义或预测与可观测的现象之间的一致性才能够得到检验;但是,这种依赖确实使得检验假说的任务更为艰巨,且使得在所涉及的方法论原则方面出现了更大程度的混乱。与其他科学家相比,社会科学家在其方法论方面需要具有更强烈的自我意识。
一种业已流行甚广且危害甚大的混淆现象就是人们在关于“假设”在经济分析中的作用问题上的混淆。任何一种有意义的科学假说或理论都将一无例外地作出这样的声明:某些力量在理解某一特定种类的现象中是重要的,而另外一些力量则是不重要的。通过下述方法来表述这样一种假说通常是非常便利的:声言该假说旨在预测的这种现象在进行实际观测的世界中的行为方式,就犹如它们在一假设的、高度简化了的世
界中的行为方式一般。这一高度简化了的世界只包含该假说认为是重要的那些力量。一般说来,进行这样一种描述的方法不止一种——即对这种理论进行表述所忧助的“假设”体系不止一种。对这样一些假设所作的选择,通常是出于下述两个方面的考虑:一是它们在表述该假说方面的简便性、清晰性及准确性;二是它们带来间接证据的能力。假设可以为假说的合理性带来间接证据这一说法,是出于下面几种考虑:假设可以使人们联想到该假说的某些含义已经可以为观察所检验;假设可以导出该假说与其它一些解决相关问题的假说之间的相互联系,等等。
这样一种理论不能通过直接地将其“假设”与“现实”加以比较来进行检验。的确,不存在任何一种进行该种检验的有效方法。完全的“真实性”是明显地无法达到的;而某一理论是否“足够”真实这一问题,只有通过考察该理论所取得的预测,对于我们所要解决的问题来说,是否是足够令人满意的,或者是否是比来自于其它假说的预测更令人满意来作出回答。然而,一理论可以通过其假设的真实性来检验,而不必考虑其预测的准确性这种看法,已经厂为流传,并成为经济理论因其非现实性而遭受的旷日持久的批评的根源所在。这些批评大多是不相关的。从而,由这种批评所促动的经济理论改革也大多是不成功的。
当然,如此众多的经济理论批评的不相关性并不意味着现存经济理论的高度可信性。这些批评可能无的放矢,但也可能存在着放矢之的。从小的方面来看当然明显地存在着这种可能性。任何一种理论都必然是暂时性的,且将随着知识的进步而置于变化之中。即使撇开这种老生常谈不论,我们也有必要使“现存经济理论”的内容更为特定,并对经济理论的各种分枝加以区分;经济理论的某些部分明显地要比其它部分具有更高的可信度。如果确实可能的话,那么,对实证经济学的现状作出综合性的评价,对与实证经济学的合理性相关的证据加以概括,及对实证经济学每一部分所应具有的相对可信度加以估计等项工作,将是一部专著或一系列专著才能完成的任务,而绝非一篇方法论的短文所能胜任。
在这里,我所能做到的只是概略地表述一下我个人的观点。在我看来,现有的相对价格理论极富成果,而且对于具有西方国家特色的这种经济体系来说又享有很高的可信程度。这一相对价格理论的主要任务是解释资源在各种最终用途之间的分配问题,及生产成果在相互联系的各种资源之间的划分问题。马歇尔的《经济学原理》一书基本上奠定了相对价格理论的现有结构。尽管似乎存在着相当的分歧,但在我看来,现有的静态货币理论也同样地极富成果,并享有很高的可信程度。现有的静态货币理论的主要任务,是解释绝对价格、总产量及其它变量对于经济总体来说所具有的结构性或长期性水平。现有的静态货币理论是以货币数量理论的形式为核心,并经历了从戴维?休姆到剑桥学派,到欧文?费雪,到约翰?梅纳德?凯恩斯的一系列重大演变过程。在我看来,目前经济理论中最薄弱、最不令人满意的环节在于货币的动态分析。货币的动态分析所涉及的是经济整体对于情况的变动所采取的调整过程问题,亦即涉及的是总体活动的短期波动问题。在这一领域内,我们甚至还没有形成一种可适当地称作现有的货币动态分析的理论。
当然,即使在相对价格理论与静态货币理论中,也仍然存在着扩展现有理论的范围与改进现有理论的准确性等方面的余地,而且这种余地是相当大的。特别地,对“假设”的描述真实性问题的不适当的重视,已经导致了人们对决定各种假说的合理性限制条件的关键问题的忽略。而上述各种假说又共同地构成了这些领域内的现有经济理论。与这些假说相对应的抽象模型,也已经得到了相当的完善与深化,并且在严格性与准确性方面也有了巨大的进展。关于我们的经济体制及其运行方面的描述性材料也已经以前所未有的规模得到了极大的丰富。这些成就都大有禆益。但是,如果我们想要实际地使用这些抽象模型与描述性材料,则还需要作相当的探索。我们需要探索的问题在于进行下述判断的标准问题,即如何确定:对于某种特定的问题来说,使用哪一种抽象模型才是最好的,一抽象模型中的哪些类型将与可观测的实际类型相一致;该问题或该种情况的哪些特征对预测的精确度影响最大——这里的预测是由某一特定假说或理论作出的。
实证经济学的进步不仅要求对现有假说进行验证并加以完善,而且还要求不断地创立新的假说。对于这一
问题我们尚缺乏正式的结论。假说的创立是一项精神、直观与发明的创造性活动;其实质就是要在众所熟知的材料中发掘新意。这一过程必须归在心理学当中进行讨论,而不应列在逻辑学当中进行研究。这一过程必须借助于自传与传记来研究,而不应从科学方法的专著中寻找答案;这一过程必须经由公理与事例所推动,而不应由定理或原则所导出。
版权:芝加哥大学,1953年。
有部分来源于密尔顿?弗里德曼的著作:《政治经济学论文集》(芝加哥;芝加哥大学出版社,1953年)。
在这一篇里,我全面地溶入了我的那篇简短的‘综述”文章的内容,而并没有作特别的提及。我的《综述》一文见于B?F?海雷编辑的《当代经济学考察》,第五册(芝加哥:理查德?D?欧文有限公司,1952年),第455,457页。
我很感激多萝西?S?布雷迪,阿瑟?F?伯恩斯,及乔治?J?斯蒂格勒对本篇编纂工作所提出的宝贵意见与批评。
范文二:实证经济学方法论
实证经济学方法论 米尔顿??弗里德曼 约翰??内维尔??凯恩斯(John Neville Keynes)在其名著《政治经济学的范围与方法》一书中,区分了实证科学、规范科学以及方法、技巧问题。他认为:“实证科学……是讨论?是什么?这类问题的一套系统的知识体系;而规范科学或也是规制科学……则是讨论?应该是什么?这类问题之取舍标准的知识体系……而(经济学)方法、技巧……则是未达到既定目标的一系列原则。”凯恩斯评论道:“有关以上三者的混淆相当普遍,并且成为众多有意无意错误的根本原因。”与此同时,他还认为“确立政治经济学作为一门独特的实证科学的认识”意义重大。 本文将主要讨论在创建凯恩斯意义上的“独特的实证科学”过程中,出现的某些方法论问题。具体来说,就是研究如何判定一个假说或者理论,是否应该被暂时地纳入“?是什么?这类问题的系统知识体系”的一部分。但是凯恩斯所不愿意看到的这类混淆却又如此之普遍,它极大的妨碍了人们确立经济学能够成为——并且一定程度上确实是——一门实证科学的认识。所以,在文章的主要部分展开之前,大体讨论一下实证科学与规范科学的关系似乎比较合适。 1.实证经济学与规范经济学的关系 某种程度上,实证经济学与规范经济学的混淆不可避免。就几乎每个经济学研究者而言,其所关注的问题与他们自身都极为攸关,并且也是自己经验之内和能力所及的。而这一点却成为无休止的争论和广泛分歧的根源,也成了频繁立法的契机。那些自诩为“专家”的意见分歧相当大,很难保证他们都是不偏不倚、毫无偏见。无论如何,在那些事关重大的问题上,即使所有“专家”意见相近而且也无明显利害关系,我们也很难完全不加考虑的接受他们的观点。实证经济学的结论似乎是,而且确实与重要的规范问题密切相关,也涉及应该做什么以及如何实现既定目标等问题。专家与外行一样,都不可避免的有如下倾向:即调整相应的实证结论以支持自己先入为主的成见,同时又拒绝那些有悖于其自身的规范性判断或立场的结论。 大体而言。实证经济学独立于任何特定的伦理立场和规范判断。正如凯恩斯所说,它关心的问题是“是什么”,而不是“应该是什么”。其任务在于提供一套能够正确预测环境的细微变化如何影响结果的一般化体系。通过与实际状况的比较,从预测的精确程度、范围是否相当、结论是否一致三个方面,将可以评判此体系的预测能力。简而言之,实证经济学是,或者说可以是一门“客观的”科学。就“客观性”而言,其同任何一门自然并无二致。当然,经济学涉及的是人与人之间的关系,而且调查研究者本身就是被调查研究事物的一部分。于是,与自然科学相比,社会调查更加具有私我性,相应客观性可能就大打折扣。然而,这却也正使得社会科学家可以得到一系列自然科学家无法得到的数据。但以我之见,以上两点都还不是这两类科学之间的根本差异所在。 另一方面,规范经济学及经济学的方法、技巧亦不能独立于实证经济学。任何呓崧鄱疾豢杀苊獾匾诓扇?持帧?瞧渌卸畋鹩跋斓脑げ猓げ庠虮囟ɑ峄蚨嗷蛏俚刂哺谑抵ぞ醚А,比唬呓崧塾胧抵ぞ媒崧壑洳?淮嬖谝灰欢杂叵担裨蚓筒槐赜械ザ婪至?墓娣毒醚А,礁龈鎏宥阅诚盍?赡艿慕峁蛐聿?抟煲椤,渲幸桓隹赡苋衔?ń峁欣谄胶猓ふ庀盍?ǎ欢硗庖桓鋈慈衔饨峁遣缓弦獾模
炊哉庀盍?ā?因此,我斗胆提出如下判断,即:目前西方世界,尤其是美国,毫无偏见的公民之间存在的有关经济政策的分歧,只要源于人们对行为的经济后果的预测有差异;理论上,通过实证经济学的进步,以上分歧是可以予以消除的;相反,分歧不是有人们基本价值观立场的差异引起的,价值观差异最终也只能通过斗
争予以解决。一个显而易见却又相当重要的例子就是最低工资法的问题。尽管存在各种各样支持或反对该立法的论点,而且讨论中广泛使用的“生存工资”概念又如此模糊不清,但所有政论方背后却都对应一个“生存工资”并无异议。分歧主要源于:各方在预测立法最终能够实现普遍认同的生存工资之一目标的效果上,存在着或隐或现的差异。法定最低工资的支持者们认为(即预测),该法案最终能够减少在最低工资线以下和一些收入略高于最低工资线的贫困人口,同时却又未相应的增加完全失业人口数量,并且也没有损害低收入阶层在找工作上的竞争力。而该立法的反对者却认为(即预测),由于法定最低工资给就业人口带来的收入提高,无法弥补失业人口增加及就业条件恶化,进而最终该法案加剧了贫困。及时就该法案立法的经济影响上的人是不存在分歧,还是无法企求就法案的合宜性问题上各方看法一致,因为仍然还必须考虑该立法政治或社会影响等问题。因而,即使目标一致,实现最终的一致同意需要走的路仍旧相当长。 工会的适当作用及其地位问题上的各种不同意见,对直接的价格、工资管制的合宜性及关税等问题上的认识存在广泛分歧,都与相应实证分析中分歧密切相关。就政府对产业规制的合宜性和必要性人们意见纷争,甚至这也引发是否应当以社会主义取代私人企业的争论等问题,这些很大程度上却都是由于对所谓的“规模经济”重要性的预测上有差异。而且此类事例不胜枚举。当然,我的主张,即西方社会中人们在经济政策问题上的主要分歧大体上都是如上类型,其本身就是一种“实证”阐述,它是否能够被接受还有待于经验证据的检验。 如果以上主张站得住脚,那么有关“正确的”经济政策的一致意见将不是取决于规范经济学的发展,而更多的有赖于实证经济学的发展,其所得出的结论也应当被广泛接受。这也意味着之所以必须建立明显有别于规范经济学的实证经济学,正是在于其将有利于促进政策问题上的一致意见。 2.实证经济学 实证科学的终极目标就是要提出一种“理论”或“假说”,能够对尚未观察到的现象作出合理、有意义的(而非老生常谈式的)预测。总体说来,这种理论应该是有两类基本要素构成的复杂混合体,其中部分是一套有助于发展“系统的、有组织的推理方法”的语言,而剩下部分则是一系列具体假说,后者旨在从纷繁复杂的现实中抽象出事物关键特征。
作为一种语言,理论不具有任何实质性内容,而仅是一系列套套逻辑(同义反复的词语的综合体)。其功能在于为组织和理解经验材料提供分类整理依据,而用以检验这一角色的优劣也应该是依据相应的分类体系标准。诸如,类别的定义是否清楚、准确,依以上分类的划分是否穷尽了所有可能性,是否能够将每一单个项目都归于具体一类吗,或者,这其中是否存在这相当程度的模棱两可现象呢,这套体系大标题及次标题的设计是否兄谘杆僬业剿枰奶跄浚恢劣诘酱λ蜒靶枰哪谌菽兀课颐撬芯康奶跄渴欠穸家驯嗯诺揭黄鹆四兀勘嗯欧掷嘞低呈欠褚丫懦舜碜鄹丛拥慕徊嬉梦侍饽兀?以上问题的回答部分地出于逻辑上的考虑,却又和事实脱不了干系。单一的正式逻辑规则就是可以揭示特定语言本身是否完备和前后一致,也就是说,可以判断该语言中的命题“正确”与否。事实证据本身则可以说明“分类编排系统”的各个分类是否具有有意义的经验对应物,亦即在分析某类具体问题时是否有所助益。“供给”与“需求”这一简单的例子能够说明以上提到的事实性和一系列逻辑问题。作为经济理论语言的构成要素,供给与需求归纳了影响产品和生产要素相对价格的诸因素。这种二分法的有效性取决于如下经验性归纳事实:即“分析任何一问题时,分别可以列举一系列的影响供给和需求的共性因素”。这种
概括对于类似的最终消费品市场都是合理有效的。在这类市场中,经济个体可以被清楚地分为产品供给方和需求方两类。通常很少出现某因素一方面影响供给,另一方面却有影响需求的现象。并且也无需考虑两类别之间的交叉互指效应。这样,将相关影响因素分别归入既简单又明了的“供给”、“需求”两个类别下,将极大的简化所处理的问题,同时又避免可能出现的差错。但是,此类概括并非总是合理的。例如,就投机性市场中的每日价格波动而言,以上概括就不是合理的。例如,有关提高超额利润税的谣传,应该被归入主要作用于当天公司股票供给方,还是应当被看作主要是针对股票需求方的影响呢,类似情况下,几乎对每一因素而言,却似乎都有将其纳入“供给”类抑或“需求”类的适当理由。这两个概念仍旧可以使用并且亦非一文不名,也还算“正确”,然则与第一个例子相比其实用性却明显小得多,这是因为它们缺乏有意义的经验对应物。 作为一个独立的假说体系,理论应该通过对其意在加以“解释”的哪一类现象的预测能力来判断。唯有实际证据才能证明理论是“正确的”还是“错误的”,或者更为确切的说,是否应当暂时的“接受”或者“拒绝”该理论。以下我将用大段篇章论证对一假说合理性的检验,将直接有赖于其预测与实际经验的对比。如果假说的预测(相比于其他假说更加“频繁地”或更经常地)与实践相抵触,那么就可以拒绝接受该假说。若假说的预测与时间一致,那么则可以接受之。又若假说业已多次成功的避免了可能出现的矛盾、不一致现象,那么其就应具有较大的可信度。事实证据永远不可能“证实”一个假说,而仅仅只能无法证伪假说,或者某种意义上也并非十分准确,当我们说到某种假说在实践中已经得到了“确认”时,我们通常所指的就是这个意思。 为了避免误会,可能有必要明确一下,用以检验假说合理性的“预测”,并不非得是针对尚未发生的现象,也就是说,不一定非得要是针对将来事件的预见;也可以是对于业已发生了的,但却又未被观察到的或者是预测者并未知晓的现象所作的预测。例如,给定其他一些已知的情况,某假说预测在1906年将出现某某情况。如果查询这一时期的史料记载,1906年该情况确实发生了,那么该预测就得到了实践的确认。反之,如若情况并没有发生,那么该预测就与实际情况不相符了。 在这个意义上,假说的有效性本身并不足以作为对被择假说取舍的标准。观察到的事实数量上总是十分有限的,但可能的假说却是无限的。如果说某一假说恰好与已有数据相一致,那么一定还有无数个假说满足此条件。举例来说,假设对某一特定的商品征收定额税后,导致价格上涨并且涨幅相当于税收的大小。完全竞争情况下稳定的需求曲线、稳定的水平供给曲线与如上观察相符。但是,在完全竞争条件下,斜率为正或者负的供给曲线配合需求曲线或供给曲线作必要的补偿移动也可以实现该结果;垄断情况下,固定不变的边际成本以及特定形状稳定的需求曲线也足以产生相同结果;类似情况还有很多,不胜枚举。进一步增加事实证据确实能够剔除一些假说,但凭借有限的证据绝无可能得到唯一符合条件的假说。虽然,也有普遍认同的相关标准,试图使结果尽量“简单易处理”同时又“富有成效”,但面对众多与已有证据均相一致的假说,选择一定程度上就相当的武断,而这却是又否定了“自我标榜”的彻底客观原则。理论越是“简单明了”,就既定领域现象的预测所需要的初始知识也就越少;理论越是“富有成效”,对现象的预测也就越是精确,而且理论预测所依据的范围也就越大,同时,为了进一步研究的需要,所要加以说明的东西也就越多。逻辑上的完备性与一致性虽然也与评判标准相关,但却仅仅起到一个辅助作用;二者的作用在于确保该假说能够正确的阐明其意欲言
说的逻辑,使得其对每一个研究者而言均是同一含义;这里,其扮演的角色又类似于统计计算中检验说子精确与否。 不幸的是,社会科学研究中很少能够设计如下实验,即将确知的有重要扰动的因素排除在外,进而检验具体预测有效与否。通常,我们不得不依赖于偶然发生的“实验”数据收集。基于以下两个考虑,依我看来,无法进行所谓的“控制实验”并非社会科学区别于自然科学的根本特点:其一,它并非是社会科学独一无二的特点(想想天文学就可以了);其二,受控制的实验与不受控制实验的差异充其量不过是一个程度上的差异。不存在完全受控制的实验,每个实验我们都只能部分的控制,这也只是意味着在该实验过程中某些干扰因素表现出相对的稳定性。 实践经验提供了相当丰富的数据资料,并且经常可以得到相当确知的结果,这与精心设计的实验并无二致。因此,无法进行实验不能成为通过预测的成功与否检验假说有效性的根本障碍。但是,此类经验性证据比较难以解读,通常错综复杂又总是不直观且支离破碎。手机这种证据常常也颇费功夫,而且还需要对其进行细致入微的分析、解读,同时还设计一系列的推理判断,然则却很少能有令人满意的结果。无法通过一些“关键”实验以获取大量的直接证据,的确妨碍假说的充分检验。但与从已有证据到达成广泛一致的意见所需要经历的困难相比,缺乏直接证据似乎就显得微不足道了,并且前者也尤为迫切这也使得剔除不成功的假说进展缓慢且困难重重。不成功的假说很少永远告别经济学的舞台,相反,它们却总是不时的一再出现。 当然,此类问题也并非总就只有一个模子。有时,经验证据能与受控制实验数据相媲美,也有大量、直观和确定性的观察结果。也许,最明显的重要例证要数有关通货膨胀假说的经验证据,该假说认为,在一个较短的时期内,货币数量的显著增长必然伴随着价格的大幅上升。这方面的证据是相当丰富的,所需的解读、分析也相对较简单。然而,尽管可观察到大量的价格显著上涨的现象,这些现象与货币存量的剧增也有着一一对应关系,以及有关其他相关因素可能引致此类现象的分歧相当大。但是,每一轮新的通货膨胀却又势必引发激烈的争论,而且这种争论不仅仅限于普通大众之间。人们要么认为货币存量的增加仅仅只是众多引致价格水平上涨的因素之一,其重要性乏善可陈;要么认为货币存量增加伴随价格上涨只是个纯粹偶尔现象。 难以对大量的经济假说进行检验,使得我们讨论就退回到纯粹的套套逻辑式分析。正如我们也已阐述的那样,套套逻辑作为一种特定的“寓言”和“分析编排体系”,在经济学及其他学科中具有极为重要的地位。此外,同样是套套逻辑的正统逻辑学与数学,又为检查推理正确与否、发现假说的引申含义和判断两个貌似不同的假说确实并非等价,并进一步分析两者之间存在的差异等,提供了重要的帮助。 但是,如果经济理论希望能够做出预测,而不仅仅只是对行动的结果的描述,并且又不至于退回到数学的变种,那么仅仅只有一个套套逻辑(同意反复)体系确实是远远不够的。正如前文提到的,套套逻辑(同义反复)本身的有用性,最终还将有赖于使用一系列假说分类、整理复杂实在时的可接受性。 通过预测检验经济家说的困难,还使得人们就经验证据在理论工作中的作用有所误解。在以下两个独立但又紧密联系的阶段中,经验证据都起到了至关重要的作用:一是构造假说阶段,二是检验假说的合理性阶段。作为假说基础以及反过来又是假说归纳解释的对象,完整且详尽的经验资料,不仅在提出新假说时候有显著的地位,其还保证该假说的确解释了其意欲解释的现象,也就是说,现象中凸显的意旨与先前已观察到的经验证据并不矛盾。如果假说与已有资料大致相符,那么对该假说作进
一步检验,将应该是推导出一些事先未知但却可能观察到的事实,进而用后续的经验证据验证这些推理事实。为了保证后续检验同前面检验相关,推理事实必须一方面是假说意欲解释的一类现象,另一方面其有得定义的相当准确,使得实际观察有可能将其否证。 构造假说与检验其合理性这两个阶段之间的相互联系,可以从以下两个方面表现出来。第一,某种程度上,每一阶段进入观察的既定事例,与数据收集过程以及特定调查者的知识存量特征密切相关。用以检验假说意义的事例可能同时又是构造该假说的原始资料,反之亦然。第二,创立假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及比较一系列早些时候观察提出的假说。假说含义之间的矛盾激发了新假说的产生或者对旧假说作进一步的修改。所以,这两个在方法上截然不同的阶段,在实际过程中又总是相辅相成、并行不悖。 对这一显而易见过程的误解,主要集中于如下表述,即“假说是作为解释这一类现象而提出的”。由于增加同一类现象的新证据以及证明其与假说内涵相一致都相当困难,社会科学将倾向于作如下认定(猜想):即其他更为可得的相关证据对证明假说合理有效也是同样重要的;假说不仅有“内在的含义”,它同时也含有“假设”成分;从假设是否与现实相符判断假说的有效性,与对假说内涵的检验是不同的;前者(检验假说)是对后者(检验内容)的补充。从根本上说,这一被广泛持有的观点是错误的,也是更多的后续谬误产生的根源。它不仅没能合理的将有效性价说和非有效性假说筛选分开,相反却使得局面更加混乱不堪,使得人们对经验证据在经济理论中的重要性有所误解,并将为促进实证经济学发展所作的睿智探索引入歧途,最终有碍于实证经济学中就常识性假说达成一致意见。 即使如果可以说理论的实质就是一系列的假设,即使“假设”的“真实性”与否可以独立于预测的有效性,理论的重要性与假设真实性之间的关系,也完全不同与前文所批评的那种观点,甚至几乎与其相反。一般可以发现,真正举足轻重的假说的“假设”,都是对现实的一种粗略的、不十分精确的描述。而且,一般来说,理论越是重要,其“假设”(在这个意义上)就越是不真实。个中原因非常简单。如果假说能够以相当简洁的形式解释丰富的内容,也就是说,如果假说能够从意欲解释的枝节交错的现象实在中抽象出一系列关键共性,同时却又能保证强大的预测能力,那么该假说就是相当出色。因此,从意义重大的角度,假说的假设就不能忠实的描述;假说在解释既有现象上的成功,表明具体现实环境因素的影响有限,那么假说的假设自然也就不必对现实环境亦步亦趋。 为了使以上观点显得不那么“荒谬”,有关理论“假设”我们需要问的问题,不是假设是否是对现实的忠实描述,因为它们从来就不是,而是假设对于我们已有的目标来说,它是否是一个良好的近似。而这一问题唯有通过考察理论是否有效才能解答,亦即理论的预测结果是否足够精确。于是,原以为肚里的两种检验就只剩下一种了。 不完全竞争或曰垄断竞争理论,就是经济理论中忽视上述主张的一个例证。人们认为,新古典经济理论中的“完全竞争”和“完全垄断”,虚假的反映了现实生活情况。于是,很显然这种不满激发了以上分析范式的发展,并且使得其被广泛赞许和接受。而这一认识本身,却几乎完全仅仅基于假设本身并非观察到现实的正确描述,而不是依据新古典经济理论的预测与现实不相符得出的。许多年以前,《美国经济评论》有关边际分析问题所进行的长篇累牍的讨论,是另一个虽远不如前一个例子重要,但是却又更为清楚的例子。争论双方的文章,在很大程度上都忽略了,在我看来似乎却是尤为关键的问题——即应用边际分析得出的结论与经验事实是否
相一致的问题。相反,争论者却把精力投注于考察商人决策当中,研究他们的决策是否却是通过代表边际成本与边际收益的表格、曲线和多变量函数进行这样一个几乎毫不相关的问题。也许这两个例子及其他业已揭示的许多事例,都说明了这方法论的基本原则进行深入讨论确实很有必要,它将有助于我们判断一些似是而非的现象。 3.可以通过假设的真实性来检验假说吗, 可以先从一个简单的物理学例子——自由落体规律——开始我们的讨论。一个普遍认同的假说是:在真空中,一落体的加速度是一个常数——g,在地球上大约是32英尺?秒??,其与落体形状、投掷方法等因素均无关。这意味着落体在任何给定时间内下落的距离,可由公式S=??gt??给出。这里,S是以英尺表示的物体下落的距离;t是物体下落的时间,单位是秒。将此公式应用于描述一个从楼顶下落的实心球,就等于说如此下落的物体,其具体运动情况就好像是在真空中下落一样。通过假设检验该假说,可能就意味得测量实际气压,并判断其是否足够接近于零。海平面的气压大概是每平方英寸15磅。15磅是否足够接近于零,进而对结果的影响是否可以忽略不计呢,显然可以。因为实心球从楼顶落到地面的时间与公式给出的时间非常接近。然而,设想如果下落的是一根羽毛而不是一个实心球,那么公式得出的结果就有很大的偏差。显然,对于一根羽毛而言,每平方英寸15磅的气压与零气压是有显著差异的。然则对实心球而言,每平方英寸15磅的气压与零气压是不会造成多大差别。或者,再设想将上述公式应用于从3万英尺高处的飞机上下落的实心球。在此海拔高度,气压毫无疑问是小于每平方英寸15磅。但是,从3万英尺下落到2万英尺,该点气压仍然大大低于海平面水平,实际消耗时间将与公式预测的时间有显著差异。其差异还明显大于实心球从楼顶落到地面的实验中,实际时间消耗与公式预测时间之间的差别。根据公式,下落球的速率应为gt,并且还将稳步加速。事实上,一个从3万英尺下落的球再碰到地面以前早就达到速度最高点了。上述公式的其他应用也大体如此。 一开始提出的那个问题,即15这个数值时候可以被视为足够接近零进而忽略不计,就显得愚不可及。每平方英寸15磅等于每平方英尺2160磅,也等价于每平方英寸0.0075帧,绻挥幸恍?庠诘暮饬勘曜迹筒荒芩稻咛迨质恰按蟆被故恰靶 保ㄒ幌喙氐暮饬勘曜季褪窃谝幌盗屑榷ǖ那榭鱿拢霉皆诓煌ㄆ顾较率欠窈糜谩,牵庥执从σ圆愦紊贤奈侍狻~昂糜没虿缓糜谩钡木咛搴逵质鞘裁茨兀考词箍梢韵
饬课蟛睿锾逑侣涞氖挡馐奔溆牍郊扑闶奔洌苌伲ㄈ绻泄幕埃?猛耆嗟取,秸咧涞牟罹啻锏多大时,可以判定理论是“不好用的”呢,以下是两种重要的衡量标准:其一,比较被择理论可达到的精确水平,并且比较结果从各个方面看都是可以接受的;其二是存在于当已知一种理论可以实现更好预测水平,然则必须以相应的成本增加为代价的情形。根据内在目的确定具体更高的精确度水平,须与付出的相应成本代价提高之间进行权衡。 以上例子说明一方面通过理论假设检验理论本身是不可行的,另一方面“理论假设”这一概念又相当模糊。公式S=??gt??,对真空中的落体来说是正确的,也可以通过观察、分析真空落体的实际运动情况推导得出。因此,可以这样说:在很多情况下,实际空气中落体的运动情况,似乎“仿佛”它们就在真空中下落一样。用通常的经济学语言,以上表述马上就可以变为:上述公式假定真空情况。然而,显然公式中没有诸如此类假定。上述公式实际说的是:许多情况下,大气压力、物体形状,投掷者姓甚名谁,投掷方法以及一系列相关条件,对落体在既定时间内下落的距离并无显著影响。不提及真空因
素,同样也完全可以将以上假说重新表述为:在很多情况下,物体在给定的时间内下降的距离可由公式S=??gt??给出。撇开公式的历史以及相关的物理理论,那么说该公式假定真空还有意义吗,就我所知,还有其他假设体系,也同样能够得出如上公式。此公式之所以被接受是因为它好用,而不是因为我们生活在一个近似真空的环境里——不管接近真空是什么意思。 与假说相关的一个重要问题,是确定公式适用的范围,或者更准确地,是明确在各种情况下假说预测的大体误差范围。的确,正如上述假说重新表述中所隐含提到的,假说适用范围的确定与假说本身并非毫不相干。范围界定本身是假说的一个重要组成部分,而且也是假说中尤其可能随着经验事实的积累,而被不断修改和扩展的部分。 就由自由落体这一特定问题,已经存在另一虽然仍不完善但更为一般化的理论。其出现很大程度上是为了解释上述简单理论预测的误差,由此可以进一步计算其他一些可能的影响因素,而原有简单理论则成为其一特例。然而,该更为一般化的理论在使用当中并非总是合适的。这是因为,其所提升的精确度很可能无法弥补使用引致的附加成本。所以,在任何情况下的一种简单理论就已经“足够好用”,仍旧是一个重要问题。气压是——也仅仅只是——众多界定理论适用范围的变量之一,其他相关变量还有诸如落体的形状、速度等。阐释气压以外变量的方法之一可以是,确实有无纳入特定变量对真空“假设”的背离严重与否。举例来说,考虑羽毛形状上的差异,每平方英寸15磅的气压和零气压可以说有很大差异,但对实心球下落一个中等距离而言形状的差异并没有造成两种气压下有显著不同结果。然而,这种说法决然区别于如下观点,即认为之所以该理论不好用是因为其假设是不真实的。相反,这两者之间的关系应该是另一种情况,即由于理论不好用,所以其假设对羽毛而言就是不对的。之所以要反复强调这一点是因为,完全正确地使用“假设”界定理论适用的范围,通常被错误的理解为假设可以判定理论在任何情况下是成立的,进而也成为主张通过假设检验理论本身这一错误论断的重要源头。 接下来考虑另外一个例子,这个臆造出来的与社会科学中的假说有很多相似特征。考察一棵树上的叶子的厚度,我提出如下假说:给定周围叶子的位置,叶子们好像是有意的通过最大化其所能获取的阳光量,确定各自具体位置;每片叶子好像都知晓决定不同位置获取具体阳光量的物理规律,并且能够迅速转移到任何未占据的合意位置。该假说更为确切的一些含义明显与实际情况相符:例如,树南侧的叶子一般密于树北侧,但本假说也指出,山的北坡,或树的南侧被其他东西遮盖,那么以上差异就不明显或甚至完全不存在。就我们所知,叶子不能“故意的”,或者有意地搜寻(位置),也没进过学校学习计算“最佳”位置所需的相关科学或数学原理,更是无法从一个位置转到另一个位置,那么难道就可以就此断言该假说是不可接受的,很明显,以上假说不相符的所有列举无多大重要性可言。所涉及的现象也不在“假说意欲解释的”范围之内。假说并没有断言叶子就如此行事,毋宁说只是根据叶子厚度分布说叶子“仿佛”就是这般行为。尽管假说的“假设”明显不真实,但由于假说含义与实际观察一致,那么其就较为合理。我们倾向于在下述意义上“解释”该假说的合理性:阳光促进叶子生长,所以阳光较多的地方叶子将生长的更加茂密,或者因此也可以说阳光充足的地方叶子将长得更加茂密也公认地更容易存活。最终,纯粹被动的响应外界环境的调整与根据环境有意识的适应,两者都得到相同的结果。后一种假说之所以比以上臆造的假说更有吸引力,并不是因为后者的“假设”更加“现实”,而毋宁说是因为后者是更为一般化的理论应用在其
他现象中也可以得到间接证明。 所臆造的假说大体正确,也就是说,在预测叶子密度上“足够”准确,仅适用于某类特定现象。我不知道具体的适用范围,也不知道如何去定义它。然而,有一点似乎是明确的,那就是:上例中理论的假设在界定范围时并无多大作用。树的种类,土地的性质等可能是界定理论适用范围的变量,但树叶做复杂的数学运算祸从一个地方移动到另一个地方的能力却与此无多大关系。我和萨维齐在别处用过一个类似的,但涉及人类行为的例子,即预测专业台球手击球情况的问题。通过如下假说,即认为该台球手击球活动“仿佛”他知晓最佳运动方向的复杂数学计算公式;可以通过眼睛准确估算击球角度、台球位置等;并且能够迅速的代入公式计算,并能够让球就按照计算结果运动,将可以得出有关击球的出色预测,这也似乎并非毫无道理。我们之所以相信上述假说,并不是因为我们认为台球手,即使是台球行家,能够也确实身体力行如上描述的过程;毋宁说是因为我们是意识到,除非台球手可以这样或那样的取得上述相同结果,否则他们实际上就不能算是台球“行家”。 这些例子离以下假说仅仅只有一步之遥。该假说认为,许多情况下单一厂商“仿佛”是理性地追求预期收益最大化(一般也使用颇具误导性的“利润”一词),并且拥有实现该目的所需的完备数据知识;也就是说,他们仿佛知晓相关的成本函数与需求函数,能够计算所有行为的边际成本与边际收益,并且在所有行为决策上都恰好作到边际成本等于边际收益。当然,商人当中并非逐一求解经济数学家用以方便表述以上假说而是用的联立方程体系。如果相反,将无疑于让台球手在击球时做复杂的计算问题,或者让落体运动严格依赖于真空条件。如果问台球手他是如何确定击球点,那么他可能回答说他自己“恰恰就发现”那个合适击球点,最后多半也只能认为是“幸运神”的眷顾了。商人可能会说自己是根据平均成本来定价,当然市场条件变化时,可能还会做一些必要地微小偏差调整。这两个说法都有一定见地,但是两者与相关假说的检验都毫无干系。 受益最大化假说可信度赖以验证的那些经验证据特征,与以上的列举有相当的差异。某种程度上说,该证据与台球手假说检验所援引的证据类型很相似——也就是说,除非上人行为或者或那与收益最大化行为大体相似,否则其似乎不大可能在该行业中持久存在。不论商人行为直白、直接的决定因素是什么,习惯性反应也好,随机性机遇也好,或什么都不是也好,只要某关键因素恰使其碰巧与理性完全信息追求受益最大化厂商行为相一致,则厂商将趋于赔本,最终只有从外部注入新资源才能维持存活。这样一来,“自然选择”过程促进了假说的合理化,或者毋宁说给定自然选择,假说合宜性很大程度上有赖于其恰当的概括了生存条件的要求。 有关收益最大化假说的另一类更为重要的证据,源自假说在无数次具体问题中的应用,其含义从未出现与现实结论相悖的情况。此类证据罕有正式书面文字版本,其主要散落于在无数的商业备忘录、论文及专著中;而这些备忘录、论文和专著讨论的主要都是一些具有问题,相反很少旨在检验某一假说。然而,假说在相当长时段内一直被接受、使用,同时未能提出更广泛接受、连贯、自洽的替代假说,这一事实也间接有力的证明了该假说的内在价值。假说的证据应当总是包括其能够反复经受住矛盾的检验,而且只要该假说仍在继续使用,那么这类证据就会继续增加。但是,从根本上说,此类证据却又难以全面完整的使用文字记载下来。这也倾向于成为科学传统和习惯的一部分,即其韧性根植于未能被驳倒的一系列具体主题假说体系,而非教科书上事例的简单罗列。
4.理论“假设”的重要性与作用 至此,我们有关理论“假设”的重要性的所有结论几
乎全都是否定的:我们已经看到无法通过“假设”的真实性来检验理论,而且理论“假设”概念本身也含糊不清。但是,如果以上就是问题的全部,那么我们将很难解释为何理论假设概念使用却如此之广,同样也很难解释如下强烈倾向,即每个人都需要演说自己的假设,并且还时不时地对不同理论的假设进行对比,怎么可能无风起浪呢, 实证科学方法论当中,一般而言否定性论断通常要比肯定行论断可行度更高。因此,相比与前文的论述,下文有关“假设”重要性及其作用的评述我的把握性就没那么大了。据我所知,理论的“假设”具有以下三种相关但不相同的积极作用:(1)它们通常能够简洁、经济地表述和呈现理论;(2)它们有时还可以便利的假说的含义做简洁的检验;而且(3)正如前文提到的,它们有时能够方便的界定理论的预期适用范围。前俩者还需作进一步的详尽讨论。 4.1用“假设”阐述理论 树叶的例子可以说明假设的第一个作用。不说树叶是追求吸收阳光的做大化,不使用任何明显的假设,而只借用一系列用以预测树叶厚度分布的原则,我们同样可以表达完全相同的假说:如果一棵树生长在一块平地上,且没有别的树木或物体阻挡阳光照射,那么,树叶的密度将倾向于这样那样;如果一棵树是生长在山的北坡,处于同种树群之中,那么……显然,相比于树叶追求所得阳光最大化的表述相比,此种假说的表述大大不经济。由于已给出就特定问题而言,哪些环境因素至关重要并且如何估计其影响,所以第二种假说表述已经简洁但又不乏有效的概括了以上提到的一系列原则,即使可能的原则有无限多,因而也更加精炼同时又不失全面性。 更一般地,假说或理论通常都包括如下断言,即就某类特定的现象而言,某些因素而非其他因素是重要的,并且也还给出关键要素的具体作用方式。我们可以把假说看作是由以下两部分组成:第一部分是概念体系世界,或者是远比“真实世界”简单的抽象模型,其中只涵盖假说认为重要的各因素;第二部分是界定假说适用某类现象的一系列原则,并且具体规定抽象模型中的变量与可观察的现象个体之间的对应关系;就假说适用的某类现象而言,抽象模型足以代表“真实世界”。 和两个部分的性质截然不同。模型是抽象、完备的,是“代数”或“逻辑”。模型一致性、完备性及其含义的检验,则必须回到数学与正规的逻辑学中进行。诸如“含糊不清”、“大概可能”和“大体相似”在模型中无处容身,同时也毫无作用。真空气压就是零,而不是“较小”。完全竞争厂商产品的需求曲线就是水平(斜率为零),而不是“几乎水平”。 另一方面,界定模型使用的一些原则就不可能抽象又完备。它们必须是具体实在,进而也就是必然不完备。完备只存在于概念世界中,待解释的真实世界里没有完备一说。“太阳底下无新鲜事物”,模型充其量只是逻辑上具体讲述了一般的真理;界定模型适用范围的原则时同样也不能忽略真理的另一半,即“历史永远不会重演”。当理论明显是更为一般理论的一部分时,正如落体真空理论的例子一样,很大程度上我们可以异常清楚或也是再简单不过地给出模型使用的原则,尽管此时的原则阐述很不完备。在追求科学尽可能“客观”的过程中,我们的目标应当是竭尽所能的扩展理论适用的范围,并尽量做到原则体系清晰连续。但是,不论在此方向上我们有多么成功,有关理论适用与否的判断总是不可避免的存在。每每出现的问题都有其独特之处,而这又是文明规定所不能一一囊括的。判断新现象的影响能否忽略,以及观察到的现象是否可以和模型中的个体相对应的能力,不能指望别人能教你,它只能通过自己的实践经验并置身于“适当的”科学氛围中掌握体会,无法机械照搬。这一点区分了所有科学中的“业余”与“专业”,也称为怪诞、狂想分子与科学家之间的分水岭。
一个简单的例子可能有助于弄清这一点。欧几里得几何学是一个抽象模型,一个逻辑完备、前后一致的逻辑体系,其中的各个元素都有严格定义。如定义直线时,就不说其是长度比其宽度或高度“大得多的”几何图形,而是说直线是宽度与高度为零的图形。这显然是“不现实的”。“实际生活”中不存在诸如欧几里得点、线或面一样的东西。将此抽象模型应用与黑板上的粉笔记号,此记号可以被视为欧几里得线、欧几里得面抑或是欧几里得体呢, 显然,假使该记号用以表示一条需求曲线、那么将其视为一直线将是合适的。但是,如若该记号正被用与地图上的国家着色,那么就不能认为其还是一直线了,否则将意味着地图上的国家是无法适当着色的,在这种情况下必须将此粉笔记号视为欧几里得面。然而,对粉笔的生产者而言,则情况亦不复如此,否则将意味着粉笔永远也用不完。出于此种考虑,原粉笔记号此时必须对应欧几里得体。在这一简单例子中,如上判断估计大家不会有异议。然而,似乎很明显,虽然只需大致粗略思量就足以得出以上判断,但却永远也不会真正做到包罗万象,囊括所有可能情况。它们并不具有欧几里得几何学本身所具有的自圆其说、自成体系的特点。 我认为,在谈到理论的“关键假设”时,我们是试图给出抽象模型的关键因素。通常完整表述一模型的有许多不同方法。也就是,作为一个整体模型中可能存在各种各样暗含的或被暗含的不同“假设”体系,这些(假设体系)在逻辑上是等价的:从某一角度看是模型公理或假设的内容,从另一角度看可以视为模型的定理;反之亦然。具体哪些“假设”是“关键”假设的重要依据在于其在模型描述中的简洁、经济,直观合理,或者能够得出一些相关引理、推断用于模型的判断和应用。 4.2用“假设”间接检验理论 在表述任何假说时,通常假说的假设部分内容与假说的具体含义内容,似乎再明显不过了。然而,两者之间的界线却不容易定泾渭分明。我认为,这并非就是假说本身的特点,毋宁说它是由假说承载的应用引起的。如果确实如此,那么假说描述的语句划分归类易于进行,必定反映了假说服务目的是明确的。抽象模型中定理和公理之间互替的可能性,预示着抽象模型具体对应的假说中,“含义内容”与“假设”之间可能界线不明。但这并不是说任意含义内容都可以与假设互换,而只是说可能存在这种情况。 举例来说,考虑寡头行为理论中的一个具体命题。如果我们假定:(1)企业家通过各种方法来追求利润最大化,包括可能采取兼并或扩大垄断势力手段;这将意味着,(2)区域“产品”需求不稳定,运输费用是重要的,明示的价格协议不合法,且该种产品的生产者为数较少,他们将试图建立基点定价体系。由于我们分析旨在预测市场行为,则论述(1)可视作理论的假设,而论述(2)则为理论的具体内容。如果我们观察到(2)中描述的情况与基点定价法大体相关,那么假设(1)就是可以接受;反之则反是。现在我们将分析目的改为,根据《谢尔曼反托拉斯法》的反对“共谋最爱交易”条款,确定哪些情况应予起诉。如果我们假定:(3)基点定价方法是蓄意使得论述(2)所描述条件下的共谋更加方便,那么这将意味着,(4)参加基点定价体系的企业家都参与“共谋阻碍交易”。先前假说的假设现在变成了假说的内容了;相反,先前内容反而变成假设了。如果我们发现企业家参与基点定价体系,通常也还存在其他被法庭视为“共谋阻碍交易”的证据资料,比如书信、备忘录等,那么就可以认为假设(3)为合理的。 假定假说就服务于第一种目的,即预测市场行为。很显然,这并无法顺利推出该假说将服务于第二种目的,即预测是否存在“共谋阻碍交易”充分证据,作为法院行动依据。反之,如果假说服务于第二个目的,同样不能认为其就适合第一
个目的的需要。然而,在缺乏其他证据的情况下,假说能够成功服务于一种目的,即可以解释一类现象,相比于假说可能可以解释另外一类现象,前者将给我们带来更大的信心,但很难说清信心或把握到底多大少。因为这将取决于我们对这两类现象相关程度的判断,而这本身有相当复杂地取决于类似的间接证据,也就是有赖于我们自身的相关经历,即在使用单一理论解释某一现象时,现象本身在某种意义上却同样又是缤纷多样。 以上观点可以更一般化地表述为:只要假设本身可以视为假说暗含的内容,因此其与现实相符也就意味这假说意旨与现实一致,或者只要假设可以让假说其他意旨含义较为容易地从随意的经验观察中得到检验,那么这就是我们所说的假说的假设可以作为检验假说接受与否的间接证据。之所以这种证据是间接证据,是因为通常假设或假说相关含义所指向的现象,与假说意欲解释的那类现象并不相同。的确,正如上文预示的,这似乎就是确定哪些论述冠以“假设”,而哪些应冠以“内容含义”所依据的主要标准。此类间接证据的权重,取决于我们对这两类现象相关程度的判断。 假说的“假设”有助于假说的间接检验的另一途径是,找出该假说与其他假说之间的“亲戚关系”从而待检验假说的合理性就与其他假说合理性的证据密切相关了。例如,现有针对某一类特定行为的一个假说,通常这种假说阐述中可以没有具体的假设。但是,假定能够证明该假说与一系列假设都是等价的,其中包括人人都只顾追求自身利益这一假设。那么,从同样作出该假设的其他假说可以成功解释类现象这一事实,则可以间接地证明带检验假说的可接受性;至少可以说,这里所作的假设并非完全是前所未有、毫无根据或者其应用于任何别的情形当中将一无所获。实际操作当中,旨在建立表面上不同假说之间联系的假设表达,正是通向一个更为一般化假说方向的第一步。 从相关假说中获得的此类间接证据,很大程度上可以解释不同背景的人对某一具体假说信任程度上的差异。举例来说,考虑如下假说:在某一特定地域或行业内,雇佣中的种族或宗教歧视程度,与该地区或行业中的垄断程度密切相关。也就是说,如果行业是竞争性的,那么,只有当雇员的种族或宗教影响到其他雇员是否愿与之工作,或者影响到消费者对他们生产的产品的接受性时,雇佣中的歧视才可能值得一提,但其却与雇主的主观偏见毫无干系。相比于社会学家,经济学家对此假说可能更感兴趣。可以说以上假说就是“假定”在竞争性行业里,雇主一门心思地追求货币化的自我利益;而且,此“假设”对涉及经济学所要研究的许多大宗现象的很多假说而言,都相当好用。所以,在经济学家看来,这一假设对此例可能同样适用,似乎是合情合理。另一方面,为社会学家所熟悉的那些假说,有着完全不同的模型或曰理想世界,其间一门心思追求自我利益的个人将无足轻重。对于社会家来说,此假说可得的间接证据,同样相比于经济学家从中可得到的间接证据,前者就显得较为不充分、不合适,因此也就可能对该假说持有更大的怀疑。 当然,经济学家的证据与社会学家的证都非确证无疑。决定性的检验只能是假说之于其意欲解释的现象是否好用。但是,在此类检验之前通常就得出判断,而且很可能,在不久的将来此检验也无法进行,那么在这种情况下也只能依据不完备证据做出判断了。此外,即使可以做出此类检验,科学家的背景对其所取得的判断来说也相当影响。科学中永远不存在确凿无疑,赋予支持或反对某假说证据的权重也永远不能做到完全“客观的”。在判断假说的含义意旨与实际情况的是否相符上,经济学家要比社会学家更为“宽容”,进而也更加容易凭借有限几个“相符”,就可以尝试地、暂时地接受假说。 5.对一些经济学主题的意义
以上讨论的这些抽象的方法论问题,可以看做是对一贯批评“正统”经济理论严重“脱离现实”,而由此认为经济学理论亟待重构的认识的一种直接回应。经济学是一门“沉闷无趣的”科学,因为它认为人是自私、唯利是图的,是“愉悦与痛苦的快速计算器;人有犹渴望快乐的小水珠,在外因的刺激下在快乐与痛苦之间来回游移,本身却总是毫发无损”。经济学的“沉闷”还源于其是基于一些“老掉牙”的心理学结论,因而随着心理学的发展,经济学依赖的基础也必须相应的调整。经济学之所以“沉闷”还在于:假定人或至少是商人们,出于一种持续的“高度警觉的状态”中,总能够凭其敏锐的本能捕捉供需状况的变化,并作出相应的价格或价格规则的调整。此外,“沉闷的”经济学还认为市场是完美的,竞争是纯粹的,而商品、劳动与资本都是同质的。
我们知道除非这类批评能够辅以或提出一个与当前理论或多或好有些区别的假说,并且经验证据表明新假说在预测的一致性和预测的广度上都有优于原理论,否则批评就毫无意义。然而,大部分的此类批评缺乏上面提到的补充,它们所有的理由也就是认为“理论假设”与“真实世界”不一致。一个显而易见的例证就是近来有关受益最大化假说的批评,批评依据就是:商人不是受益最大化,确实也不可能做到理论假定的收益最大化,支持以上论断的佐证大致无非来源于两个渠道:第一,询问商人实际决策当中究竟有哪些影响和考虑因素;第二,观察、描述单个公司是如何决策的。第一种检验经济学理论的方法,与通过向80多岁寿星以检验长寿理论的方法并无二致。一方面,鲜有证据表明商人实际市场行为与所批评的假说意旨之间不一致,还必须注意:证据得是实际观察到的商人行为,而非他们自己说自己如何行事的;另一方面,也没有给出一个相应的替代性假说。 按照通常人们意义上的“真实”这个词的描述性意思,理论或其“假设”就不可能是完全“现实的”。一个完备的小麦市场的“现实”理论,不仅需要包括直接影响小麦供给与需求的那些因素,而且还需要包括交易使用的现金、信用工具类型。此外还有:交易者的私人特征,以及他们的祖先及其受教育程度等;小麦的类型、物理及化学特征、生长期内的天气情况;麦农及小麦最终消费者的个人特征等,无尽无穷。任何一种试图实现这种“现实”的努力,最终都将只会使得理论变得毫无价值。 当然,一定程度上,“完全现实的理论”的提法就是一个“稻草人”——中看不中用。没有哪位批评者会以这种逻辑的极端情形作为自己的目标。虽然其后提出的假设同样也不真实而且毫无新意可言,批评者可能还是会辩解说,其所批评的理论的“假设”过于脱离现实,而自己的目标只是使用一系列相对更加真实的假设体系。但是,只要“真实性”意味着假设必须是直接观察的忠实描述,比如,观察到商人似乎不像边际理论描述的那么贪得无厌、动作迅捷、逻辑精密,或者就目前产品必须分步骤由不同生产机构生产的工厂经理而言,最终切实做到每个产品的边际收益等于其边际成本将不具有可行性,那么所做一切就与前文描述的“稻草人”缺陷并无二致。判定某一特定与现实不一致的假设是否可以接受的标准是什么呢,在考察商业行为时,为什么忽略商人的成本大小比不考虑其眼睛颜色更为“不现实”呢,一个显而易见的答案就是,忽略前者相比于后者在理解商业上会带来更大的偏差。但是,简单观察商人真真切切地在计较各种不同成本及其眼睛颜色,无法使我们理解以上道理(即,忽略哪者预测上会带来更大偏差)。很清楚,唯有对比考虑一种因素与纳入另一种因素,两者预测能力上的差异,才能知晓何种要素将导致更大偏差。这样一来,即使是真实性假设最忠实的拥护者,当需要就各种假设的真实程度大小进行分类时,也只能放弃自己原有的标准,
转而接受通过预测检验的方法。 所有基于理论假设的非现实性,以及由此引发的一系列对经济理论似是而非的批评,都从根本上混淆了描述的准确性与分析的相关性之间的关系。以上混淆,可以从对一篇有关经济周期理论文章的,一个貌似“无伤大雅”的评论中清楚的揭示。该评论说到:“经济现象变幻莫测、纷繁复杂,因此,任何一种全面的、能很好解释现实的经济周期理论必定是极为复杂。”科学的一个基本假说就是:表象是具有欺骗性的,而且可以通过某种方法观察、阐释和组织证据,进而可以揭示出一些与表面毫无关系的各种现象,其内在却有一个共同的简洁、基本的结构。而且,对这一假说的检验,和其他假说类似,同样应该是其结果,而迄今为止科学已是硕果累累。如果某种“经济现象”显得变幻莫测、错综复杂,那么我们必须认为那是因为缺乏合适的理论解释它。绝不可将已知事实单独搁在一边,而另一边却企求“与现实完全一致”的理论。理论是观察实施的方式,缺乏理论的观察事实时将无从下手。任何断定经济现象是变幻莫测、纷繁复杂的主张,都否定了似乎有知识本身就使科学活动富有意义。该主张约翰??斯特亚特??穆勒通常被奚落的说法如出一辙,他说到:“很幸运,价值规律中不存在任何有待于现在(1848年)或将来的作者来加以澄清的内容了,这一主题的理论一是完美无缺的了。” 有关描述的准确性与分析的相关性之间混淆,不仅导致许多针对经济理论的无望批评,而且还使得人们误解经济理论,并还将精力错误的投放在弥补假象的缺陷上。有经济理论家提出的抽象模型中的“理想类型”,旨在直接、全面的与现实世界中的个体一一对应,被视为严格的描述性范畴,与模型建立的旨意并无相干。(理论抽象与繁杂实在之间)显而易见的差异,使得以精确描述为基础建构理论的企图,最终注定要失败。 有关“完全竞争”、“垄断”概念解释,以及“垄断竞争”或“不完全竞争”理论的提出,可能再清楚不过的说明了以上倾向。据说,马歇尔假定(经济)都是“完全竞争”。可能当时的经济确实符合这种模式。但是,很显然现实经济中已经不再有完全竞争了。因此,我们必须抛弃马歇尔的理论。某读者也可能将不辞劳苦的到处寻找,试图在马歇尔的著作中找到有关完全竞争的明确假设,或发现任何如下主张:在描述的意义上,世界是由无数完全竞争的“原子式”企业组成的。我预计此举将最终徒劳无功。相反,他将会发现马歇尔有如下论述:“在一个极端,世界市场的竞争直接地源于地球上的每个角落;而在另一个极端,那些与世隔绝的市场中,所有稍微远点的直接竞争都被隔离在外。然而,即使在这种市场中,人们仍可以感觉间接竞争与传导性竞争的存在。绝大多数的市场都是介于以上两个极端之间,而其证也是经济学家和商人必须研究的对象。”马歇尔的分析忠实于世界本来面目,他所寻求的是构建一套分析世界本源现象的“工具”,而非毫厘不差的描述现实。 按照世界的本来面糠治鲋硇岢鋈缦乱桓黾偎担河捎谠诤芏辔侍馍希幸的诔讨涞南嗨菩砸侗炔钜煨灾匾谑强山坦槿氩煌摹靶幸怠保担琲ndustry)加以分析。在这些问题里,很重要的一点是行业内的厂商通常要相同的接受同一类因素变化的影响,比如,对它们产品需求的变化或者要素供给的变化。但是,以上做法并非对所有问题都适合,当对特定企业的具体影响分析更为重要时,就不能使用如上归类方法处理。 与该假说对应的抽象模型包括以下两种厂商的“理想”类型:可以归入行业分析的原子式竞争厂商和垄断厂商。如果厂商产出品的市场价格是由其他所有厂商共同决定的,并且面对的是水平无限弹性的水平需求曲线,那么该厂商就是一个竞争性厂商,可以被纳入生产相同单一性产品的“行业”中分析。这里,“产
品”仅仅是一系列的产出单位集合,就买者而言他们具有完全替代性。所以,厂商产出品之于同行业中另一厂商的价格需求弹性将是无限大,多种产出品的情况亦复如此。如果厂商的所有产出需求曲线在某些价格水平下不是完全弹性的,那么该厂商就是一个垄断厂商。垄断厂商就是行业。同样地,假说作为一个整体不仅包括抽象模型及其理想类型,而且还包含了一系列大多数含蓄的通过例证表现出来的规则,其作用在于将现实的厂商纳入这个或那个理想类型,以及将厂商归类为特定的行业。理想类型并不志在描述,其目的在于将那些对特定问题至关重要的特征要素分离出来。即使可以直接、准确地测算出厂商产品的竞争性抑或垄断。实际观察到的需求曲线从来就没有一例是绝对水平的,因此,测算出的弹源笮】隙ㄒ彩怯邢薜摹,枰实南喙匚侍庥Ω米苁牵运绞欠瘛白愎弧贝蟮娇梢员皇游尴蕖,牵途咛宓允当旧淼拇笮《裕薹鲆桓鲆焕陀酪莸幕卮稹,缥颐遣荒芤淮涡缘募虻ス娑凸絊=??gt??的应用,每平方英寸15磅的气压是否“足够地”趋近于零。同样我们也无法通过测算需求的交叉弹性,进而按照其数值大小的差异,就将厂商划归不同的行业。正如马歇尔所述:“划分归类不同产品(即不同行业)的准绳,必须服从于谈论具体问题的便利。”所有事情都取决于所需要讨论的问题,就某一问题一企业被视为完全竞争者,而在另一问题中其又被看作是垄断者来看待,个种并无任何前后矛盾的地方。正如同一粉笔画线在第一种问题中被看做欧几里得线,在第二种问题中被视为欧几里得面,而在第三种问题中却又变成欧几里得体一样,这当中并不存在任何不一致的地方。需求弹性与需求交叉弹性的大小,生产外形上大体相似的产品厂商数量,等等,都与问题密切相关。这是因为具体问题中,它们可能就是用以确立理想类型与现实个体相对应的诸要素,同时也规定了理论适用的具体环境情况。但是,它们并未提供判定厂商是完全竞争的抑或垄断的一劳永逸的标准。
下面这个例子可能会有助于说清这一点。假定现在必须确定联邦香烟税的上升,对香烟零售价格的影响且预期税收上升将是永久的。我斗胆提出如下预见,即视香烟厂商生产大体同质的产品,并且是完全竞争的,就可以得出大致正确的结果。当然,在这种情况下,“必须作出一些具体规定”,比如将切斯特菲尔德(Chesterfield)香烟的生产数量视为大体与万宝路香烟相等。 另一方面,在分析第二次世界大战中香烟厂商对价格管制的反应时,将香烟厂商视为似乎是完全竞争,就可能使分析误入歧途。这一点在分析该事件之前就必须被清楚地意识到。战争期间,香烟厂商的成本上升,这种情况下,完全竞争者一定会减少原有价格水平下的销售量。但是,当前价格水平,由于战时公众收入的提高,(香烟)需求量将可能上升。完全竞争情况下,严格的法定价格意味着将出现供不应求的“短缺”局面,以及香烟生产的绝对数量也将下降。(以上推定)事实与下述具体倾向并不相符,即厂商有理由尽量使得香烟价格最大化,并且生产数量也大幅提高。普通的成本上升,与厂商为保住以市场份额,及商标名气、价值的“破坏性”欲求相比,其影响力就大大不如了。特别是当超额所得税将这一类广告成本的很大份额转嫁到了政府头上时,则更为如此。就该问题而言,香烟厂商就不能被视为好像是完全竞争者。 小麦种植尝尝被用作完全竞争的例证。然而,虽然对于某些问题,将香烟厂商视为“好像”是出于完全竞争行业中是合适的;但是,对于某些问题来说,将小麦生产者看作完全竞争者却并非适当。例如,考察当地电梯操作员支付小麦价格的不同时,就不能将小麦种植视为完全竞争。 马歇尔的分析工具在研究受共同因素影响的某一类厂商问题时,
以及在那些可以将厂商视为“仿佛”是完全竞争的情况下,是最好用的。从某种描述性意义上说,这也就是误解马歇尔“假定”完全竞争的缘由。如果能够创立一种比马歇尔的假说更为一般化的理论,能同时满足两种不同情况,亦即既可以涵盖产品差别和厂商数量较少对研究造成很大差异的情况,又可以容纳厂商数量和产品差别可以忽略的情况,那将是极为理想的。这样一种理论将有助于解决目前尚不能解决的问题,此外还有利于确定哪些情况下,如上更为简单的理论已经是现实足够好的近似。为了能够起到这两方面的作用,这一更为一般化的理论必须既有意义又不乏内容实际,其推论含义必须既能够经得住经验的考验,同时又具有极大的影响力与重要性。 由张伯伦、琼??罗宾逊二人所提出的不完全竞争或称垄断竞争理论,就是为创立以上更为一般化的理论所做的尝试。不幸的是,他们的理论丝毫不具备一个真正有用的一般化理论所应有的特征。他们的理论贡献大体上也只有以下几个有限的方面:增加了对单个厂商的经济描述,由此相应的多了些可以由马歇尔模型推导出的论断;完善了马歇尔的垄断分析;并最终丰富了可以描绘行业实际经验的词汇。
该理论的明显不足之处或不能处理有关一类厂商的问题时——即马歇尔的行业——表现得尤为明显。只要坚持产品之间的差异是至关重要的,也是上述理论的显著特征,那么也就无异于坚持不能通过生产同质产品的厂商来定义一个行业。按照此定义,单一厂商都是一独立的行业。“接近的”替代品和需求交叉弹性大小的“显著”差异等定义中,“接近”、“显著”这类词语好比说“小的”空气压力都回避了讨论主题,而又将一些含糊不清、无法定义的要素引入抽象模型中,此举最终也只能导致理论分析变得毫无意义可言。在一个地方,张伯伦隐晦地将行业定义为具有相同成本曲线与需求曲线的一类厂商。但是,只要声称产品之间的差异是至关重要且不能忽略,那么,以上定义在逻辑上同样也毫无意义。如果“生产推土机的厂商与生产发夹的厂商具有相同的成本与需求曲线”,那这又应作如何理解呢,如果(张伯伦的)行业定义对于推土机与发夹的例子是毫无意义的,那么,只要坚持两种牌子的牙膏之间存在根本性差异,该定义对两种牌子的牙膏也同样毫无意义。 垄断性竞争理论未能提出一个行业分析的有效工具,也没能描述介于单一厂商与一般均衡两个极端的中间情况。因此,就一系列重要问题的研究未有助益:在分析的一个极端,其适用性相当窄;而相反,另一个极端却又太泛,也无法得出一些有意义的归纳。 6.结论 经济学作为一门实证科学,是由一系列能够对条件变化作出预测、可以暂时被接受的归纳体系组成。扩展这一归纳体系的内容,巩固我们对其有效性的信心,以及提高预测的精确性方面的进程,不仅受到人类知识探索能力上的限制,同时还受制于一般社会科学尤其是经济学存在的种种桎梏。但是,这些桎梏并非只局限于社会科学、经济学领域。对经济问题的熟识使得人们对专门针对此问题的经济理论知识不屑一顾。经济主体对每日生活和公共政策主要问题的重要性,一方面助长了科学分析与规范判断的混淆,另一方面又有碍于客观性。只能依据无法控制的实验,而不能做控制性试验,使得在判定接受常识性假说与否时,缺乏大量的明确证据。虽然,有赖于无法控制的实验并不影响如下方法论的基本原则,即假说检验唯有通过观察其推论或预测与可观察的现象之间是否一致才能实现;但是,这也使得假说检验尤为困难,并且使得相关方法论原则之间出现更大程度的混淆。与其他科学家相比,社会科学家在方法论方面更需有自知之明。 一种业已流行甚广且危害相当大的混淆就是有关“假设”在经济分析中的作用。任何有意义的科学假说或推论都
会无一例外的断言,在理解某类现象时,某些因素是重要的,而其他因素是不重要的。通常可以方便的将假说表述为:假说意欲预测的现象在观察者看来似乎“好像”处于一个假象的、高度简化的世界,其中只有那么假说认为是重要的因素在左右事物发展。一般来说,提出此类描述的方法不止一种,即用以表述理论的“假设”体系不止一种。备择假设的选择,通常由于下述两个方面的考虑:一是其在假说表述上的简练性、清晰性及明确性;二是假设能否带来间接证据,使得假说的一些推论的有效性可以通过简单观察加以检验,或者能否与已有研究相似现象的假说建立联系,等等。 理论的检验不能通过直接比较其“假设”与“现实”的差距。的确,这样做也毫无意义。显然,完全的“真实”是无法达到的,而就某一理论是否“足够”真实,只有通过考察理论的预测水平是否符合我们的要求,或者是否比其他备择假说的预测更优。然而,认为理论可以通过其假设的真实性来检验,而不必考虑其预测准确性的看法,已经广为流传,并还导致对经济理论的不现实性作旷日持久的批评。这些批评大多没有多大意义,结果由此引发的改革经济理论的企图也多半不成功。 当然,如此之多的有关经济理论的批评均无到达见地,并不意味着既存的经济理论就应该是具有较高的可信性。这些批评可能是无的放矢,但也可能存在有的放矢的情况。在枝端末节上,这种情况明显存在。任何一种理论都必然是暂时的,且都将随着知识的增长而置于不断变化之中。遑论这种老生常谈,却也是有必要更具体化“既存的经济理论”所包含的内容,并对经济理论的不同分支区别对待。经济理论的某些部分明显的要比其他部分具有更高的可信度。对实证经济学现状的全面评价,对其有效性检验的相关概括,进而评定每一部分的相对可信度,都是其他专著活一系列专著的任务了。如果这是完全可能的,那么的确也绝非一篇方法论的短文所能胜任。
在这里,我所能做到的只是概略的表述一下我个人的观点。在我看来,既存的相对价格理论,解决不了不同最终用途要求下的资源配置问题,以及产出品在协作生产要素之间的分配问题。马歇尔的《经济学原理》一书基本上奠定了相对价格理论的现有结构。依我之见,相对价格理论似乎已经成果斐然,并且对西方国家特有经济体制有较大(解释与预测)可信度。尽管似乎表面上存在着相当的分歧,但现有的静态货币理论也同样地极富成果,并且可信度较高。静态货币理论的主要任务,是解释经济作为一个总体的绝对价格、总产量及其他变量的结构性或长期性水平。从休谟到剑桥派再到欧文??费雪和其后的约
翰????????????????????????????????????????梅纳德??凯恩斯,静态货币理论至今沿承的核心都是货币数量论。在我看来,既有经济理论中的最薄弱、最难令人满意的莫过于货币动态分析领域。货币动态分析研究的是经济整体对环境变动所采取的调整过程,亦即涉及总量活动的短期波动问题。在这一领域内,我们至今甚至还没有形成一种堪称为货币动态分析理论的理论。 当然,即使在相对价格理论与静态货币理论中,扩展既存理论的解释、适用范围以及提高其预测的准确性方面,仍然可以大有可为。具体来说,对“假设”描述真实性的过分强调,已经导致构成该领域现有经济理论的假说体系,普遍忽略了假说有效性范围的关键问题。与假说相对应的抽象模型,都已经相当精致并且严格性与准确度也有较大改善。有关经济体系及其运行方面的描述性材料,业已大大丰富到前所未有的规模。这些都将大有裨益。但是,如果我们想要有效的使用这些抽象模型与描述性材料,则还需有一系列的可比评价标准:确定对某些具体问题最好适用哪个抽象模型;明确抽象模型的个体如何
对应到可观察的个体;判断对具体模型或理论的预测的准确度而言,具体问题或环
境的哪些特征将尤为关键。 实证经济学的进步不仅需要既有假说的检验和完善,
而且还有赖于新假说的创立。对于后者我们尚缺乏能上的了台面的论述。假说的创
立时集结灵感、直觉与发明的创造性活动,其核心要点在于从熟识的材料中发掘新
意。这一过程必须归由心理学讨论,而不应列入逻辑的范畴;只能在自传与传记中
加以研究,而并非科学方法的专著中所能讨论的;也只能由实例和格言加以发挥,
逻辑定理在此也只是英雄无用武之地。 (Friedman, Milton. The Methodology of Positive Economics. in Essays in Positive Economics. University of Chicago
Press,1953.本文为陈春良译) PAGE PAGE 1
范文三:实证经济学方法论
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
实证经济学的方法论?
Milton Friedman
(芝加哥大学)
在凯恩斯的名著《政治经济学的范围与方法》一书中,约翰. 梅纳德·凯恩斯对实证科学及规范科学作了区分。他认为:“一门实证科学……是关于什么是这一类问题的系统的知识体系;而一门规范科学(或称为管理科学)……是关于什么应该是这一类问题的标准的系统的知识体系……;是一门艺术……是为达到某一特定目标而设立的原则体系”;他指出:“这二者之间的混淆带有很大的普遍性,并成为很多殆害大分之谬误的根源”;他还强调了“创立一门准确无误的政治经济学的实证科学的重要性。” 本文将主要对某些方法论问题加以阐述,这些问题产生于人们为创立凯恩斯所倡导的“准确无误的实证科学”所作的努力,其中特别涉及的是,如何确定某一被提出的假说或理论,是否应被暂时地接受为“关于什么是这一类问题的系统的知识体系”的一部分。但是,凯恩斯所悲叹的这种混淆仍然如此之普遍,并极大地妨害了人们对经济学可以是——而且部分地确实是——一门实证科学的认可。所以,我们最好在本文的开头先论述一下实证经济学与规范经济学之间的关系。
一、实证经济学与规范经济学之间的关系
在某种程度上,实证经济学与规范经济学之间的混淆是不可避免的。在几乎每一个人看来,经济学所研究的问题与其自身是极为攸关的,而且是困于他们自己的经历与能力的范围之内;这一现象便是不断的广泛的分歧的根源,并成了频繁立法的契机。那些自许为“专家”的人们意见迟异,而且我们很难保证他们都是毫无偏见的。无论如何,在那些事关重大的问题上,即使这些“专家”们几乎一口同声而且毫无偏见,我们也很难完全不加考虑地接受他们的观点。实证经济学的结论似乎是,而且确实是与重要的规范问题密切相关的,是与应该做什么及如何取得某一既定目标等问题密切相关的。门外汉与专家一样,都在无一避免地试图改造实证结论以适应为他们所极力坚持的规范性的先入之见,并当这些实证结论的规范性含义——或所谓的这些实证结论的规范性含义——不合他们的口味时就否定这些实证结论。 从原则上说,实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说,它要解决的是“什么是”,而不是“什么应该是”一类的问题。它的任务是提供一套一般化?原载: "The Methodology of Positive Economics"In Essays In Positive Economics(Chicago: Univ. of Chicago Press, 1966), pp. 3-16, 30-43.
Milton Friedman:实证经济学的方法论
体系,这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。这一体系的运行状况可以通过它所取得的预测与实际情况相比的精确度、覆盖率及一致性等指标来加以考察。简而言之,实证经济学是,或者说可以是一门“客观的”科学,这里“客观”一词的含义完全等同于任一自然科学上的定义。当然,经济学所涉及的是人与人之间的关系,而且调查研究者本身就是被调查研究的事物的一部分。与自然科学相比,调查研究者与被调查研究的事物之间更具有本质上的联系。上述事实在使社会科学家得到了一系列自然科学家无法得到的数据的同时,也使社会科学家在实现客观性的目标上遇到了特有的困难,但是在我看来,这些都不是这两类科学之间的根本差异之所在。
另一方面,规范经济学及经济学的技术也不可能独立于实证经济学。任何政策结论都不可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测,而预测则必须明确或不明确地基于实证经济学。当然。在政策结论与实证经济结论之间并不存在着—一对应的关系;如果有的话,那么则不必另外再创立一门规范经济学了。两个不同的个体可能在对某一个别立法的结果问题上意见一致。但其中的一个可能认为这些结果有利于平衡,进而拥护这项立法;而另外一个却可能认为这些结果是不合意的,进而反对这项立法。
然而,我对这样一种看法提出疑义:这种看法认为,在目前的西方世界,特别是美国,在毫无偏见的公民之间所存在的有关经济政策的分歧,主要地来源于人们对所采取的行动将带来的经济影响的不同预测。而这些分歧从原则上说是可以通过实证经济学的发展而予以消除的。持这种看法的人不认为人们关于经济政策的分歧是来源于人们在基本的行为准则方面的根本性分歧,来源于人们在最终可能出现的矛盾双方问题上的分歧。一个明显的而且并非不重要的事例就是最低工资限制问题。尽管在形式上存在着对这一立法的褒贬纷争,但人们在为所有的人争取到一个“生存工资”这一政策目标上却形成了根本一致的意见。而且“生存工资”这一含义模糊的概念在这一类问题的讨论中得到了广泛的运用。人们的意见分歧主要产生于人们在预测方面的隐含的或明确的分歧。这一预测涉及的是最低工资限制这一特殊手段在实现目标中的功效问题。该项立法的支持者们认为(即预测),法定的最低工资通过提高那些工资收入在最低工资线之下的劳动者的收入,及提高那些工资收入在最低工资线之上的劳动者的收入,进而消除了贫困。而且与此同时并不存在完全失业人数增加及就业条件因该立法的实行而恶化一类的消极作用。而该项立法的反对者们认为(即预测),法定的最低工资通过失业人数的增加及就业条件的恶化而加重了贫困现象。而且这一消极作用不仅抵消了该项立法给在业者工资收入所带来的有益影响,市且还可能使之状况更加恶化。人们在该项立法的经济影响问题上的看法一致,并不能使人们在该项立法的合意性问题上看法一致。这是因为仍然存在着人们在该项立法的政治或社会影响等问题上的分歧。但是,在目标一致的情况下,人们一定会经过漫长的道路而趋于一致的。
人们在工会的适当作用及地位的问题上的各种不同意见,及人们对直接的价格与工资控制的合意性及关税的合意性等问题的各种不同看法,都是以实证分析中的一些密切关税的分
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
歧为依据的。人们对所谓的规模经济的重要性的不同预测,在很大程度上说明了人们在工业部门中政府的全面控制的合意性及必要性,甚至在社会主义(而不是私人企业)的合意性及必要性等问题上的不同看法。而且关于这一方面问题的事例举不胜举。当然,我的这一主张——即在西方社会中人们在经济政策问题上的主要分歧具有如上所述的性质——其本身就是一种“实证”阐述,它的正确与否还有待于经验证据的检验。
如果这一主张是合理的,那么它意味着。人们在“正确的”经济政策问题上的一致意见较少地取决于规范经济学的进步,而更多地是取决于这样一种实证经济学的发展:它所得出的结论不仅而且值得受到广泛的赞同。它还意味着:对实证经济学与规范经济学加以严格的区分的主要原因就在于这样一种贡献,即这一区分促进了人们在政策问题上的意见一致。
二、实证经济学
实证科学的终极目的就是要发展这样一种“理论”或”假说”,使之能够对尚未观察到的现象作出合理的、有意义的(而不是老生常谈的)预测。总体说来,这样一种理论是一个由两种元素构成的复杂的混合体。部分地说,它是一种‘语言”,旨在促进“系统的、有组织的推论方法”。部分地说,它是一系列假说的综合体,旨在从纷繁复杂的现实中抽象出事物的本质特征。
作为一种语言,理论不具有任何实质性的内容;它是一系列同义反复的词语的综合体。它的作用在于为经验材料的组织及对经验材料的理解提供文牍服务;而且用以检验这一服务质量的标准也是那些适合于文牍体系的标准。对这些事物的种类所下的定义清楚而准确吗?对这些事物种类的划分穷尽了吗?我们知道每一单个项目都应归于哪一类吗?或者,在这其中是否存在着相当的似是而非现象呢?人们对大标题及次标题体系的划分是否已达到这样的完备程度,从而使我们能够迅速地找到我们所要的条目呢?还是由于混乱不清而使得我们不得不一处一处地加以涉猎呢?我们将要研究的条目是否都已编排到一起了呢?条目的编排系统是否已避免了交叉重复呢?
对上述这些问题的回答部分地取决于逻辑上的考虑,部分地取决于事实上的考虑。标准的逻辑准则本身可以说明某一特殊语言是否是完全的及连续的,即这一语言中的命题是“正确的”还是“错误的”。事实上的证据本身可以说明“逻辑编排系统”的种类能否在实际中找到有意义的对应物,即在分析具体问题中的某一特殊种类时,这些条目划分是否能起到一定的作用。“供给”与“需求”这一简单的事例既说明了这一点也说明了前面所谈到的一系列逻辑分析问题。作为经济理论这种语言的构成要素,供给与需求是两大主要类别,影响产品的相对价格的因素及影响生产的因素都被划到这两大类别中来。这种二分法的实用性取决于“它在经验资料方面的高度概括性,即如果我们把任一问题中影响需求的力量与影响供给的力量分别开列出来的话,那么我们将会得到这样两类资料:它们之间很少有哪些项目是共同的。”现在,这样一种概括对于象消费品终极市场一样的市场来说是合理的。在这一类市
Milton Friedman:实证经济学的方法论
场中,可以被看作是需求产品的经济单位与可以被看作是供给产品的经济单位之间存在着明确的、严格的区分。很少存在这样的混乱现象:从某一方面看来,某一特殊因素应被划归影响供给的项目之类,而从另一方面看来,又应被划归影响需求的项目之类。而且也很少有必要考虑两个类别之间的交叉效应(即交叉重复)。在这类问题中,在标题“供给”与_“需求”下对有关因素进行编排所需要采取的步骤既简单又明了,从而极大地简化了我们所面临的问题,而且这种简单明了的方法还防止了在其它情况下可能出现的差错。但是,这种概括并不是在任何情况下都是合理的。例如,在一个主要是投机性的市场中,对于价格的每日波动来说,这一概括就是不合理的。例如,一则关于增加超额利润税的谣传,对于股票市场来说,是应当看作是主要对今天的公司股票供给发生影响的因素呢,还是应当看作是主要对今天的公司股票需求发生影响的因素呢?在类似的情况下,几乎对于每一因素来说,将其划归“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。这些概念仍然可以使用而且不可能是毫无意义的;它们仍然是“正确的”,但与在第一个例子中的情况相比它们的用处则明显地要小得多,这是因为它们没有有意义的实证对应物。
作为一种实证假说体系,理论应该通过其对它意在加以“解释”的那一类现象的预测能力来检验。唯有实际证据才能表明该理论是“正确的”还是“错误的”。或者更为准确地说,唯有实际证据才能表明该理论是被作为合理因素而暂时地得到“接受”呢,还是遭到了“拒绝”。正如我下面将更为详细地阐述的那样,对某一假说的合理性的唯一有关的检验,是将其预测与实际情况所作的比较。郊果该假说的预测(“频繁地”或比来自于另一假说的预测更为经常地)与实践相抵触,那么该假说则遭到了否定;如果该假说的预测没有与实践相抵触,那么它则为人们所认可;如果该假说业已多次成功地避免了可能出现的抵触现象,那么它则具有极大的可信赖程度。实际证据永远也不可能“证实”某一假说的正确性,它只能通过无法将该假说驳倒来显示该假说的正确性。当我们说到某一假说已经在实践中得到了确认时(并不十分准确),我们通常所指的就是这个意思。
为了避免误解,可能有必要明确一下:我们用来检验某一假说的合理性的“预测”,并不一定非得是对尚未发生的现象所作的预测,也就是说,不一定非得是对将来事件的预见。它可以是对业已发生了的现象所作的预测,但前提条件是对这一现象所作的观察尚未进行,或者是虽然对这一现象的观察业已作出。但进行预测的人尚不知晓。例如,在其它一些情况已知的情况下,某一假说预测在1906年将会有某些情况发生。如果对这一时期的史料记载所作的研究表明,在1906年某些情况确实发生了,那么该预测则得到了实践的确认。反之,如果研究表明在1906年某些情况并没有发生,那么该预测则与实际情况发生了抵触。 从这种意义上讲,某一假说的合理性本身并不足以作为对其它假说进行取舍的标准。人们可以观察到的事实在数量上必然是十分有限的,但可能的假说却是无限的。如果存在某一种假说与可得证据相一致,那么一定还有无数的假设也与这一可得证据相一致。例如,假设对某一特殊消费品所征收的一种特别货物税,导致了价格的上涨,其上涨幅度完全等同于税
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
收的数量。这与竞争情况下稳定的需求曲线、水平的且稳定的供给曲线是一致的;但它也与竞争情况下需求曲线或供给曲线发生必要的相应移动后的斜率为正或为负的供给曲线相一致:它也与垄断情况下常边际成本及稳定的需求曲线相一致,只是为了取得上述结果要求后者具有某一特定的形状;等等,等等,无穷无尽。这一假说所适应的另外一种证据可以起到剔除上述某些可能情况的作用;但它绝不可能把这些可能性削减为一种,而独自地与这一有限的证据相一致。对那些与可得证据同等一致的假说所进行的选择,在某种程度上是任意的。虽然我们一致同意这样的观点:对选择所进行的考虑应以“简洁性”与“成效性”为出发点,但这二条标准的本身就意味着否定完全的有目的的简化。一理论越是“简单明了”,在某一既定领域内对现象进行预测所需要的初始知识也就越少;一理论越是“富有成效”,它对现象所作的预测也就越精确,而且该理论进行预测所依据的范围也就越大,同时,为了进一步研究的需要,它所要加以说明的东西也就越多。逻辑上的完整性与一致性虽然也与评判的标准有关,但只起一个辅助作用;二者的作用在于确保该假说能够正确地阐明宗旨,而且做到使每一个研究该假说的人的理解都准确无误——在这里,它们与统计计算中对数字精确度的检验所起的作用是一样的。
不过,我们对社会科学中某一特殊预测所作的检验,很少能够通过这样一种实践来进行:这种实践是经过专门设计的,意在消除被认为是最重要的干扰因素。通常,我们不得不依赖于偶然发生的“实际情况”所提供的证据来进行我们的检验、在我看来,社会科学中无法进行所谓的”有所控制”的实验,这并不能反映社会科学与自然科学之间的根本区别。这既是因为“无法控制”的实验并非为社会科学所特有(自然科学中的天文学就是一例),又是因为有控制的实验与无控制的实验之间的差异充其量不过是一个程度上的差异。没有哪一种实验是可以完全控制的,同时每一种实验中又都存在着部分的控制,这是因为某些干扰因素在整个实验过程中应保持相对的稳定.
实践所提供的证据是大量的,而且常常是确定性的,犹如经过了设计的实验一般。所以,无法指导实际情况并不是通过预测的成功来检验假设的根本性障碍。但如此得到的证据在解释上却要比前种情况困难得多。它常常是复杂的,而且总是间接的和不完全的。对这种证据的收集常常是困难的,而且对这些证据的解释通常需要进行细致入微的分析工作,同时还涉及到一系列的推理判断,而这些很少能够真正做到把握事物的真谛。“具有决定性意义”的实验所带来的大量的直接证据与经济学之无缘,的确妨碍了检验假说工作的顺利进行。但与这一情况在取得合理的结论,及在由可得证据所证明了的结论上取得一致意见等方面所带来的巨大困难相比,前一种妨碍则显得微不足道了。它使得人们对失败的假说的摒除工作进展缓慢且困难重重。这些失败的假说很少永远告别经济舞台,相反却总是一再出现。
当然,这些方面的问题并不是整齐划一的。有时,实践所提供的证据与有控制的实验所能提供的证据几乎一样地直接、大量与确定。也许,最明显的重要例证要数通货膨胀问题。这种通货膨胀证据是服务于这样一种假说的:在一个较短的时期里,货币数量的大量增加必
Milton Friedman:实证经济学的方法论
然伴随着价格的大幅度上升。这里,这方面的证据是大量的,且为对这些证据加以解释所需要的推理判断较少。然而,尽管存在着大量的价格大幅度上涨的事例,但这些事例与货币存量的大量增加之间的本质上的—一对应关系,及在其它相关的情况下的变异程度等,决定了每一次新的通货膨胀体验都必将带来激烈的争论,而且这种争论不仅仅是来源于非职业经济学家的人民大众。反对原假说的观点认为:货币存量的增加或者是来源于由其它因素所导致的价格上涨的偶然性影响,或者是价格上涨的一个完全偶然且不必要的附带物。
检验大量的经济假说的困难性所造成的一种影响就是:它使得我们的检验工作退回到纯粹的正统或繁琐分析中去。正如我们业已阐述的那样,繁琐重复在经济学及其它科学中,作为一种专门的语言或“分析编排体系”而占有极为重要的地位。此外,同样是同义反复的正统逻辑学与数学又成了这些问题的重要工具:检验判断推理的正确性;发现假说的深刻含义;确定是否一系列被假定为不同的假说的确不可能是等价的,或者在它们之间存在着差异等。 但是,如果一经济理论想保能够预测未来,而不仅仅是描绘行动的结果,那么仅作为一个同义重复的体系是远远不够的。同样,如果一经济理论想要有别于模糊数学时,那么仅作为一个同义重复的体系也是远远不够的。而且如我们前面所提到的那样,这些同义反复的实用性本身还将最终地取决于关于将某一棘手的实际问题划归某一种类的那些假说的可接受性。
通过预测而对经济假说加以检验所具有的困难造成了另一个更为深刻的影响,那就是它使人们对经验证据在理论著作中的作用产生了误解。在下述两个虽联系紧密但并不相同的阶段中,经验证据起到了至关重要的作用:一是构造假说的阶段,二是检验假说的合理性的阶段。完整且详尽的经验资料,作为我们将通过假说而予以概括总结或“加以解释”的实际现象的代表,除在提出新假说时所具有的重大作用外,还被用来验证一假说确实说明了它旨在说明的问题——即该假说对某一现象所作的阐述并不与人们业已观察到的实际情况相矛盾。在某一假说与人们掌握的实际资料相一致的情况下,人们对该假说所作的进一步检验,是要将那些事先并不知道然而却可以从实践中观察到的新因素从假说中剔除出去,同时还要对这些被剔除的因素加以检验,以了解这些因素与其它的经验证据之间的背离情况。为了使后一种检验同前一种检验密切相关,那些被剔除的因素必须与该假说旨在说明的问题同属一类现象;而且对这些被剔除的因素所作的限定必须足够地准确,从而使得人们所作的观察能够证明这些因素是不正确的。
构造假说与检验其合理性这两个阶段之间的相互联系可以从两个方面表现出来。第一,在某种程度上可以这样说:进入每一阶段的那些特定的因素,是由资料的收集及某一特定的调查者的知识水平所决定的一个偶然现象。被用来检验某一假说的内涵的那些因素可能同样适当地属于被用来构造假说的那些原始资料,反之亦然。第二,创立一假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及到对一系列早些时候提出的、以实际观察为依据的假说所进行的比较。这些假说的涵义之间的相互矛盾,成了促进人们构造新假说或
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
修改原有假说的始动力。所以,这两个在方法上截然不同的阶段,在实际进程中又总是相辅相成、互为前提的。
人们对这一简洁明了的过程所产生的误解,主要在于下面这一表述:“该假说是为解释这一类现象而提出的。”社会科学中,对这一类现象的新证据的获得十分困难,而且对这些新证据与该假说的含义之间的一致性的判断也十分困难,这些情况使得社会科学试图作出这样的假设:其它的、更为可得的证据与该假说的合理性是同样相关的。这就等于说假定假说不仅具有“含义”,而且还具有”“假设”;这些“假设”与“现实”之间的一致性是检验该假说的合理性的标准——这一标准或者不同于通过含义所进行的检验,或者是对通过含义所进行的检验的一种补充。这一为人们所广泛持有的观点不仅是根本错误的,而且还成了更多的缪误产生的根源。它不仅没有为不合理的假说向合理的假说的转化提供捷径,相反却混淆了是非,造成了人们对经验证据在经济理论中的重要性的误解,使得人们为促进实证经济学的发展所作的智睿的探索迷失了方向,而且阻碍了实证经济学中人们在试验性的假说上一致意见的取得。
即使在一理论可以被说成是具有“假设”的限度内,即使在这些‘假设”的”真实性”可以独立于预测的合理性而接受检验的限度内,该理论的重要性与它的“假设”的“真实性”之间的相互关系,也完全不同于我们前面所批评的那种观点所提出的内容,甚至几乎是后者的反面。那些真正重要且伟大的假说所具有的“假设”,是对现实的一种粗略的、不十分精确的、描述性的表述.而且,一般说来,某一理论越是杰出,那么它的“假设”(在上述意义上)就越是超脱现实。这其中的原因是非常简单的。如果一假说能够通过极为有限的资料而进行大量的“阐述”,即如果一假说能够从它旨在解释的那一现象周围的大量复杂且详尽的情况中,抽象出共同且关键的因素,并能保证仅在这些有限资料的基础上作出合理的预测,那么,这一假说就是意义重大的。所以,为了意义重大,一个假说在其假设方面必须运用一些描述性的技巧;既然该假说的伟大成功将证明其它许多的有关情况与该假说旨在阐明的现象是毫不相关的,那么该假说也就不必考虑并说明这些情况。
为了使这一点不那么难于理解,我们所要问的另一个与一理论的“假设”有关的问题,不是这些假设是否在描述上是“现实主义的”,因为它们从来就不是,而是这些设想对于我们已有的目标来说,是否是一个足够好的近似物。而对这一问题的回答唯有道过考察该理论是否应验,即该理论是否取得了足够精确的预测水平来进行。这样,这两种原假设为独立的检验方法合二为一。
垄断的与不完全的竞争理论,就是在经济理论中忽视上述主张的一个例子。被说成是构成新古典经济理论的基础的“完全竞争”或“完全垄断”假设,是现实生活的一幅虚假的图象这样一种观点,明确地促进了垄断与不完全竞争分析的发展,而且也大致地说明了该分析得到广泛的接受与赞同的原因。而这一观点本身,几乎全部地以这些假设的这种直接可见的不精确性为基础,而不是以从新古典经济理论中导出的预测的任何得到认可的矛盾点为基础
Milton Friedman:实证经济学的方法论
的。许多年以前,《美国经济评论》对边际分析问题所进行的长篇累牍的讨论,是另一个虽不如前一个例子重要,但比前者更为明确的例子。争论双方的文章,在很大程度上都忽略了在我看来似乎是关键性的问题——即边际分析原理与实践经验的一致性问题,而注重于商人是否确实地通过考察代表边际成本与边际收益的表格、或曲线、或多变量函数,来制定他们的决策这样一个几乎毫不相关的问题。也许这两个例子及它们所业已揭示的其它许多事例,可以对所涉及的方法论原则问题的讨论起到判别作用,而且通过这两个例子所说明的问题也许要比其它似乎是适当的方法所能说明的问题要广泛得多.
三、可以通过一假说的假设的真实性来检验该假说吗?
我们先从自由落体法则这样一个简单的自然事例开始来进行我们的讨论。在真空中,一落体的加速度是一个常数——g,在地球上是每平方秒大约32呎——而且落体的加速度与该物体的形状、投掷方法等因素无关,这一假说已得到了人们的广泛接受。这就等于说一落体在任一特定的时间范围内所下落的距离可以用S=1/2 gt这一公式来算出。这里, S是该落体下落的距离,单位是呎,t是物体下落的时间,单位是秒。将这一公式应用到一个从楼顶下抛的实心球上,就等于说这样抛下的那个球的运行情况就如用它在真空中被抛下时的运行情况。通过这一假说的假设来对其进行检验,可能意味着对实际气压进行测量,并确定它是否接近于零。在海平面上,气压大约是每平方时15磅。为了使这一气压差别被判定为可忽略不计的,15是否是足够趋近于零的呢?因为这一实心球从楼顶降落到地面实际所需的时间与这一公式所给出的时间非常接近,所以很明显,这一15之差足够趋近于零。然而,假定现在抛下的是一根羽毛而不是一个实心球。那么这一公式所得出的结果则是非常之不精确的.很明显,对于一根羽毛(而不是对于一个实心球)来说,每平方时 15磅完全不同于零。或者,我们再假定这一公式的应用对象是从3万呎高的飞机上抛下的一个球。在这一高度,气压绝对地小于每平方吋15磅。然而,从3万呎降到2万呎(在这一点上的气压仍然大大小于海平面上的水平)所用的实际时间却完全不同于上述公式所预测的时间——大大地高于实心球从楼顶落到地面所需的时间。按照上述公式,该球的速度应为gt,而且还应该稳定地增长。事实上,一个从3万呎降落的球是在它碰到地面以前达到它的最高速度的。而且上述公式的其它含义也都与此类同。
为了使气压差别能够被判定为是可以忽略不计的,15是否足够地趋近千零这一初始问题本身就是明显地愚不可及的。每平方吋15磅等价于每平方呎2160磅,也等价于每平方吋0.0075吨。如果没有一些外在的比较标准,则不存在对这些数字评判大小的依据。而这唯一相关的比较标准就是在一系列既定的情况下,该公式可以应用或不可以应用的气压水平。但这又在另一个层次上带来了同样的问题。“可以应用或不可以应用”的含义是什么?即使我们可以消除测量上的误差,但物体降落的实际测得时间与公式计算所得的时间,很少(如果曾经有过的话)完全相等。为了能够判定自由落体理论之“不可以应用”,这二者之间的2
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
差异必须要多大呢?下面将是进行比较的两条重要的外在标准。一个是与该理论进行比较、且在所有其它方面与该理论是同等地可接受的另一理论所能达到的精确度。另一个是这样一种标准,它只有在存在着某一业已为人们所知道的、具有更好的预测水平,然而其预测成本较高的理论的前提下,才会存在。而且更高的精确度所带来的效益(这取决于人们的使用目的),一定能够弥补取得这一精确度所需要的成本。
这一例子既证明了通过一理论的假设来检验该理论的不可能性,也证明了“某一理论的假设”这一概念的模糊性。S=1/2 gt这一公式对于真空中的落体来说是正确的,而且可以通过对这一类物体的运行情况的分析而推导出来。所以,可以这样阐述:在多种情况下,在实际大气中降落的物体,其运行情况如同在真空中所进行的降落。如果用我们经济学中最常用的话来表述,那么上述文字立刻会被表述成:这一公式假设存在着一个真空。然而很明显上述表述并没有作任何诸如此类的假设。上述表述的真正意思是:在许多情况下,气压的存在,物体的形状,投掷物体者的姓名,投掷物体所采用的方法及许多其它的附加条件,对于该物体在一定时间内所下降的距离并无可估计的影响。我们完全可以对该假说重新进行表述,从而完全不再提及真空因素:在许多情况下,一物体在一给定的时间内所下降的距离由公式s=1/2 gt给出。如果我们撇开该公式的历史不谈,撇开与之相联的其它自然科学理论不谈,那么说该公式假设存在着一个真空还有意义吗?就我所知,还可能存在着其它的假设体系,而能够取得这同样的公式。这一公式之所以被接受是因为它与现实相符,而不是因为我们生活在一个大致的真空里——不管这种大致的真空指的是什么。
与这一假说相联系的一个重要的问题,是要限定该公式可以应用的条件,或者更为准确地说,是要限定在各种情况下该公式预测的总的误差范围。的确,正如上述对该假说的重新表述中所蓄含的那样,这样的限定与该假说并不是截然不同的两件事。限定本身就是该假说的一个重要组成部分,而且它是这样一个组成部分:随着实践的不断增加,它是特别有可能被修改与扩展的部分。
在落体这一特殊情况中,还存在着另一虽仍不完善但更为一般化的理论。这一理论主要来自于人们为解释前一种简单理论中存在的误差而进行的探索;而且在这一理论中,人们可以对某些可能存在的干扰因素的影响加以衡量;而且在这一理论中,前一种简单理论只是作为一种特例而存在。然而,这一更为一般化的理论并不总是能够得到应用。这是因为,它所取得的精确度的增加可能不能弥补使用这一理论所带来的成本的增加。所以,在何种情况下前一种较简单的理论可以“充分完善地”反映现实,这仍然是一个事关重要的问题。气压是限定该理论可应用的情况的那些变量中的一个,但只是其中之一;物体的形状,使达到的速度,及其它变量也都是与限定有关的。对气压以外的这些变量加以阐述的方法之一,就是将这些变量视为决定对真空“假设”的某种背离是否是事关重大的。例如,每平方吋15磅的气压对于一支羽毛来说是截然不同于零的;但对于从一高度不大的地方下抛的实心球来说,却是可以视为趋近于零的,这些都是物体的形状所带来的差别。然而,这样的表述绝然区别22
Milton Friedman:实证经济学的方法论
于下面这种不同的表述:该理论不能应用于羽毛落体,因为该理论的假设是错误的。然而它们之间的相互关系却完全是另一种情况:对于羽毛来说,这些假设是错误的,原因在于该理论不能应用于羽毛落体。这一点需要引起大家的重视。这是因为,在限定某一理论可以成立的条件的过程中,“假设”的完全正确的运用通常错误地被理解为假设可以被用来确定某一理论可以成立的条件,而且,这一误解成了理论可以通过其假设而进行检验这一观点的主要根源。
下面我们再来看另一个例子。这一次是一个臆造的事例,旨在使之成为社会科学中的许多假说的同类物。让我们来考虑一下一棵树上叶子的密度。我提出的假说是:这些叶子的位置是这样确定的:在其周围的叶子位置一定的条件下,每一片叶子都好象有意地使它所能得到的阳光数量最大化;每一片叶子都好象知晓决定在不同的位置上可得阳光数量的自然法则,并且能够迅速地(或曰即刻地)由任一位置移到任一其它合意的且尚未被占据的位置。现在,该假说的某些更为明确的含义明显地与实际情况相一致:例如,一般来说,树南侧的叶子密于树北侧的叶子,但如本假说所意含的那样,在山的北坡,或当树的南侧为其它东西所遮盖的情况下,树的南北两侧叶子密度的差异就不会那么明显。或完全不是原来的那种情况。就我们所知,叶子不能“有计划地行事”,或者说不能有意识地“追求”什么,它们没有进过学校并学会为计算“最佳”位置所必需的科学或数学的有关法则,难道我们可以据此认为该假说是不可接受的或曰不合理的吗?很明显,该假说的这些与事实相矛盾的情况中,没有一个是至关重要的。这里所涉及的现象不在“该假说旨在阐述的那一类现象”的范围之内。该假说并没有宣称叶子可以做到上述事情,它只是认为:这些叶子的密度是同一的,就犹如它们可以做上述事情一般.尽管该根说的“假设”中存在着明显的非现实性,但由于该假说的含义与实际观察的一致性,使得该假说具有极大的合理性。我们倾向于在下述意义上“阐述”该假说的合理性:由于阳光促进了叶子的生长,所以,在阳光较多的地方叶子将生长得更加茂密,或者说将有更多的假定存在的叶子能够得以生存下来。所以,完全被动地将这一假说应用到更为广泛的情况中去所得到的这一结果,与通过将某些特定环境附加其上所得到的结果是完全相同的。这后一种说法比前面造的那一种假说更为引人入胜,这不是因为后一种假说的“假设”更具“现实性”,而且因为后一种假说的“假设”本身就是一个更为一般化的理论的一部分。这种更为一般化的理论所能应用的现象种类更为广大,而且在这一更为一般化的理论中,一棵树上叶子的具体位置不过是该理论的一个特例。这一更为一般化的理论有着更多的可能招致异议的含义,但由于该理论可适用的范围更为广泛从而使得这些含义避开了可能发生的任何抵触。这样一来,叶子生长的直接证据为来自于这一更为一般化的理论所适用的其它现象的间接证据所加强。
我们所臆造的这一假说大致说来是正确的,也就是说,仅对于某些现象来说,该假说关于叶子密度的预测达到了“足够的”精确水平。我不知道这某些现象是什么,也不知道如何去定义它们。然而,有一点似乎是明确的,那就是:在这一例子中,该理论的这些“假设”
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
并不属于该理论的假设范围:也就是说,树的种类,土地的性质等都是可能影响到该理论的合理性所存在的范围的变量种类,而叶子进行复杂的数学计算,或从一个位置移到另一个位置的可能性问题,却与该理论合理性的范围限制无关。一个与人类行为有关的例子大致类似于我们刚才所举的那个例子。这个例子我与萨维奇已在别处引用过。现在,让我们来考虑一下一位台球行家对击球情况进行预测的问题。下述假设似乎并非毫无道理:绝妙的预测通常都是通过这样的假说来取得。这种假说认为,这位台球行家的击球活动就犹如他知晓将会给出最佳运行方向的那个复杂的数学公式一般。而且这一数学公式可以通过眼睛对角度的观察,并确定该球所在的位置等而精确地进行计算。这位台球行家通过该公式而进行闪电般的计算。然后使球按该公式所指定的方向运行。我们对这一假说的信赖并不是基于这样一种观点:台球手(即使是台球行家)可以而且确实经历过前面所描述过的过程;相反,我们对该假说的信赖是缘于这样一种观点:除非这些台球手可以通过这样或那样的方法而取得与上述过程同样的结果,否则的话,他们事实上就不是台球行家。
由这些例子进而引申出下面这个经济原说,这似乎是很容易做到的。这一经济假说认为,在许多情况下,单个企业常常是如此行事,犹如他们在有计划地使其预期成果(通常,如果理解有误的话,则称之为‘利润”)最大化,而且掌握着为成功地实现这一目的所必需的全部数据资料;也就是说,犹如他们知晓相关的成本与需求函数,可以通过他们所掌握的所有情况来计算边际成本与边际收益,并使得他们所采取的每一个行动都恰到好处地符合边际成本与边际收益相等的原则。当然,现在的商人实际上并不完全按照经济数学家所发现的方便途径来解这一联立方程体系。只不过他们这样做的可能性比叶子或台球手明确地完成复杂的数学计算,或落体决定创造一个真空的可能性要大一些。如果台球手被问到他是如何确定击球方向的,那么他可能回答说他“恰好算了出来”,但此外他还要摩擦一下兔后腿来证实一下。而如果一位商人被问到他是如何决策的,那么他可能回答说他是以平均成本来定价的,而且当市场情况发生了变化时,当然也会出现一些微小的偏差。这一表述与前一个表述几乎是同样有帮助的,但它们之中没有一个与对有关假说所进行的检验有联系。
人们对上述成果最大化假说的信赖是由一非同寻常的特征证据所证明的。在某种程度上,这一证据与关于台球手行为的假说中所引证的证据是非常相似的——也就是说,除非商人可以通过这种或那种方法而使其行为近似于与成果最大化相一致的行为,否则,他们似乎不可能长久地维持他们的生意。这里不管明显地、直接地决定商业行为的因素是什么——习惯性的反应,随机性的机遇,或难于归类的一些东西——其结果都是一样的。不论什么时候,只要这一决定因素碰巧导致了与合理的、有实际根据的成果最大化相符合的行为,则生意使会兴隆,并进而需求资源以扩大经营;反之,只要这一决定因素不能带来与合理的、有实际根据的成果最大化相符合的行为,则生意将会亏损,且只有从外部引入新资源才能维持存在。这样一来,“自然选择”过程促进了该假说合理化的实现,或者说在自然选择既定的情况下,人们对该假说恰当地概括了生存条件这一判定,成了人们接受该假说的主要依据。
Milton Friedman:实证经济学的方法论
该成果最大化假说的另一更为重要的证据,来自于该假说在特殊问题中的无数次应用,及在这多次应用中,该假说的含义与实际情况并没有发生抵触这一事实。然而,如果要让这一证据提供佐证那是极为困难的。这是因为它散落在无数的商业便函中、文章中,及专题著作中,而这一切主要地是与特殊的具体问题相联系,而与对该假说的检验并不相关。然而,在很长时期内人们对该假说的持续使用与接受,及未能创立一种逻辑严密、自圆其说的假说来取而代之并得到广泛的接受这一情况,间接地有力地证明了该假说的存在价值。任一假说的证据都总是由人们试图证明它与实际情况相抵触而遭到的多次失败所组成。只要该假说仍在继续使用,那么这一证据就会继续增加。而且,由于该证据的特殊性质,让该证据提供完全充分的证明是十分困难的。这已开始变成某一科学的传统及传说的一部分,后者反映在人们持有假说的坚定性方面,而不是反映在教科书中对那些未能证明该假说与实际情况相抵触的事例所进行的罗列上面。
四、理论“假设”的重要性与作用
到现在为止。我们对一理论的‘假设”的重要性问题所作的结论几乎全都是否定的:我们已经证明了一理论是不能用其“假设”的“真实性”来加以检验的,而且,一理论的“假设”这一概念充满了可疑之点。但是,如果这就是问题的全部,那么我们将很难对这一概念的广泛应用作出解释。同时我们也很难说明这样一种较强的倾向:我们每个人都常常身不由已地谈到一理论的假设,并对各种理论的假设加以比较。有烟就有火。
在方法论当中(如同在实证科学中一样),作出否定性的结论通常要比作出肯定性的结论更有把握。所以,与前面的评述相比,我对下面这些有关“假设”的重要性及作用的评述的把握性较小。就我所能认识到的,一理论的“假设”具有三种虽则紧密相连但却完全不同的实证作用:(1)它们是对一理论进行描述或表述的一种简便形式;(2)它们有时会促进通过假说的含义而对假说所作的间接检验;而且(3)如我们前面已经提到过的,它们有时是对一理论预期的合理性的存在条件加以限定的方便途径。前两个方面还需要作进一步的讨论。
1.“假设”在表达一种理论中的作用
叶子的例子证明了假说的第一个作用。不采用叶子力图使它们所得到的阳光最大化这一说法,我们同样可以在没有任何明显的假设的情况下来表述这一假说。我们的表述是以预测叶子的密度所须遵循的一系列原则的形式来进行的:如果一棵树生长在一处平地上,且没有别的树木或其它物体来阻挡阳光的照射,那么,这棵树上叶子的密度将是如何如何。……相反,如果一棵树是生长在山的北坡,且位于由同样树木所形成的森林的中央,那么,这棵树上叶子的密度将是如何如何……等等。很明显,与叶子力求使它们所能得到的阳光最大化这种表述相比,刚才的那一种表述远不是这一假说的简便形式。事实上,由于前一种较简便的表述既指出了如何确定对本问题来说是非常重要的环境特点,又指出了如何对它们的影响加
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
以评价,所以,前一种表述是对上述一系列原则的简单概括——即使这一原则系列被扩展到无穷大。前一种表述更为精悍而又不失全面。
更广泛地说,一假说或理论通常都含有这样的断言:某些力量(言外之意就是别的力量不是这样)对于某一特定种类的现象来说是重要的;并通常对它所断言的重要力量的行为方式加以限定。我们可以把这一假说看作是由两部分组成的:第一部分是一个概念性的世界,或者说是一个与“现实世界”相比较为简单的抽象模型。这一世界只包含该假说认为是重要的各种力量。第二部分是一系列原则。这些原则定义了这样一类现象——它们使得上述模型得以成为“现实世界”的一个适当的代表,同时,这些原则还对模型中的变量或实体与可观测的现象之间的对应关系作了限定。
从本质上看,这两个部分是截然不同的。模型是抽象的、完整的,它是一种“代数学”或“逻辑学”。在检验模型的一致性与完整性,探究模型的含义方面,数学与正统的逻辑学回归它们的老本行。在模型当中,“大概”、“可能”、或“近似于”这一类东西根本没有存在的余地,而且也不起任何作用。对于真空来说,气压是零,而不是“较小”;对于竞争性市场上的产品生产者来说,需求曲线是水平的(斜率为零),而不是“几乎是水平的。”
另一方面,使用模型的原则却又不可能是抽象的和完整的。它们必然是具体的,从而也就必然是不完整的。这是因为,不论人们如何定义“现实世界”,完整性只有在概念性的世界里才会存在,而不可能存在于”现实世界”中。模型是“在太阳之下不存在任何新的东西”这一只有部分真实性的欺人表述的逻辑体现;然而,在应用模型的原则中却不能忽略具有同等重要性的另一个只有部分真实性的欺人表述:“历史永远不会重新开始。”当一理论是一明显地更为一般的理论的一部分时(如落体这一例子中的真空理论一样),在相当程度上,我们可以把模型的应用原则明确地、系统地阐述出来。尽管这时的阐述仍不完整,但却是最容易进行的。为了使一科学尽可能地具有“客观性”。我们的目标应当是尽其所能地对这些原则作以明确、系统的阐述。并不断地扩大可以进行如此阐述的现象范围。但是,不论在这一努力上面我们取得了多么大的成功,总是不可避免地要在实行这些原则时出现新的问题。每一种情况都有其独特之处.而这是那些明文规定的原则所不能—一囊括的。对这些特殊情况加以判断,并对这些特殊情况是否应影响到可观测现象与模型中的实体之间的对应关系加以判断,这需要具备这样一种能力:这种能力不能靠别人的传授来获得。它只能通过实践并置身于一种“正确的”科学氛围中来掌握,而不能机械照搬。正是在这一点上,出现了业余爱好者与专职人员之间的分水岭,这对所有的科学来说都是一样的。也正是在这一点上,体现了怪诞者与科学家之间的微妙差异。 下面这个简单的例子可能会有助于弄清这一点。欧几里得几何学是一个抽象的模型。从逻辑上看它是完整的和一致的。模型中的实体(或称变量)都经过了严格的定义。如一条直线的定义不是一个其长度要比其宽度或深度“大得多”的几何图形,而是一个其宽度与深度为零的图形。它同时也是非常“非现实主义的。”在“现实”中不存在如欧几里得之点、之线、或之面一样的东西。让我们将欧几里得这一抽象模型
Milton Friedman:实证经济学的方法论
应用到我们用粉笔在黑板上所作的一个记号上面。这一记号是与欧几里得之线,还是与欧几里得之面,还是与欧几里得之体相一致呢?很明显,如果这一记号正在被用来表示(比如说)一条需求曲线,那么它完全与一直线相一致。但是,如果这一记号正在被用来为(比如说)地图上的国家着色,那么它就不能与直线相一致了,这是因为那将意味着该地图永远也不会具有颜色。为了实现这一目的,这同一记号必须与面相一致。但是,对于粉笔的生产者来说,它却不能与面相一致,因为如果是这样的话,那么粉笔将永远也用不完。出于这种考虑,这同一记号必须与体相一致。在这一简单例子中,上面所提到的那些判断将取得广泛的一致意见。然而,似乎很明确,虽然我们可以对指导这些判断的一般性原则作一系统的阐述,但这些原则永远也不会真正作到包罗万象,囊括每一种可能出现的情况。它们并不具有欧几里得几何学本身所具有的自圆其说、自成体系的特点.
我认为,在谈到一理论的“至关重要的假设”时,我们是在试图对这一抽象模型的关键因素加以阐述。通常,可以用许多不同的方法来对这一模型加以完整的描述。也就是说,存在着许多不同的“基本原理”体系;作为一个整体,它们既包含了模型的內容又为模型的内容所包含。从逻辑学的角度上看它们是等价的:从某一角度来说可以视为一模型的公理或曰基本原理的东西。从另一角度来说也可以视为一模型的定理。反之亦然.被称为是至关重要的那些特定的“假设”是以下述因素为依据选择出来的:这些‘假设”在阐述模型方面的简洁性或经济性,直观的合理性,及提出假设的能力等.如果仅仅从含义上来看,也就是与人们判断或应用模型有关的那些原则的一部分。
2.“假设”作为理论的间接检验标准所起的作用
在任一假说的表述中通常存在着这样一种情况:用来阐述该假说的那些论段中,哪一些与假设有关,哪一些与含义有关似乎是泾渭分明的。然而,这二者之间的区别却难以准确定义。我认为,这不是由这类假说本身的特点所决定的,而是由该类假说将被用于的对象的特征所决定的。如果确实是这样,那么要想使对这些论述的划分易于进行,就必须确保该假说旨在服务的目的的明确性。在一抽象模型中定理和公理之间互换的可能性,意味着在与这一抽象模型相对应的那个独立的假说中,也存在着“含义”与“假设”之间互换的可能性。但这并不是说任一含义都可以与任一假设互换,而是说那种可以包含其它论述的论述体系可能不止一个。
例如,让我们来看一下寡头行为理论中的一特殊主张,如果我们假定:(1)企业通过各种方法来使其成果最大化,甚至不惜获得或扩大垄断力量。这将意味着,(2)当对某一“产品”的需求存在着地区性的不稳定,运输费用极高,公开的价格协议不合法,且该种产品的生产者为数极少时,他们将会试图建立基点定价体系。由于我们已将市场行为预测接受为本分析的目的,所以我们将论述(1)视作该理论的假设,而将论述(2)视作该理论的内容。如果我们发现(2)中所描述的情况通常与基点定价法结合在一起,那么我们将认为假设(1)是可以接受的;反之亦然。现在让我们将该分析的目的改为:按照谢尔曼反托拉斯法对控制
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
贸易同盟的禁止,确定哪些情况应予上诉。如果我们现在假定:(3)基点定价方法是在(2)中所限定的条件下蓄意产生的一种手段,以利于协同一致.那么这将意味着,(4)参加墓点定价的企业参与了“控制贸易同盟”。先前作为假设的东西现在变成了内容;同样,先前作为内容的东西现在变成了假设。现在,如果我们发现企业参与了基点定价,那么我们将现假设(3)为合理的。当一企业参与基点定价时,通常还会存在其它的证据,如书信、便函等.这些材料将被法庭视为“控制贸易同盟”的证据。
假定该像说服务于第一种目的,即预测市场行为。很清楚,这并不等于说该假说将服务于第二种目的,即预测是否存在足够的证据来证实“控制贸易同盟”的存在,从而确定法院所应采取的行动。反之,如果该假设服务于第二个目的,这同样不等于说它将服务于第一个目的。然而,在缺乏其它证据的情况下,该假设服务于一种目的所取得的成功(在解释一类现象方面所取得的成功),与该假说服务于另一种目的所可能取得的成功相比(即在解释另一类现象方面所取得的成功),前者将给我们带来更大的信心。要想具体说明前者所证实的把握性比后者到底大多少,将更为困难。这是因为这取决于我们对这二类现象之间相互联系的紧密程度的判断;而这本身又将通过复杂的途径而取决于某些同种的间接证据——即在通过单纯的理论现象进行解释时我们所具有的在其它方面的经历。而这些单纯的理论现象在某种程度上又是同样纷呈复杂的。
为了更进一步地阐述这一观点,我们可以通过那些被称作一假说的假设的东西,来取得一些间接证据。这些间接证据是关于一假说的可接受性的。上述结论仅在如下意义上才能成立:假设本身可以被视作等同于该假说的含义。因为这样一来,假设与现实的一致性就可以被视作等同于人们在试图证明某些含义与现实相抵触时所遭到的失败。或者说上述结论仅在如下意义上才能成立:这些假设可能使人们想起该假说中另外一些易受偶然的实际观察所影响的含义。之所以说这一证据是间接的,是因为这些假设或该假说的各种含义所指的那一类现象,通常不同于该假说旨在说明的那一类现象。的确,如我们前面所讲的那样,这一点似乎是我们在确定哪些论述应冠之以“假设”,而哪些论断应冠之以“含义”时所依据的主要标准。这一间接证据所具有的重要性,取决于我们对这两类现象之间相互联系的紧密程度的判断。
一假说的“假设”为该假说提供间接检验的另一种途径是:找出该假说与其它假说之间的相互关系,从而使得正待接受检验的该假说的合理性与其它假说的合理性的证据联系起来。例如,一假说正在对某一特殊种类的行为作出解释。同以前一样,我们也可以不限定任何“假设”而对该假说加以阐述.但是,假定我们能够证明该假说与某一假设体系是等价的,并且这一假设体系中还包括了人人都在追求自己的利益这一假设,那么,这一假说就可以通过与它具有同样假设的那些假说在其它种类现象上的成功,而间接地获得其合理性;即使不能的话,我们这里所作的探索也不会完全是前无古人后无来者的,至少不会是在任何方面都一无所获。实际上;为引出表面上互不相同的假说之间的相互关系而对假设所作的这番研究,
Milton Friedman:实证经济学的方法论
正是我们在通向一个更为一般化假说的道路上迈出的一步。
从相关的假说中导出的这种间接证据,在很大程度上说明了持有不同背景的人,在对某一特定假说的信任程度上的差异。例如,让我们来考虑这样一个假说:在某一特定地区或行业内,在就业问题上所存在的种族或宗教歧视,与该地区或该行业中的垄断程度密切相关。也就是说,如果该行业不是垄断性质的而是竞争性的,那么,只有在就业者的种族或宗教影响到其它就业者与他们一起工作的情愿性,或影响到消费者对他们所生产的产品的接受性,而与雇主的偏见毫不相关时,才可能存在较为严重的种族歧视。这一假说对于经济学家所具有的吸引力将远远大于它对于社会学家所具有的吸引力。这一假说可能被说成是“假定”在竞争性的行业里,雇主一门心思地追求其在金钱方向的利益;而且,这一“假设”适用于许多经济假说。这些经济假说,涉及的是经济学所要研究的许多大宗现象。所以,在经济学家看来,这一假设同样地也适合于我们所讲的这一情况,似乎是合情合理的。另一方面,为社会学家所熟悉的那些假说其模型或曰理想世界与此是截然不同的。在他们的模型或理想世界中,一门心思地对金钱方面的个人利益的追求只起到非常小的作用。对于社会学家来说,在这一假说问题上可得的间接证据,对于该假说并不十分有利;而对于经济学家来说,在这一假说问题上可得的间接证据,对于该假说的有利程度与前者相比则要大得多。所以,社会学家对该假说可能持有较大的怀疑态度。
当然,一经济学家的证据与社会学家的证据都不是决定性的。该假说对于它旨在说明的现象来说是合起作用这才是决定性的检验。但是,在做出任何令人满意的决定性检验之前,还需要作出一种判断。而且,很有可能,如果这种检验不能很快地作出时,在这种情况下,这一判断将不得不以可得到的不充分的证据为依据来进行。此外,即使这样的检验可以作出,科学家们的背景情况对于他们所取得的判断来说也不是完全不相干的.在科学中永远不存在一定的东西.证据对一假说所起的肯定的或否定的作用,永远不能说是完全“客观的”。在判断假说的含义与实际情况的一致性方面,经济学家要比社会学家更为“宽容”,而且较少的几个“一致性”事例就可以促使他暂时地接受假说。
五、经济学中的某些含义问题
我们一直在进行讨论的这些抽象的方法论问题,与人们对“正统的”经济理论作为一种“非现实主义的”理论所进行的旷日持久的批评,及人们对为迎合这一批评的要求而重新构造理论的种种尝试所进行的旷日持久的批评之间,有些直接的联系。经济学是一种“沉闷无趣的”科学,因为它假定人是自私的和唯利是图的,人是“欢乐与痛苦的计算器,且其计算速度如闪电一般。人这架计算器,就象一粒充满着幸福渴望的水珠一样,在某些使他游离于幸福与痛苦之间的动因的作用下,振荡不已,但在这当中人是不变的。”说经济学是一门“沉闷无趣的”科学,还因为经济学是建立在旧心理学的基础之上的,从而必须随着心理学的新发展而同步改进。第三点原因在于经济学假定人(至少对于商人来说是这样)总是处于“一
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
种连续的警觉状态”,一旦他们那敏感的直觉嗅察到了供给与需求状况的变化,他们将立即改变价格或改变定价原则。第四点原因在于,经济学假定市场是完美的,竞争是纯粹的,而且商品、劳动力与资本等都是同质的。
正如我们所看到的,除非这一类的批评得到了下面这一证据的补充说明,否则的话将主要集中在其它方面。这一证据就是:存在着某一种假说,它与正在受到批评的理论在上述那些方面中的某一方面上并不相同的,然而该假说在较大范围的现象的预测上取得了较好的成果.然而大部分的此类批评都没有这种证据作为补充;它们几乎全部地取决于“假设”与“现实世界”之间所谓的直接可见的差异。最近一段时间人们对成果最大化假说所作的批评,为说明上述问题提供了明显的例证.这一批评的理论依据就是商人没有,而且确实也不可能象该理论所“假设”的那样去做。被用来作为该论断的佐证的证据,通常来自于两个方面。或者是来自于商人对影响其决策的因素问题的回答——这是检验经济理论的一种程序,这种程序与通过向80岁的老人询问长寿的秘诀来检验长寿理论的作法别无二致。或者是来自于对单个企业的决策活动所作的描述性研究。一方面,人们很少(如果曾有过的话)能够提供这样的佐证:这里的证据是关于商人的实际行为与正在受到批评的假说的含义之间的一致性问题的,即是关于商人的所作而不是关于商人的所说的证据。另一方面,人们也很少(如果曾有过的话)能够提供这样的佐证:这里的证据是关于商人的实际行为与另一假说的含义之间的一致性问题的。
就人们时常对一理论或其“假设”所赋予的直接描述性而言,一理论或其“假设”不可能是完全“现实主义的”。关于麦子市场的一个完全“现实主义的”理论,不仅需要包括直接决定麦子的供给与需求的那些情况,而且还需要包括用于交易的现金或信用工具的种类。此外还有:交易者的头发与眼睛的颜色,他的祖先及受教育程度,他的家庭人数,他家庭成员的特征,祖先,受教育程度等个人特征;种植麦子的土壤种类,土壤的物理及化学属性,在生长期内的主要天气情况;种植小麦的农民及最终食用小麦的消费者的个人特征,等等,等等,无穷无尽。为达到这样一种“真实”而作的过分努力,都只会使该理论失去真实有用的作用。
当然,部分地说,完全现实的理论这一想法不过是一个稻草人。没有哪位理论批评家会以这一逻辑极端作为目标。任何一种理论批评都可能这样说:正受到批评的这一理论的“假设”“太”脱离现实了;而它的目标是这样一种假设体系:尽管不是完全地毫无创造性地追求真实,但要比正受到批评的这些假设“更为”真实一些。但是,只要“真实性”的检验标准是“假设”的直接可见的描述准确度,则不存在进行上述区分的依据,那永远也不会存在前一段所描述的那个稻草人。例如,“真实性”的检验标准可能是这样一些实际观察:“商人似乎并不象边际理论所描绘的那么贪婪,那么精悍,那么富有逻辑性”;或者,“在当前的情况下,对于多工序工厂的管理者来说,试图算出每一生产要素的边际成本与边际收益,并使二者相等这将是绝对不可行的。”判断某一特定的偏离现实情况是否可以接受的标准是什么
Milton Friedman:实证经济学的方法论
呢?在分析商业行为时,为什么忽视商人的成本大小比忽视商人的眼睛的颜色更为“不现实”呢?答案很明确,这是因为对于商业行为来说,省略前者会比省略后者带来更大的偏差。但是,简单地通过商人之间确实存在着成本大小的不同及眼睛颜色的差别这一观察,并不能使我们知道这一点。很清楚,将一种因素考虑进来与将另一种因素考虑进来将会对偏差产生不同的影响。而我们唯有通过它们对实际行为与预测行为之间的偏差的影响的比较,才能知道上述答案。这样一来,即使是真实性假设的最极端的拥护者,当他们对各种假设按真实程度大小加以划分时,也必然要被迫放弃他们的标准,而接受通过预测的检验标准。
描述方面的准确性与分析方面的相关性之间的根本性混淆,构成了大部分经济理论批评的主要内容。这些经济理论批评是关于理论假设的非现实性的。这一根本性的混淆及导致这一混淆的那些观点的正确性问题,都在一篇关于商业循环的文章中得到了充分的说明。这一篇文章中有这样一段似乎是无害的评述:“经济现象是变幻莫测、纷繁复杂的,所以,任何一种能与现实紧密地结合起来的关于商业循环的综合性理论,都必定是极为复杂的。”科学的一个基本的假说就是:现象是具有欺骗性的,而且我们可以通过某种方法而对证据加以考察、解释或组织。从这些证据中我们将发现那些表面上直不相关、各不相同的现象事实上却是一种更为基本且相当简单的结构的表现形式。而且,对这一假说加以检验的标准,同其它假说的检验标准一样,是它所取得的成果——即迄今为止科学所取得的巨大成就。如果某类‘经济现象”看起来好象是变幻莫测、纷繁复杂的,那么我们只好这样假定:这是因为我们没有适当的理论来对它们作出解释。我们决不可能把已知的事实放在这一边而把“与现实紧密结合的”理论放在另一边。理论是我们“透视”事实的桥梁,而且如果没有理论,我们将不能透视事实。“经济现象是变幻莫测、纷繁复杂的”这种主张,否定了知识的试验性状态,殊不知这种状态本身也可以使科学活动富有意义;这种主张与约翰·斯图尔特·穆勒的以下完全荒谬的观点同属一类。穆勒认为:“很幸运,在价值法则中不存在任何有待于现在(1848年)或将来的作者来加以澄清的东西;关于这一问题的理论是完美的。”
描述方面的准确性与分析方面的相关性之间的混淆,不仅导致了在许多不相关的方面对经济理论所作的批评,而且还导致了对经济理论的误解及在弥补所谓的缺陷的努力中方向性错误。由经济理论家们提出的抽象模型中的“理想类别”,已经被视为严格的描述性的分类。这些描述性的分类将直接地、完全地与现实世界中的现象实体相对应,而独立于该模型的使用目的。而描述性的分类与现实世界中的现象实体之间存在的明显的偏差,导致了在构造理论的努力上的不可避免的失败,这是因为,重新构造理论的努力是以这些意在具有充分的描述性的分类为基础的。
人们对“完全竞争”与“垄断”概念所作的解释,及“垄断性的”或“不完全竞争的”理论的发展,可能再清楚不过地说明了这种倾向。据说,马歇尔假定存在“完全竞争”;可能曾经有过这种消沉。但是,很明显,现在已经不再存在这种情况了。所以,我们必须放弃马歇尔的理论。读者可能将不辞劳苦地到处搜寻(我预言这将是徒劳的),试图在马歇尔的
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
著作中找到关于完全竞争的明确假设,或任何这样的主张:从描述的角度来说,世界是由参与完全竞争的基本单位——企业所组成的。然而,读者将发现马歇尔的如下论述:“在一个极端上,存在着这样的世界市场,在这个世界市场里,竞争直接地从地球的每一部分展开;而在另一个极端上。存在着这样的封闭市场,在这个封闭性的市场里,所有来自远方的直接竞争都被排斥在外,然而即使在这样的市场中,人们仍然可以感觉到间接竞争与传导性的竞争之存在。而且在这两个极端之间还存在着大量的其它种类的市场,这种市场的情况还有待于经济学家和商人的进一步研究。”马歇尔按照世界的本来面目来描述世界;他所追求的是为分析世界开辟道路,而不是使现实世界得到摄影般精确的再现。
在按照世界的本来面目而对世界进行的分析中,马歇尔构造了这样一个假说:在很多问题中,众多的企业将被组合成“部门”,这样做的目的是使得每一集团中各企业之间的相同之处远远胜于它们之间的差异。这些问题通常都具有这样的特点,即下述情况对于它们来说同样是重要的:企业集团也将受到某些变动的影响,如对它们的产品的需求方面的变动。或者生产要素供给方面的变动。但是,并不是所有的问题中都存在这种情况,也就是说,上述重要情况可能是只作用于某些特殊企业的个别影响。
与这一假说相对应的抽象模型,包含着两种“理想的”企业类型:作为基本单位的竞争性企业(这些企业将组合成部门)与垄断性企业。在所有其它企业的价格一定的条件下,如果对该企业产品的需求曲线相对于该企业的产品价格来说具有无限弹性的话(这适用于某些价格及全部产量),那么该企业则是竞争性的。它隶属于某一“部门”,这种部门的定义是生产单一“产品”的企业集团。这里“产品”的定义是那些对于购买者来说具有完全的替代性的产品的集合。所以,某一企业的产品相对于同部门中另一企业的价格的需求弹性,对于某些价格和某些产量来说是无限的。囫如果某企业产品的需求曲线对其所有产品的某种价格皆不具有无限弹性,那么该企业则是垄断性的。对于垄断性的企业来说,企业就是部门。 同往常一样,作为一个整体该假说不仅包含了这一抽象模型及其理想的企业类别,而且还包含了一系列原则——这些原则大部分是含蓄的且通过例证来体现。这些原则系列是为使实际生活中的企业与这种或那种理想类型相一致,及为将企业划归部门而设立的。这些理想类型本来并不是描述性的;它们最初的使命是对那些对某一特定问题来说极为重要的特征加以区分。即使我们可以对某企业的产品需求曲线作出直接的、准确的估计,我们也不可能立即进行如下划分:按照需求曲线的无限弹性及非无限弹性来划分完全竞争企业与垄断企业。我们实际观察到的那些需求曲线没有哪一个是绝对水平的。所以,我们所能估算出的弹性永远也不会是无限的。所以,真正相关的永远是这样一个问题:某一弹性是否“足够”大,从而可以被看作是无限的。但是,对于这一问题,我们不能简单地通过弹性数值本身来作出一劳永逸的回答。正如我们不能永久性地断言:对于公式S=1/2 gt 2的应用来说,每平方吋15磅的气压是否是“足够地”趋近千零。同样,我们也无法计算出需求的交叉弹性,进而按照‘需求的交叉弹性之间的差异”来将企业划归部门。正如马歇尔所述:“不同产品(即
Milton Friedman:实证经济学的方法论
不同部门)之间的区分应如何确定这一问题,必须从便于某种讨论的角度来加以解决。这决定了所有的问题;同一企业在一种问题中被当作完全竞争者来看待,而在另一种问题中又被当作垄断者来看待,在这当中并不存在任何不一致的地方。
正如同一个粉笔记号在一种问题中被看作是欧几里得直线,在另一种问题中被看作是欧几里得面,而在第三种问题中被看作是欧几里得体一样,这当中并不存在任何不一致的地方。需求的弹性与需求的交叉弹性的大小。生产物理性能相同的产品的企业的数量,等等,都与问题密切相关。这是因为,这些因素属于(或者说可以属于)下述变量的一部分。这些变量将被用来确定某一特定问题中理想实体与实际实体之间的相互关系;并限定该理论得以充分成立的前提条件。但是,这些变量并不能一劳永逸地确定企业在完全竞争与垄断之间类型的划分,
下面这个例子可能会有助于说明这一点.假定现在有这样一个问题:要确定联邦香烟税的增加(被预期为永久性的增加)对香烟零售价格的影响。我冒昧地提出这样的预见:如果想得到大致正确的结果,就必须这样来看待香烟企业,即好象它们正在生产一种没有差别的产品且正处于完全竞争之中。当然,在这种情况下,“必须建立某些协议”,如对切斯特菲尔德香烟的数量加以限定。这里,“切斯特菲尔德香烟被看作是与马尔巴勒香烟等价的。” 另一方面,香烟企业将犹如完全竞争企业一般行动这一假说,对于二次世界大战中香烟企业对于价格控制的反应来说,应该是一个错误的指导,而且毫无疑问,在此之前人们一定已经认识到了这一点。战争期间,香烟企业的成本一定会上升。在这种情况下,完全竞争者一定会减少原有价格下的销售量。但是,战时公众收入的增加又会增加那一价格下的需求量。在完全竞争的情况下,严格固有法定价格将意味着“短缺”的出现及香烟生产数量的绝对下降。这里“短缺”的含义是需求数量超过了供给数量。事实否定了这一特定含义:人们将很好地、合理地坚持最大化香烟价格;而生产数量将大幅度地增加。成本上升这一共同性力量,大概不如每一企业对保住其市场份额及商标名望与价值这种愿望的破坏性力量来得强烈。特别是当超额所得税将这一类广告成本的很大份额转嫁到了政府头上时,则更为如此。对于这一问题来说,我们不能把香烟企业假设为完全的竞争者,并以此来对待它们。
小麦的种植常常被用来作为完全竞争的例证。然而,虽然对于某些问题来说,假设香烟企业组成了一个完全竞争的部门,并以此来对待它们是适当的;但是,对于某些问题来说,假设小麦的生产者是完全的竞争者并以此来对待他们则是不适当的。例如,如果现在所要考虑的问题是当地的谷物加工者所支付的麦价之间的差异,那么上述假说则是不适当的。 在那些某一企业集团受到共同因素的影响,及企业可以被假设为完全竞争者并以此来对待的问题中,马歇尔的理论分析被证明是最为有用的。从某种描述性的意义上说,这就是歇尔“假定”完全竞争这一误解的根源。如果能够创立一种比马歇尔的假说更为一般化的理论,即能同时对下述两种情况加以考虑的理论,那将是极为理想的。在一种情况中,产品的差别及企业数量的稀少会带来本质上的不同;而在另一种情况中,产品的差别及企业数量的稀少
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
则不会带来本质上的不同。这样一种理论将使得我们能够解决那些目前尚不能解决的问题。此外还将使得我们能够更好地确定前一种较为简单的理论的适用范围,即在哪些情况下该理论才能被看作是现实世界的一个足够好的近似。为了能够起到这两方面的作用,这一更为一般化的理论必须具有要义与实质;它必须使其含义接受实践的考验,并具有极大的影响力与重耍性。
由张伯伦、鲁宾逊二人所提出的不完全竞争或称垄断性竞争理论,就是为创立这样一种更为一般化的理论所作的尝试。不幸的是,他们所提出的这一理论不具备成为真正有价值的一般化理论所必须的特征。他们的理论贡献主要局限于如下几个方面:完善了人们对单个企业经济学所作的阐述,从而完善了人们对马歇尔模型含义的推导;完善了马歇尔的垄断分析,并丰富了可用来描绘部门情况的词汇构成。
这一理论的不完善之处特别明显地表现在它对涉及到企业集团(即马歇尔部门)的问题的处理上,或者说它在这类问题上无能为力。只要坚持认为产品之间的差异是实质性的,并坚持认为该理论对这一点的坚持正是该理论的卓越之所在,那么,通过生产同一产品的企业而对部门所下的定义则不再适于应用。按照这个定义,每一企业都是一个独立的部门。而通过“紧密的”替代品或交叉弹性之间“较大的”差异这些词语所下的定义,则避开了这一问题。同时,这种定义将一些含糊不清、无法限定的东西引入抽象模型,而在其中找不到可与之相对应的类型。这种定义的唯一作用就是使得该理论在分析上毫无意义——这是因为“紧密的”与“较大的”这种表述与“较小的”气压同属一类。在某一情况下,张伯伦不明确地将部门定义为具有相同的成本曲线与需求曲线的企业集团。但是,同样,只要产品之间的差异是(如他们所主张的那样)实质性的且不能置之不理,那么这种定义在逻辑上也是毫无意义的。“生产推土机的企业的成本与需求曲线,同生产发夹的企业的成本与需求曲线相一致”这句话的含义是什么呢。而且,如果它对于推土机与发夹来说是毫无意义的,那么,只要人们仍坚持认为两种牌子的牙膏之间的差异是非常重要的。则它对于这两种牌子的牙膏来说同样也是毫无意义的。
垄断性竞争这一理论,对干部门分析来说没有提供任何帮助,而且没有提出任何中间情况以介于企业(在一个极端上)与总均衡(在另一个极端上)之间。所以。它没能推进对许多重要问题所进行的分析。第一种极端情况面太窄从而无法具有较大的实用性;第二种极端情况面太宽从而无法确保有意义的概括性。
六、结论
经济学作为一门实证科学,是一种暂时被接受的、关于经济现象的概括体系。这一概括体系可以被用来对情况变动的影响作出预测。人类在扩展这一概括体系,增强我们对其合理性的信赖,及改进其预测的精确程度等方面所取得的进步,受到了下述两种因素的阻碍:一是所有知识探索的人类能力方面的有限性,二是社会科学中所存在的种种桎梏。这些桎梏对
Milton Friedman:实证经济学的方法论
于一般性的社会科学来说影响极大,而且对于作为社会科学的一种的经济学来说也特别重要。上述说法中绝无过分挑剔的成分。人们对经济学课题的熟悉,促成了人们对关于这一方面的专门知识的轻视。经济学的中心议题对日常生活的重要性及对公共政策中大部分问题的重要性,妨碍了经济学的客观性,并造成了科学分析与规范判断之间的混淆。依据未经控制的实践而不是依据受到控制的实践的必要性,使得为证明试验性假说的可接受性而创造大量的、准确的证据成为困难。虽然对未经控制的实践的依赖并不影响这一基本的方法论原则:一假说唯有通过它的含义或预测与可观测的现象之间的一致性才能够得到检验;但是,这种依赖确实使得检验假说的任务更为艰巨,且使得在所涉及的方法论原则方面出现了更大程度的混乱。与其他科学家相比,社会科学家在其方法论方面需要具有更强烈的自我意识。 一种业已流行甚广且危害甚大的混淆现象就是人们在关于“假设”在经济分析中的作用问题上的混淆。任何一种有意义的科学假说或理论都将一无例外地作出这样的声明:某些力量在理解某一特定种类的现象中是重要的,而另外一些力量则是不重要的。通过下述方法来表述这样一种假说通常是非常便利的:声言该假说旨在预测的这种现象在进行实际观测的世界中的行为方式,就犹如它们在一假设的、高度简化了的世界中的行为方式一般。这一高度简化了的世界只包含该假说认为是重要的那些力量。一般说来,进行这样一种描述的方法不止一种——即对这种理论进行表述所忧助的“假设”体系不止一种。对这样一些假设所作的选择,通常是出于下述两个方面的考虑:一是它们在表述该假说方面的简便性、清晰性及准确性;二是它们带来间接证据的能力。假设可以为假说的合理性带来间接证据这一说法,是出于下面几种考虑:假设可以使人们联想到该假说的某些含义已经可以为观察所检验;假设可以导出该假说与其它一些解决相关问题的假说之间的相互联系,等等。
这样一种理论不能通过直接地将其“假设”与“现实”加以比较来进行检验。的确,不存在任何一种进行该种检验的有效方法。完全的“真实性”是明显地无法达到的;而某一理论是否“足够”真实这一问题,只有通过考察该理论所取得的预测,对于我们所要解决的问题来说,是否是足够令人满意的,或者是否是比来自于其它假说的预测更令人满意来作出回答。然而,一理论可以通过其假设的真实性来检验,而不必考虑其预测的准确性这种看法,已经厂为流传,并成为经济理论因其非现实性而遭受的旷日持久的批评的根源所在。这些批评大多是不相关的。从而,由这种批评所促动的经济理论改革也大多是不成功的。
当然,如此众多的经济理论批评的不相关性并不意味着现存经济理论的高度可信性。这些批评可能无的放矢,但也可能存在着放矢之的。从小的方面来看当然明显地存在着这种可能性。任何一种理论都必然是暂时性的,且将随着知识的进步而置于变化之中。即使撇开这种老生常谈不论,我们也有必要使“现存经济理论”的内容更为特定,并对经济理论的各种分枝加以区分;经济理论的某些部分明显地要比其它部分具有更高的可信度。如果确实可能的话,那么,对实证经济学的现状作出综合性的评价,对与实证经济学的合理性相关的证据加以概括,及对实证经济学每一部分所应具有的相对可信度加以估计等项工作,将是一部专
上海师范大学商学院研究生课程《经济学研究方法》选编读物之一
著或一系列专著才能完成的任务,而绝非一篇方法论的短文所能胜任。
在这里,我所能做到的只是概略地表述一下我个人的观点。在我看来,现有的相对价格理论极富成果,而且对于具有西方国家特色的这种经济体系来说又享有很高的可信程度。这一相对价格理论的主要任务是解释资源在各种最终用途之间的分配问题,及生产成果在相互联系的各种资源之间的划分问题。马歇尔的《经济学原理》一书基本上奠定了相对价格理论的现有结构。尽管似乎存在着相当的分歧,但在我看来,现有的静态货币理论也同样地极富成果,并享有很高的可信程度。现有的静态货币理论的主要任务,是解释绝对价格、总产量及其它变量对于经济总体来说所具有的结构性或长期性水平。现有的静态货币理论是以货币数量理论的形式为核心,并经历了从戴维·休姆到剑桥学派,到欧文·费雪,到约翰·梅纳德·凯恩斯的一系列重大演变过程。在我看来,目前经济理论中最薄弱、最不令人满意的环节在于货币的动态分析。货币的动态分析所涉及的是经济整体对于情况的变动所采取的调整过程问题,亦即涉及的是总体活动的短期波动问题。在这一领域内,我们甚至还没有形成一种可适当地称作现有的货币动态分析的理论。
当然,即使在相对价格理论与静态货币理论中,也仍然存在着扩展现有理论的范围与改进现有理论的准确性等方面的余地,而且这种余地是相当大的。特别地,对“假设”的描述真实性问题的不适当的重视,已经导致了人们对决定各种假说的合理性限制条件的关键问题的忽略。而上述各种假说又共同地构成了这些领域内的现有经济理论。与这些假说相对应的抽象模型,也已经得到了相当的完善与深化,并且在严格性与准确性方面也有了巨大的进展。关于我们的经济体制及其运行方面的描述性材料也已经以前所未有的规模得到了极大的丰富。这些成就都大有禆益。但是,如果我们想要实际地使用这些抽象模型与描述性材料,则还需要作相当的探索。我们需要探索的问题在于进行下述判断的标准问题,即如何确定:对于某种特定的问题来说,使用哪一种抽象模型才是最好的,一抽象模型中的哪些类型将与可观测的实际类型相一致;该问题或该种情况的哪些特征对预测的精确度影响最大——这里的预测是由某一特定假说或理论作出的。
实证经济学的进步不仅要求对现有假说进行验证并加以完善,而且还要求不断地创立新的假说。对于这一问题我们尚缺乏正式的结论。假说的创立是一项精神、直观与发明的创造性活动;其实质就是要在众所熟知的材料中发掘新意。这一过程必须归在心理学当中进行讨论,而不应列在逻辑学当中进行研究。这一过程必须借助于自传与传记来研究,而不应从科学方法的专著中寻找答案;这一过程必须经由公理与事例所推动,而不应由定理或原则所导出。
范文四:实证经济学方法论
7 实证经济学方法论
【美】米尔顿?弗里德曼:《弗里德曼文萃》,首都经济贸易大学出版社,2001年版。
在约翰?内维尔?凯恩斯(John Neville Keynes)的名著《政治经济学的范畴与方法》(The Scope and Method of Political Economy)一书中,他对实证科学、规范科学和艺术进行了区分:“实证科学(positive science)??是探讨是什么的系统知识体系;规范科学(normative science)??是探讨应该是什么的标准的系统知识体系;人文科学(art)??是为了达到特定目标而设立的规则体系。”他指出:“人们常常将它们混为一谈,并且因此而造成许多有害的影响。”所以,他强调:“认识到政治经济学是一门独立的实证科学”这一点非常重要。
本文主要讨论在创立凯恩斯倡导的“独立的实证科学”时所产生的一些方法论问题,尤其是这样一个问题:如何判断一种试验性的假说或理论是否应该暂时地被看做是“探讨是什么的系统知识体系”的一部分。但是,凯恩斯所悲叹的混淆仍然非常普遍,以致于极大地影响了人们认识到经济学可以是而且在一定程度上确实是一门实证科学。因此,我最好在文章的一开始就简单地分析一下实证经济学与规范经济学之间的关系。
7.1 实证经济学与规范经济学之间的关系
在某种程度上,实证经济学与规范经济学之间的混淆是不可避免的。对于几乎每一个人来说,经济学研究的主要问题都是至关重要的,而且都在人们的经历和能力的范围之内,它既是持续而广泛的争论的根源,也是频繁立法的原因。那些自称为“专家”的人意见各不相同,而且难以保证他们都是公正无私的。无论在什么时候,在那些非常重要的问题上,即使这些“专家”几乎意见一致而且完全是公正无私的,我们也不能完全不加考虑地接受他们的观点。实证经济学的结论似乎而且确实与重要的规范问题密切相关,与应该做什么以及如何才能实现既定目标等问题密切相关。正如专家们所做的那样,门外汉也都不可避免地受到诱惑,总想使实证结论符合他所固守的规范性成见,而当这些实证结论的规范性含义(或者说是所谓的这些实证结论的规范性含义)不合他的口味时,就否定这些实
证结论。
原则上,实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说的那样,它研究的是“是什么”的问题,而不是“应该是什么”的问题。它的任务是提供一个概括体系,这个概括体系可以用来正确地预测经济状况发生的任何变化所产生的影响。它的绩效要根据他所做出的预测与实际情况之间的精确度、覆盖率及一致性等指标来判断。总之,实证经济学是或者可以是一门“客观”科学,其“客观性”与任何一门自然科学的“客观性”完全相同。当然,经济学研究的是人们之间的相互关系,而且研究者本身就是被研究的对象的一部分。与自然科学相比,经济学的研究者与被研究的对象之间的关系更加密切。这个事实使得社会科学家在能够得到一系列自然科学家所无法得到的资料的同时,也使社会科学家特别难以保持客观的态度。但是,我认为这些并不是这两类科学之间的根本差异。
另一方面,规范经济学和经济学规则不可能独立于实证经济学。任何政策结论都必然依赖于人们对做某一件事而不是做另外一件事的后果所作的预测,而预测必须隐含地或明确地依赖于实证经济学。当然,在政策结论和实证经济结论之间并不存在一一对应关系,否则,也就不存在独立的规范经济学。两个人可能对某一项立法的结果有着相同的看法,但是,其中的一个人可能认为这些结果有利于促进平衡,从而支持这项立法;另外一个人却可能认为这些结果是他所不希望出现的,从而反对这项立法。
但是,有些人认为,在目前的西方世界,特别是在美国,在公正无私的公民之间所存在的关于经济政策的分歧,主要是因为他们对所采取的行动的经济影响的预测各不相同,而不是因为他们的基本价值现在存在根本性分歧;原则上,前一种分歧可以通过实证经济学的发展而加以消除,而对于后一种分歧,人们最后只能通过战斗来加以解决。我不赞成这种看法。一个明显的而且并非不重要的例子是最低工资立法。表面看来,人们对这项立法存在着赞成和反对的激烈争论,但在为所有的人都争取到一个“最低生活工资”(1iving wage)(在这场争论中,他们广泛地使用“最低生活工资”这个含义不明确的术语)的目标上,他们却取得了根本性的一致。人们的观点分歧主要是因为他们对这种特殊手段实现共同目标的效果存在着隐含的或明确的分歧。这项立法的支持者认为(即预测):法定最
低工资不仅提高一些工资高于最低工资线的人员的工资,而且提高那些工资低于最低工资线的人员的工资,从而消除了贫困,与此同时,它并不会导致完全失业或就业条件恶化的人数增加。这项立法的反对者们则认为(即预测):法定最低工资使失业或就业条件恶化的人数增加,从而使贫困加剧,这种消极作用不仅抵消了它对就业者的工资带来的有益影响,而且使总体情况更加恶化。人们对这项立法的经济影响的意见一致,并不能使得人们对这项立法的合意性的意见也完全一致,因为人们对这项立法的政治影响或社会影响的意见可能仍然存在分歧。但是,只要人们的目标一致,他们就一定可以经过艰苦的努力而在其他方面取得一致。
在工会的适当作用和地位、直接的价格和工资控制的合意性、关税的合意性等问题上,人们的看法也各不相同,这是因为在实证分析中,存在着一些与这些问题密切相关的分歧。人们对所谓的规模经济(economy of scale)的重要性有着不同的预测,从而在很大程度上导致了人们对政府全面控制工业部门的合意性和必要性存在不同的看法,甚至导致人们对社会主义(而不是私人企业)的合意性和必要性存在不同的看法。类似的情况不计其数。当然,我对西方国家的人们在经济政策上的主要分歧的这种判断,它本身就是一种“实证性”论点,人们要根据经验证据来决定是接受它还是拒绝它。
如果我的这种看法是正确的,那么,这就意味着:人们在“正确的”经济政策上意见一致,将较少地取决于规范经济学本身的进步,而较多地取决于那种所得出的结论应该而且值得人们广泛地接受的实证经济学的进步。这还意味着:我们之所以要将实证经济学与规范经济学明确地区分开来,正是因为这样有助于人们在政策问题上达成一致。
7.2 实证经济学
实证科学的最终目的是要发展出一种“理论”或“假说”,它能够对尚未观察到的现象作出合理的、有意义的(而不是不言而喻的)预测。总的来说,这种理论是由两种元素构成的复杂的混合体。一方面,它是一种旨在促进“系统的、有组织的推理方法”的语言。另一方面,它是一种旨在抽象出复杂现实的本质特征的实质性假说体系。
作为一种语言,理论没有什么实质性内容,而只是一系列的同义反复。它的作用是作为—种组织经验材料、促进人们理解经验材料的文件编排系统(filing system),而判断研究对象的标准也是适用于文件编排系统的标准。对事物种类的定义是清楚而准确的吗,对事物种类的划分是全面而彻底的吗,我们知道每个项目应该归入哪一类或者是否存在相当多模棱两可的地方吗,大标题和次标题体系的设计是使得我们能够迅速地找到我们要找的项目还是不得不到处寻找
这种文件编排系统避免了复杂的呢,我们想要研究的项目已经归在一起了吗,
相互参照(cross-reference)吗,
对于这些问题的回答,部分地取决于逻辑上的考虑,部分地取决于实际上的考虑。规范的逻辑标准本身可以说明某种语言是否是完备的和一致的,即这种语言中的命题是“正确的”还是“错误的”。实际证据本身可以说明“分析性的文件编排系统”的种类是否存在有意义的实际对应物,即在分析某种类型的具体问题时,“分析性的文件编排系统”的种类是否有用。“供给”和“需求”的简单例子不仅说明了这一点,而且说明了前面所说的一系列类似问题。
作为经济理论的语言要素,供给和需求是因素的两种主要类型,人们可以将影响产品相对价格的因素或生产性因素分别归入这两种主要类型。这种二分法的实用性取决于“它的实证概括性,即在任何问题中,我们都可以把影响需求的各种力量与影响供给的各种力量分成两类,而且这两类之间很少包括共同的项目。如果我们能够进行这样的概括,那么,对于像消费品的最终市场之类的市场来说,这种概括就是合理的。在这种市场中,在那些可以被看做是需要产品的经济单位与那些可以被看做是供给产品的经济单位之间,存在着清晰而明确的区别。在某个特定因素是否一方面应该被归入影响供给的因素,而另一方面又应该被归入影响需求的因素方面,这两种类型之间不仅很少存在非常疑难的现象,而且也很少存在考虑交叉效应(即相互参照)的必要。在这些情况下,将有关因素归入“供给”和 “需求”的步骤非常简单,甚至可以说非常明显,从而使问题得以极大地简化,并且能够有效地防止其他情况下可能出现的谬误。
但是,这种概括并不总是合理的。例如,对于一个投机占主导地位的市场来说,我们就不能对它的日常价格波动进行这种概括。一个关于提高超额利润税(excess-profits tax)的谣言,是应当看做主要对股票市场上公司股票今天的供
给产生影响的因素呢,还是应当看做主要对它今天的需求产生影响的因素呢,类似地,对于几乎每一个其他因素来说,我们都有同样多的理由将它归入“供给”或“需求”。当然,在这种情况下,我们仍然可以使用供给和需求的概念,而且它们可能并不是毫无意义的。它们仍然是“正确的”,但与第一个例子中的情况相比,它们的作用显然要小很多,因为它们没有富有意义的实际对应物。
作为实质性假说体系,理论应该根据它对其希望“解释”的一系列现象的预测能力来进行检验;只有实际证据才能表明这种理论是“正确的”还是“错误的”,或者更确切地说,只有实际证据才能说明这种理论是应该暂时地“被接受”还是应该“被拒绝”。正如我下面将要详细地加以分析的那样,对一种假说的“合理性”情况进行比较。如果这种假说的预测(“经常地”或者比另外一种替代性假说更加经常地)与实际情况相抵触,那么,它就应该被拒绝;如果这种假说的预测与实际情况不抵触,那么,它就应该被接受;如果在很多情况下,这种假说的预测都没有与实际情况相抵触,那么,它的可信度就非常高。实际证据永远都不能“证实”一种假说,它只可能无法证伪这种假说,当我们不很准确地说一种假说已经被经验“证实”了的时候,我们一般就是指这个意思。
为了避免混淆,也许我应该明确地指出:由一种其合理性有待检验的假说所作出的“预测”,并不一定是对尚未发生的现象所作的预测,即并不一定是对未来事件的预测;它可以是对已经发生但尚未进行观察或者预测者尚不知道的现象所作的预测。例如,一种假说可能会认为,给定其他一些已知条件,某种情况肯定在1906年发生。如果对有关记录进行的研究表明,这种情况确实发生过,那么,这个预测就得到了证实;如果对有关记录进行的研究表明,这种情况没有发生,那么,这个预测就与实际情况相抵触。
从这种意义上讲,一种假说的合理性本身并不是在替代性假说之间进行选择的充分标准。我们观察到的事实必然是为数有限的,而可能的假说却可能不计其数。如果有一种假说与可以得到的证据是一致的,那么,一定还有无数的其他假说也与这些证据是一致的。例如,假定对某种特殊消费品征收一种特别消费税,导致价格上涨,且价格上涨幅度等于税收额。这种情况与竞争性环境、稳定的需求曲线、水平而且稳定的供给曲线是一致的。但是,它与竞争性环境、需求曲线或供给曲线发生必要的补偿移动的正斜率或负斜率的供给曲线也是一致的;与垄
断性环境、边际成本不变、产生这种结果所要求的特定形状的稳定的需求曲线也是一致的。总之,它能够与无穷多种情况相一致。更多的与这种假说相一致的证据也许可以剔除一些可能性,但它永远都不可能将可能性减少到只有一种,使得只有这一种可能性与有限的证据相一致。
人们在那些与可得到的证据具有相同的一致性的替代性假说之间进行的选择,必然是在某种程度上随意进行的。虽然我们一致同意应该以“简单性”(simplicity)和“成效性”(fruitfulness)作为选择标准,但是,“简单性”和“成效性”本身就与完全客观的具体说明相矛盾。一种理论越“简单”,它对给定领域内的现象进行预测所需要的初始知识就越少;一种理论越有“成效”,它的预测就越准确,就可以在越大的范围内进行预测,就可以为进行深入研究提供越多的线索。逻辑上的完备性(completeness)和一致性(consistency)也可以作为人们在替代性假说之间进行选择的标准,但它们只能起辅助作用。它们的作用是确保这种假说所阐述的正是它想阐述的,而且采用这种假说的所有人都能同样准确地理解它。在这里,它们所起的作用与统计计算中对数字精确度的检验所起的作用是相同的。
不幸的是,我们很少能够通过进行精心设计的、希望消除那些被认为是最重要的干扰性影响的实验,来检验社会科学中的某些特定预测。一般情况下,我们必须依靠偶然发生的“实验”所提供的证据来进行检验。我认为,社会科学无法进行所谓的受控实验(controlled experiment),并不表明社会科学与自然科学之间存在着根本区别。一方面,这是因为并不是只有社会科学无法进行受控实验,自然科学中的一些学科也同样无法进行受控实验,如天文学。另一方面,这是因为受控实验与无控实验 (uncontrolled experiment)之间的差别最多只是受控程度的差别。没有哪一个实验可以被完全控制,但从一些干扰性影响在实验过程中始终保持相对稳定的意义上说,每一个实验都受到部分的控制。
经验提供的证据是丰富的,而且常常是决定性的,就好像它们是由精心设计的实验得到的证据一样。因此,无法进行实验并不是通过检验预测是否成功而检验假说的根本性障碍。但是,人们非常难以解释经验所提供的证据,因为它们不仅常常是复杂的,而且总是间接的、不完全的。人们常常难以收集这些证据,而且解释它们一般需要进行细致的分析工作,并涉及一系列的推理,而这些推理很
少是确切无疑的。由于经济学缺乏由“决定性的”实验所提供的给人深刻印象的、直接的证据,从而确实妨碍了人们对假说进行充分的检验。但是,与它妨碍人们获得合理的提示而带来的困难相比,或者与它妨碍人们就那些被可以得到的证据证明了的结论达成广泛一致而带来的困难相比,这种妨碍就显得微不足道了。它使得人们摒除不成功的假说的工作进展缓慢、困难重重。这些不成功的假说很少永远消失,相反总是一再地出现。
当然,在这些方面,情况变化很大。有时,与受控实验所能够提供的证据相比,经验所提供的证据几乎一样地直接、给人深刻印象而且确定。最明显的重要例子也许就是来自通货膨胀的证据。关于通货膨胀的一种假说认为,在相当短的时间内,货币量的大量增加必然伴随着价格的大幅上涨。在这方面,有关的证据给人深刻印象,而且解释这些证据所需要的推理过程相当简短。尽管存在着大量的价格大幅上涨的事例,但是,由于价格的大幅上涨与货币存量的大量增加之间存在着必然的一一对应关系,而且其他可能有关的情况变化很大,从而使得每一次发生新的通货膨胀都引起激烈的争论,并且这种争论不仅仅来自于外行的普通百姓。反对者认为,货币存量的增加既可能是其他因素引起的价格上涨的偶然性影响,也可能是价格上涨的一个完全偶然的、不必要的伴随物。
难于检验实质性经济假说所造成的一种影响是,它使得我们的检验工作退回到纯粹的规范分析或同义反复之中。正如我已经指出的那样,在经济学及其他科学中,作为一种专门化语言或“分析性文件编排系统”,同义反复具有非常重要的地位。除此以外,在检验推理的正确性、探索假说的含义、确定一系列被认为是不同的假说是否确实不是等价假说或者它们之间存在什么差别的时候,同属于同义反复的正规逻辑学和数学都是必要的辅助工具。
如果经济理论希望能够预测而不是仅仅描述行动的结果,如果经济理论希望成为一门有用的科学而不是伪装成数学,那么,它肯定不能只是一种同义反复的体系。而且正如我在前面已经指出的那样,同义反复的实用性本身最终还取决于实质性假说的可接受性,而这些假说将难以处理的实际问题归入到特定类型中。
人们难以通过检验经济假说的预测而检验经济假说所造成的一个非常严重的影响是,它加深了人们对经验证据在理论著作中的作用的误解。在构造假说和检验假说的合理性这两个虽然密切相关但并不相同的阶段,经验证据起着至关重
要的作用。 关于一种假说旨在概括或“解释”的现象的完整而广泛的经验证据,除了在提出新假说时具有显而易见的作用以外,还是确保这种假说解释了它试图解释的问题所必需的,即这种假说在这些现象方面的含义不会与人们已经观察到的经验证据相抵触。如果一种假说与人们已经掌握的证据是一致的,那么,人们对它所作的进—步检验,就是要从这种假说之中演绎出新的事实,这些事实可以被观察而以前并不为人知晓;同时,人们还要根据更多的经验证据来检验这些演绎出来的证据。为了使这种检验是相关的,这些演绎出来的事实必须与这种假说试图解释的那一类现象有关,而且对它们的限定必须足够准确,从而使人们对它们所作的观察能够表明它们是错误的。
在以下两个方面,构造假说与检验假说的合理性这两个阶段是相关的,第一,那些进入每一个阶段的特定事实,在一定程度上是由资料收集过程和特定调查者的知识水平决定的偶然结果。那些用来检验假说内涵的因素可能同样属于用来构造假说的原始资料,反之亦然。第二,人们构造假说的过程从来都不会从零开始。所谓的最初阶段,其本身总要涉及对一系列以前提出的、以实际观察为依据的假说进行比较。如果这些含义之间相互抵触,那么,这将促使人们构造新假说或修改旧假说。所以,这两个在方法论上不同的阶段总是同时进行的。
人们对这个表面简单的过程所产生的误解,集中于人们对“这种假说试图解释的这类现象”的误解。在社会科学中,由于人们难以获得关于这类现象的新证据,难以判断这些新证据与这种假说的含义是否一致,从而使人们倾向于假定其他的更加容易得到的证据与这种假说的合理性是同样相关的:假定假说不仅具有“含义”,而且具有“假设”,认为检验这些“假设”与“现实”之间的一致性是检验假说合理性的一种方法,是不同于通过检验假说的含义而检验假说的一种方法,或者是对通过检验假说的含义而检验假说的一种补充方法。人们广泛相信的这种观点不仅是根本错误的,而且造成了许多危害。它不仅没有为区分合理的假说与不合理的假说提供简单的方法,反而混淆了二者之间的区别,加深了人们对经验证据在经济理论中的重要性的误解,误导了人们为促进实证经济学的发展所作的许多学术探索的方向,阻碍了人们就实证经济学中的试验性假说取得一致意见。
只要我们可以说每一种理论都具有“假设”,只要“假设”的“真实性”可
以独立于这种理论预测的合理性,那么,理论的重要性与它的“假设”的“真实性”之间的关系就几乎与我前面批评的那种观点所认为的相反。我们会发现,那些真正重要的、有意义的假说,它们的“假设”是对现实粗略的、不精确的、描述性的表述。一般说来,一种理论越有意义,它的假设就越不现实(在上述意义上)。其中的原因非常简单。如果一种假说能够根据很少的现象而“解释”大量的现象,也就是说,如果这种假说能够从它试图解释的现象周围大量复杂的、详细的情况中抽象出共同的、关键性的因素,并且只根据这些有限的资料就能够作出合理的预测,那么,这种假说就是重要的。所以,要成为一种重要假说,这种假说的假设就必然是描述性不真实的(descriptively false);既然这种假说的巨大成功已经表明许多其他的伴随情况与它试图解释的现象无关,那么,它就不必考虑并解释这些情况。
为了使这一点不太自相矛盾,我们要问的一个与理论的“假设”有关的问题,不是这些假设是否在描述上是“现实的”(因为它们从来就不是现实的),而是对于我们近期的目的来说,它们是否是足够好的近似。只有通过考察这种理论是否起作用,即它是否作出了足够准确的预测,我们才能回答这个问题。所以,我们可以把这两种被认为是相互独立的检验简化成一种检验。
垄断和不完全竞争理论就是在经济理论中忽视假设的真实性的一个例子。有一种观点认为,被看做新古典经济理论基础的“完全竞争”或“完全垄断”假设,是对现实的一种不真实的描述。这种观点明确地促进了垄断和不完全竞争分析的发展,并且能够较好地说明它被广泛接受和赞同的原因。但是,这种观点本身几乎完全是以这种假设直接的、可感觉到的不准确描述为基础,而不是以新古典经济理论所作出的预测的任何已知矛盾为基础。几年以前,《美国经济评论》对边际分析问题进行的冗长讨论是一个更加明确的例子,虽然它不如前一个例子重要。争论双方的文章都在很大程度上忽视了我认为明显是主要问题的问题,即边际分析的含义与经验之间的一致性问题,而集中于争论一个基本无关的问题,即商人实际上是否通过分析那些说明边际成本(marginal cost)和边际收益(marginal revenue)的表格、曲线或多变量函数而进行决策。这两个例子及其暗示的许多其他例子,也许可以用来证明:与其他可能值得讨论的问题相比,有关的方法论原则更加值得进行广泛的讨论。
7.3 可以通过一种假说的假设的真实性来检验这种假说吗,
我们可以从落体法则(1aw of falling bodies)这个简单的物理学例子开始进行讨论。人们接受的一种假说认为,在真空中,落体的加速度是一个常数g,
2或者约等于地面上32英尺,秒而且与落体的形状、抛下落体的方式等因素无关。这就是说,在任何一段特定的时间内,任何一个落体降落的距离可以由公式
2s=1,2gt给出,其中,s是落体降落的距离,单位是英尺;t是落体降落的时间,单位是秒。将这个公式应用到一个从楼顶降落的实心球上,就等于说这样降落的球仿佛与它在真空中降落一样地运动。如果我们要通过检验这种假说的假设来检验假说,就可能意味着要测量实际的气压,并判断它是否足够接近于零。在海平面上,气压大约是每平方英寸15磅。在使气压差可以忽略不计的意义上说,15足够接近于零吗,显然是这样,因为实心球从楼顶降落到地面实际所用的时间与这个公式给出的时间非常接近。但是,如果我们抛下的不是一个实心球而是一根羽毛,那么,这个公式就会给出很不准确的结果。显然,对于一根羽毛而不是对于一个实心球来说,每平方英寸15磅与零之间有很大差别。我们还可以假定将这个公式应用于从3万英尺高的飞机上抛下的一个圆球上。在这个高度,气压肯定小于每平方英寸15磅。然而,圆球从2万英尺降落到2万英尺(这个高度的气压仍然大大低于海平面上的气压)实际所用的时间,将显著地不同于这个公式预测的时间,显著地长于实心球从楼顶降落到地面所用的时间。根据这个公式,圆球的速度应该等于gt,而且应该稳定地增长。事实上,一个从3万英尺的高空抛下的圆球,将恰好在它碰到地面之前达到它的最高速度。这个公式的其他含义与此类似。
在使气压差可以忽略不计的意义上说,15是否足够地接近于零,这个最初的问题本身显然就是一个愚蠢的问题。每平方英寸15磅等于每平方英尺2160磅,或者等于每平方英寸0(0075吨。如果我们不确定一些外在的比较标准,我们就没有判断这些数据是“大”还是“小”的依据。就这个公式而言,惟一有关的比较标准是在一系列给定的条件下,使这个公式有效还是无效的气压水平。但是,这又在另外一个层次上引起了类似的问题。“有效还是无效”的含义是什么,
即使我们可以消除测量误差,测得的降落时间很少(如果曾经有过的话)恰好等于算得的降落时间。当二者之间的差距是多大时,我们才能说这种理论是“无效”的呢,我认为有两个重要的外在比较标准。第一个比较标准是替代性理论可能达到的精确度,这种替代性理论是正在与这种理论进行比较的、在所有的其他方面都与这种理论具有同样的可接受性的另外一种理论。当存在一种能够产生更好的预测但其成本也更高的替代性理论时,我们应采用第二个比较标准,也就是说,更高精确度所带来的收益(这取决于人们的目的)必须能够弥补获得更高精确度所需要的成本。
上面所举的例子不仅说明了人们不可能通过检验一种理论的假设来检验这种理论,而且说明了“一种理论的假设’,这个—概念是不明确的,对于真空中
2的落体来说,公式s=1,2gt是正确的,而且可以通过分析这类落体的运动情况推导出来。所以,我们可以说:在许多情况下,在实际大气中降落的物体的运动类似于在真空中降落的物体的运动。如果采用经济学常用的方法来表述,那么,我们马上就可以说:这个公式假定落体在真空中降落。但是,它显然并没有这样进行假设。它真正想说的是:在许多情况下,气压的存在、落体的形状、抛下落体的人的姓名、用来抛卞落体的机械的种类以及许多的其他伴随条件,对落体在任何一段特定的时间内降落的距离不会产生明显的影响。我们可以很容易地将这种假说重新进行表述,以便完全忽略真空条件,在很多情况下,在任何一段特定
2的时间内,落体降落的距离, 可以由公式s=1,2 gt给出。如果我们不考虑这个公式的历史以及有关的物理学理论,那么,我们说它假设落体在真空中降落又有什么意义呢,据我所知,我们也可以进行其他形式的假设而同样得到这个公式。我们之所以接受这个公式,是因为它是有效的,而不是因为我们生活在一个近似真空的环境中(无论近似真空是什么意思)。
与这种假说有关的一个重要问题是,我们要明确地说明这个公式有效的条件,或者更准确地说,要明确地说明人们在各种情况下根据这个公式所作出的预测的总误差的大小。事实上,正如我们在前面重新表述这种假说所暗示的那样,这样的明确说明与这种假说并不是完全不同的两件事。这样的明确说明本身就是这种假说的一个必要组成部分,而且随着经验不断积累,它特别有可能被修正和扩展。
在落体这个特殊例子中,还存在着另外一种虽然尚不完善但却更加一般的理论。这种理论是人们为解释简单理论的误差而努力探索的主要结果;它可以计算出一些可能的干扰因素的影响,而且将简单理论作为一种特例。但是,我们不应该总是采用更加一般的理论,因为它取得的更高精确度所带来的收益也许并不能弥补由于采用它而带来的额外成本。所以,仍然重要的一个问题是:在什么情况下,简单理论能够“足够好地”起作用,气压是限定这些条件的一个变量,但也只是其中的一个变量;落体的形状、落体达到的速度以及其他变量也同样与此有关。我们说明除气压以外的其他变量的一种方法是将这些变量看做决定因素,以确定对真空“假设”的一定偏离是否重要。例如,对于从适当的高度抛下一根羽毛而不是一个实心球来说,我们可以认为落体形状的差别使每平方英寸15磅的气压显著不同于零气压。然而,我们必须将这种说法与另外一种截然不同的说法明确地区别开来。这种截然不同的说法认为,这种理论不能适用于羽毛,因为它的假设是错误的。我认为,它们之间的关系恰好相反:对于羽毛来说,这些假设是错误的,因为这种理论不能适用于羽毛。我们需要重视这一点,因为人们常常将完全正确地使用“假设”来明确地说明一种理论成立的条件,错误地理解为可以使用假设来决定这种理论成立的条件,也正是由于这个原因,很多人认为可以通过检验一种理论的假设而检验这种理论。
下面。我们再来分析另外一个例子。这一次,我构造了一个例子,使它成为社会科学中的许多假说的类似物。我们来考虑一下一棵树的树叶密度。我提出的一种假说认为:给定每一片树叶周围的其他树叶的位置,每一片树叶都好像有意使它所能得到的阳光数量最大化那样来确定自己的位置,就好像它知道决定不同位置上可以得到的阳光数量的物理学法则,并且能够迅速地或立即从一个位置移动到任何其他合意的、空着的位置上。现在,这种假说的一些更加明显的含义显然是与经验一致的,例如,一般情况下,树南侧的树叶密度高于树北侧的树叶密度。但是,正如这种假说所暗示的那样,在山的北坡或有一些其他东西遮住了树的南侧的情况下,树叶的密度分布就不会这样,甚至完全相反。难道因为我们都知道,树叶不会“有意地”或者有意识地“试图”做什么事,它们也没有上过学并学会计算“最优位置所必需的有关科学法则或数学法则,而且不能从一个位置移动到另外一个位置,我们就可以认为这种假说不可接受或不合理吗,显然,在
这种假说与现实相抵触的这些现象中,没有一种现象是极其相关的;这些现象都不属于“这种假说试图解释的那类现象”;这种假说并没有宣称树叶做了这些事情,而只是认为树叶的密度看起来就像它们做了这些事情一样。尽管这种假说的“假设”显然是不真实的,但由于它的含义与观察结果是一致的,所以,它似乎非常合理。在“解释”这种假说的合理性时,我们倾向于认为,由于阳光有利于树叶的生长,从而使在阳光较多的地方,树叶就长得更加茂密,或者有更多假定存在的树叶能够幸存下来,这样,树叶完全被动地适应外部环境的结果也就与它们有意识地适应环境的结果是相同的。这种替代性假说之所以比前面构造的那种假说更加具有吸引力,并不是因为它的“假设”更加“真实”,而是因为它是另外一种更加一般的理论的一部分。这种更加一般的理论能够适用于更多的现象,一棵树上的树叶位置只是其中的一个特例;它有更多的与现实相抵触的含义,但在更多的情况下,它没有与现实相抵触。从这个意义上说,来自于这种更加一般的理论能够适用的其他现象的间接证据,加强了树叶生长的直接证据。
我构造的那种假说是大概正确的,也就是说,只是在一些特定条件下,它能够对树叶密度作出“充分”准确的预测。我不知道这些条件是什么或如何定义它们,但是,在这个例子中,这种假说的“假设”显然没有明确地说明树的种类、土壤的特性等条件。这些变量可能会影响这种理论的适用范围,而树叶进行复杂的数学计算或从一个位置移动到另外一个位置的能力则不会影响这种理论的适用范围。
萨维奇(L.J(Savage)和我曾经在别处采用过一个与人类行为有关的例子,它大致类似于上面所举的例子。我们来分析对一位台球高手击球情况进行预测的问题。—种假说认为,这位台球高手击球时,就仿佛他知道那些将会给出台球最优运行方向的复杂的数学公式;能够用眼睛对角度等描述台球位置的变量进行准确的估计,能够根据这个公式进行闪电般的计算,并且能够使台球按照公式给出的方向运动。这种假说似乎并不是完全没有道理,而且常常能够给出极好的预测。我们认为这种假说有道理,但并不是因为我们认为台球手甚至是台球高手能够或者确实是通过上述过程来击球的,而是因为我们认为,如果他们不能以这种或那种方式取得与此基本相同的结果,他们就不是真正的台球高手。
我们可以很容易地从这些例子过渡到这种经济学假说:在许多情况下,单个
企业行事时,就仿佛他们在理性地追求预期收益(常常被误解成“利润”)最大化,并且知道成功地实现这个目标所需要的全部资料;也就是说,仿佛他们知道有关的成本和需求函数,能够计算他们可能采取的所有行动所带来的边际成本和边际收益,并使他们所采取的每一个行动都恰好进行到边际成本等于边际收益的程度。当然,商人实际上并不会像数理经济学那样用笔来求解这个联立方程组(system of simultaneous equations),而数理经济学家则发现求解联立方程组是表述经济理论的一种简便方法。但是,与树叶或台球手明确地完成复杂的数学计算或者与落体决定创造一个真空的可能性相比,商人求解联立方程组的可能性更大。如果我们问台球手他是如何决定击球方向的,那么,他可能会说他“恰好算出来了”,但还要祈求上帝保佑,以确保取得这种结果。如果我们问商人他是如何决策的;那么,他可能会说他是按平均成本定价的,而且在市场情况发生变化时,价格与平均成本之间当然会有一些较小的差别。这两种说法都是有用的,但没有一种说法是对有关假说所举行的相关检验。
一个具有非同寻常的特征的证据表明,我们有理由相信收益最大化假说。在一定程度上,这个证据与关于台球手行为的假说所缓引的证据是相似的:如果商人的行为不是多多少少地类似于与收益最大化一致的行为,他们似乎就不可能长期维持他们的生意。对于商业行为的任何明显的、直接的决定因素,如习惯性反应、偶然性机会或诸如此类的其他因素,情况都是一样。无论什么时候,只要这个决定因素恰好使得商业行为与理性的、消息灵通的收益最大化行为相一致,企业就会兴隆,并能得到扩大经营所需的资源;反之,它就会失去资源,并且只有在能够从外部不断地得到资源的情况下,它才能维持存在。这样,“自然选择”(natural selection)的过程促进了这种假说的合理性,或者说,考虑到自然选择,人们主要是因为这种假说恰当地总结了适者生存条件而接受它。
收益最大化假说的另外一个更加重要的证据,来自于将这种假说无数次应用于具体问题而且其含义总是没有与实际情况相抵触的经验。但是,人们非常难以证明这个证据,因为它散落在备忘录、文章以及专著之中。这些备忘录、文章以及专著主要与具体问题有关,而并不是为了检验这种假说而递交上来的。然而,在很长时间内,人们一直使用和接受这种假说,而且没有发展出并广泛地接受任何一种条理清楚、首尾一致的替代性假说,从而有力地间接证明了这种假说的价
值。有利于任何一种假说的证据,总是由它再三地没有与实际情况相抵触的事实所组成。只要人们仍在使用这种假说,这种证据就会不断地积累起来,而且从这种证据的基本性质来看,人们难以充分地证明它。它将变成某种科学的传统和传说的一部分,并反映在人们对这种假说的坚决支持上面,而不是反映在教科书对这种假说没有与实际情况相抵触的事例的罗列上面。
7.4 理论的“假设”的重要性及其作用
到目前为止,我们关于理论的“假设”的重要性的结论几乎全部是否定的:我们已经知道,人们不能通过一种理论的“假设”的“真实性”来检验这种理论,而且一种理论的“假设”这个概念充满了歧义。但是,如果这就是问题的全部,那么,我们就将难以解释为什么人们广泛地使用“假设”这个概念,难以解释为什么人们会有强烈的倾向,总是身不由己地谈及理论的假设并比较各种替代性理论的假设。常言说得好,越是禁止人们做什么事情,做这件事情的人就越多(there is too much smoke for there to be no fire)。
就像在实证科学中一样,在方法论中,人们作出否定性陈述常常比作出肯定性陈述更有把握。所以,与前面关于“假设”的重要性及其作用的评论相比,我对下面关于“假设”的重要性及其作用的评论感到把握较小。据我所知,“一种理论的假设”具有三种虽然彼此相关但却各不相同的实证作用:(1)它们常常是对理论的一种简洁的描述方式或表述方式;(2)它们有时促进了通过假说的含义而对假说所进行的间接检验;(3)正如我们在前面已经提到过的那样,它们有时是明确地说明理论可能正确的条件的一种简便方式。下面,我们对第一、二种作用进行更广泛的讨论。
7.4.1 “假设”在表述一种理论中的作用
树叶的例子说明了假设的第一种作用。在没有任何明显的假设的情况下,我们可以不采用树叶试图使它们得到的阳光最大化这种说法,而是采用列表说明人们预测树叶密度所应遵循的规则的形式来等价地表述这种假说:如果一棵树木生
长在一处平地上,而且没有别的树木或其他物体遮挡它所得到的阻光,那么,树叶的密度就将是如何如何;如果一棵树木生长在山丘的北坡,而且处在由同种树木所形成的森林的中央,那么,树叶的密度又将是如何如何;等等。显然,与树叶试图使每片叶子得到的阳光最大化的表述相比,这种表述很不简洁。事实上,即使上面所列的规则是无穷的,树叶试图使每片叶子得到的阳光最大化的表述也是这些规则的简单概括,因为它不仅指出了如何确定对特定问题来说是非常重要的环境特点,而且指出了如何评价它们的影响。它不仅更加简洁,而且不失全面。
更一般地说,一种假说或理论是由一个断言和一个限定构成的:断言认为某些力量(言外之意就不是别的力量)对于某类现象来说是重要的,限定则详细地说明被认为是重要的力量的行为方式。我们可以把假说看做是由两部分组成的:第一部分是一个概念性世界或者抽象模型,它比“现实世界”简单,并且只包括这种假说断言是重要的那些力量;第二部分是一系列规则,它们定义了能够用“模型”来作为其在“现实世界”中的充分代表的那类现象,并详细地说明了模型中的变量或实体与可观测的现象之间的对应关系。
这两部分的性质极不相同。模型是抽象的、完备的是一种“代数学”或“逻辑学”。在检验模型的一致性和完备性以及探索模型的含义方面,这都属于数学和规范逻辑学的主要领域。在模型部分中,“大约”、“也许”或“近似”等没有容身之地,而且没有任何作用。对于真空状态来说,气压是零而不是“小的”;对于竞争性生产者的产品来说,需求曲线是水平的(斜率为零),而不是“几乎是水平的”。
另一方面,使用模型的规则不可能是抽象的、完备的。它们必然是具体的,因而也是不完备的;无论人们如何定义完备性,它只可能存在于概念性世界之中,而不可能存在于“现实世界”之中。模型是诸如“太阳之下没有新的东西”之类的半真半假的欺骗性陈述的逻辑体现,但是,应用模型的规则却不能忽略另外一些同样重要的诸如“历史永远不会重新开始”之类的半真半假的欺骗性陈述。当一种理论是一种显然更加一般的理论的一部分时,如关于落体在真空中降落的理论,在相当大的程度上,我们可以把应用模型的规则明确地用公式表示出来。尽管这样表述是不完备的,但却是非常容易进行的。为了使一门科学尽可能地“客观”,我们的目标应当是尽可能明确地将这些规则用公式表述出来,并不断地扩
大可以这样表述的现象的范围。但是,无论我们的这种努力是多么成功,在应用这些规则时,我们总是不可避免地要进行判断。每—个事件都有其独有的特点,而这是明确的规则所不能全部囊括的。对于应不应该忽视这些特点,对于这些特点会不会影响可观测的现象与模型中的实体之间的一致性,这些都需要一定的判断能力,这种判断能力是不可能由别人教会的。它只能通过经验并将自己置身于“正确的”科学氛围中学会,而不能生搬硬套。
下面这个简单的例子也许能说明这一点。欧几里德几何学(Euclidean,geometry)是一个抽象模型,它在逻辑上是完备的、一致的。模型中的实体都有准确的定义,例如,一条直线不是一个长度要比宽度或深度“长很多”的几何图形,而是一个宽度和深度为零的图形。它也是明显地“不现实的”。在“现实世界”中,并不存在诸如欧几里德点、线或面之类的东西。如果我们将欧几里德几何学这个抽象模型应用到用一支粉笔在黑板上所作的一个记号上,那么,这个记号应该被看做是欧几里德直线或欧几里德平面,还是应该被看做是欧几里德立体呢,显然,如果它正被用来代表一条需求曲线,那么,它最好应该被看做是一条直线。但如果它正被用来为地图上的国家着色,那么,它就不应该被看做是一条直线,因为如果它被看做是一条直线,这将意味着这张地图永远也不会被着色。出于这种考虑,这个同样的记号就必须被看做是平面。但是,对于粉笔的制造者来说,它不能被看做是平面,因为如果它被看做是平面,这将意味着粉笔永远也不会被用完。出于这种考虑,这个相同的记号就必须被看做是立体。在这个简单的例子中,这些判断需要取得广泛的一致意见。然而,实际情况显然是:虽然我们可以将一般性考虑明确地表述出来,但这些一般性考虑永远也不可能包罗万象,永远也不可能囊括每一种可能出现的情况。它们并不具有欧几里德几何学本身所具有的自成体系、自我一致的特点。
我认为,在谈到一种理论的“关键性假设”的时候,我们是在试图说明这个抽象模型的关键因素。我们一般可以采用许多不同的方式来完整地描述这个模型,也就是说,存在着许多不同的“假定”体系:作为一个整体,它们既暗示模型,同时又被模型所暗示。在逻辑学上,它们都是等价物,一种观点可以把它们看做是模型的公理或假定,而另外一种观点又可以把它们看做是模型的定理,反之亦然。我们之所以将某些“假设”称之为“关键性假设”,其选择根据是它们
在描述模型方面的简洁性、经济性、直观合理性或启发能力等因素。
7.4.2 “假设”作为理论的间接检验标准的作用
在表述任何一种假说的时候,我们一般可以明显地看出,在用来解释这种假说的陈述中,哪些陈述涉及假设,哪些陈述涉及含义。但是,这种区分却不容易严格地定义。我认为,这并不是假说本身所具有的特点,而是使用假说进行说明的方式所具有的特点。如果事实真是这样,那么,如果容易划分陈述的种类,这就表明人们希望这种假说发挥作用的目的是明确的。在一个抽象模型中,定理和公理之间存在着互换的可能性,意味着在与这个抽象模型相对应的实际假说中,“含义”和“假设”之间也存在着互换的可能性。但是,这并不是说任何“含义”都可以与任何“假设”互换,而只是说可能存在着一个以上的能够暗示其他陈述体系的陈述体系。
例如,我们来分析寡头垄断理论中的一个特殊命题。如果我们假设:(1)企业家通过各种方式(包括谋取或扩大垄断势力)来追求收益最大化,这将意味着:(2)在对一种“产品”的需求存在着地区性的不稳定、运输费用具有显著影响、公开制定价格协议是非法的这种产品的生产者数量较少的时候,这些生产者将倾向于建立基点定价制(basing-point pricing system)。因为我们将预测市场行为作为这个分析的目的,所以,我们可以将断言(1)看做是这种理论的假设,将断言(2)看做是这种理论的含义。如果我们发现断言(2)所规定的条件常常与基点定价制联系在一起,我们也可以认为假设(1)是可以接受的,反之亦然。现在,假定我们的分析目的变成根据《谢尔曼反托拉斯法》(The Sherman Antitrust Law)
禁止“抑制贸易的同谋”的条款,确定应该对哪些案例进行起诉。现在,如果我们假设:(3)基点定价制是一种有意识地建立起来的定价方法,促进了在断言(2)所规定的条件下的同谋,这将意味着:(4)加入基点定价制的企业家,也就参与了“抑制贸易的同谋”。在这种情况下,以前被看做是假设的断言现在就变得具有含义,反之亦然。现在,如果我们发现一旦企业加入了基点定价制,一般就会有被法庭看做是“抑制贸易的同谋”的其他证据,如信函、备忘录及其他类似材料,那么,我们就可以认为假设(3)是合理的。
如果这种假说被用于第一个目的,即预测市场行为,这显然并不表明它也将被用于第二个目的,即预测是否存在证明应该采取法律行动的“抑制贸易的同谋”的足够证据。反之,如果这种假设被用于第二个目的,这也不表明它将被用于第一个目的。不过,在缺乏其他证据的情况下,这种假说在一个目的上的成功(即成功地解释了一类现象),与它可能在另外一个目的上的成功(即成功地解释了另外一类现象)相比,我们对前者更有信心。但是,我们非常难以判断它在多大程度上是更加合理的,因为这取决于我们认为这两类现象之间的关系是多么密切,而这种判断本身又以某种复杂的方式取决于类似的间接证据,即取决于我们以其他方式、用单纯的理论解释现象的经验,而这些现象在某种程度上同样是变化多端的。
为了更一般地说明这一点,只要一种假说的假设本身可以被看做是这种假说的含义,因而假设与现实相一致就可以被看做是这种假说的含义没有与现实相抵触,或者只要这种假说的假设可能使人们想起这种假说的易受偶然性经验观察影响的其他含义,我们就可以使用假设来获得一些关于这种假说的可接受性的间接证据。我们之所以说这些证据是间接的,是因为这些假设或有关的含义涉及的这类现象,常常不同于这种假说所希望解释的那类现象。事实上,正如前面所暗示
我们用来决定哪些陈述是“的那样,这似乎就是假设”,哪些陈述是“含义”的主要标准。这些间接证据的重要性取决于我们认为这两类现象之间的关系是多么密切。
一种假说的“假设”能够促进对这种假说的间接检验的另外一种方式是:先找出这种假说与其他假说之间的类似性质,然后提出关于与其检验假说合理性有关的其他假说合理性的证据。例如一种假说可以被明确地表示成一系列行为。同样,我们也可以不指定任何“假设”而将这种假说表述出来。但是,如果我们可以证明它等价于一系列假设,包括人人都在追求自身利益的假设,那么,通过那些与它进行了同样假设的其他假说在其他类型的现象上的成功,这种假说就获得了间接的合理性。即使不是这样,这样做也不会在所有其他用途上都是完全无用的。实际上,为了找出表面上互不相同的假说之间的关系而对假设进行的这些研究,正是在通向一种更加一般的理论的道路上迈出的一步。
这种来自于相关假说的间接证据,在很大程度上说明了有着不同背景的人对
某种特定假说的置信度不同的原因。例如,假定一种假说认为:在某个特定地区或产业内,就业的种族歧视或宗教歧视程度,与本地区或本产业内的垄断程度密切相关。这就是说,如果这个产业是竞争性的,那么,只有在职工的种族或宗教信仰影响其他职工与他们一起工作的意愿,或者影响消费者对他们生产的产品的可接受性,而且这些情况与雇主的偏见无关的时候,歧视才可能明显存在。这种假说对经济学家所具有的吸引力要远远大于它对社会学家所具有的吸引力。我们可以认为,这种假说“假设”在竞争性产业内,雇主全心全意地追求金钱上的私利,而且在关于经济学要处理的许多群体现象方面,适用于多种经济学假说。所以,经济学家们可能会认为它也同样适用于这些情况。另一方面,社会学家习惯于采用的那些假说则有着极不相同的模型或理想世界,其中,全心全意地追求金钱上的私利的动机所起的作用微不足道。与经济学家可以得到的关于这种假说的间接证据相比,社会学家可以得到的间接证据要不利得多,所以,社会学家可能非常怀疑这种假说。当然,经济学家的证据和社会学家的证据都不是决定性的,决定性的检验应该是这种假说是否能够很好地解释它所希望解释的现象。但是,在进行任何令人满意的决定性检验以前,我们也许需要作出某种判断,而且非常可能的是,如果我们不能在近期进行这种决定性检验,我们就只能根据可以得到的不充分的证据来作出判断。此外,即使我们可以进行这种决定性检验,科学家们的背景并不会与他们的判断毫无关系。在科学中永远都不存在确定性;人们永远都不可能完全“客观地”评估那些支持或反对一种假说的证据的重要性。在判断一种假说的含义是否与实际相一致时,经济学家要比社会学家更加“宽容”,只要存在很少的几个“一致性”的例子,经济学家就可能暂时地接受这种假说。
7.5 经济学问题的一些含义
我们一直在讨论的这些抽象的方法论问题,与人们对“正统的”经济理论是“不现实的”理论韵长期批评以及人们面对这种批评而重新构造理论的种种尝试之间有着直接联系。经济学是一门“沉闷的”科学,因为经济学假定人是自私自利、惟利是图的,是“一个闪电般计算欢乐与痛苦的计算器,就像一粒渴望幸福的均匀水珠那样,在那些使它游离于幸福与痛苦之间的激励的刺激下振荡,但其
本身却保持不变”;因为经济学依赖于过时的心理学,必然随着心理学的每一次新发展而进行重建;因为经济学假定人(或者说至少是商人)总是“处于一种连续的‘待命’状态之中;一旦他们敏感的直觉??发现供给与需求条件的变化,他们就立即改变价格或定价原则”因为经济学假定市扬是完美的,竞争是纯粹的,而且商品、劳动以及资本都是均质的。
正如我们已经知道的那样,如果这类批评没有得到某种补充证据的支持,它就是极不中肯的。这种补充证据是存在着一种假说,在上述那些方面,它与正受批评的理论存在着这样或那样的区别;但它能对广泛的现象作出更好的预测。然而,在这类批评中,大多数批评都没有这种补充证据,它们几乎完全都是根据假设与“现实世界”之间所谓的可以直接感觉到的差异而作出。一个非常明显的例子是,人们最近对收益最大化假说的批评,就是因为他们认为商人没有而且也确实不可能像这种理论“假设”的行为方式那样去行事。他们用来支持这个断言的证据一般来自两个方面:一个是商人对影响其决策的因素的回答(这是检验经济理论的一种程序,它与通过询问80多岁的老人如何解释他们的长寿原因而检验
;另一个是人们对单个企业的决策活动所作的描述性研究。长寿理论的做法类似)
但是,人们提供的证据表明,商人的实际市场行为(即他们做什么而不是他们说他们会做什么)既很少与正受批评的这种假说的含义相一致,也很少与替代性假说的含义相一举。
在人们经常赋予一种理论或其“假设”直接描述性的意义上说,这理论或“假设”不可能是完全“现实的”。一种关于小麦市场的完全“现实的”理论,将不仅需要包括直接影响小麦的供给和需求的那些条件,而且需要包括用来交易的货币或信用工具的种类,小麦交易者的头发和眼睛的颜色等个人特征,他的祖先及受教育程度,他的家庭成员数,他的家庭成员的个人特征、祖先和受教育程度等,种植小麦的土壤种类、物理及化学属性,小麦生长期的主要天气状况,种植小麦的农民和将要最终使用小麦的消费者的个人特征,以及无数的其他条件;如果人们为了达到这种“现实性”而作出过分的努力。必将使得这种理论毫无用途。
当然,我们可以在一定程度上说,完全现实的理论的想法,是一个稻草人。没有一位理论批评家会把这种逻辑上的极端作为自己的自标。他会说他正在批评的这种理论的“假设”“太”不现实了,他的目标是孜孜以求地得到一系列虽然
仍不完备但却“更加”现实的假设。但是,只要“真实性”的检验标准是可以直接感觉到的有关“假设”在描述上的准确性,如关于“商人似乎并不像边际理论所描绘的那样贪婪,也不像边际理论所描绘的那样精力充沛,更不像边际理论所描绘的那样富有逻辑性”的观察结果,或者关于“在目前情况下,对于多工序工厂的管理者来说,试图??算出每一种生产要素的边际成本和边际收益并使二者相等,这将是完全不切实际的观察结果,就不存在进行这种区分的基础,即不存在突然抓住前面所说的那个稻草人的理由。人们判断一种特定的偏离现实的情况是否可以接受的标准是什么呢,为什么在分析商业行为时,忽略商人的成本大小就比忽略他们的眼睛颜色更加“不现实”呢,答案是明确的,因为与商人的眼睛颜色差别相比,商人的成本大小使商业行为产生更大的差别。但是,仅仅通过观察商人之间确实存在的成本大小差别和眼睛颜色差别,我们是无法知道这一点的。显然,只有通过比较商人考虑这种因素或那种因素的实际行为与预期行为之间的差别的影响,我们才能知道这一点。所以,在将各种替代性假设划分为较现实的假设或较不现实的假设时,即使是现实假设的最极端的拥护者,也只能被迫放弃他们自己的标准,并接受通过检验预测而检验假说的标准。
在一篇关于商业周期理论的文章中,有这样一句似乎无害的评论:“经济现象是变化多端、错综复杂的,所以,任何一种能够精密地应用于现实的、全面的经济周期理论都必然是非常复杂的。”这句评论不仅明确地说明了在描述的准确性与分析的相关性之间所存在的根本性混淆,而且明确地说明了导致这种混淆的那些观点的合理性。这种混淆是经济理论的批评者因为经济理论的假设是不现实的而批评经济理论的重要原因。一种基本的科学假说是:虽然表面现象具有欺骗性,但是,对于那些将揭示表面上互不相关、变化多端的现象实际上是一种更加基本、相当简单的结构的表现形式的证据,我们有办法对它们进行分析、解释或组织。就像其他假说的检验标准一样,这种假说的检验标准也是它的结果,即它迄今所取得的巨大成功。如果某种“经济现象”似乎是变化多端、错综复杂的,那么,我们必须假定这是因为我们没有适当的理论来解释它们。我们不可能把已知的事实放在这一边,而把“精密地适用于现实的“理论放在另一边。理论是我们理解“事实”的桥梁,如果没有理论,我们就不能理解“事实”。经济现象是变化多端、错综复杂的这种断言否定了知识的试验性状态,而这种状态本身却使
得科学活动富有意义。它与约翰?斯图尔特?穆勒的非常荒谬的观点类似:“幸运的是,在价值法则中,并不存在任何需要现在(1848年)或将来的作者加以澄清的东西;关于这个问题的理论是完美的。”
人们对描述的准确性与分析的相关性之间的混淆,不仅导致人们由于基本无关的原因而批评经济理论,而且导致人们误解经济理论,并且误导了人们为了弥补所谓的缺陷而努力的方向。人们认为经济理论家发展的抽象模型中的“理想类型”是严格的描述范畴,旨在直接地、完全地与现实世界中的实体相对应,而不管这个模型将被用做什么目的。但是,抽象模型中的理想类型与现实世界中的实体类型之间存在的明显差异,已经导致人们根据这些范畴构造理论的努力必然归于失败,因为人们试图使这些范畴完全是描述性的。
人们对“完全竞争”和“垄断”概念的解释以及对“垄断竞争”或“不完全竞争”理论的发展,也许极其清楚地说明了这种倾向。据说马歇尔假定存在“完全竞争”。世界上也许曾经存在过“完全竞争”,但很明显,现在已经不再存在“完全竞争”了,我们必须抛弃马歇尔理论。读者可能会在马歇尔的著作中不辞辛苦地寻找(我认为这将不会有什么收获),希望能够从中发现任何关于完全竞争的明确假设,或者这样的断言:在描述性的意义上说,世界是由原子似的、参与完全竞争的企业组成的。但是,读者将会发现马歇尔的名言:“在一个极端,世界上存在着这样的市场,竞争直接地来自于地球的每一个部分;在另一个极端,世界上存在着一个封闭市场,所有来自远方的直接竞争都被排除,但即使是在这样的市场中,人们仍然可以感觉到间接的、外界传递而来的竞争;在这两个极端之间,还存在着大量的其他市场,这些市场正是经济学家和商人们需要研究的。”马歇尔按照世界的本来面貌来认识它。他试图构造一个分析世界的“引擎”,而不是像照相那样再现世界。
在按照世界的本来面貌分析世界的过程中,马歇尔构造了一种假说:在很多问题中,人们可以将企业归类为“产业”,以使每一个产业集团中各个企业之间的相同点比它们之间的不同点更加重要。世界上确实存在着很多这样的问题,其中的重要因素是使某些激励(如企业的产品,需求或要素供给的共同变化)对一个产业集团中各个企业的影响是相同的。但是,并不是所有的问题都是这样的,因为有些问题的重要因素对某些特定企业可能会有不同程度的影响;与这种假说相
对应的抽象模型包含两种“理想”类型的企业,即原子似的竞争性企业(这些企业将归类为产业)和垄断性企业。在所有其他企业的价格一定的条件下,如果对于一些价格水平和所有产量来说,一个企业的产品需求曲线对于它自己的产品价格具有无限弹性,那么,这个企业就是竞争性企业,并属于一个“产业”,即生产单一“产品”的企业集团。其中,“产品”定义为产出单位的集合,它们对购买者来说是完全替代的,从而在一定的价格和产量范围内,相对于同一个产业中的另外一个企业的产品的价格来说,一个企业的产品需求弹性是无限的。如果对于一些价格水平和所有产量来说,一个企业的产品需求曲线不是无限弹性的,那么,这个企业就是垄断性企业。如果一个企业是垄断性企业,那么,这个企业就组成整个产业。
通常情况下,作为一个整体,这种假说不仅包含这个抽象模型及其理想的企业类型,而且还包含一系列将实际中的企业划分为某种理想类型以及将企业归类为产业的原则。这些原则大多数是以含蓄的方式并且通过例证来体现的。人们并没有有意识地使这些理想类型成为描述性的,而是将它们用来区分那些对某些特定问题来说是至关重要的特征。即使我们可以直接地、准确地估计出一个企业的产品,我们也不可能立即按照需求曲线的弹性是否是无穷大而将这个企业划分为完全竞争企业或完全垄断企业。在我们实际观察到的需求曲线中,没有一条需求曲线是完全水平的,因此,我们估计出采的弹性将总是有限的,有关的问题将总是某个弹性是否是“足够地”大,以至于可以被认为是无限的。但是,对于这个问题,我们不能简单地通过弹性本身的数值大小而作出一劳永逸的回答,正如我
2们不能一劳永逸地断言:对于使用公式s=1,2gt来说,每平方英寸15磅的气压是否是“足够地”趋近于零。同样,我们也不能计算出需求的交叉弹性(cross-elasticity),然后按照“在需求的交叉弹性之间存在着实质性差异”而将企业归类为产业。正如马歇尔所说的那样:“不同商品(即产业)之间的区别应该如何确定这个问题,必须以便于某种讨论的方式给予解决。我们应具体问题具体分析。如果在一个问题中,我们把一个企业看做完全竞争企业,而在另一个问题中,我们却把它看做垄断性企业,这样做并不存在任何不一致的地方,正如同一个粉笔记号在一个问题中被看做是欧几里德直线,而在第二个问题中被看做是欧几里德平面,在第三个问题中则被看做是欧几里德立体那样,这样做也并不存
在任何不一致的地方。需求弹性及其交叉弹性的大小、生产物理性质类似的产品的企业数量等因素都与问题密切相关,因为它们属于或者可能属于所用变量的一部分。这些变量将被用来定义某个特定问题中的理想实体与现实实体之间的对应关系,明确地说明这种理论能够充分成立的条件。但是,我们并不能根据这些变量而一劳永逸地确定企业在完全竞争与垄断之间的类型划分。
下面这个例子也许有助于说明这一点。如果我们面临的问题是要确定联邦香烟税预期永久性的增加而对香烟零售价格造成的影响,我敢预测:如果我们把香烟企业看做是一群正在生产一种完全相同的产品、处于完全竞争之中的企业,我们就能得到大致正确的结果。当然,在这种情况下。“我们必须确定一些约定,以使”一定数量的切斯特菲尔德牌(Chesterfield)香烟“等价于”一支马尔伯勒牌(Marlborough)香烟。另一方面,假定香烟企业会像完全竞争企业那样行事的假说,将是对第二次世界大战期间香烟企业对价格控制反应的一个误导,而且毫无疑问,人们在此之前已经认识到了这一点。在战争期间,香烟企业的成本肯定会上升。在这种情况下,在原有价格水平上,完全竞争企业将会减少销售量。但是,在这个价格水平上,战时公众收入的增加又会增加需求量。在完全竞争的情况下严格按照法定价格进行销售,将不仅意味着会出现需求量超过供给量意义上的“短缺”,而且意味着香烟生产量的绝对下降。在这里,事实与这个特定含义相抵触:即使香烟的生产量大幅度增加,我们也有很好的理由坚持实行香烟最高限价。这是因为与每个企业希望保持其市场份额、维持其品牌价值和声誉等破坏性力量相比,成本上升的共同性力量大概不太强烈,特别是在超额利润税将很大一部分广告成本转嫁给政府的情况下,情况更是如此。在这个问题中,我们不能把香烟企业当做完全竞争企业。
人们常常把小麦种植业当做一个完全竞争的例子。但是,尽管对于一些问题来说,假定香烟生产者构成一个完全竞争的产业是一种适当的做法,而对于另外一些问题来说,假定小麦生产者构成一个完全竞争的产业却是一种不适当的做法。例如,如果我们的问题是要分析当地的电梯操作员支付的小麦价格的差别,那么,这种做法就是不适当的。
事实证明,对于一群企业集团受到共同激励的影响、企业可以被当做完全竞争者的那些问题来说,马歇尔理论是极其有用的。但是,人们误解马歇尔理论的
根源是:人们错误地以为在某种描述性意义上,马歇尔“假设”存在着完全竞争。我们非常需要构造一种比马歇尔理论更加一般化的理论,它能够在同一个时候,不仅包含产品差别和企业数量少会引起本质差异的情况,而且包含产品差别和企业数量少不会引起本质差异的情况。这种理论不仅将使我们能够处理我们现在不能处理的问题,而且将使我们更加容易地决定在什么条件下,相对简单的理论可以看做是对更加一般化的理论的一种足够好的近似。为了发挥这种作用,这种更加一般的理论必须具有内容和实体,而且必须具有含义,其含义能够接受是否与经验相抵触的检验,并有着实质性的影响和重要性。
由张伯伦(E.H.Chamberlin)和罗宾逊(Joan Robinson)发展的不完全竞争理论或垄断竞争理论,是构造这种更加一般的理论的一次尝试。但不幸的是,它并不具有能够使它成为一种真正有用的一般化理论的任何特征,它的贡献主要局限于改善了人们对单个企业的经济学解释,并因此而完善了人们对马歇尔模型含义的推导;改进了马歇尔的垄断分析;丰富了可以用来描述产业经验的词汇。
这种理论的缺陷极其明显地表现在它对企业集团即所谓的马歇尔“产业”的有关问题的处理上,或者说表现在它对这些问题无能为力上。只要我们坚持认为产品差别是实质性的(坚持这一点正是这种理论与众不同之处),那么,我们就不能采用生产同一产品的企业的方式而对产业进行定义。按照这个定义,每一个企业都是一个独立的产业。但是,如果以“密切的”替代品或交叉弹性之间“实质性的”差异的方式来定义产业,我们就可以避开这个问题,但同时却将模糊性以及难以定义的条件引入抽象模型之中,而这些东西本来并不应该存在于抽象模型之中,它们只能使这种理论在分析上没有意义,因为“密切的”替代品或交叉弹性之间“实质性的”差异与“较小的”气压是相同的表述方法。在一段文章中,张伯伦隐含地将产业定义为具有相同的成本曲线和需求曲线的企业集团。但是,只要产品差别像他所声称的那样是实质性的,而且不能将它置之不理,那么,这种定义在逻辑上就是没有意义的。当我们说一个生产推土机的企业的成本曲线和需求曲线与一个生产发夹的企业的成本曲线和需求曲线是相同的时候,我们的意思是什么呢,如果这句话对于推土机和发夹说是没有意义的,那么,只要我们坚持认为两种品牌的牙膏之间的差异非常重要,它对于两种品牌的牙膏来说也同样是没有意义的。
垄断竞争理论没有为产业分析提供任何工具,因而也没有,填补一个极端上的企业与另一个极端上的一般均衡之间的空白。所以,它并没有促进对许多重要问题的分析:在一个极端,它的面太窄,以至于没有多大的实用性;在另一个极端,它的面又太宽,以至于无法进行有意义的概括。
7.6 结论
作为一门实证科学,经济学是一种被暂时接受的、关于经济现象的概括体系,可以被用来对经济状况变化的影响进行预测。我们在发展这种概括体系增强其合理性、改进其预测的准确程度方面所取得的进步,不仅受到那些妨碍我们探索知识的人类能力的局限性的制约,而且受到那些对社会科学尤其是经济学来说是非常重要的障碍的制约。当然,这些障碍绝对不是只影响社会科学。由于人们熟悉经济学的主要内容,从而使人们轻视关于这些主要内容的专门知识。由于经济学的主要内容对日常生活和公共政策中的主要问题非常重要,从而妨碍了经济学的客观性,并加剧了人们对科学分析与规范判断之间的混淆。由于经济学必须依靠没有控制的实验而不是受控实验,从而使人们难以为了证明试验性假说的可接受性而提出大量的、准确的证据。虽然对没有控制的实验的依赖并不影响基本的方法论原则:一种假说只熊通过它的含义或预测与可观察的现象之间存在一致性而得到检验,但是,这种依赖的确使得人们检验假说的任务变得更加困难,而且使得人们对有关的方法论原则更加混淆不清。与其他科学家相比,社会科学家应该对方法论问题具有更加清醒的自我意识。
一种已经非常普遍而且危害很大的混淆现象是,人们常常混淆“假设”在经济分析中的作用。任何一种富有意义的科学假说或理论一般都声称,对人们理解某种特定类型的现象而言,某些因素是重要的,而其他因素则不重要。通过声称一种假说试图预测的现象在实际观察的世界中的行为方式,与它们在只包括这种假说认为是重要的因素的假定的、高度简化的世界中的行为方式类似,是表述这种假说的一种非常简便的方法。一般情况下,人们可以采用一种以上的方法来系统地阐述这种表述,也就是说,人们可以采用一种以上的“假设”体系来阐述这种理论。人们在这些替代性假设之间所进行的选择,一般是根据它们在表述这种
假说方面的简便性、清晰性、准确性,或者它们能为假说的合理性带采间接证据的能力大小,或者其他类似因素。这些间接证据既可以是表明这种假说的一些含义能够轻易地与观察结果相一致,也可以是表明这种假说与处理相关现象的其他假说有关。
人们并不能通过将一种理论的“假设”与“现实”进行直接比较的方法而检验这种理论。事实上,人们进行这种检验是完全没有意义的。完全的“现实性”显然是不可能达到的。人们要解决一种理论是否是“足够地”现实的问题,就只能考察对于当前的目的来说,它的预测是否足够好或者是否比替代性理论的预测更好。但是,人们普遍认为,一种理论可以通过它的假设的现实性来进行检验,而与它所作出的预测的准确性无关。这种观点是导致人们不断地批评经济理论是不现实的主要原因。这种批评基本上是不中肯的,所以,它所激起的改革经济理论的大多数尝试都是不成功的。
当然,对经济理论的这么多批评都不中肯,并不意味着现有经济理论值得人们高度信赖。虽然这些批评可能无的放矢,但经济理论仍有应该批评的地方。在某种程度上,情况显然是这样。任何一种理论都必然是暂时性的,并将随着知识的进步而不断变化。即使撇开这些陈词滥调不谈,人们也必须使“现有经济理论”的内容更加明确,并区分它的不同分支,因为经济理论的一些部分比另外一些部分显然更值得人们依赖。如果确实可行的话,对实证经济学的现状进行综合评价,对关于实证经济学合理性的证据进行概括,对实证经济学每一部分的相对可信度进行估计,这些显然是一本专著或一系列专著才能完成的任务,而不是一篇关于方法论的短文能够完成的。
在这里,我只能粗略地阐述我个人对这些问题的观点。现有的相对价格理论旨在解释在各种替代性目的之间的资源配置问题,以及在各种共同起作用的资源之间的产品分配问题。在马歇尔的(经济学原理)(Principles of Economics)一书中,它几乎就已经达到了目前的这种形式。我认为,现有的相对价格理论不仅成果极其丰富,而且对于具有西方国家特征的经济制度来说,它的可信度也非常高。虽然人们对现有的静态货币理论的看法似乎存在相当大的争议,但在我看采,它和现有的相对价格理论一样,也是成果极其丰富,而且对于具有西方国家特征的经济制度来说,它的可信度非常高。现有的静态货币理论旨在解释绝对价格、
总产量及其他衡量经济总体特征的变量的结构性水平或长期水平。在它从大卫?休谟(David Hume)到剑桥学派(Cambridge School),又从欧文?费雪(Irving Fisher)到约翰?梅纳德?凯恩斯的所有重要变形中,它始终以货币数量论作为自己的基本核心。我认为,当前经济理论的最薄弱、最不令人满意的部分就存在于货币动态分析领域之中。货币动态分析主要研究经济整体对于经济状况的变化所进行的调整过程,即整体经济活动的短期波动。在这个领域中,我们从来就没有形成过一种可以被恰当地称做现有货币动态分析理论的理论。
当然,即使是在相对价格理论与静态货币理论中,在扩展现有理论的范畴、提高现有理论的准确性方面,人们仍然大有可为。特别是由于过分重视“假设”的描述真实性,从而导致人们忽视决定各种假说合理性局限的关键问题,而这些假说共同构成这些领域内的现有经济理论。人们已经将与这些假说相对应的抽象模型进行相当详细的深化,并且在严密性、准确性方面取得了很大的进展。人们对关于我们的经济制度的特征及其运行状况的描述性材料的收集已经达到了前所未有的规模。这些都非常有用。但是,在有效地使用这些抽象模型和描述性材料方面,我们还要对一些标准进行相当多的探索。这些标准决定哪一个抽象模型最适合于某种特定的问题,抽象模型中的哪些变量与可观察的实体是一致的,这个问题或这种条件的哪些特征对某个特定模型或某种特定理论的预测准确性具有最大的影响。
人们要想在实证经济学方面取得进步,不仅需要对现存假说进行检验和完善,而且需要不断地构造新假说。对于这个问题,人们还没有得出最终结论。构造假说是一项需要灵感、直觉与创新的创造性活动,其实质就是要在人们习以为常的材料中发现新意。这个过程必须在心理学范畴中进行讨论,而不是在逻辑学范畴中进行讨论;必须研究关于科学方法的自传和传记,而不是研究关于科学方法的专著;必须由公理和实例促进,而不是由推论或定理促进。
范文五:实证经济学的方法论读书笔记
《实证经济学的方法论》读书笔记
米尔顿?弗里德曼以研究宏观经济学、微观经济学、经济史、统计学、及主张自由放任资本主义而闻名,曾在1976年取得诺贝尔经济学奖。弗里德曼的政治哲学强调自由市场经济的优点,并反对政府的干预。他的理论成了自由意志主义的主要经济根据之一,并且对1980年代开始美国的里根以及许多其他国家的经济政策都有极大影响。
弗里德曼的《实证经济学的方法论》主要分为六个部分。在第一部分中弗里德曼认同凯恩斯的观点认为实证经济学它要解决的是“什么是”,而不是“什么应该是”一类的问题。实证经济学是独立于任何特别的伦理观念或规范判断的,它的任务是提供一套一般化体系,这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。规范经济学是研究“什么应该是”的问题的研究方法。然而规范经济学及经济学的技术不可能独立于实证经济学。任何政策结论都不可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测,而预测则必须明确或不明确地基于实证经济学。因此,弗里德曼认为实证研究和规范研究在某种程度上的混淆是不可避免的。
第二部分,作者旨在阐述实证经济学的终极目标就是形成假说或理论,使之能够进行预测或者指导实践。在阐述过程中,弗里德曼论述了实证分析的前提,实证分析的检验以及如何科学,客观的解释分析结果。 第三部分的内容从逻辑上应该从属于第二部分中对实证分析的检验。然而作者却将此板块独立成一个部分,并大篇幅的阐述以及引入大量简单的例子来说明实证分析中对假设条件该如何看待的问题,可见此部分在实证分析中的重要性。
第四部分的主要内容如同该部分的小标题一样,旨在论述假设的重要性,该重要性体现在2个层面,1是假设”在表达一种理论中的作用,2是“假设”作为理论的间接检验标准所起的作用。前者意在表明,合理的假设能在理论的表达过程中,使理论简单明了而又科学严谨;后者主要表明在现实中对理论的检验往往直接或者间接的通过该理论的假设来达到目的。 第五部分通过对两大例子的大篇幅阐述主要表达的意思是如何处理和看待经济研究(或者经济模型)中的假设与现实之间的误差导致的理论结果与客观事实不相符的问题。最终强调经济假设的目的还是将影响经济变量变动的主要因素抽象出来。
结论部分作者指出经济学作为一门实证科学,是一种暂时被接受的、关于经济现象的概括体系。这一概括体系可以被用来对情况变动的影响作出预测。人类在扩展这一概括体系,增强我们对其合理性的信赖,及改进其预测的精确程度等方面所取得的进步,受到所有知识探索的人类能力方面的有限性和社会科学中所存在的种种桎梏的阻碍。实证经济学的进步不仅要求对现有假说进行验证并加以完善,而且还要求不断地创立新的假说。
通读此文,作者站在很高的位置以独特的视角,客观而又全面的在看实证经济这个问题。弗里德曼一开始就表明了他的观点:实证研究旨在建立理论模型,预测经济。从实证分析的最根本前提—对事物合理的逻辑分类开始弗里德曼就进行了比较深入全面的描述;然后作者在合理的逻辑分类的基础上论述经济因素的变动是对某一分类在起作用,而非对与之相对的另一分类起作用,由此才建立起了合理的能够具有说服力的理论假说,然而现实中的经济变量很难明确的区分成完全可以分割的两个部分,也就是说某一因素的变化可以说是通过作用到A引起的,也可以说是通过对B产生作用引起的,而到底是A还是B作用引起的,对分析有很大的影响。所以在现实世界,在对分析结果进行解释时不要片面的看待,主观臆断,妄下结论。道理深刻,举例贴切。文中所阐述的许多内容是我们未曾想过要去思考的问题。当作者在论述是否可以通过假说的假设来验证假说的真假这个问题时,将我们的思维从社会科学牵引到了自然科学上。显然是因为自然科学的假说已被证明而且完全接受。作者举例用铅球和羽毛分别来验证重力加速度的假说及推论。很明显,不论是自然科学还是经济学,假设与现实状况必然相悖,然而,它们建立假设的目的都是抽象出主要影响因素来判定被影响因素。当现实与理想存在差距时,应该视被考察因素的具体状况来分析结果,既不能一味的盲目套用理论,也不能盲目的否定理论。阐述客观,批判合理。
弗里德曼在本文中主要对三个人进行了批评。首先是约翰?斯图尔特?穆勒。穆勒认为:“很幸运,在价值法则中不存在任何有待于现在(1848 年)或将来的作者来加以澄清的东西;关于这一问题的理论是完美的。”这显然是错误的,价值理论中很多地方都需要补充和修正(如价格越高,需求越低)。弗里德曼认为约翰穆勒的说法是十分荒谬的也毋庸置疑。弗里德曼认为马歇尔将经济中的主体公司、集团划分为部门是不合理的。而且假设只存在完全竞争和垄断两种市场对
于现在是缺乏现实意义的。但是弗里德曼最后还是客观的评价“马歇尔按照世界的本来面目来描述世界;他所追求的是为分析世界开辟道路,而不是使现实世界得到摄影般精确的再现”。这使得马歇尔的理论存在这指导性的意义。最后作者批评了张伯伦和鲁宾逊认为张、鲁的理论不存在真正的价值。他们的理论贡献主要局限于完善了人们对单个企业经济学所作的阐述,从而完善了人们对马歇尔模型含义的推导;完善了马歇尔的垄断分析,并丰富了可用来描绘部门情况的词汇构成。言下之意,就是没有做出应有的实质性的更大层次的演进。
本文不足之处在于语言晦涩,表述绕口。可能由于中西文化差异的原因,作者在阐述很多观点的时候通常会绕几个弯子,加上阐述的内容抽象,导致语言所表达的意思让读者不能轻易领会,再加上有些地方作者阐述机理的时候没有更加明确的解释,就更让人难以捉摸。例如:假定我们能够证明该假说与某一假设体系是等价的,并且这一假设体系中还包括了人人都在追求自己的利益这一假设,那么,这一假说就可以通过与它具有同样假设的那些假说在其它种类现象上的成功,而间接地获得其合理性,正是我们在通向一个更为一般化假说的道路上迈出的一步。这句话实际上主要表达具有相同假设的假说在没被推翻前是可以互相佐证的。
另外,文中没有清楚解释的地方:在一个主要是投机性的市场中,对于价格的每日波动来说,这一概括就是不合理的。例如,一则关于增加超额利润税的谣传,对于股票市场来说,是应当看作是主要对今天的公司股票供给发生影响的因素呢,还是应当看作是主要对今天的公司股票需求发生影响的因素呢,在类似的情况下,几乎对于每一因素来说,将其划归“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。我想理由应该是这样的:一部分人认为征收超额利润税是对股票供给发生影响的因素,他们认为,超额利润税的增加会导致企业资产的减少,因此会积极筹资,增加股票供给,导致股票价格下降。另一部分人认为征收超额利润税会使得股东收益减少,因此对股票的需求产生不利的影响,造成每股价格下降。