1  /  1  页   1 跳转 查看:2353

人类行为的法则

人类行为的法则

绪  论
1 学习行为问题研究的经济学背景
作为经济学领域里的学习问题,正如托马斯·勃伦纳(2004)所言,“长期以来,学习问题都只是经济学的一个很小的问题”。由此引发出两点思考:一是为什么以前经济学研究一直不关注学习行为,二是学习行为研究对经济学中什么领域至为重要。
对于第一点,为什么以前经济学研究一直不关注学习行为。
我们粗略地看,其主要原因是研究任务来源于社会工程用户的愿望。无论是君主还是一般民众,当他们认为需要经世济民的富国强兵之策或需要构建自己愿望中的亲睦安逸之邦,进而带领众人接近大同世界,并把这种社会工程的设计任务称之为经济学的时候,那么,以此为己任的经济学家,就会一门心思围绕社会福利的效率指标,例如帕累托效率、卡尔多-希克斯效率,精心开展机制设计工作,或者说开发机制设计的技术。
比较一下其他学科,例如,有生物工程也有生物学,有临床医学技术也有生理病理等基础学科研究,有化学工程也有化学。这些工程技术与基础研究之间虽然有紧密的关联,前者可以为后者提出研究任务——需解答的疑问,但后者本身就有自己学科活动,处理经验观察中出现的问题。[1]而前面以社会工程为目标的经济学,其全部使命就是实现或尽量接近社会工程用户的愿望,所以这种经济学几乎就不可能有自己的基础研究任务。可具体表述为:作为社会工程设计的经济学最关心的是多方参与的决策状态,不同的参与规则及初始条件会导致什么样的决策均衡——产出量、效率和分配;对其他人采取什么样的激励、约束,施加什么影响,会使工程用户方的愿望最大化。这样的经济学研究任务就不再包括Menger早期关注的核心问题——人类决策行为本身及其行为变化。所以,包括选择偏好的变化,个体关于自己可以采取的策略知识的变化,关于不同策略可能导致结果的认识变化等,这些都不在主流经济学的视野之内了。
还有一个主要原因,来自于主流经济学方法的公理化趋势。多年来,从基于极值一阶条件的局部均衡联立方程、阿罗-德布罗的点集拓补的微观体系,一直到基于共同知识的纳什均衡表达形式,基本走上了立足于公理基点上思辨演绎之路,虽然也做应用题——计量估计,但这种计量估计的确就是数学的应用题,其检验的不是数学形式而是应用时的简化假设。数学形式本身不需要也不可能通过计量估计检验确认或拒绝。所以,在经济学的这种方法论趋势发展之下,就不会产生个体在相应环境下究竟是如何作出决策的基础性问题,也就不会产生个体是否会改变,如何改变决策知识之类的问题了。简而言之,主流经济学在此意义上不同于所有基于经验观察抽象基本问题的学科。
第二点,学习行为研究对经济学中什么领域是至为重要的。
至少我们可以认为,一旦研究者关注的现实事件发生的变化,在主流经典模型框架里难以刻画的时候(例如,制度或技术变迁过程的刻画与解释),那么,学习过程的行为研究就可能被纳入经济学的关键环节。最显著的当属诺斯的工作,诺斯致力于寻找制度变迁的微观基础,因为制度变迁是决定经济体增长、提高绩效的最重要因素,所以,诺斯等 (C. Mantzavinos,Douglass C. North,Syed Shariq,2004 )指出:

The greatest challenge for the social sciences is to explain change—or more specifically, social, political, economic, and organizational change. The starting point must be an account of human learning, which is the fundamental prerequisite for explaining such change. The ability to learn is the main reason for the observed plasticity of human behavior, and the interaction of learning individuals gives rise to change in society, polity, economy, and organizations. Because learning is the main object of inquiry in cognitive science, only a dogmatic attitude would prevent social scientists interested in phenomena related to change from paying appropriate attention to its findings. The revolution over the past decades in cognitive science has produced valuable insights regarding the processes of individual learning across different types of environments.

这里明确指出的是,若要解释变迁,就不得不聚焦在“the observed plasticity of human behavior, and the interaction of learning individuals”之上,简言之,“human learning is the fundamental prerequisite for explaining such change”。
探究制度形态或者惯例的起源、变化,导向学习行为研究的另一位大师就是肖特。肖特在1980年完成的《社会制度的经济理论》(The Economic Theory of Social Institutions)一书中表明,有必要“将经济问题视为演化的问题,其中,经济行为人只有有限的生命,并将促进经济和社会活动协调的各种各样的社会经验规则、制度、规范和惯例创给他们的后代。……有些制度得到了公开的认同,并写进了法律,而另外一些制度则只是得到了默认,并随着行为人各自最大化他们效用的行为而同时演化”(安德鲁·肖特,2003:2)。即我们的根本任务是理解制度形态或者惯例为什么、如何发生变化。
近30年来,纽约大学的CESS在肖特的带领下,已经发展出了一大批以学习行为研究为核心的实验经济学项目(Experimental Economics Projects),主要开展的项目内容如下:
· Project on Learning
· Project on Intergenerational Games and Advice
· Project on Advice Giving and Following
· Project on Bank Runs
本书所选的文献,大部分都与肖特率领的研究团队——CESS组织开展的工作有关。一系列实验研究的目的就是考察:个体在不同场景下决策行为变化的过程机理——受什么因素影响,是如何影响的。例如,关于行动与收益支付的不同新信号来源,分别对个体调整原有知识,影响主观估计进而决定其行动的影响如何?至于“行动与收益支付的不同新信号来源”,可以是自己的新尝试、看到的别人的尝试或听到的别人的建议,以及在不完美信息下可能的模仿行为,代际交替过程中习得的情况等。
2 经济学研究学习问题的简单回顾与学习行为的若干实验研究
针对决策行为的最基本性质的考察,实际上早在休谟那里,就有了非常精辟的归纳与彻底的推理尝试——只要基于观察和实验,那么就必然要从个体接收处理信号的perceptions开始,个体受三种福利追求的的驱动[2],作出反应,调整行为。经过一步步梳理,休谟高度精炼地概括出了行为调整与制度变迁的脉络:
人类个体之间重复的交往方式(包括人类共同缔结的、有关正义规则的协议),都“只是一般的共同利益感觉,这种感觉是社会全体成员互相表示出来的,并且诱导他们以某些规则来调整他们的行为。”……“当这种共同的利益感觉互相表示出来、并为双方所了解时,它就产生了一种适当的决心和行动。”[3]
但是,通常的经济学家在关注学习问题时,正如MP经济学研究组的托马斯·勃伦纳(2004)所指出的,他们关注的主要是“如何才能最优”与“怎么才会收敛到均衡”两方面的问题:
第一,建立规范性学习模型用于描述最优学习过程——贝叶斯学习;
第二,主要是发展出学习模型,以反映学习行为收敛至均衡的最优行为。
至于为什么会这样,前面在“背景”部分已作了说明。既然有前述的背景原因,所以在相当长的时期内,研究学习过程的大部分经济学工作,主要致力于证明学习过程收敛至最优行为。这一类证明的首次尝试出现于1951年。(Brown,1951)纳什均衡的提出,激起了以下问题的讨论:人们如何变得会根据这个均衡来参与博弈。布朗建立了被称之为虚拟博弈的学习模型;而罗宾逊 (Robinson,1951)说明虚拟博弈学习模型可收敛至纳什均衡行为,随后又被证明,只有在某些条件下才成立(Shapley,1964)。
与此数学模型形式化倾向有所不同的是经验性的学习实验研究。近二十多年来,伴随着行为金融被应用领域日益关注,弗农·史密斯和卡尼曼被经济学界所重视,基于经验观察抽象基本问题的经验学科研究方法得到了发展,学习行为的实验研究就是该发展趋势中的一个重要方向。
在这里必须强调的是,卡内基–梅隆的西蒙(Carnegie Mellon University,Herbert A. Simon)的伟大贡献虽然不是学习过程和制度变迁,但是却直指经济学问题的核心——决策行为,即,个体究竟根据什么如何做出决策!也许这完全不是公理化体系的一般均衡所关心的问题,当然更不是依靠选择集公理化体系所能证伪的。所以西蒙对公理设定提出的质疑,使卡尼曼遵循其“有限理性”和启发式(heuristic)思维研究方向,取得了显著进展。
学习现象的经济学研究中,干中学(learning-by-doing)被关注得比较多,但实际上个体接受新的行为习俗,或者说群体中很多个体习得(acquisition)新的决策知识,并非直接来自于自己的反复练习等亲身经历,他们往往是通过观察别人的行动和结果,形成自己的新知识。这种观察别人的行动和结果的学习在心理学研究中称之为社会学习理论,经典的是班杜拉[4](Bandura, 1962)所作的示范攻击行为的观察模仿实验。按社会学习理论[5],观察者第一要“注意 -attn-”;第二通过观察获得别人活动的符号表征(symbolic representation,又称象征性再现表象),被编码和储存到了记忆中(不必再靠动作和图像,用逻辑思维获得知识,了解世界,简称为“符号表征的保持”或曰“记忆 -ret-”);第三要有把符号表征转变成适当的行动的“动作再现 -prod-”过程;最后第四,要有把习得(acquisition)展现出来(performance)的“动机 -motivation”。合起来observational learn的四要点即“-attn-ret-prod-motivation”。
经济学领域考察的个体决策问题与心理学在许多方面都不太一样,例如:
·心理学实验的观察学习(observational learning )中,有待学习的就是一个既定的新策略;经济学的问题是个体没有既定的新策略,而是如何找到尚不知道的最佳策略。经济行为实验的任务就是考察这个搜寻过程。这一项考察工作,就是“看着学:一项观察学习的实验研究”文献的内容。
·在班杜拉考察的观察记忆过程中,其理论简化的设定和实验安排都要求被观察的行动与赏罚后果是确定的,对观察学习的被试来说,所见所知的信息与行动者(殴打充气娃娃的的扮演者)是一样的。但现实中的序贯行动往往是,只能看见前面行动的人在自己之前作出行动,但是看不见前行者决策获得的结果;也不知道前行者决策前的信息如何(前行者据以决策的信息是私人信息),就像看别人纷纷投资买某个金融产品,但是不知道究竟他们决策的结果——收益是多少。这种情况下,个体如何观察学习,是否会跟随着投资呢?这就构成了不完美信息下的学习行为问题——“不完美信息下观察学习的一个实验检验”。
·可以理解,经济学的学习实验,肯定会沿着最优解的思路进行实验假设和检验。而行为实验的假设则主要来自对现实行为的观察,根本的理论突破要依赖脑科学和演化生物学的进展。所谓沿着最优解的思路进行实验假设,就是对每个人的各种不同决策行为,都认为他们能够最大限度地利用很受局限的观察信息,按照数学期望这种可能性达到最优,计算出要采取的相应决策行动。虽然不可能人人都是数学家,但是经济学的成功似乎正是说明了,人人都不是最优化数学家的时候,采取的行动和均衡结果恰恰如同最优化设计一般。所以放到学习实验中,自然要对羊群现象进行经济人的行为假设——每个个体根据自己的私人信息,在此前已有诸多相同行动的条件下,采取的最佳决策也还是与别人一样。其中的关键是个体决策时,究竟是依据自己的私人信息还是忽略了自己的私人信息。这就是“从羊群行为中区分信息追随的实验研究”。
·作为经验研究的测试方法,进行行为研究的心理学实验与经济学的侧重当然也不一样。前者可以直接基于前额叶新皮质层(prefrontal cortex)的活动机理进行行为学实验设计(如关于prefrontal cortex工作记忆功能的延迟反应实验,是记录反应的动作)或神经心理学实验(如谜津测验),甚至直接用无创伤性影象技术进行记录。但是经济学测试显然不会涉及该层面,其基础性理论简化也不会深入到这一层,所以通常就像显示性偏好的处理那样,仅限于决策行动的记录。但是,实际上注意到个体决策取决于主观概率和heuristic决策的行为经济学家,和严守公理化最优决策的经济学家,在面对观测现象的时候都只能仅限于决策行动的记录。这对前一类经济学家是一个经验研究方法上的遗憾。肖特率领的团队,在此进行了突破,尝试给出了直接记录决策者行动前信念的“诱导信念”,作为中间解释变量的方法。该项工作即“使用诱导信念的信念学习实验研究”。
3 关于“看着学”而非“干中学”的实验评述
在班杜拉的观察学习实验中,被观察者采取的是某个既定的行动策略,而观察者此前还不知道采取这个行动策略就可以获得好收益。对比经济学,经济学学习问题关注的是:个体不知道哪个策略最好,他要为了最佳收益找出最佳策略,这就类似“trial and error”,只不过不是自己亲自动手去尝试,而是看别人动手——采取什么策略、得到多大收益?这里可能有一个疑问,就是观察者是否直接掌握了决策变量与目标函数之间的关系,就不用再去看别人劳神费力地“trial and error”了呢?当然,如果观察者已经知道了哪个是最佳策略,那么这里就没有需要“学习”的事情了。
就像现实中许多情况一样,我们每个人事先并不知道能带来最佳收益的策略是什么样,或者计算过程太复杂以至于不可能通过运算求解之后再决策,就像很多人买了新手机以后宁愿自己摆弄按键而不看说明书一样。所以,在不知道最佳策略情况下寻求最佳决策的观察学习行为研究,就构成了安东尼奥•梅洛和安德鲁•肖特两人的重要工作——“看着学:一项观察学习的实验研究”。
这项工作的基本思路是:安排一个被试进行“trial and error”,另一个被试在旁边静静地观看亲自动手所作的决策选择值和对应产生的收益结果值。这里由带有随机变量极值问题解析解所确定的最佳选择期望值是37,但被试无法知道通过复杂的解析解才能得出的最佳选择是多少,仅仅在0到100之间试取选择值,每次的收益结果都对应一个奖励分。亲自尝试的行动者在经历了长达75次的试错学习之后,在一旁观看的观察学习者也积累了75轮“trial and error”信息。然后,叫两组被试再分别进行一次事先没详细说明的选择实验,这次的奖励分值是次前75轮中每轮的75倍。所以作者称之为“惊奇大奖测试”。要分析比较的是“干中学”和“看着学”这两组被试,在“惊奇大奖测试”中的选择是否有差别。
作者对学习过程的理论贡献是:揭示了在不依赖肌肉协调、运算方法训练等技能训练的情况下,在类似藏宝搜索的过程中(存在一个最佳期望搜寻策略,需要学习者找出来),“看着学”和“干中学”两类学习者面对相同的尝试与结果数据,或者说信息集(data or information set),对相同试误数据序列的处理利用是不一样的。而根据两个理性经济个体面临同样的目标函数,都试图使其最大化。那么在他们处置过程中依同样的数据或者说信息集,就会做出同样的选择。实验研究表明,学习行为研究必须考虑当事人接收试误信号数据(信息集)的过程,实际不符合理性的贝叶斯推断(依广义贝叶斯推断,已发生事件的信息集一样,据此所作的条件概率推断也就一样了)。结果是,冷静的旁观学习可能要比亲自动手尝试的学习更有效。
为什么不一样?可能的理论含义是什么?注意到实验中30%的行动者在75轮之后的“惊奇大奖测试”中,做出了远远偏离了最佳值37而是很靠近100的选择。而观看他们的被试却没有跟着这个错误落入陷阱,这是令人吃惊的。由此引发的理论思考是,行动者和观察者可能启用不同的学习类型。因为行动者的每轮选择都受到小额支付的反馈,他们的调整努力方式可能更像是强化学习——对任一特定决策来说,随着某种所作选择的累积支付的增长,将提高这种决策的概率。然而,强化学习仅仅加强实际做了的那些选择。如果一个行动未被选择,它就得不到强化。因此,如果一个行动者持续在“高处”范围内选择,那么她会继续仅仅强化那些尝试过的行动,并且再也不会发现自己误选在“高处”了。同时,观察者可能更像凯默瑞和胡(Camerer,Ho,1999)描述的学习者:通过计算与选择相关的假定要发生的支付,这一类学习者会强化自己没有做过的选择。观察者更有可能以这种方式行动,因为他们处在更抽象的场景中,有助于信息的理论化处理。因此,也许一类学习模型可以解释行动者的选择,而另一类学习模型则适用于解释观察者的行为。
4 关于学习行为实验研究的展望
通过前面几部分的讨论可以大致看出,学习行为实验研究的问题及方法,有别于传统的经济学均衡模型与计量检验。
因为学习行为实验研究的问题是:个体在某类场景下如何受自己过去经历常识,如何取用或看或听采集到的信息,如何调整主观信念做出决策行动。抽象地说,就是个体如何根据自己可得信息作出什么样的决策,当然可能符合“充分运用可得信息做出最佳调整”的经典假设,但也可能不符合公理化经济学家赋予的最优反应假设。而这个问题在传统经济学研究框架中是不存在的,或者说根本不允许存在——公理性的预设前提怎么能作为待检验的假说呢?这个问题虽然已经无法再与弗里德曼进行讨论了,但是估计还会有坚持的意见。例如早在1953年莫里斯·阿莱斯(Maurice Allais)就已经指出偏好是会逆转(Allais paradox)的——个体选择集公理化设定不成立,但是依弗里德曼在方法论争论中的观点,这不是通常要解释、检验的经济现象,公理前提可以不符合现实,但只要推论能够被检验就可以了,推论所考虑的现实才是经济学的问题。总之,从方法论的角度看,持主流经典观点要坚持的一种意见是,把经验观察和检验对象放在公理预设上没有必要。
同时,即使将把大量的普遍的市场现象作为经验观察和检验对象时,争论依然存在。例如法玛(Fama,1998)等人批评行为经济学,提出卡尼曼等人的Prospect theory解释不具普遍性,认为只能解释市场个别异常现象,不能提出普遍解释的理论或模型。注意,这恰恰是方法论的差异导致的误解,因为基于经验观察抽象基本问题的经验学科研究任务设定就是某类现象,然后到某几类现象的共性观察抽象;而主流的公理体系注定了就是普遍理解的理论或模型。
虽然行为实验研究者对普遍解释的理论或模型心向往之,但是他们的确不能奢望发展出概括各种决策场景的普遍解释的理论或模型,无论是针对风险决策的金融市场,还是主观信念调整的学习过程。其实,基于神经生物学及认知科学成果的学习行为理论已经显示:不存在统一的学习行为过程,也不存在能够解释市场中决策行为的统一理论或模型。
正因为学习行为考察在理论体系的根本上涉及经济学的基础,所以这一类工作必将处于有可能引起争议的前沿,并且有可能使人感到缺乏经典经济学那样的整体性,但是这也正是经验学科要经历的过程。可以预见,包括学习行为研究在内的决策行为实验研究,将促使经济学发生从公理化形式化向经验性学科的变化。
还必须承认的是,既然这一经济学理论分支的研究都是基于认知心理学、脑科学等一系列经验学科的进展之上,那么在关注经济人的学习和决策行为的同时,显然再也无法心无旁骛,而需抱着开放的心态,不断借鉴、跟进这些作为我们经验支撑的跨学科研究进展,为揭示人类社会行为的内在机制提供可能。

朱宪辰
2008年8月12日于南京紫金山麓
参考文献
Bandura, A. (1962): Social Learning through Imitation. Lincoln: University of Nebraska Press.
Bandura, A. (2001): “Social cognitive theory: an agentic perspective,” Annu Rev Psychol, 52, 1-26.
Brown, G. W. (1951): “Iterative Solution of Games by Fictitious Play,” Activity Analysis of Production and Allocation, John Wiley and Sons, 374-376.
Camerer, C. F., Ho, T. (1999): “Experience-weighted Attraction Learning in Normal Form Games,” Econometrica, 67, 827-874.
Fama, E. (1998): “Market Efficiency, Long-Term Returns, and Behavioral Finance,” Journal of Financial Economics, 49, 283-306.
Kahneman, D., Tversky, A. (1979): “Prospect theory: An analysis of decision under risk,” Econometrica, 47, 263-291.
Mantzavinos, C., Douglass, C. North, Syed Shariq. (2004): “Learning, Institutions and Economic Performance,” Perspectives on Politics, 2, 75-84. [Preprints of the Max Planck Institute for Research on Collective Goods Bonn 2003(13)]
Robinson, J. (1951): “An Iterative Method of Solving a Game,” Annals of Mathematics, 54, 296-301.
Shapley, L S. (1964): “Some Topics in Two-Person Games,” M Dresher, L Shapley, A Tucker (eds.): Advances in Game Theory, Princeton: Annals of Mathematic Studies No.52, 1-28.
安德鲁·肖特. 社会制度的经济理论. 陆铭,陈钊,译. 上海:上海财经大学出版社, 2003.




[1] 而且,基础学科研究中争议的判断,几乎完全与应用者的好恶评价无关,不同假说中的哪一种更有解释力只能以经验检验为准。
[2] “一是我们内心的满意;二是我们身体的外表优势;三是我们凭勤劳和幸运而获得的所有物的享用。”见休谟《人性论》下,p.528。
[3]  见休谟《人性论》下,pp.530-531。
[4]  Bandura, Department of Psychology, Stanford University, Stanford, California 94305-2131, USA. Email: bandura@psych.stanford.edu.
[5] 30多年后,班杜拉发展了自己早期的工作,将其称之为Social Cognitive Theory(Bandura A., 2001)。


人类行为的法则:学习行为实验经济学研究

书    名  人类行为的法则:学习行为实验经济学研究
作    者  朱宪辰
出 版 社  浙江大学出版社
书    号  308-06478-1
责任编辑  开本 16
出版时间 2009年2月
 

回复:人类行为的法则

貌似很有意思……

现代人类行为学的发展,是条很长的路……
 
1  /  1  页   1 跳转

版权所有 北望经济学园  北望博客  Sitemap

Powered by Discuz!NT 2.1.202    Copyright © 2001-2012 Comsenz Inc.
Processed in 0.046875 second(s) , 5 queries. 京ICP备05006035号
返顶部