首页 > 文章中心 > 博弈论在管理学中的应用

博弈论在管理学中的应用

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇博弈论在管理学中的应用范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

博弈论在管理学中的应用

博弈论在管理学中的应用范文第1篇

一、博弈论的形成和发展

1、博弈理论的早期研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(Waldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Cournot)和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反映函数。这些都是关于博弈问题的早期的零星研究。

2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯・诺伊曼和奥・摩根斯坦(Morgenstern)在1944年的《博弈论与经济行为》这部著作,他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立,则是以纳什(John Nash)1950年的博士论文《非合作博弈》为标志,该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代),美国海萨尼(Harsanyi)和德国塞尔顿(Selten)的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,博弈论逐渐成为经济学的基石。

1944年,冯・诺伊曼(Von Neumann)和奥・摩根斯坦(Morgenstern)合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论。而且,在该书以前,博弈论主要是数学家们研究的课题,主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此,博弈论开始被经济学家们所接受,对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成,但是这个时候的博弈论还是比较幼稚的,研究的范围也较小,总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。

20世纪的40年代末到50年代初,是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年,纳什(John Nash)在他的博士论文《非合作博弈》中,将博弈论扩展到了非零和博弈,最终形成了非合作博弈理论的思想源泉,纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明,发展了以纳什均衡概念为核心的非合作博弈理论。纳什均衡是对古诺模型和伯特兰德模型中均衡概念的一般化,纳什均衡的概念是有关均衡概念的最基本的概念,后来的子博弈精炼纳什均衡,贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念的提出都是以纳什均衡为研究出发点的。

20世纪50年代中后期一直到70年代也是博弈论发展历史上较为重要的一个时期。“微分均衡”、“强均衡”、“重复博弈”以及在此基础上的完全信息动态博弈等概念就是在这一时期提出来的,而且在60年代初开始了博弈论在进化生物学中的应用的研究。这个时期产生的里程碑式的成果是海萨尼(Harsanyi)关于不完全信息博弈理论,他在1967-1968年的三篇关于不完全信息博弈理论的论文中,提出了关于不完全信息静态博弈的“贝叶斯纳什均衡”的概念,此外还在1973年提出了关于“混合策略”的不完全信息解释,以及关于不完全信息动态博弈的严格“纳什均衡”概念。同时这个时期也是进化博弈论发展的重要阶段,提出了“进化稳定策略”等概念。当然,这个时期产生的博弈论成果还有很多,博弈论更多地应用到经济学理论的研究当中,为80-90年代博弈论的成熟以及经济学理论的博弈论革命起了很大的推动作用。

20世纪80-90年代到现在是博弈论走向成熟的时期,期间产生了大量的研究成果和文献,表明博弈论已经作为一种一般的分析方法逐渐走进了政治学、军事学、生物学、统计学等多门学科中。尤其是在经济学中,博弈论占据了核心地位。这个时期,是对非合作博弈理论的进一步深化,产生了博弈论基础上的经济学分支,如信息经济学,以及一些关于特殊问题的理论,如拍卖理论、激励理论。早在1983年,因一般均衡理论而得到诺贝尔经济学奖的德布鲁(J・Debreu)表明,如果没有博弈论中纳什均衡的重要概念,也就没有他对一般均衡的存在性的证明。到了90年代,克莱普斯(D・Kreps)、克鲁格曼(P・Krugman)和格罗斯曼(S・Grossman)都是因为在博弈论上的贡献而获得了美国的克拉克奖(Clark Prize),这是美国对40岁以下经济学家的最高奖。之后,博弈论两度夺得诺贝尔经济学奖,1994年颁给纳什(Nash)、海萨尼(John Harsanyi)和塞尔顿(Reinhard Selten)三位博弈论专家;2005年颁给罗伯特・奥曼(Robert J・Aumann)和托马斯・谢林(Thomas C・Schelling )。

二、博弈的类型及其均衡概念

博弈理论有合作博弈和非合作博弈之分。合作博弈强调团体理性,强调效率、公平和公正,非合作博弈更强调个体理性、个体的最优决策。按照参与人行动的先后顺序,博弈可以分为静态博弈和动态博弈。完全信息博弈是指每个参与者对所有其他参与者的特征、策略空间和支付函数有准确的知识;否则,就是不完全信息博弈。下图是基于上述分类方法的博弈类型以及各自的均衡概念。

三、博弈论的研究趋势及未来

1、合作博弈和非合作博弈之分。博弈论有合作博弈和非合作博弈之分,现在的研究更多地是基于非合作博弈的研究,事实上合作博弈也是博弈理论的重要内容。当前合作博弈理论研究的落后,正说明这个领域有很大的发展潜力,基于这方面的研究可能会带来博弈理论以及经济学理论的重大革命。

博弈论在管理学中的应用范文第2篇

作者:,上海财经大学公共经济与管理学院助理教授、硕士生导师 上海 200433

[摘 要]本文对当代西方主流的政治学与公共管理学研究中常用到的“规范研究”的方法进行了简明的介绍。文章从规范研究的基本假设谈起,指出在最基本分析单位应当有内在一致性和应当是理性的假设条件下,规范研究大致可从效用理论和博弈论两个方向来进行,而究竟选取哪一个方向则取决于研究者关注的是单一主体在决策时的不同选择还是多个主体在寻求均衡路径中的互动。文章还探讨了规范研究的隐含假设,并勾勒了一个典型的规范研究的操作框架。文章最后探讨了对于规范研究不同模型的评价原则,及如何构造一个规范研究的模型。

[关键词]规范研究;模型;效用理论;博弈论

[中图分类号]D035 [文献标识码]A [文章编号]1006-0863(2014)02-0074-05

一、引言

在政治学与公共管理学的研究中,除了我们所熟知的量化研究和质性研究的方法之外,当代西方主流的学术期刊上还时常用到一种被称为规范研究 (formal theory) 的方法,规范研究在我国台湾学术界又被称为形式理论。[1] 规范研究或形式理论(以下皆称为规范研究)最大的特色就是用数理的模型来分析主体的行为。需要注意的是,本文关注的“规范研究”应当与另一个常用的“规范性理论”(normative theory)的概念区分开。“规范性理论”有一个对于世界应该如何的价值判断,在公共行政学中,规范性理论与实证研究是两条研究路径, 相对于以经验为基础,运用自然科学方法的实证研究,规范性理论是一种以价值问题为核心关注点、以解读和诠释文本为主要表现形式、通过严谨的逻辑构造来回答某个学科的基本问题乃至人生与世界的“大问题”的研究路径。[2]而“规范研究”则通常从不言自明的公理出发,按照严格的数理逻辑和设定规则推演出世界应该如何。这些推演和对于应然状态的判断再反过来用实证的方法进行研究。

虽然很多所谓的规范性理论的文章事实上是不严谨的学术研究,但这不影响规范性理论的文章在我国目前的公共行政学的文献中占据主流地位这一事实。[3][4]如本文将要介绍的“规范研究”在不少关于行政学研究方法的讨论中还不被单独列为一个类型。[5][6]然而有一些学者已经开始用符合“规范研究”要求的方式写作。如杨立华构建了一个知识困境的博弈模型来理解如何通过提高个体对博弈对方知识的尊重和认同,同时加强相互之间的知识交流和沟通,来走出由于知识困境而导致的知识成员之间的矛盾、冲突和对立。[7] 郭庆松讨论了如何通过分析劳动关系的博弈规则来确定劳动关系的博弈均衡,从而促进劳动关系利益主体效用函数的实现或预期收益的最大化。[8]

用数理模型来分析的好处显而易见。数学作为符号逻辑,理论上讲日常语言可以表达的一切都能转化成数学这种符号逻辑。而数学相对日常语言来说,其结构性、工具性、操作性更强,有利于对复杂现象的沟通,及对事物的控制。就易于沟通而言,比如,一个普通的中国人可能并不懂瑞典语,但如果有基本的数理训练的话,他可以很方便的理解瑞典人写的规范研究的模型。

最早的规范研究的著作见诸于经济学的文献中,如古诺(Cournot)[9] ,伯川德(Bertrand)[10] ,和埃奇沃思(Edgeworth)[11] 关于垄断定价和生产的论文。约翰・冯・诺伊曼(John von Neumann)和奥斯卡・摩根斯坦(Oskar Morgenstern)1944年在《博弈论和经济行为》一书中提出大部分经济问题都应当被当作是博弈来分析[12]。 而在政治学与公共管理学界,四本巨著可以被认为是规范研究的应用的奠基之作。它们是,安东尼・唐斯(Anthony Downs)的《民主的经济学理论》 [13],邓肯・布拉克(Duncan Black)的《委员会与选举理论》 [14],威廉・赖克(William H. Riker)的《政治联盟的理论》 [15] 及詹姆斯・布坎南(James Buchanan)与戈登・图洛克(Gordon Tullock)的《同意的计算――立宪民主的逻辑基础》 。[16] 大批后来的学者继续用规范研究的方法发展自己在各个方面的理论,如关于经济和政治的发展有曼瑟尔・奥尔森(Mancur Olson)的《国家的崛起与衰落》[17],关于官僚体系有威廉・尼斯卡宁(William Niskanen)的《官僚制与代议制政府》[18], 关于利益集团有奥尔森的《集体行动的逻辑》[19], 关于民主理论有赖克的《自由主义与民粹主义》[20], 关于合作行为的演变有罗伯特・阿克塞尔罗德(Robert Axelrod)的《自由主义与民粹主义》[21] 等。

二、规范研究的基本假设

我们知道,统计分析的核心是归纳,也就是说,从繁多的资料中整理出相关变量间系统的联系。而规范研究的核心是演绎,即从设定的模型出发,推演出主体在模型的约束条件下根据一定规则如何达到自己的目的。具体的规范研究有各自不同的模型,但所有的模型基本都遵循几个假设。其一,模型的最基本分析单位应当有内在一致性;其二,基本分析单位的行为应当是理性的。

是否具有内在一致性,主要指标是分析单位有没有自己的行为目标。同一个分析单位在同一个时段内,行为目标应当是确定的。假如在研究的时段内,这一个分析主体的目标是游离的,那么,这个主体就不应被作为规范模型的最基本单位。一个有内在一致性的分析单位(或主体)可以是一个人,或一个群体,或一个国家,甚至一个国家联盟。但这些单位未必任何时候都有内在一致性。比如,如果一个人既有利己性,又有利他性,那么我们必须严格设定我们的规范模型到底是在描述利己时,还是利他时的个人。这样,我们才能得到前后一致的模型。

如果分析主体为了达成既定目标而采取最优的方式,我们就认为这个分析主体是理性的。注意这里的理性有可能与我们通常理解的“理性”有一些出入。比如,二战末期日本军队采用了神风敢死队的方式与对手作战,我们通常会认为这是疯狂和“不理性”的作战方式,但如果我们把它理解为分析主体(神风敢死队队员)为达成既定目标(最快和最大限度的打击对手),那么在当时的限定条件下,同归于尽也许是他们能采取的最优选择。

三、规范研究的分类

常见的规范研究大致可分为两大类,一种是效用理论(utility theory),另一种是博弈论(game theory)。效用理论同时也是博弈论的基础,它用数学理论来表达决策过程。[22]对于一个理性的主体而言,他有趋利避害的本能。效用理论假设理性主体的偏好是不变的,它会首先设定理性主体的目标是什么,再指明主体的各种行动的后果是什么。因为主体对各种后果的偏好不同,我们可以用一组从小到大的数值来表明主体对各种后果到底有多么偏好,这些数值就是效用。把主体对各种后果的偏好与这些数值对应起来的公式就是效用函数。最后,各种后果的出现是有一定的概率的,主体会根据这些概率而冒着相应大小的风险来采取产生不同后果的行动。效用理论这时就能够给我们一个科学的决策指南。我们可以将所有不同行动的效用与所有不同行动的风险分别相乘,以得到每个行动的预期效用。理性的主体将会选择产生最大预期效用的行动。

但社会科学里最流行的规范研究的类型还当数是博弈论了。与其它的研究方法,如效用理论或统计分析相比,博弈论最大的特色是把分析主体的互动纳入到模型中。这样,主体间策略性的行为就能被模型所解释:我的选择是如何因为你的选择而改变,与此同时你的选择又是如何因为我的选择而改变;为了实现目标,因为我预期你会如此行动,所以我策略性地没有选择短期内的最优行为;而你由于预期到我不会采取短期最大化的行为,也策略性地选择与短期最大化不同的另一套应对;如此这般。这样,博弈论的构架本身自然而然的迫使我们直面决策行为的“内生性”,也就是说,决策不是一成不变,而是随着模型内其他变量的改变而不断变化。博弈论相信,当博弈终止,尘埃落定之时,理性的局中人将已经把所有可能的信息纳入到最终决策之中了。所以,最终各方的决策应当是均衡的,即,没有任何一方愿意改变现状,从而进入重新一轮的博弈。虽然,根据博弈论理论,理性主体的行为最终将落在均衡路径之内,但博弈论的框架要求我们不得不考虑在均衡路径之外的,理论上不会发生的决策与行为。因为这样才能帮助我们得到模型的最终解答。

除此之外,近些年规范研究也开始向新的方向发展,值得注意的有两个方向。第一,规范研究开始注意与实验的方法相结合。[23] 后面将会介绍,规范研究大多是从一些基本的假设出发开始推演的;但当假设并不契合实际时,结论将会偏差。对于在受控的环境下的受试者,研究人员可以用多种方式检验假设及结论的可靠性,并利用这些反馈修正自己的规范研究的模型。第二,政治学与公共管理学研究中一种新兴的网络分析法(network analysis),可以被视为是规范研究的一类分支。[24] 网络分析法明确地把主体放在一个社会关系的网络之中,主体的每一个社会关系都是网络中的一条线,主体本身是网络中的一个节点。关系的演变将依据研究者给定的假设与逻辑。由于任意一点都可能与多点相连,任意一点的决策将受到多种输入的影响,但这个决策也会反过来影响其他点,因此网络分析法充分的体现了社会内主体间的相互依赖(interdependency),对理解许多政治与经济问题有重要意义。

表1 规范研究分类

(一)著名的博弈论模型

最著名的博弈论模型恐怕非“囚徒困境”莫属了。最原始的囚徒困境模型是两个囚犯被隔离讯问,招认就能减低刑期,不招会被罚,并假设只要一人招认,检察官就有足够证据能处罚两个人。当两人都招时,两人都会中度受罚,但当两人都不招,则检察官只能轻罚两人。重点在于,如果只有其中一方招认,招的那一方就能获释,不招者则得到重度惩罚。每个人都会去想对方到底招不招,然后发现,不论对方招不招,我自己招认的好处都大于不招,所以两人基于理性,就各自发展出主导策略,即都选择招认,因此两人都受到中度惩罚。

表2 囚徒困境

注:括号内是两人的所得,越大的数字表明越大的所得。括号内左边的数字是囚犯一的所得,右边是囚犯二的所得。但假如囚徒困境的情形要重复不断地进行,最理性的方式则是大家形成合作的默契,都不招认,因此都只受到轻度惩罚。假如默契不形成,两人每次都受到中度惩罚,显然不理性。不过,要是博弈只有一轮,基于不信任,大家就都会诉诸短期理性,宁可受到中度惩罚。囚徒困境模型证明时间是重要的因素,即博弈玩一次和玩无限次的结局是不一样的。如果是无限次,两人就会合作,因为考虑到博弈的次数n乘上两人合作的利得,远大于n乘上两人不合作的利得,所以两个人终究会学习合作。囚徒困境模型的目的,是在说明人通过学习,即使基于自利而在短期内做出不利于自己的决定,但长期里最终会回归最理性的方式,修正自己的行为选择。[25][26]

与囚徒困境一样有名的另一个规范研究的模型是懦夫游戏。在这个模型的情境中,两人开车迎面撞来,看谁是怕死先闪开的一方就算输。和囚徒困境最大的不同在于,当双方都不合作(即不闪开)时,得到的结局对双方都是最凄惨的;而在囚徒困境中,两人都不合作时,得到的结果对双方都只是次凄惨的(即中度惩罚),所以两囚才都有可能选择招认。

表3 懦夫游戏

注:括号内是两人的所得,越大的数字表明越大的所得。括号内左边的数字是主体一的所得,右边是主体二的所得。在博弈论的建模过程中,每一种决策的效用值究竟有多大,其实并不重要,真正重要的是每一种决策效用相对其他决策效用的大小。例如在刚刚提到的囚徒困境与懦夫游戏这两个模型中,如果我们改变其中一个模型中效用值的相对大小,我们甚至可以把这个模型转换成另一个模型。

(二)博弈论的弱点

尽管博弈论是规范研究中非常有力的一个工具,但正如任何其他工具一样,博弈论也有自己的局限性。具体来讲,有如下几点。[27]

1.博弈论通常假设博弈中的行为主体有相同的期待,即,每个人都知道自己及他人的所有可能的策略,并以此为基础来决定自己的应对策略。但当相同期待的假设不能被满足时,博弈该如何进行呢?一个办法是允许行为主体在不断博弈中理性的学习:从每轮博弈中,每个主体的期待通过观察其他人的应对而得到更新,更新后的期待成为下一轮博弈的基础。

2.许多博弈论的模型会产生多重均衡点,而无论我们用何种解决办法,多重均衡的结果都没法消除。多重均衡意味着博弈的结果并不唯一,如何从多个均衡中选取我们需要的结果呢?博弈论中的“无名氏定理”可以帮助我们更好地理解多重均衡的现象,并给出选取唯一解的理由。

3.博弈论通常假设相同的知识。字面上的理解自然是行为主体们都掌握同样多的信息,这意味着除了客观事实的信息外,主体们还知道其他的主体也知道这些客观事实,主体们知道所有的主体们都知道所有人都有相同的期待,主体们知道所有人都是理性的,等等。在有限信息博弈论模型中,相同的知识这个假设可以被放松,即一些主体比另一些主体有更多的信息,但信息不对称这个“信息”却是行为主体们都知道的。

4.博弈论通常会假设行为主体是理性的,可另外一个可能的假设是“有限理性”,即在追求特定结果的过程中主体的推演能力是有限的。关于有限理性,文献中有三类可能的解决办法。(1)每个行为主体的策略都基于对手所有过往行动出现的频率,理性是有限的因为主体只需要记住所有的历史;(2)每个行为主体的策略是基于“有限自动回复”,主体没法记住所有历史,他的行动由固定的前几期的历史所决定;(3)不同主体从各自的有限知识与分析能力出发得出不同的策略,这些不同策略在同一个平台下相互竞争、优胜劣汰,最好的策略自然会最终胜出。

四、规范研究的隐含假设

在用效用理论或博弈论来建立模型进行规范研究之前,研究者通常需要接受一些隐含的假设。第一,假设参与博弈的主体之间没有任何情感联系。这保证了各主体的行为是由纯粹利益的计算而决定的,从而使不可观测的因素不会改变建模者的结论。比如,在囚徒困境中,假如两个囚徒是父子关系,那么我们对于即使只有一次博弈的结果,也极不可能得到两人相互背叛的结论。这就是说,模型本身没有考虑的非直接的利益因素改变了模型的结果。第二,假设主体是利己而非利他的。这与之前提到的主体一致性相呼应,保证了建模者可以相对容易的推演出主体的效用函数。然而,这是对现实的极大简化,比如,在公车上让座是我们常见的利他行为,但如果用规范研究的模型来解释这一点的话,往往会从建模本身的需要出发,把利他行为解释成为了更好达到自己目标的利己行为。

五、规范研究的操作框架

在这些明显的或隐含的假设的基础上,我们可以勾勒出一个典型的规范研究的操作框架。

第一步,研究者应当提出要研究的问题。这是所有研究必须跨出的第一步,但通常也是最为困难的一步。好的开始是成功的一半,好的问题正是好的开始的核心。虽然也有灵光一闪的情形出现,但绝大多数的情况下,提出好的问题要在熟悉本领域文献,广泛阅读其他跨领域的材料,及对社会、政治、经济、公共政策等众多领域内规律性的现象保持敏感并不断思考的基础上形成的。

第二步,根据提出的问题以及研究者本身的训练和偏好,研究者应当决定到底用效用理论还是用博弈论来研究这个问题。如前所述,博弈论的精髓在于研究多主体间互动中的策略。因此,如果我们的研究对象是单一主体如政府,研究目标是这个单一主体应如何在给定的选项间选择,例如政府应打破还是维持垄断,那么,这个研究目的决定了纯粹的效用理论可能是更适合的方法。所以,应当是研究问题决定了采用何种研究方法,而不是相反。

第三步,在确定了研究问题和适当的研究方法后,研究者要考虑在自己的模型中要采用哪些假设。因为归根到底,大部分规范研究的结论在其假设被设定的那一刻起,其实就已经确定了。规范研究的过程是用一套符号逻辑的语言,清晰地告诉读者怎样可以从假设推导至结论。这样,规范研究的每一步都是符合逻辑,并经得起后来研究者的检验的,后来的研究者可以很容易地发现模型推演中可能的错误。

最好的假设应当是不言自明的,被绝大多数人和学术界所承认的。但通常仅有这些假设不足以得出研究想要得出的结论,因此,更多的假设不可避免。研究者要使用的新假设应当是较少争议的。这些假设最好应该有现实的经验作为依据,并有已有的文献曾采用过相同或类似的假设。即便如此,研究者还是应当用较大的篇幅来说明自己为什么要用这些假设,及这些假设为什么是合理的。

表4 规范研究常用的假设

第四步,自然是推演的过程。这通常是一个模型最显眼的部分,虽然,对于有经验的建模者,之前的确定问题(并确立变量)和设立假设,恐怕才是最伤脑筋和凸显功力的步骤。社会科学规范模型的推演用到最多的数学知识包括代数、微积分和概率论等。

六、如何评价不同的规范研究的模型

那么,当一个规范研究的模型被构建出来以后,我们如何把它和另一个规范研究的模型作比较,并评价孰优孰劣呢?像任何社会科学的模型那样,我们首先的评价指标是这个模型是否能更好的帮助我们理解和解释我们关心的问题。对于某个问题,好的模型或者能把我们久已认为本该如此的观念用数理化、逻辑化的语言在一个严谨的框架内清晰的表达出来;或者能够在简单无争议的假设的基础上,推演出反直觉的结论,从而弥补单纯靠观测、归纳的研究方法的不足。比如,斯托尔珀和萨缪尔森在公认的比较优势理论的基础上,推导出国际贸易使得一个国家里相对蕴含更丰富的生产要素获利更多的结论。[28] 这个结论与我们的一般直觉相反。一般的直觉告诉我们,稀缺的东西才能获取高价,充足供给的东西价格应当下跌才对。

规范研究的模型还应能自圆其说,也就是说,从假设到结论的推演是按照逻辑一步步进行的,从而保证读者对于每一步的推演都是信服的。一个好的规范研究的模型还应当对多种情境有普适性。这个模型看似是在某一种很特殊的情境下分析主体的行为,但由于规范研究的特征,只要模型的结构和假设能够保持,我们完全可以替代入不同的主体,从而用同样的模型来研究不同的问题。比如,博弈论中的囚徒困境模型,完全可以超越“囚徒”的选择这个最初的情境,而来分析个人、企业、群体、或国家在类似囚徒困境的结构中是如何用与囚徒类似的逻辑来理性的决策的。事实上,国际关系研究中经常用到囚徒困境模型来分析国家间战争与和平的考量。又比如,政治学分析中常见的中间选民理论,最初是被用来解释为什么美国的选举候选人有向政党意识形态偏中间的选民们靠拢的倾向。但随着这个理论的广为人知,美国政治以外的学者也开始用中间选民理论来解释其他领域的热门问题,如福利国家为什么会发生,或者为什么威权政体可能会转变为民主政体,等等。

规范研究与社会科学的其他研究方法一样,也应当尽量追求简洁有力。这就是指一个模型应当用尽可能少的变量或假设来解释尽可能多的变化。如果一个假设不能带来更大的解释力,那么这个假设就不应当被包括在模型中。[29]

七、如何构造规范研究的模型

作为本文的结尾,我们来探讨一下该如何构造一个规范研究的模型。第一种办法,是自建一个模型。在这里,最重要的原则是简单、简单、再简单。建模从写下主体们一系列的选择开始:有什么选择;该什么顺序;选择时有什么信息;选择会产生什么后果。然后,考虑主体们对这些后果的可能的偏好。接着,就可以写下决策树并算出这个模型的结果了。

第二种办法,是修改一个现有的模型,比如改变现有模型的某个假设,或取舍现有模型的某(几)个变量。从工作量上来说,这通常要比构建一个全新的模型要容易些。但同样的,我们还是在修改模型的过程中需要简单、简单、再简单。如果普通的方法可以解决问题,就没有必要用更复杂的方法。

[参考文献]

[References]

[1][25]石之瑜. 政治科学中形式理论的运用与瓶颈――从赛局理论谈起[J].东吴政治学报,2003(17).

Shih Chih-yu. The Epistemological Limit of Formal Theory in Political Science: Game Theory Revisited. Soochow Journal of Political Science, 2003(17).

[2][4]颜昌武,牛美丽. 公共行政学中的规范研究[J]. 公共行政评论,2009(1).

Yan Changwu, Niu Meili. The Normative Research in Public Administration. Journal of Public Administration, 2009(1).

[3][5]何艳玲. 问题与方法:近十年来中国行政学研究评估(1995―2005)[J].政治学研究, 2007(1).

He Yanling. Questions and Methods: Evaluation of Chinese Public Administration in the Past 10 years. Cass Journal of Political Science, 2007(1).

[4][6]刘晓峰,刘祖云. 我国行政学质性和量性研究方法的评价与反思:基于2006-2008年部分期刊文章的样本分析[J].甘肃行政学院学报, 2010(3).

Liu Xiaofeng Liu Zuyun. Evaluation and Reflection on the Chinese Public Administration Research Methods. The Journal of Gansu Administration Institut, 2010(3).

[7]杨立华. 知识困境及其解决方式:以环境治理为例的博弈模型构建[J].中国行政管理,2010(10).

Yang Lihua. The Knowledge Dilemma and its Resolution Methods: Game Theoretical Models of Environmental Governance. Chinese Public Administration, 2010(10).

[8]郭庆松. 论劳动关系博弈中的政府角色[J].中国行政管理,2009(7).

Guo Qingsong. A Study of Government Role on the Game of Labor Relations. Chinese Public Administration, 2009(7).

[9]Antoine Augustin Cournot,Irving Fisher. Researches into the Mathematical Principles of the Theory of Wealth. Macmillan, 1838.

[10]Joseph Bertrand. Théorie mathématique de la richesse sociale’. Journal des Savants, 1883:499508.

[11]Francis Ysidro Edgeworth. La teoria pura del monopolio. Giornale Degli Economisti.1897: 1331.

[12]John von Neumann, Oskar Morgenstern. Theory of Games and Economic Behavior. Princeton University Press, 1944.

[13]Anthony Downs. An Economic Theory of Democracy. New York: Harper & Row, 1957.

[14]Duncan Black. Theory of Committees and Elections. Cambridge: Cambridge University Press, 1958.

[15]William H. Riker. The Theory of Political Coalitions. New Haven: Yale University Press,1962.

[16]James Buchanan, Gordon Tullock. The Calculus of Consent. Ann Arbor: University of Michigan Press, 1962.

[17]Mancur Olson. The Rise and Decline of Nations. New Haven, CT: Yale University Press, 1982.

[18]William Niskanen. Bureaucracy and Representative Government. Chicago: Aldine, 1971.

[19]Mancur Olson. The Logic of Collective Action. Cambridge, MA: Harvard University Press, 1968.

[20][22]William H. Riker. Liberalism Against Populism. San Francisco: W. Freeman, 1983.

[21]Robert Axelrod. The Evolution of Cooperation. New York: Basic Books, 1984.

[23]James D. Morrow. Game Theory for Political Scientists. Princeton: Princeton University Press, 1994.

[24]Rose McDermott. Experimental Methods in Political Science. Annual Review of Political Science, 2002. 5:3161.

[26]Michael D. Ward, Katherine Stovel, Audrey Sacks. Network Analysis and Political Science. Annual Review of Political Science, 2011. 14:245-64.

[27]David Kreps. Game Theory and Economic Modelling. New York: Oxford University Press. 1990.

[28]James E. Alt, Kenneth A. Shepsle. Perspectives on Positive Political Economy. New York: Cambridge University Press, 1990.

[29]Wolfgang F. Stolper, Paul A. Samuelson. Protection and Real Wages. The Review of Economic Studies, 1941. 9 (1).

The Methodology of Formal Theory:A Brief Introduction and its Application in Public Administration

Zhou Qiang

[Abstract]This article is a brief introduction to the methodology of formal theory, which is common in contemporary research in fields like political science, economics, and public administration. We start from discussions of the basic assumptions of formal theory, namely, internal consistency and rationality, and point out that formal theory research can be conducted using either utility theory or game theory. The choice of a specific approach depends on whether the research in question focuses on the different options facing the decision-maker in his decision making process, or the interactions between multiple players in pursuit of equilibrium. Furthermore, we discuss the implicit assumptions in formal theory, give a typical operational framework for a formal theory research, and enumerate some criteria for judging the quality of a formal theory model. We conclude by listing the ways to construct a formal theory model.

博弈论在管理学中的应用范文第3篇

关键词:职业院校 学生管理 博弈

中图分类号:G717 文献标识码:A

文章编号:1004-4914(2011)06-147-02

一、引言

“博弈论是研究决策主体的行为发生直接相互作用的时候的决策以及这种决策的均衡问题的,又称为对策论。”近年来,博弈论已被广泛应用于社会学、经济学、政治学和文化学等研究领域,并深刻地改变着人们的思想和行为。博弈论不仅是一种理论知识,更是一种解决问题的方法。将博弈论引入教育管理领域,能够使教育管理问题得到全新的方法论指导。

目前,职业院校的学生多数文化基础较薄弱,自我管理能力较差,学生管理工作成了职业院校发展的瓶颈。学生管理是职业院校管理工作的重点,没有良好的学生管理体系,学校就不可能获得长足的发展,更无法达到培养人才的目的。因此,面对有着多样性需求和不同层次的学生,探求如何进行有效管理是必要的,是职业院校学生管理中不可忽视的问题。学校对学生的管理归根结底是对学生心理活动的管理,因此,要做好学生管理,必须研究学生的心理和行为规律,并以此来制定管理策略,选用管理方法。参与职业院校学生管理活动的各主体的行为是一个动态的、相互影响和制约的博弈过程。本文正是从博弈论的角度对学生管理问题进行探讨。

二、职业院校学生及学生管理工作的特点

(一)职业院校学生的特点

职业院校的学生除了具有同龄学生的一般特点外,还具有以下几方面特点:

1.文化基础薄弱,自我学习能力不强。职业院校录取学生时,分数线大多在300分至400分之间,部分学生甚至低于300分。这样的中、高考成绩从总体上可以反映出这一层次学生的为文化基础薄弱,学习能力较差。薄弱的文化基础给他们的入校后的学习带来一定的困难,容易导致学生丧失学习的主动性和积极性。

2.人生态度比较目标不明确。职业院校的学生在中学往往属于“差生”“后进生”,是常被老师和同学看不起的“弱势群体”。很多学生存在自卑心理。他们的学习态度和人生态度多数比较消极,人生目标不明确。甚至有少数学生由于受到社会不良风气的影响,形成不良的价值取向。

3.依赖性强,自我管理能力差。职业院校的学生基本上都是在新时期成长的独生子女,从小事事由父母操心,逐步养成了对外部管理的依赖,自我管理能力较差。一旦离开父母进入学校,在处理学习、生活等问题时,很多学生会感到茫然,需要得到学校、老师的帮助和鼓励。

(二)职业院校学生管理工作的特点

职业教育是人人成功的教育,不是淘汰选拔的教育,所以职业院校学生的管理必须从生源的基础素质出发。职业院校要随时准备接受多样性的学习者,制定多样性的入学标准和办法,设计多样性的学习内容、学习方式、结业方式,满足社会多样化需求。学校在教学方面按适用和就业的标准设计职业技术教育课程体系,按照人人成功的理念设计学生考核和激励机制,重视的是“合格”而不是“选优”。由于学生是有感彩的人,对学生的管理常常是不可预测的,需要因人而异、因材施教,所以在学生管理上要有多种准备,要有广泛的适应性。

三、博弈模型的建立与分析

(一)博弈的要素

1.参与人。博弈的主体是职业院校和学生。他们的目的是通过选择行动或战略最大化自己的支付水平。

2.行动。是参与人职业院校和学生在博弈中某时点的决策变量。文章用H1=(努力,不努力)表示可供学生选择的所有行动的集合,用H2=(奖励,不奖励)表示可供学校选择的所有行动的集合,针对学生努力或不努力的行为,学校可以选择采取奖励的手段进行激励,或者不予任何奖励。

3.信息。行动顺序和行动空间是职业院校和学生的共同知识。

4.支付。在学生付出努力的情况下,学校的收益为R:一旦发现学生不努力,就对其实行惩罚F,此时学校的收益只有W。学生努力时付出的成本是C,学校给学生的奖励是π,且π>C,学校对学生进行监督管理的成本为D。

(二)模型构造及分析

本文用不完全信息的混合战略博弈模型来表述职业院校与学生的行为选择,对学生管理的相关因素进行分析。

职业院校选择模型。假定职业院校以α的概率选择对学生进行管理,1-α的选择不管理;职校学生以β的概率选择努力学习,以1―β的概率选择不努力学习;学生努力而得到奖励的概率为V,不努力受罚的概率为θ,博弈模型用图1表示。

在上述模型中,U(F)是学生被惩罚的效用损失,U0是学生不努力学习所得效用。职业院校选择管理与不管理的期望效用分别是:

E1=β(R-Vπ-θF-W)+θF+W-D

E2=βR+(1-β)W

高校行为要达到纳什均衡时,必须有E1=E2,即

β(R-Vπ-θF-W)+θF+W-D=βR+(1-β)W

可得:

学生努力的期望效用为E3=αγU(π)-C;学生不努力的期望效用为U0-αVU(F)。学生的行为要达到纳什均衡,必须有E3=E4,可得

α=(C+U0)/[VU(π)+θU](2)

由(2)式可知:如果学校管理的概率大于(C+U0)/[VU(π)+θU],学生就选择努力学习;如果学校管理的概率小于(C+U0)/[VU(π)+θU],学生就选择不努力学习;当学生管理的概率等于(C+U0)/[VU(π)+θU],学生随机选择努力或不努力学习。

四、结论与启示

1.职业院校学生的行为选择是管理制度的函数。学校的管理制度约束了学生行为的选择集,学生在不同的制度环境中将选择不同的行为方式。如在上述的职业院校与学生的博弈模型中,对选择努力学习的学生给予奖励,促使其自觉地强化和保持努力行为;对选择不努力学习的学生给予惩罚,促使其自觉地抑制和取消不努力行为,则学生选择努力行为的概率增大。同时,由于惩罚所得变为学校的监督收益,使学校监督成本下降,监督概率增大,学生不努力行为被查处的可能性增大,不认真学习等行为相应减少,学生选择的努力行为的可能性进一步增大。因此,学生的行为选择是管理制度的函数,科学、合理的管理制度的设置将有效地规范职业院校学生的行为。

2.处罚力度是参与人行为的函数。职业院校对学生的处罚力度要根据学校的监督概率的大小和学生服从不服从管理,做相应的减弱或加强。但处罚不能太小,否则可能起不到应有的教育效果。

3.职业院校在学生管理中应科学地运用激励措施。学校管理归根到底是对学生心理活动的管理,也就是说要做好学生管理工作,必须研究学生的心理和行为规律,并以此来选用管理方法,制定管理制度。职业院校招收的学生文化成绩偏低,学生自卑情绪严重,自控能力不强,违纪犯错现象比较常见。但是,职校学生的追求和向往并不比其他学生差,他们需要得到更多的理解、关爱和帮助。职校学生的以上特点要求在教育管理实践中,学校和老师必须弄清楚学生的各类需要,采用相应的激励措施调动学生的积极性。

管理学中激励理论的借鉴与运用,为职业院校的学生管理工作提供了新的工作思路,可以克服传统学生管理工作的过度刚性,克服管理方法的公式化和简单化,由于激励理论具有平等性、启发性、情感的感染性等特点,强调人性化教育和柔性管理,注重个性和情感因素的充分发挥,因此符合当代职校生的思想、心理和行为特点,必将成为职业院校学生管理工作顺利开展的有效手段。学校通过运用有效的激励措施,可以最大限度地调动学生的积极性和能动性,使之以最大的热情投入到学习和工作中,充分发挥职校生的最大潜能,从而更好地实现教育管理目标。

此外,职业院校在制定奖学金和其他奖励措施时,应针对后进学生设立一些奖项,使得他们有可能实现目标,这样的措施对后进生才具有激励作用。职业院校重视的是“合格”,而不是“选优”,所以,学校应该改变现有单一的评估体系及考评措施,设立诸如“进步奖”等奖项,激发后进生的积极性,使得他们能够获得成就感和满足感。

4.强化学生管理,形成严格的校风、学风。对学校而言,形成良好的风气很重要,对学生而言,形成良好的习惯很重要。尤其对自我管理能力较弱的职校学生。学校加强管理,能促使学生走向自觉,学校放松管理,学生容易松懈。所以,职业院校应该在学生管理方面加大力度,切实强化学生管理,以树立严格的学风、校风。这样虽然会增加学校的投入,加重老师的负担,但是会对学生的行为产生积极的影响,并有助于学生逐步养成良好的学习和生活习惯。

五、结语

学生管理工作一直都是职业院校各项工作的重中之重。随着人才观、教育目的观转变,势必要求职业学院改革以往的学生管理制度,创造新的管理制度。因此,职业院校应将学校管理制度的建设与创新作为头等大事来抓。学校在学生管理了工作中要科学合理地运用激励措施、惩罚措施,创建良好的校风与学风,促使每个学生循着正确的方向努力。

参考文献:

1.张维迎.博弈论与信息经济学.上海人民出版社,1996

2.付宜新,王玉.浅谈高等职业院校学生管理中的分层管理.太原城市职业技术学院学报,2006

3.余佳华,王庭.激励理论在高校学生教育管理中的应用.皖西学院学报,2007(1)

(作者单位:山西电力职业技术学院 山西太原 030021)

博弈论在管理学中的应用范文第4篇

关键词:学术权力 行政权力 协调博弈

历经千年风雨洗礼的大学尽管面临着危机和挑战、质疑和指责,仍然在培养人才、发展科学、社会服务中发挥着不可替代的社会职能。随着大学的发展,大学内部治理结构,尤其是学术权力与行政权力的关系问题受到普遍的关注,关注的焦点从二者的冲突发展到二者的协调,非此即彼的误区产生了诸多的疑问和困惑。在学术权力与行政权力之间,权力如何界定?利益如何分配?价值如何追求?规则如何制定?学术权力与行政权力的纠缠不清,致使大学在实际运行中,存在着值得深入反思的现象:诸如,学术会议中,绞尽脑汁的桌牌摆放次序;介绍词中,行政职务和代表学术造诣的职称称谓并存;更有甚者,用行政手段直接干涉学术事务的现象,比比皆是。行政权力凌驾于学术权力之上的事实,严重地削弱了大学教育性和学术性的内在属性,大学的核心价值追求受到严峻的挑战。上述现象反映的是大学内部主要权力即学术权力与行政权力的关系问题。无怪乎,阿什比发出这样的慨叹,“大学的兴旺与否取决于其内部由谁控制”。[1]

大学内部学术权力与行政权力的关系问题决定着大学的发展,将协调博弈理论应用到高等教育领域,强调的是协调博弈理论在解析二者关系上的工具价值。协调博弈存在着多重纳什均衡,其“强调参与者行为信念选择的一致性”,[2]即参与者既得利益不仅依赖自身行为策略的选择,同时依赖对方行为策略的选择,因此双方的行为信念,以及对于信念的预期在行为选择时尤其重要。学术权力与行政权力能否协调意向均衡?二者是否具有统一的行为规范?能否确立相互信任的信念?协调的结果对利益的分配会带来怎样的变化?从某种意义上讲,以协调博弈理论重新审视学术权力与行政权力的关系,构建学术权力与行政权力的协调博弈模型,分析学术权力与行政权力选择的策略情境及其利益主体之间的均衡,从而揭示大学内部权力运行机制,必将有助于完善大学的内部治理结构,推进大学的长远发展。

一、学术权力与行政权力

(一)学术权力、行政权力综述

国外关于学术权力和行政权力的经典研究当属加拿大学者约翰・范德格拉夫等编著的《学术权力――七国高等教育管理体制比较》以及美国学者伯顿・克拉克所著的《高等教育系统――学术组织的跨国研究》。约翰・范德格拉夫运用组织社会学、比较政治学和公共管理学比较联邦德国、意大利、法国、瑞典、英国、美国和日本七国高等教育制度的权力结构。运用结构的等级性和决策的内聚性分析权力结构的特征,进一步研究系列讲座、学部、大学、联合大学、州政府、中央政府六级组织层次以及总规划与决策、预算与财政、招生办法与入学机会、课程与考试、高级与初级教学人员的聘任、研究的决策模式六大政策领域。

伯顿・克拉克从组织的观点阐明高等教育系统的基本要素:工作、信念、权力。克拉克认为“各种不同的群体有着自己特定的利益和信念,甚至有自身的神话和游戏规则”, [3]因此群体、信念、利益、规则构成了法定权力模式。高等教育系统的学术权力形式表现为:扎根于学科的权力、院校权力以及系统权力。扎根于学科的权力具体表现为个人统治、学院式统治、行会权力、专业权力;院校权力具体表现为董事权力、官僚权力;系统权力具体表现为政府权力、政治权力、全系统学术权威人士权力,各种形式的权力在高等教育系统中构成了错综复杂的权力网络全景图。在分析各国权力分配的模式时,克拉克抓住了权力结合模式的基本特征,即学术权力和行政权力在大学中是如何分配的,谁在大学中占统治地位,概括出四种权力结合模式:大陆型模式、英国模式、美国模式以及日本模式。

克拉克从广义的范畴对学术权力加以理解,在他看来,学术权力即高等教育管理中各个层次的管理机构和人员所享有的权利。因此,王世权、刘桂秋认为:西方学者关于大学学术权力和行政权力的模糊界定,取决于二者关系的定位,行政权力是大学发展过程中由学术权力衍生的,行政权力服务并服从于学术权力,行政权力的服从与服务性质,使得权力的运行秉承“大学术、小行政”的理念,符合学术权力与行政权力的价值逻辑。[4]

国内关于学术权力与行政权力的研究最早始于二十世纪九十年代,并逐年上升成为热点研究问题。相比国外研究,国内研究则以学术权力和行政权力的概念为起点,注重基础理论研究,从不同视角阐释学术权力和行政权力。目前,学者关于学术权力的典型界定大致分为三种:界定强调学术权力主体,将学术权力理解为学术人员和学术组织所拥有和控制的权力;界定强调学术和学科能力,将学术权力理解为学术权威,即真正的学术权力是学术权威的学术地位和学术成就及影响形成的学术魅力;界定强调学术权力客体,将学术权力理解为管理学术事务的权力。厦门大学别敦荣教授,认为“就学理而言:学术权力指管理学术事务的权力。其主体,即权力的掌握者或行使者,可以是教师民主管理机构或教师;也可以是学校行政管理机构或行政管理人员。还可以是政府及高等教育管理部门等。客体,即权力的作用对象,必定是学术事务。作用方式,可以是行政命令式的,也可以是民主协商式的。”[5]

学者关于行政权力的典型界定大致分为以下三种:依据行政权力的行为主体,认为行政权力是指行政人员和行政机构所拥有的保障大学理想实现的权力;依据制度的赋予,认为行政权力的大小取决于行政组织在整个管理系统中的位置和层次,行政权力产生于正式的组织和制度,并依赖组织的任命;依据行政管理职能,以行政管理体制作为基础的法定权力,认为行政权力是行政组织机构和行政人员所行使的权利。

纵观国内学者关于大学学术权力和行政权力的概念界定,背后折射的是中国语境下学术权力和行政权力的关系,行政权力的强势和泛化,导致学术权力成为行政权力的附庸,丧失了决策学术事务的独立话语权,行政权力取代学术权力的现象反映的是“大行政、小学术”的价值逻辑。[6]

(二)学术权力、行政权力的逻辑起点

阿什比在论及大学的理想时指出,大学是遗传与环境的产物。时至今日,大学的发展依旧秉承两条脉络:大学自身内部发展的逻辑;作为社会环境子系统发展的需要。具有现代意义的大学自诞生之日起,就是“控制高深知识和方法的社会机构”, [7]大学加工的基本材料高深知识不同于其他社会组织,“这些知识有着内在的逻辑性和内在的自主性倾向”。 [8]根据知识材料随之而来的是学科和专业的分化,教授是专业和学科领域中从事教学和研究的专家、学者,他们的工作与学科和专业的发展密不可分,是学术事务、学术活动中最有资格、最具权威的人。学术权力是大学维系其存在和发展的内在逻辑的要求,保证了学术组织、学术人员、学术专业服从于真理的标准,而不受外界诸如国家、政府、市场的利益所驱使,避免了大学因迷恋政治权力、行政权力、自由市场而沦为权力、金钱、市场的附庸。

自由与自治体现了学术权力的价值取向,但是缺乏约束的权力会盲目膨胀,致使学术陷于门户和宗派之争。同时,随着大学组织内、外部环境的不断变化,大学日益繁杂的行政事务需要具有“效率为先”价值取向的行政机构行使行政权力进行管理与决策。行政机构和行政权力的出现恰恰体现了大学作为社会环境子系统的特性。但是,现实的发展却超乎了人们臆想的局面,行政权力不仅以其绝对的优势管理和决策行政事务,还以其拥有的权力干预学术事务。行政权力超越了既定的权限,甚至与大学成长的内在逻辑产生冲突,自由与自治精神渐行渐远,违背了大学精神与科学理想的初衷。由此可见,“任何权力都有局限性,权力的无度和滥用必然导致权力的异化,导致失误和混乱。”[9]基于此,大学内部学术权力和行政权力以其特有的信念与规则,代表着各自不同的利益,配置资源、调控信息、选取策略,形成了完整的协调博弈主体。

二、构建学术权力与行政权力的协调博弈模型

建构合理、高效的大学内部权力利益协调、资源分配及补偿机制,寻求行为信念选择一致的多重均衡点是大学内部权力协调博弈模型构建的关键。纳什对于多人博弈中的均衡点理解为:在其他博弈参与者策略不变的情况下,每个参与者的混合策略都将最大化自身利益。通俗地讲,在博弈中至少存在着这样的策略组合,参与者任何一方如果要改变策略,都将会获得更差的结果。因此,萨缪尔・鲍尔斯认为,纳什均衡“是一种在其他人的状态给定的条件下,每个人都尽其所能,做到最好。”[10]“均衡表明事物处于平衡和稳定状态。而稳定性恰恰是了解很多自然过程的核心概念。生物系统、化学和物理系统,甚至社会系统,无不在寻求稳态。”[11]大学的内部权力正是在均衡、打破均衡、寻求进一步均衡的过程中持续存在和发展的。确定学术权力和行政权力如何在学术事务和行政事务的决策、执行中达到均衡可以预判大学的发展趋势,以至影响大学的兴旺发达。

以交通博弈为例,支付矩阵如表1。

路人甲、路人乙相向而行,假设甲乙二人同时左行或者同时右行,那么甲乙二人各行其道,保证了通行秩序,各获得3个单位支付;假设甲乙二人一个选择左行,另一个选择右行,行进中可能相碰,各获得0个单位支付。该矩阵中存在:同时左行、同时右行的两个纯策略纳什均衡以及左行和右行各占50%的混合策略纳什均衡。在协调博弈中,参与者双方只要就策略的选取进行协调,不论是选择左行的策略A或是选择右行的策略B,协调的结果总是最佳的。

在大学内部权力的协调博弈中,如果学术权力与行政权力参与者均相信某个特定的均衡,同时相信对方也相信这个特定的均衡,那么这个特定的均衡发生;反之,如果信念不同,对另一方的信念的信念预期也不同,博弈的结果则会出现偏差。可见,学术权力与行政权力策略选择一致的情况下,可以获得最大利益,即最大利益来自于双方的协调而不是冲突。例如在资源有限的前提下,以学科建设为例,权力主体就优势学科和一般学科建设进行决策,他们的选择是:加强优势学科建设或者扶持一般学科建设。假设优势学科建设与一般学科对于大学的发展各带来10单位的支付,那么支付矩阵如表2。

在该矩阵中同样存在优势学科、优势学科,一般学科、一般学科的两个纯策略纳什均衡,以及优势学科和一般学科各占50%的混合策略纳什均衡。如果双方均选择加强优势学科建设或扶持一般学科建设,对于大学相应的学科发展尤为有利。当然也可能会出现一方支持优势学科建设,一方支持一般学科建设的情况,导致无果而终。当利益双方发生冲突时,权力主体只要就优势学科建设还是一般学科建设进行协调,相信选择优势学科建设与一般学科建设的最佳策略更容易形成纳什均衡,但不论是加强优势学科还是扶持一般学科,协调的结果对于大学的发展都是有利的。

大学事务中存在着广泛的类似的协调博弈。在有限的学术资源配置过程中,如果利益双方存在冲突,就要设法进行协调。协调过程中,参与双方就利益群体不同的信念、规则而做出相应的行为选择,协调成功或者失败依赖具体的博弈环境。在学术权力和行政权力处理大学事务时,构建协调博弈模型如表3。

在该矩阵中可以清晰地看到学术权力和行政权力的协调博弈。尽管存在策略A、策略A,策略B、策略B的两个纯策略纳什均衡,以及策略A和策略B各占50%的混合策略纳什均衡,但是通过协调,学术权力与行政权力确立相同的行为选择信念,协调的结果是同时选择策略A或策略B的最佳方案,策略的一致使双方获得最大利益,最终有利于大学事务的决策与执行。

三、构建学术权力与行政权力协调博弈模型的条件

(一)协调与信念

大学兴旺发达符合大学发展的长远利益,构建学术权力与行政权力的协调博弈模型,信念是形成特定均衡的重要条件。行为信念选择一致才能达成均衡,或者理解为为了达成均衡,权力双方彼此要求对对方的信念形成信念。在上述学术权力和行政权力处理决策事务的协调博弈中,学术权力可能选择策略A、可能选择策略B,同理行政权力亦然,这样就形成了复杂的局面,而解决复杂局面的关键即形成这样的信念:学术权力和行政权力博弈双方均相信策略A或策略B有利于大学的发展,同时相信对方也同时选取策略A或策略B。信念相同,同时对另一方信念的预期亦相同,才能获得最大的利益收益。

在囚徒困境博弈和猎鹿博弈中,博弈双方都在追求利益的最大化,但结果却出人意料,为什么会出现双方视最大利益不顾,而选取了另外的策略呢?实际的情况是缺乏沟通、协调。协调是形成一致的行为信念的关键。在学术权力和行政权力协调博弈模型中,如果没有协调,学术权力和行政权力选择策略A或策略B时,考虑的是自身利益,利益与参与者的直接关联可能导致博弈的危机。而通过协调促使双方行为信念趋于一致,最终会形成合作的博弈结果。

(二)合作与忠诚

大学的学术权力与行政权力各有其存在与发展的逻辑基础,而双方的合作有利于大学的长远发展,通过协调获得的双方的行为信念的一致性,已经为合作创造了条件。同时,在协调共存体系中,学术权力和行政权力的博弈重复进行,博弈双方不得不考虑此次行为策略的选择是否会影响下一阶段博弈的结果。换句话说,重复博弈的存在使得博弈双方不得不考虑双方的长期利益,而不是一次性的即时利益。因此,采取合作而不是对抗,必要时舍弃短期利益,恰恰体现了双方的长期利益,即合作则双赢。

合作引发了学术权力和行政权力的重新审视:学术权力和行政权力在群体、信念、利益、规则方面存在着很大的差异性,但基于大学理想,学术权力和行政权力博弈双方有必要也可能打造有利于大学发展的忠诚文化。根据上述学术权力与行政权力的协调博弈模型的分析,博弈双方追求自身即时利益造成危机的可能性是存在的,通过协调形成行为信念一致的出发点,是大学发展的长期利益。可见,学术权力和行政权力在博弈过程中,忠诚大学理想的文化是最终形成选取纯策略A或策略B的有效法则。

综上所述,大学内部学术权力与行政权力各有其存在和发展的必要性和必然性,事实证明,试图抵制任何一方在大学中的发展都是不可取的。因此,在学术权力与行政权力共存的体制下,大学内部学术权力与行政权力协调博弈模型的构建,必将有助于理清学术权力与行政权力的关系,完善大学内部的治理结构。通过博弈双方即学术权力与行政权力的协调与合作,确立行为信念选择的一致性,打造忠诚于大学理想的文化,最终服务于大学的长远发展。

参考文献:

[1][3][7][8]伯顿・R・克拉克.高等教育系统――学术组织的跨国研究 [M].王承绪,徐辉,殷企平,蒋恒,译.杭州:杭州大学出版社,1994.4:17,120,11,16.

[2] 小约瑟夫・哈林顿.哈林顿博弈论[M].韩玲,李强,译.北京:中国人民大学出版社,2012.2:58.

[4][6]王世权,刘桂秋. 大学治理中的行政权力:价值逻辑、中国语境与治理边界[J].清华大学教育研究,2012,(4):100-106

[5] 别敦荣.学术管理、学术权力等概念释义[J].清华大学教育研究,2000(2):47.

[9] 潘懋元.多学科观点的高等教育研究[M].上海:上海教育出版社,2001.9:295.

博弈论在管理学中的应用范文第5篇

关 键 词:博弈论;信息经济学;行为经济学;激励理论

中图分类号:F069.9

文献标识码:A

文章编号:1005-0892(2007)03-0005-07

一、现有委托―理论的不足

委托―关系广泛出现于各种经济管理问题中。大到国家对其下属各类机构的管理,中到行业管理机构与企业的关系,小到企业内部董事会与经理层,甚至工厂班组领导与其所管理的工人们,委托―关系几乎是无处不在,无时不有的。现有的委托―理论模型主要是来自信息经济学的直接应用,是博弈论在不对称信息情形的应用。该模型的主要思想是,委托―关系中存在的主要问题是委托―合约签定之后可能会出现事后的信息不对称,即道德风险,从而损害对方的利益。人的道德风险会损害委托人的利益,而委托人的道德风险也会损害人的利益。现有的委托―模型更多地是对存在人道德风险情况下的激励机制进行研究(张维迎,1996;Holmstrom,B,1979; Mirrlees,J,1975,1976)。[1-4]当然,对于存在委托人道德风险情况下的激励机制也有相关的研究(张维迎,1996)。[1]在委托人不能无成本地观察到人行为的情况下,委托人通过与人签定合约,约定按照某些双方都可观察到的指标体系来向人支付报酬(或进行奖惩)的办法对人激励。在这种模型中,委托人的支付函数是期望效用函数,委托人不能直接无成本地观察到人的行为或努力水平,而是通过激励相容约束条件对人的行为或努力水平进行间接判断。委托人给予人的报酬一般分为两部分,一部分是固定报酬(如固定工资或基本工资),另一部分是与业绩挂钩的变动报酬(或变动工资)。业绩一般用双方都可观察到的指标(如利润等)来衡量。在现有的主流模型中,最优激励机制或合约要求参与约束条件给予人的期望支付(或期望效用)恰好等于人的保留支付(或保留效用),或者人得到的期望支付比其保留支付最多多出一点点儿。这是委托人理性假定的必然结果。委托―模型近年来在已故的法国图卢兹学派领头人拉丰(JJ Laffont)的推动下有了新的发展。[5]

现有的委托―理论模型存在这样一个问题:人的行为只对其所获得的绝对收入水平作出反应,没有考虑人会关注其他人的收入水平,或者说,只是假定人的效用仅仅取决于其个人绝对收入水平,没有考虑相对收入对人效用的影响。尽管现有的委托―模型也考虑了人的相对业绩对委托人设计最优合约的影响(即所谓的“标尺竞争”机制),但是,人行为反应居然未考虑其相对收入,这不能不说是研究上的一个严重缺失。同时,人在现有的委托―模型里没有出现对“公平”的追求,这也是与许多事实相左的。委托人在给人支付报酬时,如果人不止一个,就会出现人对委托人进行的利益分配是否公平予以关注,而这种关注一般会影响人的行为反应或努力程度。一般来说,收入效应又是与公平效应相联系的。我们可从现实中观察到的现象来说明这一问题。

在现实中,我们可观察到许多与现有的委托―模型相矛盾的现象。譬如,一些公司给它们的职员(特别是白领职员)以明显高于其保留工资的固定工资,这可理解为公司给予这些职员的期望收入是远高于他们在其他地方工作所得到的保留收入。这些公司本来完全可给予其职员较低些的固定工资也不会影响其职员的积极性,因为这些固定工资只要能够满足参与约束条件即可,而把这些固定工资降低一些后,参与约束也仍然是满足的。影响职员工作积极性的是变动工资部分的收入。所以,如果假定公司所有者是理性的,现有的委托―模型就不能解释这些现象。笔者最近作了一项实证研究,搜集了10个行业的公司白领职员人均年收入数据,每个行业搜集了50个公司的数据。通过统计分析,将这些数据分解为人均固定收入和人均变动收入两部分,又通过计量经济模型分析发现,每个行业里不同公司的人均固定收入都是不同的,而相同行业中不同企业职员的保留收入却是基本相同的。所以,这项研究否定了现有的委托―模型所作出的预言。

由于每个样本序列中人均固定收入最低的公司的人均固定收入是不小于其保留收入的,因此,所有那些人均固定收入大于人均固定收入最低的公司的样本公司的人均固定收入都是大于行业保留收入的。可见,这些公司白领职员的期望收入是严格大于行业保留收入的,这项实证研究否定了现有的委托―模型。

笔者在研究中发现,通过在现有的委托―理论模型中引入对“公平”的考虑,不仅可完善现有的委托―理论模型,而且还能够对上述研究结果加以解释。近年来,许多研究者对传统经济学关于理性人的假定提出异议,认为至少不是所有人的行为都能用新古典经济学的效用最大化来加以解释,而利他行为,即人们之间的相互帮助现象是普遍存在的。所以,近年来行为经济学也针对理性人假设进行了修正,试图对许多传统经济管理理论不能解释的现象予以解释。一项引人注目的原创性研究是Rabin(1993)的思路,他在J.Geanakoplos,D.Pearce和E.Stacchetti(文献中简称为GPS)所提出的“心理博弈”框架基础上,构造了一个引入公平偏好的博弈论体系。通过对“公平”概念加以严密的定义,他改造了传统博弈论中的支付函数,从而发现了一些新的均衡。即除了传统博弈论中已知道的纳什均衡外,还出现了一些新的“公平均衡”――“合作性均衡”,这些新的均衡并不象传统博弈论那样要求无限次重复博弈或信息不对称条件。这种结果对利他行为和合作现象的解释是强有力的。

Rabin(1993)的一个有价值的贡献是把“公平性”(fairness)定义为“当别人对你友善时你也对别人友善,当别人对你不善时你也对别人不善(即‘投桃报李’和‘以牙还牙’)”,而且他的独特贡献是对这种概念给予明确的规定,即“如果你在损失自己效用(收入,利益等)情况下去损害别人的效用(收入,利益等),就被定义为你对别人不善;如果你在损失自己效用(收入,利益等)情况下去增进别人的效用(收入,利益等),就被定义为你对别人友善。”心理学的诸多实验证据表明,人的行为在许多情形下是遵循这种定义的“公平性”规则,特别是在按照这种规则作出反应时所造成的潜在物质利益损失不太大的情况下更是如此。本文认为,按照Rabin的方法,不仅可解释为什么一些公司给予其职员的期望收入明显高于其保留收入,而且还能够解释上面提到的那项近期实证研究结果。公司在给予其职员明显高于其保留收入情况下是损失公司自己的收入或利益,因而表现出对其职员的友善行为;基于“公平性”规则的考虑,职员们在这种情况下对公司也表现出友善,这种友善行为表现为即使在没有公司管理人员监督的情况下,也不会有偷懒或小偷小摸等损害公司利益的行为。这样,公司给予其职员高于其保留收入的期望收入尽管减少了公司的利润,但是由于职员们的“投桃报李”,公司可以通过减少监督而在监督费用上有节省。当节省的监督费用大于因为公司给予其职员高于其保留收入的期望收入而减少的公司利润时,公司的总利润水平却是增加的。可见,这些公司的行为仍然是理性的,因为其行为仍是追求利润最大化。

运用Rabin的分析框架,我们对企业的多样化行为就有了更深刻的认识,即企业可以将“公平”作为新的要素加以运用,以增加其利润。由于不同公司的职员表现出不同程度的“公平性”行为,因此,在将“公平”作为新的要素加以运用来增加公司利润时,不同公司给予其职员的固定收入一般是不同的,这也是我们在实证研究中发现每个行业里不同公司的人均固定收入都是不同的原因。当然,根据现有的效率工资理论,也可对公司为何给予其职员高于其保留收入现象作出解释,但这要求博弈是无限次重复的,而按照“公平博弈”的思路并不需要作出这样的假定。从这样的思路出发,我们可以将基于Rabin的公平性植入现有的委托―理论模型中,从而在保持现有的理性人假定下(即追求利润最大化假定),将现实中的公平偏好纳入最优机制或合约的设计里,完成对现有委托―理论模型的改造,并获得同时考虑了理性人假定和公平性的一个新的委托―理论模型。这项研究的理论意义在于将行为经济学中有价值的要素与现有委托―理论模型相结合,从而完成对现有委托―理论模型的修正和改造。该研究的实际意义是使委托―理论的适用面更加广泛。按照这种理论模型所设计的最优激励合约也更加有效率,为企业带来更大的利润。此外,它还具有更加广泛的意义,因为我们所看到的不同企业在企业文化上的差异也许正是它们的管理层和职员在公平偏好上的差异造成的,而得到的预期理论模型还可为我们在组织行为学和人力资源管理学(如雇佣决策和薪酬设计等)的研究中产生较大的影响,甚至可能对现有的组织行为学和人力资源管理学带来创新性研究。

二、引入“公平博弈”的委托―模型

本文目的是在现有的委托―模型中引入“公平”要素,并在“公平”概念的界定上采用Rabin(1993)的理论,即“互惠性”理论。“互惠性”理论是属于行为经济学范畴,因而本文工作的实质是在传统激励理论中引入行为经济学的假定。我们假定人具有Rabin(1993)所说的“互惠性”行为。[6-10]对于委托人,这里仍假定其是传统的理性人,这在委托人是公司或政府等非自然人的场合是恰当的。这种假定可使我们去考虑这样的问题,即委托人如何利用人的非理去设计工资制度,使委托人获得最大利润,甚至比在现有委托―理论中(其中假定人是理性人)所获得的最大利润还要大的利润。

在具体的模型构造中,一个问题是如何在模型中刻画委托人与人之间的“互惠性”。这个问题在Rabin(1993)[6]中没有给出具体答案(尽管其中给出了抽象的效用函数)。因此,不同的刻画方法会得出不同的对现有委托―理论的修正结果。本文将给出一种具体的刻画方法,结果证明现有的Holmstrom―Milgrom模型中的最优合约不是帕累托最优的。

假定委托人知道人是非理性的,且在行为上表现出这样一种“互惠性”――当委托人在牺牲自己利益的情况下给予人更多的利益时,人会以情愿牺牲自己的利益来回报委托人的好意。具体来说,假定委托人给予人的固定收入要比现有委托―理论中恰好使人获得等于其保留支付的固定收入要高一些。这样,委托人以牺牲一个等于这个高出保留支付数量的利润给予人,使其以同样数量的收入增加。人的“投桃报李”行为假定他们会在现有最优努力程度上再增加一定数量的额外努力,从而使自己不能获得最大效用,但可以增加委托人的利润,使委托人的利润比在人选择传统委托―理论中的最优努力程度时所获得的利润还要多。人选择了以牺牲自己的效用为代价的方式去增加委托人的利润。我们将证明,在一定的条件下(这些条件对委托人和人各自牺牲自己利益的程度作出限制),人的非理的确使委托人得到的利润比人表现出理时还要高,即使委托人这时付出了比现有委托―模型中的固定收入还要高的固定收入之代价。

下面先给出现有的Holmstrom―Mirrlees委托―理论的一种简化模型,由Holmstrom与Milgrom(1987)给出,[6]它是一个适当简化的一维连续变量一般化模型,用参数化方法表述。该模型在文献中被大量采用。设a为人程度的一维变量,生产函数为π=a+θ,π是产出或利润,θ是均值为零、方差为б2的正态分布随机变量,是外生不确定因素。故有

其中E表示数学期望算子,Var表示方差。

假定委托人是风险中性的,人是风险规避的。

现在考虑线性合约,即当委托人和人的绝对风险规避度都为常数时,理性人情形下的最优合约是线性的,这里假定不变的绝对风险规避度(见张维迎,1996):

这样,我们就完成了传统委托―模型的行为经济学改造。这说明在一定条件下,企业对其职员更加人性化的关怀,给予员工比其保留支付还要多的固定收入,不仅不会减少企业的利润(本文中支付,效用,利润和收入等概念是在可互换意义上使用的),而且正好相反,企业因此而激发起员工的感激之情,使员工更加努力地为企业工作。这个模型可以解释许多成功企业的人性化管理和相应的企业文化,可以解释如日本企业员工在下班后仍然在为企业无偿工作等现象,也可解释大公司给予其高管高年薪收入的现象。在日本的许多企业里,公司给予员工非常好的福利,公司高层也经常在业余时间里与员工们进行平等友好的交流沟通;反过来,员工的回报是在公司处于困境时也不象欧美企业中的员工那样频频跳槽,而是宁愿接受减薪在原来的公司里继续努力工作,与公司共渡难关。这种现象在韩国企业中也能看到。这都是通过上述这个模型可以得到解释的。

根据式(2),当δ>0,у>0时,基于人的这种非理性“互惠性”行为的工资合约给委托人和人都带来比Holmstrom―Milgrom合约更高的支付,所以,新合约带来的是一种帕累托改善。这种帕累托改善在理性人的Holmstrom―Milgrom框架里是无法实现的。这也说明,Holmstrom―Milgrom模型中的最优合约不是帕累托最优的。笔者猜想,包括文化在内的一些潜制度如习俗、宗教等,都可能有将这些仅靠理性合约不能实现的帕雷托最优加以实现的功能,这种猜想还有待于进一步加以验证或者证伪。

三、考虑人的“互惠性”是委托人“善意程度”的函数的情形

将δ理解为委托人对人的“善意程度”,人在委托人给予其较大的“善意程度”的情况下,理应以较大的“善意程度”回报,这是人之常情。所以,我们自然地假定у是δ的函数。当δ愈大时,у就应愈小,所以有у=у(δ),у′(δ)

委托人在式(3)中选择δ使Ev*最大化。一阶条件为:

其实,在理论上存在着许多可想象出来的刻画人的“互惠性”非理的方式,这些不同方式所形成的合约性质是下一步工作要研究的问题。

本文所进行的是原创性工作,通过引入行为经济学方面的理念,并在将这种理念加以具体刻画的基础上,改造了经典委托―理论中的Holmstrom―Milgrom模型,使之能够在人的行为动机上包含“互惠性”非理在内的比单纯的理性人假定更加丰富的内容,而现有的理性人假定下的委托―理论(即Holmstrom―Milgrom模型)只是我们发现的模型之特例。譬如,在我们得到的模型里,令人是理性的,则给定委托人的任何δ,人选择的努力程度都是最大化式(2)的左端。容易验证,此时由新模型给出的最优合约就正好是Holmstrom―Milgrom模型。

需要指出,无限次对称信息重复博弈中的无名氏定理以及有限次重复不对称信息中的声誉模型,都不能解释诸如日本企业中的公司与员工间的互惠,因为它们实际上要求人的行为是委托人可以观察到的,这是这些模型的潜在假定。但是,在委托―关系中,人的行为被假定是不能被委托人所观察到的。

由于Holmstrom―Milgrom模型是现有激励理论和整个信息经济学的最基本的模型,激励理论和信息经济学是从这个模型框架发展而来的,所以在本论文中所做的工作具有开创性的意义。因为,通过这种行为经济学理念的植入,可以完成对整个信息经济学和激励理论体系的改造。这种改造是需要的,从本文中已发现,至少对于经典的Holmstrom―Milgrom模型来说,其最优激励合约是非帕累托最优的。即是说,从本文所得到的模型出发,可以开展对现有信息经济学和激励理论基本框架的重建。这将是未来的一个系统且漫长,但又是激动人心的系列工作。

――――――――

参考文献:

[1]张维迎. 博弈论与信息经济学[M]. 上海:上海三联书店,1996.

[2]Holmstrom,B. Moral Hazard and Observability[J]. Bll Journal of Economics,1979,(10):74-91.

[3]Mirrlees,J. The Theory of Moral Hazard and Unobservable Behavior: Part I[R]. Nuffield College,Oxfordd,1975.

[4]Mirrlees,J. The Optimal Structure of Authority and Incentives Within an Organization[J]. Bll Journal of Economics,1976,(7):105-31.

[5]JJ 拉丰,D 马赫蒂摩. 激励理论:委托-理论(第一卷)[M]. 陈志俊,等译. 北京:中国人民大学出版社,2002.

[6]Rabin, Matthew. Incorporating Fairness into Game Theory and Economics[J]. The American Economics Review,1993,(83):1291-1302.

[7]Rabin,Matthew. A Perspective on Psychology and Economics[J]. European Economic Review,May 2002,46(4-5):657-685.

[8]Rabin,Matthew. Review of Arrow, K., Colombatto, E., Perlman, M. and Schmidt, C. (eds.)[A]. The Rational Foundations of Economic Behaviour[C]. Macmillan Press Ltd, 1996, Journal of Economic Literature,December 1997,35(4):2045-2046.

[9]Rabin,Matthew. Incorporating Behavioral Assumptions into Game Theory[A]. James Friedman (ed.). Problems of Coordination in Economic Activity[C]. Norwell,MA:Kluwer Academic Publishers,1994.

[10]Rabin,Matthew. Fairness in Repeated Games[R]. Berkeley Department of Economics Working Paper,January,1997:97-252.

责任编校:周全林

A Model Incorporating Fairness into Principal――Agent: a Contribution from Behavior Economics

Pu Yong-jian

(Chongqing University, Chongqing400044)

Abstract:By incorporating Rabin’s concept of fair gambling intothePrincipal――Agent model,this paper develops a new model featuring the irrational behavior of the agent’s showing reciprocity, whereby an agency agreement can be reached to maximize thebenefitand producea higher profit thanfrom Holmstrom―Milgrom optimal Principa―lAgent contract. The new model can help to illustrate the humanization management of businesses and account for the development of this kind of corporate culture. The paper is an attempt to combine behavior economics and incentive mechanism theory and makes an innovative exploration into the construction of the structure of the information economics using behavior economics principle.