进化博弈理论(精选5篇)

前言：想要写出一篇令人眼前一亮的文章吗？我们特意为您整理了5篇进化博弈理论范文，相信会为您的写作带来帮助，发现更多的写作思路和灵感。

进化博弈理论

进化博弈理论范文第1篇

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

进化博弈理论范文第2篇

关键词：知识共享进化博弈蛙鸣博弈

企业内部的知识有多种形式，如个人经验、产品信息、客户信息、工作流程、各种文档。企业知识共享，就是员工互相交流彼此的知识，使知识由个人的经验扩散到企业的层面，从而提高企业的工作效率。知识共享在企业中产生的是一种知识放大效应，它通过知识管理等手段，使企业的知识资源不断得到整合与利用，从根本上推动企业竞争能力的提升。

进化博弈理论与企业知识共享机制

对于企业知识共享机制问题，可以用博弈理论进行研究。目前，国内一些研究已对此做出了初步的探索，如用“囚徒困境”模型解释不愿知识共享的问题，但是这些分析研究均是应用经典博弈理论进行分析。经典博弈理论从博弈方的完全理性出发，在信息充分的前提下找到了博弈的均衡解。然而对现实中的决策行为者来说，完全理性是很难满足的高要求。当社会经济环境和决策问题较复杂时，人的理性局限是非常明显的。因此要保证博弈分析的理论和应用价值，必须对有理性局限的博弈方之间的博弈进行分析，进化博弈论从有限理性的个体出发，以群体行为为研究对象，合理解释了生物行为的进化过程。生物进化中生物性状和行为特征动态变化过程的“复制动态”，在有限理性博弈分析中正是模拟有限理性博弈方学习博弈和调整策略过程最主要的动态机制之一，而生物进化理论中具有在动态调整过程中达到，在受到少量干扰后仍能“恢复”的稳健性均衡概念“进化稳定策略”，正是有限理性博弈分析最核心的均衡概念，或者说动态策略稳定性概念。

一般来说，在企业内部的知识共享行为上，行为主体的理性层次较低。这主要是因为这类决策是群体决策，而行为是企业行为。此时行为主体意识到错误和调整策略的能力较差，其行为变化更多的是一种缓慢进化而不是快速学习与调整机制。因此可以用生物进化的复制动态机制模拟，即进化稳定策略（ESS）。在重复博弈中，具备有限信息的个体根据其既得利益不断地在边际上对其策略进行调整以追求自身利益的改善，不断地用较满足的事态代替较不满足的事态，最终达到一种动态平衡。在这种平衡中，任何一个个体不再愿意单方面改变其策略，这种平衡状态下的策略称为进化稳定策略。因此，利用进化博弈的方法分析企业知识共享机制更加接近于现实情况，也更有实际意义。

理论基础和模型构建

（一）理论基础

假定两类行为主体均采用纯策略，令S是行为主体所有纯策略的集合，(S)代表所有在t阶段采用纯策略s∈S的行为主体集合，定义状态变量θt(S)表示在t阶段采用纯策略 s的行为主体的群体比例向量，于是有：

根据前面的假设，有限理性的行为主体有一定的统计分析能力和对不同策略收益的事后判断能力，收益较差的行为人迟早会发现这种差异，并开始学习模仿另一类行为人，因此行为人的比例是随时间而变化的，是时间的函数。上述比例随时间变化的速度取决于行为主体的学习模仿速度。学习模仿速度取决于两个因素：一是模仿对象数量的大小（可用相应类型的行为人的比例表示），因为这关系到观察和模仿的难易程度；二是模仿对象的成功程度（可用模仿对象的策略收益超过平均收益的幅度表示），因为这关系到判断差异的难易程度和对模仿激励的大小。于是，有以下连续时间的动态模型：

这是一个模仿者复制动态方程，在本模型中，有如下的定理：

定理(Fudenberrg,1998)模仿者动态的一个稳定稳态是一个纳什均衡，更一般地说，具有源于内部路径限制的任何稳态都是纳什均衡。反之，如果对于一个非纳什均衡，存在一个σ＞0，所有内部路径最终将从该稳态的σ邻域内被清除。

（二）模型构建

假设与前提条件。

1.博弈方：假设该博弈方都是有限理性，且划分为两类，即同事群体1和同事群体2。分析的框架是反复在两个群体中各随机抽取一个成员配对进行博弈。博弈方的学习和策略模仿局限在他们所在的群体内部。这样我们就可以分别对两类群体进行复制动态和进化稳定策略分析。

2.行为策略。博弈方都有两种行为方式：共享；不共享。如果他们的知识都不愿共享，相互封锁，那么个人的知识就会出现低水平重复，使他们各自获得的利益不多，假设为0收益；如果有一个企业成员打破常规，进行知识共享，那么他就获得m(0.5＜m＜1)发展机会,但共享者是有学习成本z的;如果他们的知识都实行共享,就会获得更多的发展机会p(m＜p＜1),此时各有学习成本z。

3.行为策略的采取比例。博弈方中可能采取“共享”与“不共享”的比例分别为x、1－x。

4.得益矩阵。用w表示参与人的收益。随机博弈中双方的得益矩阵如图1所示。

企业知识共享行为的博弈分析

由得益矩阵可知，该博弈的纳什均衡取决于其中P、m、z的具体水平或者说相对水平。根据上述假设，按照博弈的一般公式：

博弈方1中，“共享”类型参与人的收益为：

根据进化稳定策略的性质，一个稳定态必须对微小扰动具有稳健性才能称为进化稳定策略。也就是说，作为进化稳定策略的点x*，除了本身必须是均衡状态外，还必须具有这样的性质，即如果某些博弈方由于偶然的错误偏离了它们，复制动态还会使x恢复到x*。在数学上，相当于要求当干扰使x出现低于x*时，必须大于0，当干扰使x出现高于x*时，必须小于0。这就是微分方程的“稳定性定理”。

当0＜(m-x)/(1-P)＜1时，上述进化过程复制动态的三个稳定状态都是合理的，因为都处于0≤x≤1的有效范围。这时候复制动态方程的相位如图2所示。

由图2可以看出，x*=(m-z)/(1-P)是进化稳定策略。这意味着一旦企业内少数成员开始共享，那么随着获得利益的机会增多，就有更多的成员进行仿效，开始共享，直到组织中成员共享的数量比重为x*=(m-z)/(1-P)。如果超出这个比重，甚至所有的成员都进行共享，那么就会出现有些成员不愿贡献自己的知识让他人共享，反而利用其他成员创造环境氛围，从中牟利，出现“搭便车”的现象，最终仍然回到了x*=(m-z)/(1-P)的均衡比例。

随着支付矩阵的不同取值，x*可能与其它的两全解相等或者不存在第三个解，博弈退化为只有两个稳定态。

当(m-z)/(1-P)＜0，也就是m由图3不难看出，这时候复制动态的唯一稳定的均衡点为x*=0，也就是说企业所有的成员都是不愿共享的。只要不是一开始所有成员都是共享型的极端情况，最终都会在长期的动态变化中趋于不共享。即使是所有成员都共享，只要在组织内部有不共享的人出现，就会破坏共享学习的氛围，破坏整个企业的现状，企业去管理就会增加成本，这样企业反而不去管，最终会趋向所有成员都不愿共享的均衡。

当(m-z)/(1-P)＞1,也就是m-z＞1-P的情况。此时，复制动态的三个不动点中也只有x*=0和x*=1两点符合要求。复制动态方程的相位如图4所示。

由图4可以看出，现在的进化稳定策略是x*=1，也就是所有的成员都共享，整个企业组织就是学习共享型的。在社会环境和成员的素质都很好以及从学习中获得的收益远远大于成本代价时，这样的条件下是合理的。

通过对以上三种情况的分析，我们可以知道，企业知识共享机制是个长期的问题，无法以短期来解决。企业中的成员不是每个都是知识共享型的，而是存在着“搭便车”的现象，在有限理性的条件下，不是所有的企业都是知识共享型的，不是所有的企业都能做到长期性的知识共享。这也可以解释我国有很多的企业在实施知识管理，但真正取得好的结果的却并不多。

企业知识共享的行为演化机制

通过进化博弈的参数分析，可以看出企业知识共享机制的进化博弈包括如下几种可能的行为演化机制。

企业知识共享机制的选择机制，即在博弈中能够获得较高收益的策略，在以后演化过程中被更多的参与者选择。通过进化博弈的得益矩阵分析，使企业知识共享机制容易实现较高效率进化策略均衡。只要调整好P、m和z的大小，就可以保证较高效率的企业知识共享机制顺利进行。具体来说是要求用更低的成本z，创造更多的发展机会P和m，企业就会促使更多的工作人员去实施知识共享。为此企业需要加大内部不共享行为的机会成本，务必对企业内部成员的知识自私行为进行惩罚和压制，以提高这种变异的门槛，使这种不愿知识共享的行为成为一种风险很大收益很小的活动，从而压缩不实现知识共享者的生存空间，避免企业内部的知识共享机制向不利的方向演进。

企业知识共享机制的放弃机制，即在博弈中获得较低收益的策略，在以后演化过程中被更多的参与者放弃。在进化博弈分析的第二种情况下，由于m企业知识共享机制的突变机制，即参与者以随机（无目的性）的方式选择策略，其中包括突变策略，参与者将选择获得较高收益的策略。通过进化博弈的得益矩阵分析，使p-z 变大或1-m 变小，促使(p-z)-(1-m)增大，保证企业较易地实现较高相互支持、相互协作、相互沟通，鼓励和促进企业内部的知识共享行为，褒扬部门、同事的团队精神，把知识共享变成一种自动机制，从而使企业内部采取知识共享行为者获得较高的收益，这样使企业内部采取少数不共享行为的人所占的比例越来越小，提高企业知识共享机制向理想方向进化的可能性和比例，从而促进企业知识共享机制向最理想的方向演进。

参考文献：

1.谢识予.有限理性条件下的进化博弈理论.上海财经大学学报，2001（5）

进化博弈理论范文第3篇

关键词：班级安全文化；进化博弈；有限理性

一、问题的提出

学校是培育人才的摇篮，班级是学校的基本构成单元。班级安全文化是指班级在教学、科研以及生活等领域所创造的理念、形象、设施与行为等的总和，班级安全文化建设是学校安全文化建设的基本立足点。学生是班级的主体，班级安全文化是全班学生共建共享的，一个班级的安全文化氛围浓厚只是一枝独秀，只有当学校所有班级的安全文化不断优化，才能有助于学校安全文化的提升，为学生的学习和生活提供安全保障。彻底否定传统博弈论赖以成立的基础即“理性人假设”的进化博弈理论从具有有限理性的“社会人”出发，分析参与人的行为从而建立起崭新的分析框架。自从1973年生态学家史密斯和普赖斯引进进化稳定策略，TaylorandJonker于1978年提出模仿者动态概念后，进化博弈论被广泛应用于各学科。经典的博弈论建立在完全理性的假设基础上，在解释现实行为方面具有明显不足。而进化博弈论用于解释群体之间的行为是如何相互影响的动态变化过程，因而适用于班级安全文化建设的解释性分析及探索性研究。

二、有限理性条件下学生之间的安全文化建设进化博弈分析

学生作为行为主体，具有有限理性，在班级安全文化建设中的策略选择也是可模仿学习的。运用进化博弈原理对具有有限理性的学生间的相互行为及班级安全文化建设进行分析，颇具理论及现实意义。

（一）基本假设

学生之间是无差异的，由学生组成的群体成员间进行了随机配对博弈，形成两人对称博弈，学生的策略选择受其他学生的策略影响，策略的调整是一个缓慢的动态调整过程。

（二）模型构建

第一，博弈参与者。根据进化博弈原理，将随机配对的两名学生分别记作“学生1”和“学生2”。在班级安全文化建设中，学生有认真参与和敷衍了事两种选择。第二，博弈方的行为策略。在班级安全文化建设中，学生采取的博弈策略有两种：一是积极主动，另一种是敷衍应付，分别记作“主动”和“敷衍”。第三，博弈得益。通过开展班级安全文化建设，假设两名学生都能够认真学习安全知识和技能，可以在很大程度上避免和防范常见校园安全事故，即使遇到安全事件也能尽其所能成功应对的概率为1，从而获得一定的效用，记作V。假设两名学生中，一名学生在班级安全文化建设中采取“主动”策略，安全素质得以提高，从而获得了安全文化建设效用，另一名学生选择“敷衍”策略。严格来讲，学校安全事故的发生具有偶然性，即两名学生在防范和应对校园安全事故时也有一定的成功概率，分别记作R和r。因此，采取“主动”策略的学生获得的效用水平为V*R，采取“敷衍”策略的学生获得的效用水平为r*V，且r≤R，0≤r≤1，0≤R≤1。假设在班级安全文化建设中，两名学生都采取“敷衍”策略，则获得的效用均为M，可正可负，在学校安全形势比较稳定的条件下，学生即使不积极主动参与班级安全文化建设，也不会有任何损失，此时M为正值。相反，校园安全事件的发生会造成一定的人身财产损失以及不良声誉，此时M为负值。

（三）随机配对的两名学生

对称博弈模型的纳什均衡求解根据划线法对博弈模型进行分析，班级安全文化建设中“主动”的学生都能获得较高的效用，即V*R≥M。根据班级安全文化建设实际，运用划线法求解得：当r≤R，V*R＞M时，“主动”是每名学生在任何情况下都不会改变的占优策略，因此（认真学习，认真学习）成为随机配对的两名学生对称博弈模型的唯一纳什均衡。当r≥R，V*R＜M，存在两个纳什均衡，即两名学生会相互影响，（认真学习，认真学习）和（敷衍学习，敷衍学习），学生以一定的概率选择参与班级安全文化建设策略，要么都“主动”，要么都“敷衍”。当r≥R，认真学习安全知识和技能，即“主动”参与班级安全文化建设的学生仍然不幸遇到安全事故，当事故具有偶然性时，“主动”参与班级安全文化建设的学生会改变策略，转为“敷衍”参与班级安全文化建设。

（四）有限理性条件下学生之间的安全文化建设进化博弈分析

当进行班级安全文化建设，对学生开展安全教育和安全管理时，假定以y（t）表示选择纯策略———“主动”参与班级安全文化建设策略的学生人数在群体中所占的比重，则选择“敷衍”策略的学生人数所占比重为1-y（t）。

三、结论及建议

通过构建学生参与班级安全文化建设的进化博弈模型并进行分析求解，得到不同条件下两种不同的进化稳定策略，从而得出学生在参与班级安全文化建设过程中，受其他同学的影响非常明显，要么都“主动”，要么都“敷衍”。安全文化建设是一种居安思危、预防为主、防患于未然的系统工程，如同温水煮蛙实验。从学生参与班级安全文化建设的演化过程看，要改变目前多数学生都存在“敷衍”的现状，应注重对学生学习安全知识和技能的引导，强化安全防范意识，提高“主动”参与班级安全文化建设的效用。采取多种形式开展班级安全文化建设，对学生开展人性化的安全管理尤其是参与式管理，例如通过应急演练、情境模拟等方式吸引学生参与，激发学生的学习力，提高学生安全素质，提升班级安全文化建设实效。

参考文献：

[1]石连海学校安全问题分析与对策[J].当代教育科学,2011,(16):27-30.

进化博弈理论范文第4篇

影子银行是游离在传统银行体系之外的金融体系。它能够促进信贷市场进行有效的资金配置，刺激经济发展。然后影子银行不受监管，难以把控，从而导致其产生负面影响。2008年美国的次贷危机国内外学者几乎将内因归结于影子银行。但是，在如今互联网金融发展的背景下，想要完全消除影子银行是不可能的，引导影子银行朝着积极正面的方向发展才是正确之路。若是影子银行与传统银行能够实现合作共赢，那将成功解决对影子银行的监管问题。

二、相关概念阐述

（一）影子银行

影子银行一词来源于美国次贷危机爆发后，首次被Paul Mcculleys提出的。后来FBS（2011）正式指出，影子银行是传统银行体系之外所涉及信用融资活动的机构。这成为了国内外学者接受度最大的界定。

我国对影子银行的界定一直与体制外金融、民间金融、民营金融、地下金融等概念混用的现象。但是大家对影子银行的基本认知都包括未受国家法律规范，游离于监管当局监管之外等等。有的学者还指出，除了金融机构外，还应包含金融创新产品、服务以及产品和服务适用的金融市场。不过由于本文讨论的是两个主体间的合作关系，故而本文所指的影子银行即是游离于传统银行管理体系之外的非银行金融机构。

（二）有限理性

由于现实生活中许多现象无法用传统金融学来解释，故而后起之秀――行为金融学因合理解释了这些金融现象被广大学者所接受，行为金融学与传统金融理论最大的不同之处就在于，行为金融学认为是投资者不是完全理性人，而是有限理性人。他们总是会受到心理、环境、他人的影响而作出决定。投资行为不全是根据利益最大化原则，还包括安全最大化等等。

（三）进化博弈模型

进化博弈论博弈是一个动态的博弈过程，是有限理性博弈双方群体在一定的前提下对当前局面进行选择，在一个群体中得益较差的博弈方迟早会发现这种差异，并开始学习模仿得益较高的博弈方，后经过自我体验以及学习其他人的选择，而不断改变自己的策略。最终市场会根据“优胜劣汰”的自然规律，形成一个稳定的策略。这种类似于生物进化论的动态博弈方式被称为进化博弈论。最终形成的策略成为进化稳定策略（ESS）。

本文基于进化博弈论的研究方法，对传统银行和影子银行二者的合作进行预测，并判断何时能够达到二者自然选择“合作”策略。基于进化博弈论的基本理论，我们假设传统银行和影子银行都是有限的理性人，对两个博弈方不再细分其内部的个体，并且假设传统银行与影子银行的最大的区分是是否受监管当局监管。

三、影子银行和传统银行合作问题的进化博弈分析

我们粗略地假定我国金融市场中有传统银行机构和影子银行两类机构，而双方面临的选择只有“合作”和“不合作”两种策略，自我的选择和其他群体的选择都将影响自身与他人的收益。他们都将依据这种相对收益率不断地调整自己的策略。两个群体不断地博弈交流，最终通过“物竞天择、适者生存”的进化法则自发进化到具有稳定性的均衡状态――进化稳定策略（ESS）。

1.博弈双方的得益

我们先假设传统银行和影子银行在非合作状态下的收益分别为Rc和RY。我们假设，当二者采取合作时，由于渠道拓宽，客户量增大以及销售效率提升，双方的收益将会增加πc和πY，此时双方存在一个合作的成本分别Cc和CY，且我们假定πc大于Cc，πY大于CY。根据上述假设，可以得到如表1所示的矩阵图。我们发现，如果传统银行与影子银行都是理性“经济人”时，表1的结果必然存在一个纯战略的纳什均衡（合作、合作）；但是如果我们把前提假设放宽至“有限理性”，我们发展最后的进化稳定策略并非都是（合作，合作）

2.传统银行和影子银行的期望得益及其动态微分方程

假定当t时，x是传统银行群体中选择合作策略的银行占传统银行的且X∈（0，1），则选择不合作策略银行比例为1-x；同理，在影子银行群体中，y是选择合作策略的银行占影子银行的比例，且Y∈（0，1），则选择不合作策略的银行比例为1-y。

在传统银行群体中采取“合作”和“不合作”策略两类博弈方的期望得益分别为μCHZ和μCNH，群体平均期望得益为μC：

3、基于传统银行群体和影子银行复制动态微分方程的分析

从（7）式可知，传统银行群体中选择“合作”策略博弈方的比例x的变化率与该类型博弈方的超额期望得益呈正相关关系，也与该类型博弈方的比例x呈正相关。

当y=时，，传统银行中选择 “合作 ”策略的银行的比例的变化率为0，即采取“合作”策略的博弈方比例不会发生变化，此时传统银行群体处于稳定状态。当，即采取“合作”策略的银行获得超额收益，那么，选择“不合作”策略的银行将逐渐发现并调整策略的策，选择“合作”策略，选择“合作”的比例x会向趋近1，此时是该群体复制动态下的一个ESS。当，即采取“合作”策略的博弈方的期望得益小于群体平均得益。那么，选择“合作”策略的银行也会逐渐选择“不合作”策略，采取“合作”策略的博弈方数量会逐渐减少，直到X=0 ，此时是该群体复制动态下的另一个ESS。下图1给出了上述三种情况的动态变化的相位图和稳定状态。

同理可知影子银行群里的情况。当，在影子银行里选择“合作”策略银行比例y的变化率为0 ，即y不会发生变化，此时影子银行群体处于稳定状态。当0，即选择“合作”的影子能够获得超额收益，此时采取“不合作”策略的银行将会调整策略，最终选择“合作”，之后y会向趋近1，当y=1时，该群体处于进化稳定策略。当，表示，选择“合作”的影子银行不能获得超额收益，甚至所获得的收益低于平均收益，故而采取“合作”策略的银行数量会调整策略，y会向趋近0，此时是该群体复制动态下的另一个进化稳定策略。下图2给出了上述三种情况的动态变化的相位图和稳定状态。

4. 传统银行与影子银行合作的进化博弈系统复制动态分析将传统银行和影子银行两个特殊群体类型的比例变化复制动态的关系用一个坐标平面图表示，可得到下图3：

从图 3中A、B、C和D四个区域我们可发现，传统银行和影子银行的合作博弈过程中，最终会趋向（0，0）和（1，1）这两个进化稳定策略。同时，若传统银行与影子银行是处于 B区域时，二者将收敛到进化稳定策略（1，1），即采用“合作”策略；而传统银行与影子银行在C区域时，二者将收敛到进化稳定策略（0，0），即采用“不合作”策略，当他们处在A和D 两个区域时，二者是否选择“合作”是不确定的。传统银行和影子银行能够选择“合作”策略由双方合作后的收益增加量与成本决定。想要增加B区域的面积，提高传统银行与影子银行趋向纳什均衡（合作、合作），有两种方法。一是在传统银行与影子合作时他们的收益增加量πc和Cc不变时，让二者的合作成本Cc和CY越小；二是当双方的初始合作成本Cc和CY一定时，提高双方获得的合作收益增加量πc和πY。

进化博弈理论范文第5篇

Research on Enterprise Independent

Innovation Risk Compensation System Evolution

Based on Evolutionary Game

ZHAO Shi1，2， XIE Kefan1

（1. School of Management， Wuhan University of Technology， Wuhan 430070；

2. Shanghai Precision and Gravels Logisitics Co.， LTD， Shanghai 201700）

Abstract： On the basis of three major entities behavioral analysis in enterprise independent innovation risk compensation system which is at an early stage of development in China， this paper structures enterprise independent innovation risk compensation system evolution model with evolutionary game theory and system dynamics theory. Then it analyzes the evolutionary stability of enterprise independent innovation risk compensation system by example simulation， and based on it， analyzes the effects of risk compensation policy， independent innovation will and risksharing will on the enterprise independent innovation risk compensation system evolution， proves the availability and necessity of enterprise independent innovation risk compensation policy， reveals the evolutionary mechanism of enterprise independent innovation risk compensation system， and proposes the policy proposals of carrying out the risk compensation policy and propaganda policy at the same time.

Key words： risk compensation； system dynamics； enterprise independent innovation； evolutionary game

1引言

随着知识经济时代的不断发展，创新能力已经成为了企业重要的核心竞争力，而我国政府也认识到企业自主创新是国家经济持续高速发展的重要基础。自政府提出构建以企业为核心的技术创新支撑平台以来，我国企业在全国以及区域性企业自主创新支撑平台的支持下，得到了长足的发展；但与发达国家相比，我国企业在自主创新能力和自主创新绩效上仍然存在较大差距。究其原因，从客观而言是创新环境不完善和创新资源不充足，从主观而言则是自主创新的高风险阻碍了企业的自主创新意愿。因此，降低企业自主创新风险，减少企业自主创新的阻滞力是提高企业自主创新源动力的关键，也是促进我国企业自主创新不可忽视的重点。

企业自主创新风险防范机制主要由三个维度构成：企业承担、社会分摊和政府补偿。企业承担是指企业作为自主创新的核心主体，是风险防范措施的决策者和实施者，也是风险损失的最终承担者。技术创新风险的减少和防范与组织策略有重要的关系[1]，很多关键的策略可以用于技术创新风险的防范和管理，以促使技术创新项目达到利益最大化[2]，寻求社会分摊作为一种有偿的风险防范渠道，是企业防范自主创新风险的一个重要策略。然而因自主创新风险过高而引起的风险分摊契约缔结障碍阻碍了社会风险分摊机制的运行，因而，政府补偿在企业自主创新风险补偿机制中起着重要的促进和调节作用。

我国对于企业自主创新风险补偿的研究源于20世纪80年代，最初的补偿方式为设立经营风险准备金或经营风险基金。林跃武认为企业技术创新风险客观存在，且严重阻碍了企业的技术创新，建立风险补偿体系十分必要[3]。企业技术创新风险补偿体系是国家和各级政府部门为了健全和完善技术创新活动的外部环境，促进技术创新活动，在考虑到技术创新活动本身的高投入与高风险特点的基础上，遵循风险与收益对等的原则，对参与技术创新活动的主体，包括企业、科技保险公司、贷款银行、担保机构及风险投资公司所进行的一种全面、系统、规范的补偿机制与制度安排[4]。由此可见，我国对于企业风险补偿的研究主要集中于政府补偿，而国外学者则对于政府直接投入企业技术创新项目存在异议，认为企业风险补偿应基于企业或联盟的内部机制。例如：针对联盟项目利益分配问题的风险补偿[5]，以高质量的产品组合策略开展企业风险补偿[6]，利率波动引起的企业风险补偿[7]，企业人力资源的风险补偿问题[8]等等。

系统的运作基础主要是系统内主体的决策变化，而系统的进化过程就是系统内主体通过不断的分析、决策、学习和博弈不断进化的过程，因此，进化博弈理论是开展系统进化分析的有效工具。龚健等运用进化博弈模型分析了企业海外R&D战略联盟的进化过程[9]，于斌斌则运用进化博弈理论研究了产业集群产业链中企业的进化过程[10]。

2企业自主创新风险补偿系统的主体及假设

企业自主创新风险补偿系统主要涉及三方行为主体：自主创新企业、政府和社会风险分摊组织。虽然社会风险分摊组织包含了保险公司、银行、信贷担保公司、风险投资公司等不同类型的主体，但他们在与政府的博弈过程中存在较高的相似性和一致性，在企业自主创新风险补偿政策中也属于同一类被调节对象，因而将其共同视为一方主体。三方主体在企业自主创新风险补偿系统中，以实现自身利益最大化为目标进行动态决策，并通过各自的决策相互影响、相互作用，构成动态博弈关系，而企业自主创新风险补偿系统即是基于这种动态博弈关系运作[11]。

为了使复杂的企业自主创新风险补偿过程简单化，以便于运用模型进行分析，基于企业自主创新风险补偿体系中各方主体行为的特点和我国社会经济情况，对主体作出如下假设：

（1）假设企业自主创新风险补偿系统中的三方主体均有两种策略选择：政府可选择推行风险补偿政策和不推行风险补偿政策；企业可选择开展自主创新和不开展自主创新；社会风险分摊组织可选择分摊风险和不分摊风险。

（2）主体中的“政府”为风险补偿的实施主体，可以是中央政府，也可以是地方政府，政策调整范围与政府管辖范围一致，其决策基于政策覆盖的全部区域。其决策为实时决策，而非定期决策，即政府可以根据自主创新风险补偿的发展现状随时作出决策，并立即推行政策的实施，不考虑政策有效期和政策延迟情况。该假设主要用于保证博弈过程连续性。

（3）政府的风险补偿行为主要包括两类：直接补偿和间接补偿。对直接从事创新活动的企业的补偿是直接补偿，对社会风险分摊组织的补偿是间接补偿。两种补偿政策属于同一个政策系统，即政府一旦决定开展风险补偿，则两种补偿方式同时进行。风险补偿强度为定值，风险补偿的额度只受到风险发生概率的影响。所有风险补偿均为风险损失补偿（事后补偿），即只有当企业开展自主创新项目发生损失，或社会风险分摊组织分摊企业自主创新风险发生损失时，补偿政策才生效。假设政府有充足的资金进行补偿，但在决策时，充分考虑补偿的成本，即服从经济人假设。此外，在博弈过程中，政府获得的所有社会效益全部转化为经济收益，以经济指标表现。

（4）假设自主创新企业的风险偏好为风险中性，政府的风险补偿政策对其具有正效应，且为了有效防范自主创新风险，企业具有分摊自主创新风险的意愿。此外，假设自主创新企业具有独立投资和开展自主创新项目的能力，而自主创新结果只有成功和失败两种，即一旦发生风险损失则视为自主创新项目失败，企业无法获取风险收益[12]。

（5）假设社会风险分摊组织为政策覆盖区域内的大中型风险分摊组织，具有分摊企业自主创新风险的能力。社会风险分摊组织的风险偏好也为风险中性，政府的风险补偿政策对其具有正效应。

为了便于进行进化博弈分析，基于以上假设前提，对博弈分析过程中设计的一些基本变量做出如下假设：

（1）假设若自主创新企业进行自主创新，其全部投入总额为Cy，项目成功时获取的收益为πy。自主创新项目失败（发生风险损失）的概率为p，成功并获取收益的概率为1-p。若企业不开展自主创新，则会因失去市场竞争优势造成经营收益下降，从而遭受损失，该损失与产业整体的技术创新竞争力有关，而产业整体的技术创新竞争力主要受到政府补偿和社会风险分摊的影响，因而，该损失可以根据是否有政府补偿和社会风险分摊分为四类。由于政府补偿只是一种辅作用，而社会风险分摊为企业自主创新风险防范的主要力量，所以社会风险分摊影响强于政府补偿影响，从而产生的损失分别为：政府补偿且社会分摊时为Lyza，有社会分摊无政府补偿时为Lya，有政府补偿无社会分摊时为Lyzd，两者皆无时为Lyd，且Lyza>Lya>Lyzd>Lyd。

（2）假设若社会风险分摊组织开展社会风险分摊业务，则固定成本为Cx，当自主创新项目失败时，其分担的风险损失为s。分摊风险所获得的收益与政府补偿相关，当有政府补偿时，风险分摊收益较高，为Δπxa；当无政府补偿时，风险分摊收益较低，为Δπxd。若社会风险分摊组织不开展社会风险分摊业务，而企业存在分摊风险的需求，则社会风险分摊组织会因为丢失市场份额而产生损失，这一损失与企业的风险分摊需求强度和社会风险分摊组织的整体风险分摊能力有关，当政府进行补偿时，企业自主创新意愿较强，风险分摊需求较大，且社会风险分摊组织受到政府补偿后，整体分摊能力提高，因而不开展社会风险分摊业务的损失较大为Lxa，反之，当政府不进行补偿时，损失较小为Lx。

（3）假设政府推行和运作补偿政策的费用是Cz，当发生风险损失时，对企业的直接补偿为O1，对社会风险分摊组织的风险损失补偿为O2。当政府开展风险补偿时，企业开展技术创新所产生的社会效益，在有社会风险分摊条件下为Δπza，在无社会风险分摊条件下为Δπzd；当政府不开展风险补偿时，企业开展技术创新所产生的社会效益，在有社会风险分摊条件下为Δπ0a，在无社会风险分摊条件下为Δπ0d，且Δπza>Δπ0a>Δπzd>Δπ0d。

（4）假设在系统运作过程中政府选择补偿策略的概率为z，选择不补偿策略的概率为1-z；企业选择自主创新策略的概率为y，选择不创新策略的概率为1-y；社会风险分摊组织选择分摊的概率为x，选择不分摊策略的概率为1-x。

（5）以上所有假设变量均为正实数，其中0

3企业自主创新风险补偿系统进化模型的构建

基于进化博弈思想，在企业自主创新风险补偿系统中，各方主体的策略选择决策基础主要是其所选策略的效用，因而基于系统中各方主体的策略选择和各方利益机制构建博弈效用矩阵，如表1所示。表1企业自主创新风险补偿的博弈效用矩阵

自主创新企业创新（y）不创新（1-y）政府补偿（z）社会风险

分摊组织分摊（x）（Δπza-Cz-p（O1+O2），Δπxa+pO2-Cx-ps，（1-p）πy+pO1-Cy+ps）（-Cz，-Cx，-Lyza）不分摊（1-x）（Δπzd-Cz-pO1，-Lxa，（1-p）πy+pO1-Cy）（-Cz，0，-Lyzd）不补偿（1-z）社会风险

分摊组织分摊（x）（Δπ0a，Δπxd-Cx-ps，（1-p）πy-Cy+ps）（0，-Cx，-Lya）不分摊（1-x）（Δπ0d，-Lx，（1-p）πy-Cy）（0，0，-Lyd）注：表格中效用顺序为政府效用、社会风险分摊组织效用、企业效用

基于企业自主创新风险补偿博弈效用矩阵可以构建各方主体的效用模型如下：

（1）政府的效用模型

设政府选择补偿策略时效用为uz1，选择不补偿策略时效用为uz2，可得：

uz1=xyΔπza-xypO2+yΔπzd-ypO1-Cz-xyΔπzd（1）

uz2=xyΔπ0a-xyΔπ0d+yΔπ0d（2）

（2）社会风险分摊组织的效用模型

设社会风险分摊组织选择分摊策略时效用为ux1，选择不分摊策略时效用为ux2，可得：

ux1=zy（Δπxa-Δπxd）+zypO2+yΔπxd-yps-Cx （3）

ux2=zy（Lx-Lxa）-yLx（4）

（3）企业的效用模型

设企业选择创新策略时效用为uy1，选择不创新策略时效用为uy2，可得：

uy1=zpO1+xps+（1-p）πy-Cy（5）

uy2=zxLyzd-zxLyza-zLyzd-xLya+xzLya-Lyd+zLyd+xLyd-xzLyd （6）

为了进一步分析三方主体的进化博弈过程，根据进化博弈理论，构建三方主体动态复制方程[13]得：

dxdt=x（ux1-ux）=x（x-1）（ux2-ux1）=x（x-1）[zy（Lx-Lxa）-yLx-zy（Δπxa-Δπxd）-zypO2-yΔπxd+yps+Cx]（7）

dydt=y（uy1-uy）=y（y-1）（uy2-uy1）=y（y-1）[zxLyzd-zxLyza-zLyzd-xLya+xzLya-Lyd+zLyd+xLyd-xzLyd-zpO1+xps+（1-p）πy-Cy] （8）

dzdt=z（uz1-uz）=z（z-1）（uz2-uz1）=z（z-1）[xyΔπ0a-xyΔπ0d+yΔπ0d-xyΔπza-xypO2-yΔπzd+ypO1+Cz +xyΔπzd] （9）

为了进一步分析企业自主创新风险补偿系统的进化机理，将进化博弈理论与系统动力学理论结合，基于系统中各方主体的博弈效用模型和动态复制方程，运用Vensim软件，构建如图1所示的企业自主创新风险补偿系统流图。

4企业自主创新风险补偿的系统进化分析

为了对企业自主创新风险补偿的系统进化机理进行分析，并验证企业自主创新风险补偿系统进化模型的有效性，本文以武汉市企业自主创新风险补偿系统为算例，进行模拟计算分析。

为了保证算例参数设计的一般性，有效规避进化博弈中的特殊稳定点，基于进化稳定理论，算例参数应符合以下条件：

Cy-（1-p）πy

基于以上参数设计条件和一般企业技术创新数据设计算例参数如表2所示。表2参数值表

参数名称参数值参数名称参数值参数名称参数值参数名称参数值Δπza10Δπxa8Lya25O22Δπzd6Δπxd6Lyd15p 06Cz2Cx4Lyza3s 5Δπ0a4Lx2Lyzd2πy5Δπ0d2Lxa3O13Cy4注：以上参数除损失概率p外，其他参数单位均为百万

首先，对系统的进化稳定性进行分析，取x、y、z的初始值为（03，03，02）和（04，04，05）分别进行模拟，得到如图2、图3所示的模拟计算结果。由图2和图3可知，企业自主创新风险补偿系统有两个进化稳定点：（1，1，1）和（0，0，0）。当三个主体选择补偿、创新和分摊策略的初始概率大于一定值时，系统最终将稳定于（1，1，1）点，即稳定于（分摊，创新，补偿）策略组合；反之，当三个主体选择补偿、创新和分摊策略的初始概率小于一定值时，系统最终将稳定于（0，0，0）点，即稳定于（不分摊，不创新，不补偿）策略组合。

然后，分析政府补偿政策对企业自主创新风险补偿系统进化的影响。在不考虑政府补偿政策的情况下，三方系统变为两方系统，根据进化博弈稳定性分析可得：

当CxLxa+Δπxd-ps

当0

当Cy-（1-p）πyLya+ps

当0

为了分析政府补偿的作用，依据以上进化博弈分析结果，取（x，y）初始值为（02，03），使系统在政府补偿概率初始值为0时的进化稳定点为（0，0）。然后，取政府补偿概率为02，04，06，08分别进行系统模拟计算，得到如图3所示的系统进化结果比较图。

基于以上模拟结果可知，政府补偿政策对企业自主创新风险补偿系统具有推动性作用，随着政府补偿初始概率的增大，企业和社会风险分摊组织的进化稳定点从（0，0）转向（1，1），该结果说明，政府的风险补偿政策有利于促进企业自主创新行为和社会风险分摊组织对企业自主创新风险的分摊，只要政府坚持推行企业自主创新风险补偿政策，最终企业和社会风险分摊组织会选择（创新，分摊）策略组合。

第三，分析社会风险分摊组织的风险分摊意愿对企业自主创新风险补偿系统进化的影响。取系统初始值为（03，04，04）和（06，04，04）分别进行模拟计算，得到如图4所示的进化结果比较图。

如图4所示，当社会风险分摊组织的分摊意愿增强，企业的创新意愿和政府的补偿意愿会提高得更快，系统会更快达到进化稳定点（1，1，1）。该结果说明，社会风险分摊组织风险分摊意愿的提高有助于增强企业的自主创新意愿和政府的风险补偿意愿，促使系统快速向有效的稳定点进化。

第四，分析企业自主创新意愿对企业自主创新风险补偿系统进化的影响。取系统初始值为（04，03，04）和（04，06，04）分别进行模拟计算，得到如图5所示的进化结果比较图。

如图5所示，当企业的自主创新意愿增强，社会风险分摊组织的风险分摊意愿和政府的补偿意愿会提高得更快，系统会更快地达到进化稳定点（1，1，1）。该结果说明，企业的自主创新意愿的提高有助于增强社会风险分摊组织的风险分摊意愿和政府的风险补偿意愿，促使系统快速向有效的稳定点进化。

5结论

通过企业自主创新风险补偿的系统进化分析可以得到以下结论：

（1）政府推行企业自主创新风险补偿政策有助于提高企业的自主创新意愿，促进社会风险分摊组织主动分摊企业自主创新风险，进而促进区域企业自主创新，推动区域的科技和经济发展。

（2）扶持区域社会风险分摊组织有助于提高区域企业自主创新能力。政府通过扶持区域社会风险分摊组织，提高其风险分摊能力和风险分摊意愿，从而通过有偿的社会风险分摊辅助企业进行自主创新风险防范，提高区域企业自主创新能力和意愿。

进化博弈理论

进化博弈理论范文第1篇

进化博弈理论范文第2篇

进化博弈理论范文第3篇

进化博弈理论范文第4篇

进化博弈理论范文第5篇

AI文章写作

热门文章排行更多

相关期刊更多

生物进化

前沿科学

科学世界

精品文章排行更多

在线服务