博弈论的基本原理(精选5篇)

前言：想要写出一篇令人眼前一亮的文章吗？我们特意为您整理了5篇博弈论的基本原理范文，相信会为您的写作带来帮助，发现更多的写作思路和灵感。

博弈论的基本原理范文第1篇

关键词：独立董事；博弈

一、引言

独立董事指具有完全独立意志，代表全体股东和公司整体利益董事会成员。我国绝大部分上市公司按照证监会的要求，在公司董事会中引入了两名以上的独立董事。经过近几年的运行实践，业界普遍认为，虽然独立董事在一定程度上改善了上市公司治理结构，但独立董事的作用没有充分的发挥。独立董事缺席董事会会议、对公司的重大交易听之任之、做重大经营决策时“搭便车”等现象普遍存在，有关实证研究表明，我国独立董事与公司业绩只有非常微弱的正相关关系。独立董事的作用不能充分发挥，固然有其各方面主观或客观的原因，但独立董事在与被监督对象――大股东与经营者博弈中处于劣势则是问题产生的根源。本文运用博弈论的基本原理，剖析了独立董事制度失效的原因，提出通过完善独立董事制度，改善博弈双方的信息和支付，并由此改变博弈双方的行动和战略，充分发挥独立董事的作用。

二、分析方法

博弈论是研究多个决策主体的战略选择问题的理论，其中的核心概念是纳什均衡。通过对纳什均衡的分析，揭示了一项制度充分发挥作用的前提条件，即制度安排所涉及的战略是行为者最优战略的组合，也就是一种纳什均衡。

从博弈论的角度来看，独立董事制度的引入恰恰是资产所有者（股东）与资产经营者（公司高层管理人员）博弈的结果。原有董事会的失灵，破坏了原有的均衡状态，需要引入独立董事制度，建立起新的均衡关系，克服董事会失灵，解决公司“内部人控制”问题。

三、模型分析

本文用博弈论的基本原理，建立独立董事与股东之间以及独立董事与经营者之间两个博弈模型，对独立董事的博弈行为进行分析。

（一）独立董事与大股东的博弈

大股东与独立董事的博弈分为两个阶段：第一阶段发生在上市公司在聘用独立董事时，第二阶段则发生在独立董事被聘用后。因为上市公司必须聘用独立董事，所以本文对第一阶段的博弈不做分析，着重分析博弈的第二阶段。

在此阶段，大股东和独立董事的行动策略是共同知识，所以博弈属于完全信息博弈，又双方的行动存在时间上的先后，因此博弈属于动态博弈，即大股东和独立董事在此阶段的博弈属于完全信息动态博弈。

基本假设：一是独立董事和大股东都是理论上的理性人，都追求自身效用的最大化。二是博弈双方获取的信息是对称的。三是博弈双方的收益包括经济和声誉两个方面。四是大股东可能存在违规与合规两种行为，即其战略空间为（违规，合规），独立董事在观察到大股东的行动以后可能会对这种行为选择发表独立意见或不发表对立意见，即其战略空间为（发表，不发表），独立董事选择行动后博弈结束。五是大股东选择违规的情况下，独立董事如选择发表意见，会受到来自管理层的压力如更换独立董事等，这是给独立董事带来的损失Ip。同时大股东也会有一个声誉损失Lr，这时双方的支付函数为（L-Lr，I-Ip）；若独立董事选择不发表意见，这时大股东与独立董事可能分别获得额外收益Ld和Id，但双方的合谋可能受到监管当局的查处，假设合谋受到查处的概率为r，这时双方的物质损失和声誉损失分别为Lc，Lr和Ic，Ir，此时双方支付函数为：（L+Ld-r（Lr+Lc），I+Id-r（Ir+Ic）），在大股东选择合规情况下，双方的支付函数为（L，I）。具体的博弈树，如图1所示：

根据图1的博弈树，本文采用逆归纳法对此模型求解：在此博弈的第二阶段，独立董事是否会对大股东的违规行为发表意见取决于其收益，根据理性人的假设，独立董事会选择使自己获得最大收益的战略。由上图可见，如果独立董事选择发表意见，其效用为I-Ip，如果选择不发表意见，则其效用为I+Id-r（Ir+Ic）。现实情况中，我国对于独立董事与大股东之间的合谋缺乏完善的查处机制，即r非常小；另一方面，独立董事选择不发表意见后，其所获得的额外收益Id非常大，显然有I+Id-r（Ir+Ic）1-Ip>I-Ip，即不发表独立意见成为独立董事在该阶段的最优策略。在博弈的第一阶段，大股东同样作为一个理性人，预测到独立董事在第二阶段会选择不发表，其行为选择取决于L与L+Ld-r（Lr+Lc）的大小，根据前面分析，显然有Ld-r（Lr+Lc）>0。因此，此博弈出现惟一的一个子博弈精练纳什均衡（违规，不发表），即“双方合谋”。由上面的分析可以看到，独立董事能否发表独立意见是大股东与独立董事之间基于收益与成本上的理性选择，是一套制度安排的结果。如果加大违规成本，降低合谋收益，将促使双方的博弈均衡点离开“合谋”，从而促使独立董事发表独立意见。

（二）独立董事与经营者的博弈

在此博弈模型中，参与人是独立董事和经营者。经营者的战略空间是（合作，不合作），独立董事的战略空间是（积极作为，消极作为）。假定独立董事积极作为的成本是C，消极作为的成本是0；经营者合作的成本是YC，不合作的成本是NC。

在不同条件下，参与者的收益情况设定如下：在经营者合作条件下，独立董事积极作为的收益是R1，消极作为的收益是0；在经营者不合作条件下，独立董事积极作为的收益是R2，消极作为的收益是0。其中独立董事充分发挥效用的概率是P，经营者合作的概率是Q，即在此处引入“混合战略”的概念。

当独立董事选择积极作为时，其收益Ud1=（R1-C）×Q+（R2-C）×（1-Q）=（R1-R2）×Q+R2-C；当独立董事选择消极作为时，其收益Ud2=0×Q+0×（1-Q）=0。显而易见：Ud1Ud2时，Q（C-R2）/（R1-R2）；Ud1Ud2时，Q（C-R2）/（R1-R2）；Ud1=Ud2时，Q=（C-R2）/（R1-R2）。

当经营者选择合作时，其收益Uj1=（R1-YC）×P-YC×（1-P）；当经营者选择不合作时，其收益Uj2=（R2-NC）×P+0×（1-P）=（R2-NC）×P。同样有：Uj1Uj2时，PYC/（R1-R2+NC）；Uj1Uj2时，PYC/（R1-R2+NC）；Uj1=Uj2时，P=YC/（R1-R2+NC）。

综合以上分析，如果经营者合作的概率小于（C-R2）/（R1-R2），独立董事积极作为的期望收益小于消极作为的期望收益，这将导致独立董事消极作为；如果经营者合作的概率大于（C-R2）/（R1-R2），则独立董事积极作为的期望收益大于消极作为的期望收益，这将导致独立董事积极作为；如果经营者合作的概率等于（C-R2）/（R1-R2），独立董事积极作为的期望收益等于消极作为的期望收益，此时，独立董事在选择积极作为或消极作为是无偏好的。

如果独立董事积极作为的概率小于YC/（R1-R2+NC），经营者合作的期望收益小于不合作的期望收益，经营者将选择不合作；如果独立董事积极作为的概率大于YC/（R1-R2+NC），经营者合作的期望收益大于不合作的期望收益，经营者将选择合作；如果独立董事充分发挥效用的概率等于YC/（R1-R2+NC），经营者合作的期望收益等于不合作的期望收益，此时，经营者在选择合作或不合作上是无偏好的。

四、结论及政策建议

（一）结论

通过分析，得出两个结论：一是在现有的公司法人治理结构下，由上市公司选聘独立董事难以真正发挥独立董事的监督作用，独立董事未能有效地监督和制约上市公司的行为。二是独立董事与大股东合谋问题，在现有监督体制下无法得到有效解决。

通过对独立董事与经营者的博弈模型的分析，可以发现此博弈的纳什均衡与独立董事积极作为的成本C，合作及不合作条件下预期收益（R1或R2），以及经营者选择合作或不合作的策略成本（YC或NC）有关。换言之，博弈的结果能否达到预期目标不但取决于独立董事、经营者各自的支付成本，很大程度上还取决于（合作、不合作）条件下两种预期收益的差额（R1-R2）。因此，在进行独立董事制度的构建时，对于上述因素应给予足够的重视，创造实现纳什均衡的条件，以使制度的效用充分发挥。

（二）政策建议

首先，必须改变独立董事的聘任方法。将独立董事的聘用决定权交给证监会，其行为将与上市公司无关，有效行使监督职责是证监会聘用独立董事的唯一标准。从独立董事的角度看，尽责行为付出的成本小于回报，会最大限度地履行职责，以期得到证监会的信任和继续得到聘用。

其次，完善独立董事的激励机制，刺激独立董事积极履行职责，多做贡献。一是声誉激励。独立董事发挥作用的动力来源于其维持自身声誉的努力，在上市公司中表现出应有的独立性和客观性，无形中将极大地保护和提升他们的声誉，并由此产生相应的收益，在一定程度上避免独立董事与执行董事之间的“合谋”。二是薪酬激励。采取给予报酬和持股计划以促使独立董事更加积极认真地投入工作，独立董事在其从事的领域乃至社会上具有较高的知名度和良好的声誉，必须有相对固定的薪酬以其心理上得到平衡。三是权利激励。授予独立董事必要的控制权，如提名、审计、监督、评价等。独立董事必须具有监督权、审核权、否决权。

参考文献：

1、张维迎.博弈论与信息经济学[M].上海人民出版社,1996.

2、施锡铨.博弈论[M].上海财经大版社,2000.

3、孟明.独立董事的激励机制[J].企业改革与管理,2003(11).

4、张凡.关于独立董事制度几个问题的认识[J].管理世界,2007(2).

5、胡金焱,丁士祥.我国上市公司独立董事制度的博弈分析[J].山东大学学报社会科学版,2003(3).

6、林凌,常诚.独立董事制度研究[J].证券市场导报,2000(9).

7、何问陶,王金全.我国独立董事制度的实证分析[J].财贸经济,2002(9).

8、饶玉蕾,李永红.独立董事制度失效的博弈分析[J].湖南财经高等专科学校学报,2003(5).

9、谭劲松.独立董事与公司治理:基于我国上市公司的研究[M].中国财政经济出版社,2003.

博弈论的基本原理范文第2篇

关键词：入行论；博弈论；思想；辩证

《入行论》全称入菩萨行论，是印度那烂陀寺寂天菩萨[1]所著，所作年份不详，该论典是是大乘佛教诸多典籍中较为重要的论著，正如索达吉堪布在《入行论广释》中说：“《入菩萨行论》是修学大乘佛法者不可缺少的论典。在藏传佛教各派中，每一个正规寺院里的修行人，都会传讲听习此论；而且已形成一种普遍观念，认为如果要做真实的修行人，必须精通《入菩萨行论》 ”[1]。佛学中将论著分为四类：言简而义深、言繁而义浅、言简而义浅、言繁而义深。其中最佳的当属言简而义深的一类，而《入行论》正是属于这一类论著，其中所阐述的内容精辟而深刻，运用了诸多比喻，系统的示解了大乘佛法修行者所要修行的步骤及方法。九世纪初，《入菩萨行》传入藏地，历代高僧大德广泛弘扬，至今也留下了二十余部注疏，使其成为地区脍炙人口的一部宝典，也成为了藏传佛教中修行者的必修论典。这部论典中所阐述的价值观，也是佛教教育者们的价值观，是以利他菩提心为主，不单讲不能偷盗邪、要尊师重道、知礼义廉耻、回报社会、尊老爱幼，更甚者讲到除人类外的所有有生之物，都要营造无害、和谐，这种思想也就必然对后人起到了影响。

博弈论（Game theory）又称之为对策论、游戏论，现在已发展成为现代数学的一个分支，被当作运筹学的一个重要研究对象和方法。1928年冯・诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯・诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》，开启了博弈论思想的系统化研究浪潮。然而，这一论著并非最早提出博弈的著作，其实早在战国时期，孙武所作的《孙子兵法》，可以说是最早的一部讲述博弈的著作。随之便出现了诸多研究博弈，以博弈思想为基石创作诸多方方面面的著作，也成为了风靡一时的青少年读物，更甚者以此为自己的价值观，出现了诸多效仿的事迹。但大风大浪过后，回头审视这一行径，才恍然发现博弈论带来的不完全只有利益，更多的是磨灭了传统思想中正面和积极、人性化的部分，这点值得研究和考虑。

一、《入行论》所阐述的主要思想

《入行论》一书的创作背景具有特殊性和局限性，其特殊性表现在，它是作于一个佛法盛传的那烂陀寺，而且作者又是一位得道修行者，其局限性在于作者是出家人，又置身寺院中，从科学理论的角度而言，是具有一定的局限性的。而论著中主要讲大乘深观和广行法，主要以广行法为主，讲解如何修心、修行应当持有怎样的心态等。这部论著分为十品，第一品讲发菩提心的利益，第二品讲忏悔罪业，第三品讲受持菩提心，这三品就是为了“未生者当生”，没有生起菩提心的令生起菩提心。第四品讲不放逸，第五品讲正知正见，第六品讲安忍，这三品是为了“已生勿退失”，相续中已经产生了菩提心，但这也是很容易退转的，这三品是为了令生起的菩提心不退转。第七品讲精进，第八品讲静虑（禅定），第九品讲智慧品，第十品讲回向品，这四品是讲“辗转益增长”，为了已经具有的菩提心能够增长，甚至圆满。整部《入行论》就是为了未生的菩提心能够生起，已经生起的不退失，而能够增长[2]。其中以诸多比喻形象而生动的喻说了善恶取舍，正如《入行论》中将人身比作过河之乘舟，将最终的和谐当做彼岸，为得到这种人与人、人与自然的和谐而只为利他。

二、博弈论所涵盖的主要思想

博弈思想简单概括就是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。也就是二人对局如何占优。以博弈中的要素：参与者、各自的策略、得失（或者支付矩阵）、次序等达到均衡。理性的参与者为了使自己的利益最大或者损失最小并结合对方的处境等指导作出决策达到均衡。甚至牺牲他人的利益，将自己的利益最大化。

正如其中典型的海盗分金、囚徒困境等等举例，大致将可以涵盖和解释其内在的思想角度。在军事战略、游戏、统筹等学科，这一理论无疑是极具指导价值的，但在伦理人情中，尤其是东方文化中是否可行，这一论点值得探讨和研究。

三、两者的辩证关系

《入行论》的菩提思想与博弈思想，两者即统一又对立，其统一点在于，两者最终都是致力于求得最大的功利，这点是完全相同的。二者又有着对立的一面，因为菩提心不仅为了今生得到功利，还致力于来世，所做一切都是为了得到和谐、善果，甚至为得到和谐不惜失去生命的大爱。而博弈论则不同在于它不承认来世，所以只致力于眼前的现世今生，所求的是物质上的利益，甚至是将自己的利益建立在别人的损失之上，甚至认为任何别人的付出都是“有原因”的，极度机械化的价值观，不利于处理伦理、友情等问题，因为有些时候人与动物的区别正在于此，在于贡献和无私付出，在于“利他”。

注释：

[1]寂天菩萨：印度南方贤疆国王太子，原名寂铠，出家来到那烂陀寺后，依当时寺内五百班智达之首的胜天为亲教师出家，法名寂天。

参考文献：

[1] 索达吉堪布著. 《入行论广释》[Z] . 智悲佛网电子版记述.2013：2.

博弈论的基本原理范文第3篇

在我国旅游业高速发展的今天，作为旅游业的三大之柱之一的酒店业也取得了很大的成绩，但在发展的过程中也存在一些问题，如各星级酒店发展的不平衡，酒店内部管理体制问题，基层员工的离职率较高等，本文以酒店业为背景，运用了博弈论的基本原理，建立数学模型，应用动态博弈模型研究来员工与经理的多阶段博弈问题，讨论了酒店发展过程中的员工的离职问题，谈到了如何才能降低离职率，同时也给出了优化酒店管理的合理化的建议。

一、模型中数据参数的假定

在酒店里，作为酒店的管理者，作为股东的人，他要对员工的日常工作情况进行监督和管理，下面是他和员工在工作中的一些参数的假定设置。

1.酒店经理一旦进行监督就能发现酒店员工是否努力。2.假设酒店员工工作努力就不会离职，所以也无需考虑经理是否会进行教育，当经理不监督时也不存在教育与离职的问题，即没有博弈树下面的分支了。3.当员工工作不努力时，客人们可以能会将酒店员工的不努力行为扩散给其他人，这样酒店经理的声誉会损失，设为。4.经理进行酒店日常的管理工作，股东赋予他的管理经费为M，这也是工资的一部分，经理的监督成本，酒店员工的努力成本为，F为经理不教育时对不努力的员工的罚金，（注意这里教育则不罚款了）假设员工离职向经理交事先劳动合同上的违约金为，这个可以对员工起到一定的约束作用。5.经理不教育不努力员工时，经理教育不努力的员工时，教育成本为J。经理出于短期效益，对于不努力的员工，他希望罚款，而董事会的股东们则更希望他通过教育，让他们接受爱岗敬业，接受企业文化的教育，增强团队凝聚力，这有利于酒店长远的发展，所以本节后面有一个股东对经理的监督与否的问题。6.员工将要离职时对外界有个期望值R，当期望高时，对他是一种离职的诱因。7.当员工工作不努力时，经理自身的声誉损失为；经理一旦监督，发现了员工不努力时，酒店员工声誉损失为；员工努力时，其声誉得益为；当经理通过教育后员工不离职了，则经理的声誉损失为。这里要说明一下，声誉损失再这里主要表现的是一种量变关系，当然我们也可以把赋予它一定的实际意义，比如经理的声誉损失可以在股东召开股东大会在季度奖、年终奖时给予体现，而员工声誉损失、声誉得益也可以由经理对他的努力情况进行评价后，在他的奖金中设置给予一定的份额来体现。8.设经理监督的概率为，不监督的概率为1-，员工工作努力的概率为，员工工作不努力的概率为1-，经理不教育的概率为，经理教育的概率为1-，员工离职的概率为，员工不离职的概率为1-。9.设最底层经理与员工的期望收益分别为11、12，上一层经理与员工的期望收益分别为21、22

该模型的博弈树如图1所示，树中显示了经理与员工在多个阶段的动态博弈，根据假定条件与博弈树可以确定图1中各参与人在结点①-⑧的收益值，即有：

二、博弈模型的求解

采用逆向归纳法求此动态博弈的均衡解，即从博弈树的最低层开始，组成考察每层的经理与酒店员工的期望收益，具体过程如下：

1）从最底层考察酒店员工离职与经理不教育的情况，分别求出酒店经理与员工的期望收益，用11、12表示，涉及到决策点②、③、④、⑤

则这个阶段经理的期望收益

（1）

则员工的期望收益

（2）

对式（1）、（2）求一阶求导，并取：

从而得在这一阶段二者的均衡解为

（3）

2）在讨论了上面这个阶段的情况后，再考察酒店员工是否努力及经理是否监督这一层次，涉及决策结点①、⑥、⑦、⑧，用21、22分别表示本阶段经理和酒店员工的期望收益。

本阶段中，在决策点处

对于经理

（4）

对于员工

（5）

对（4）、（5）求一阶条件，并取

从而均衡解为：

（6）

三、对上述的均衡结果分析

上面通过数据的假定，求出了在各个阶段经理与员工之间的均衡策略，即最底层的考察酒店员工离职与经理不教育的情况，分别求出酒店经理与员工的期望收益，当讨论了上面这个阶段的情况后，再考察酒店员工是否努力及经理是否监督这一层次，分别求出了本阶段经理和酒店员工的期望收益，然后依次求导后，得出了下面的均衡概率，下面对上述结果给予分析。

由上述求解过程可得模型的均衡解为：

（7）

1）均衡条件下为经理监督的概率，由可知：

①酒店员工努力成本C2越高，经理监督的概率越大，因为酒店员工的努力成本越高，酒店员工不努力的概率越大，因此经理为促使酒店员工努力就需提高其监督概率。

②酒店员工努力的声誉得益越大，酒店员工努力可以得到承认，那么酒店员工越敬业，即使经理不监督，酒店员工仍然努力，所以，此时经理监督的概率就越小。

③1*2越大，不努力酒店员工的损失越大，酒店员工为了避免这种损失就需要努力工作，在这种环境下，可降低其经理监督概率。

2）是酒店员工努力的概率，由可知：

①C1越大，越小，因为经理的监督成本越高，造成经理监督概率越小，导致酒店员工越会降低其努力积极性。

②越大，这表明经理在第一阶段的收益越大，而这个收益与不努力酒店员工在这个阶段的损失相关，也就是说越大时不努力酒店员工的损失越大，为了避免这种较大的损失，酒店员工努力的概率越大，即越大。

③M越大，股东赋予经理的管理费用越多，经理越会加强监督，执行股东的想法，员工自然会努力工作了。

3）为经理不教育不努力员工的概率，由可知：

①J越大，越大，当教育不努力的员工成本太高时，经理显然越不会去教育员工了，而会选择罚款。②越大时，越小，员工意识到不努力带来的声誉损失太大，有可能被解雇的危险，必然会努力工作，自然就不会发展到下一步需要经理去罚款了。③R越大，越小，当员工对外界有一个较大的期望时，此时员工是最容易离职的，那么此时若经理只是简单的罚款，只会加速员工的离职，因此只能是教育了，教育的概率加大了，不教育的概率变小了。④越大，越大，这是因为我们可以借助后面模型带来的股东情况，当员工因离职要交的违约金越多时，员工因不愿意交这部分违约金，而会努力工作，则经理高忱无忧，不教育的可能性是显然增大了。

4）为酒店员工离职的概率，由可知：

博弈论的基本原理范文第4篇

关键词：演化博弈；品牌；价值体验；自主创新

中图分类号：F713.50 文献标识：A 文章编号：1674-9448 （2013） 04-0061-10

An Evolutionary Game Model about Independent Innovation Based on Experience of Brand Value

GUO Ben-hai1，2 LIU Si-feng2（1. School of Management， Jiangsu University， Jiangsu Zhenjiang 212013， China，2. School of Economics and Management， Nanjing University of Aeronautics and Astronautics， Jiangsu Nanjing 211100， China）

Abstract： From a market perspective， enterprise independent innovation must adhere to category innovation and brand strategy as the core， create new category different from competitors’ or even the opposite one and make consumers get more experience of brand value. This is not only the respect for the generalized virtual value demand， but also the mark of enterprise market success by independent innovation. The enterprise independent innovation based on brand value experience is a comprehensive system which Includes activities such as concept innovation， technology innovation and service innovation and so on. Whether enterprise will devote to this complicated and high-risk innovation activities not only depends on the interests of the enterprise itself， but also is affected by the policy environment and competitors. Facing the dilemma and incentives of enterprise brand building， the bounded rationality and incomplete information evolutionary game theory are applied to analyse the strategies and earnings of main game parties during the enterprise innovation process on brand value experience. An “enterprise-enterprise” and “enterprise-government” evolutionary game model is established to solve and seek evolutionary stable strategy.

Keywords： evolutionary game， erand， value experience， independent innovation

一、引言

美国著名未来学家阿尔文・托夫勒曾指出，体验经济将逐渐成为继农业经济、工业经济、服务经济之后的一种经济形态[1]。现时代经济社会生活与过去相比，发生的显著变化是大批只具有虚拟价值的商品涌入商品大家族[2]，虚拟价值在本质上是社会心理需求对商品价值的再造[3]。作为经济活动微观主体的企业，必须在提高提供顾客体验价值的过程中获取竞争优势；以品牌价值体验为导向的自主创新活动，将会是企业发展的不竭动力。中国企业之所以难出国际知名品牌，缺少的就是在消费者心中的品牌价值认知度；自主品牌产品少、品牌价值偏低，是我国企业自主品牌建设的基本现状。提升消费者的品牌价值体验度和认知度，已经成为摆在中国企业面前的当务之急问题。

理论界对自主知识产权品牌建设及演化博弈问题做了多方面研究。张明立[4]从消费者―品牌关系中的广义虚拟价值角度探索品牌形象对品牌忠诚的作用机制；刘明珍 [5]通过数据研究方法，提出从内在机制、建立法规、统一内外资企业所得税等方面支持我国企业自主知识产权产品发展的政策建议；黄永春，杨晨 [6]以品牌竞争理论为基础，从外显性与潜力性构面探究了企业自主知识产权名牌竞争力的构成要素；范秀成 [7]从服务的过程属性出发，阐述了服务企业品牌建设的焦点应该是顾客体验，并提出通过塑造顾客体验来创建服务品牌的策略。

对演化博弈论发展具有开创性贡献的是 Smith [8]与Price [9]，他们提出的“演化稳定策略”成为演化博弈论的基本概。近年来，演化博弈研究出现了一些新动向。如L.A. Bach，T.Helvikc，F.B.Christiansen [10]研究了演化稳定策略（ESS）的分歧问题；David K. Levine，Wolfgang Pesendorfer [11]对有一方模仿情况下的合作演化博弈问题进行了相关研究；韩少春等 [12]在演化博弈论的基础上，分析舆论传播的羊群效应问题。在演化博弈应用领域，郭本海、方志耕 [13]运用演化博弈的基本原理，分析了中国节能政策实施中中央与地方的演化博弈策略，提出“中央―地方”演化博弈的三个阶段；阮爱清、刘思峰 [14]运用演化博弈模型分析了产业集群的种子、核和集群三种状态及不同阶段的收益状况，建立了产业集群成长的演化模型；周德群 [15]基于非对称主体的进化博弈方法，探讨了不同规模的企业在新兴产业进入问题上的对策；谢非 [16]应用进化博弈论的方法从风险投资者和风险企业的角度，结合风险资本的时间价值，对风险投资退出方式进行了研究；刘伟兵、王先甲 [17]将强化学习引入到进化博弈中，建立了进化博弈中的多人强化学习模型。

本文在已有研究基础上，从顾客的品牌价值体验入手，分析企业创新过程中各方利益主体的博弈关系以及品牌价值体验与企业自主创新的作用机理；构建了“企业―企业”及“企业―政府”为博弈双方、以提升品牌价值体验为基本目的的自主创新演化博弈模型，通过模型求解，阐释各方主体的演化稳定策略。

二、提升品牌价值体验的自主创新博弈关系分析

演化博弈理论源于生物进化论，其基本思想是，在具有一定规模的博弈群体中，博弈方进行着反复的博弈活动；相对于静态均衡和比较静态均衡，演化博弈强调动态均衡。演化博弈以有限理性和学习能力代替了传统博弈论关于主体完全理性的假定，即博弈双方不可能在每一次博弈中都能找到最优的均衡点；演化博弈以一种动态的框架来分析系统均衡及达到均衡的过程，从而更准确地描述系统的发展变化。演化博弈的核心概念是“演化稳定策略”（ Evolutionary Stable Strategy， ESS ）和“复制动态”（Replicator Dynamics）。

以提升顾客品牌价值体验为根本诉求的企业自主创新活动，既要考虑到创新的不确定性、外部经济性等风险，又要深度理解并充分尊重市场需求，这个过程实际上是不同企业、政府部门、消费者和社会公众等主体间的复杂博弈。其中，不同企业的策略选择、政府的政策设计与选择将在很大程度上影响着博弈态势，企业与企业之间、企业与政府之间的博弈占据主导地位。在不同的政策体系下，各方博弈主体的收益预期会有所不同，相应的博弈策略也不断调整。一方面，企业将根据政策特点及竞争对手的策略采取相应的行动，决定是否全力置身于自主创新和自主品牌建设；或者根据已选择的创新模式以及政府的政策作用效力估测收益趋势，对已有创新模式做出相应调整。另一方面，政府根据政策执行的情况评估政策效力、判断品牌建设未来发展趋势，并对现有政策做出相应的调整。

（一）损益变量选取

（1）影响企业自主创新的损益变量

初始收益M：企业在不创新且不“搭便车”情况下所获得的经营利润；

自主创新边际收益V：企业因自主创新而获得的直接收益；

自主创新衍生收益E0：企业因自主创新而获得的间接收益；

创新基础设施投入G：政府在创新基础设施建设上的投入，以减轻企业基础性成本负担；

“搭便车”收益E：不从事创新的企业“搭便车”获得包括初始受益在内的收入，令，E=M+ηV；η∈（0，1）；

创新直接成本I0：企业自主创新所发生的直接支出；

“搭便车”成本H：不从事创新的企业“搭便车”所产生的必要费用；

惩罚费用C0：“搭便车”可能被查处而遭受的惩罚，令C0=βI（β为惩罚系数，I为从事创新的企业在某个方面的创新投入）；

（一）损益变量选取

1.影响企业申请知识产权保护的损益变量

初始收益M：企业在不创新且不“搭便车”情况下所获得的经营利润；

自主创新边际收益V：企业因自主创新而获得的直接收益；

品牌溢出价值B0：自主创新提高了产品知名度和品牌价值体验度，企业因此而获利，可令B0=λM0=λ（M+V）0，λ为品牌价值溢出率，λ∈（0，1）；

让渡收益O：企业通过知识产权买卖、转让而获得的收益；

政府激励G0：企业积极申请知识产权保护而获得的来自政府的奖励收益；

赔偿收益P：申请了知识产权保护的企业获得的来自“搭便车”侵权企业的赔偿；

保护成本K：企业实施知识产权保护产生的成本费用；

知识产权溢出损失B1：因企业不申请知识产权保护或政府不监督，企业被侵权而导致利润减少；

品牌价值折损B2：因企业品牌建设不力或政府监督弱化，品牌价值折损导致企业收益相应减少。

2.影响政府监督的损益变量

行政收费Y：政府向申请知识产权保护的企业收取的费用；

衍生收益W：政府因在知识产权保护上的有力作为（监督）而无形收益，如政府形象及区域形象改进等；

罚没收入P：政府依法对“搭便车”企业实施罚没惩戒而获得的收益；

奖励支出G0：政府对积极申请知识产权保护的企业给予的奖励；

监督成本C：政府实施监督过程中消耗的人、财、物成本；

衍生损失W’：政府因在知识产权保护上不作为可能带来的负面影响，如区域形象受损、投资环境质量下降等。

（二）收益函数构建

1.支付函数构建

假定：政府知识产权保护上采取“监督”策略的概率为p，则不监督（或监督力度不力）的概率为（1-p）；企业申请知识产权保护的概率为q，则不申请知识产权保护的概率为（1-q）。令企业申请知识产权保护的情形为F1，不申请知识产权保护的情形为F2；政府部门进行监督的情形为G1，不进行监督的情形为G2。双方的收益矩阵如表2所示。

五、结束语

解决我国企业自主品牌产品少、品牌价值偏低的问题，是一个系统工程，企业、政府、消费者以及社会公众皆在其中扮演着重要角色；以企业为基本主体、以政府为重要推动力量、以提高顾客品牌价值体验程度为根本诉求的自主创新，是解决这一系统性问题的关键。围绕这一问题而展开的“企业-企业”间及“企业-政府”间演化博弈，实质上是有效构建科学调控机制，促使具有竞合关系的不同企业与政府一起构成策略互动体，以演化稳定策略顺利推进基于品牌价值体验的企业自主创新活动。

参考文献：

[1] 阿尔文・托夫勒著.未来的冲击[M].蔡伸章译.北京：中信出版社， 2006.

[2] 林左鸣.虚拟价值的人类活动论依据[J].北京大学学报（哲学社科版），2006（2）：43-50.

[3] 吴秀生.虚拟价值：价值规律的新视野[J].广义虚拟经济，2011（4）：36-45.

[4] 张明立，任淑霞，王伟.基于广义虚拟价值的品牌形象对品牌忠诚影响机制研究[J].广义虚拟经济研究，2011（3）：38-46.

[5] 刘明珍.中国企业自主知识产权和知名品牌发展研究[J].中国软科学，2006（3）：123-130.

[6] 黄永春，杨晨.企业自主知识产权品牌的竞争效应的理论分析[J].科技管理研究，2007（4）：27-33.

[7] 范秀成.顾客体验驱动的服务品牌建设[J].南开管理评论，2001（6）：123-131.

[8] Maynard Smith J. The Theory of Games and the Evolution of Animal Conflict[J].Journal of Theory Biology，1973，（47）.

[9] Maynard Smith J， Price G R. The Logic of Animal Conflicts [J]. Nature， 1974 （246）：15-18.

[10] L.A. Bach， T. Helvikc， F.B.Christiansen. The evolution of n-player cooperation-threshold games and ESS bifurcations [J].Journal of Theoretical Biology，2006， 238.

[11] David K. Levine， Wolfgang Pesendorfer. The evolution of cooperation through imitation [J]. Games and Economic Behavior，2007，58.

[12] 韩少春，刘云，张彦超等.基于动态演化博弈论的舆论传播羊群效应[J].系统工程学报， 2011（2）：275-281

[13] GUO Benhai， FANG Zhigeng.A study of evolutionary game between central government and the local in energy conservation policy implementation[C]. 2011 IEEE International Conference， 2011（9）：874-879.

[14] 阮爱清，刘思峰.基于进化博弈模型的产业集群成长研究[J].科学学与科学技术管理， 2008（2）：91-95.

[15] 许肖瑜，周德群.基于进化博弈的新兴产业进入问题研究[J].技术与创新管理， 2008（11）：600―606.

博弈论的基本原理范文第5篇

[关键词]博弈论；理性人假定；公共知识；社会科学方法论

[中图分类号]C3

[文献标识码]A

[文章编号]1671-511X（2012）04-0020-03

博弈论是研究理性人的互动的理论，或者说研究交互决策的理论。1928年，冯·诺依曼证明了博弈论的基本原理，宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统应用于经济领域，奠定了这一学科的基础和理论体系。1950-1951年，约翰·纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚定的基础。塞尔顿、哈桑尼、谢林、奥曼等人的研究也大大推动了博弈论的发展。因此，尽管博弈论是一门新生的学科，但是它今天已经发展成为有较完善的理论体系的科学。

今天，博弈论已经成为社会科学的通用方法论。尽管它是演绎科学，对社会现象有强大的解释力，然而，由于其理想主体的假定使得其演绎出的理论解与实际博弈结果存在差异。许多实验经济学家通过博弈实验研究实际中人们的博弈过程，分析博弈论的演绎解与博弈实验结果之间的差异。如2002年诺贝尔经济学奖就颁发给了丹尼尔·卡尼曼和迈农·史密斯，他们是实验经济学的先驱。今天在西方学术界通过实验来验证博弈的理论结果已经成为一种潮流。本文下面设计并进行了一个博弈实验，通过分析实验结果与理论解的差异，分析博弈论作为社会科学方法论的局限性，并提出改进的可能路径。

一、博弈实验及结果分析

1 实验描述

我们设计了如下的一个博弈实验。该实验的参与人是南京大学选修文化素质课“逻辑与科学方法基础”的大学生，他们是二三年级的学生，文理科学生均有。

该实验是以试题的形式进行的，该试题作为期末试卷中的最后一道题。该题目为：

在0-100之间选择一个数字，规则是：若你选择的数字“是或最接近”在座同学所选择的数字的平均数的2/3（即在座同学所选数的总和除以总人数之后所得数字的2/3，如：若平均数为90，你应当选2/3×90=60），你将获胜。请给出你选择的理由。

实验说明：

（1）实验参与者即参加考试的学生，事前不知道这是一个实验；

（2）该课程教师以讲座的形式给实验参与者传授过博弈论知识，但没有提到所进行的博弈；

（3）因为（2），他们中的大多数掌握“博弈”、“公共知识”等概念；

（4）试卷是保密的，没有任何学生预先知道考试内容，考试过程中学生间无任何交流；

（5）该博弈的理论解（即纳什均衡）为0或1。

2 实验结果

对于考试中的每个学生，在这个博弈实验中他能够获胜的关键是，他要准确猜测他人是如何选择的，一旦他猜测正确，他将他猜测的平均数乘以2/3便是获胜答案。

共有176人参加了考试。排除掉5个不明确的选择，供分析的实际选择数为171个（其中3个选择非整数）。实验结果为（按照数字大小排序）：

“0”：46人；“1”：14人；“5”：1人；“9”：1人；“10”：4人；“12”：1人；“15”：3人；“20”：3人；“22”：18人；“22.44”：1人；“24”：1人；“25”：3人；“28”：2人；“29”：1人；“30”：4人；“32”：2人；“33”：24人；“100/3”：1人；“34”：4人；“35”：1人；“36”：2人；“38”：3人；“39”：1人；“40”：6人；“43”：1人；“44”：5人，“45”：3人；“47”：1人；“50”：3人；“58”：1人；“59”：1人；“60”：2人；“66”：1人；“67”：3人；“”：1人；“72”：1人；“75”：1人。

3 结果分析

在这些所选择的数字中，最大的数字为75，最小的数字为0。171个数字相加后的平均数为21.91，本博弈胜出解：21.84×2/3=14.61。

这个博弈中，0和1是均衡解（下一部分将分析），它们是“理论解”。在该实验中，0是所选最多的数字，共有46人选择，比例为26.9%；选1的为14人，比例为8.2%。两者相加共有60人，比例为35.1%。

从上述数据可以看出，在这场博弈中，“实验解”为14.61，最接近该数的是14或15，这和“理论解”的“0”或“1”不同。在本实验中，没有人选择14，而选择15的有3人，这3人是该实验的胜出者。

若按照区间来统计，实验结果的分布情况见表1。本博弈实验的“实验解”14.61落在11-20之间。若我们把11-20看成是胜出区间，则有7人胜出。

对于这些选择，有以下值得注意的几点：

第一，67以上的选择都是不理性的，因为参加考试的学生数为150-200之间，这是公共知识，即使所有的学生都选择100，胜出的数字都不会超过67。但是还有3位学生选择了大于67的数字，其中选择的最大数为75。他们在给出这些选择时没有给出理由。

第二，分析学生所给出这些选择的理由，可以看出，绝大部分选择者在进行他们的选择时考虑到了他人的选择以及他人的推理。不同的人对他人的假定不同，所进行推理的步骤也不同。如选择67的学生假定了他人都选择100，因而选择67是最优选择；再比如选择30-40之间的数字的同学，其理由大体上有两个：或者认为平均数集中在50-60之间，其2/3就集中在35-40之间；或者认为都选100的话，66.7是最优选择，都选择66.7的话，44是最优选择，而都选44的话，33是最优选择。

第三，有三个区间处的选择比例较高：0-10间为38.6%，21-30间为17.6%，31-40间为25.7%。从所给理由可看出，不同区间的选择者考虑群体的互动推理的步骤存在差别，如0-10区间的选择者考虑他人的推理步骤比31-40区间的选择者多些。

第四，值得注意的是，11-20区间里的选择较少（事实上是，在这个博弈中所选择的数字落在这个区间是最有可能胜出的）。原因可能是，一旦选择者进行了多步的互动推理，他们便能够将这样的推理进行下去，从而将选择向理论解0或1靠近。

第五，有一些“智慧的”选择者，他们知道理论解，但他们知道存在不完全理性的选择，因而他们没有选择理论解。尽管他们的选择没有胜出，他们的推理是有智慧的。这里，本文选择了其中2个。一位选择22的学生是这样给出他所选择的理由的：“作为理性人，我不会选择大于2/3×100的数，因为即使所有人都选择最大数，平均数的2/3也不会超过2/3×100。如果大家和我一样理智，那么大家都不会选择大于2/3×100，那么我不会选择大于100×2/3×2/3。因为他们选择最大的他们可能会选的数，平均数的2/3也不会超过2/3×2/3×100。依此类推，如果全班都充分理智，那么全班最终都会选择1，然而我不认为班里的人都是足够理智，故平均数的2/3会大于1。根据两次游戏，平均数的2/3在20～30。如果是我，我会选择靠近20的数，那我就22吧。”一个选择10的学生的理由是：“如果其他人都是随机选择，那么平均数最后可能接近于50，50×2/3≈33。但是，如果所有人都选择接近33的数，那么33为平均数，33×2/3≈22……如此推理应该为1。但是并非所有人均是理性、均会如此计算。我对南大有信心，所以，我将数字选得接近1一点，选10。”

第六，有一些选择是没有考虑到他人的选择。如有这样一些理由：“大家都认为60是及格分，所以我选择59”，“58是我的幸运数字”，等等。

二、博弈的理论解分析

本实验是一个多人完全信息静态博弈：参与者同时选择行动，然后根据所有参与者的选择，每个参与者得到各自的结果，每一参与者的收益函数在所有参与者之间是公共知识。

在这个实验中，参加考试的176位学生是参与者，每个考生同时对0-100之间的数字进行选择行动，即每个参与者的策略空间Si∈（0，100），即有101种可能的策略。根据所有考生的选择，每个考生最后得出自己的结果，对每个考生来说，结果无非就是，自己的选择是“大家所选数字的平均数的2/3”，胜出；要么与“大家所选数字的平均数的2/3”不一致，失败。

我们假定该博弈的参与人都是绝对理性人（事实上，这个要求在实际中难以达到，这也是本文要得到的一个结论）。

我们来分析绝对理性人的推理过程。

在这个博弈中策略组合有176×101种，每种策略组合下，每个人的收益是公共知识。如：如所有人都选100，平均数为100，此时每人都失败，胜出结果是100×2/3=67；如175人都选100，有一个人选择了67，那么选100的人失败，而选择67的人胜出……所以这些是理性参与人的公共知识。

我们看到，任何人都不应该选67或以上，或者选择67或以上是非理性的，因为所选择的数字的最大平均数为100，此时胜出的数字为67，因此选择67以上而获胜的可能性是没有。因此，作为理性人他们都不会选择67或以上。

每个人都不会选择67或以上，这本身也是公共知识。在这样的公共知识的前提下，45以上的选择都是不合理的，因为对每个人而言，只有在他人都选择67以上，我选择45或以上才是合理的（67的2/3约为45）。

每个人都不会选择45或以上，这本身也是公共知识。于是，每个人都认为不应该选择30或以上。

……

结论是：每个人选择0或1是合理的，它们是该博弈的理论解。

事实上，每个人选择0或都选择1是纳什均衡：对每个人而言，在其他人不改变选择的情况下，当下的选择是最优的。

在所有人均选择0的情况下，因为对于每个人而言，若所有人都选择0的话，0便成为平均数，该数的2/3还是0。这样，他选择0是最优选择：在他人不改变选择的情况下，他改变选择将失败。因此这点构成纳什均衡。

在所有人均选择1的情况下，同样，对于每个人而言，在其他人选择1的情况下，平均数1的2/3为0.67，此时1最接近该数。因此，他选择1是最优选择，并且若他改变了他的选择他将失败。因此，这点也构成纳什均衡。

当然，面对多个纳什均衡，作为理性的参与人作何选择才能胜出呢？具体到这个博弈中，每个人要考虑的是，他选择0还是选择1才能胜出呢？

他会这样思考：没有理由认为其中一个比另外一个更有可能胜出，这样，选择0或1胜出的概率为50%，但是，他人能够与我有同样的想法。既然如此，期望平均数应该为0.5×1+0.5×0=0.5。于是，0.5的2/3接近0。因此，选择0是最优选择。

从上面的分析可见，尽管0和1是纳什均衡点，但选择。是最优选择。

三、改进博弈论的可能路径

本文已经表明，上述博弈是一个完全信息静态博弈，然而，本实验的实验解（14.61）与理论解（0或1）之间发生偏离。本文认为，有两个主要原因：

第一，博弈论中所假定的理想主体与实际中的决策主体不相符合。理想的博弈参与人是绝对理性人；他们能够进行任何有穷步骤的推理，能够分析所有有穷可能的情况，并且他们的推理、分析是在瞬时完成的，而实际博弈中人们是有界理性的。在我们的博弈实验中若参与者是理想主体，他们能够做本文上一部分那样的分析，他们应当知道0和1是均衡解，也能够预测O是最有可能实现的结果。本实验表明，并不是所有人都能够做出这样分析的。并且，在实际中存在完全非理性的选择，如本实验中选择大于67的3人，这不是完全偶然现象。

博弈论的基本原理

博弈论的基本原理范文第1篇

博弈论的基本原理范文第2篇

博弈论的基本原理范文第3篇

博弈论的基本原理范文第4篇

博弈论的基本原理范文第5篇

AI文章写作

相关推荐更多

热门文章排行更多

相关期刊更多

逻辑学研究

管理工程学报

供应链管理

精品文章排行更多

在线服务