标准式博弈的混合战略(精选5篇)

前言：想要写出一篇令人眼前一亮的文章吗？我们特意为您整理了5篇标准式博弈的混合战略范文，相信会为您的写作带来帮助，发现更多的写作思路和灵感。

标准式博弈的混合战略

标准式博弈的混合战略范文第1篇

关键词：纳税遵从；税收管理；博弈

一、引言

纳税遵从，是指纳税人遵照税法及税收政策，向国家正确计算缴纳应缴纳的各项税收，并服从税务部门及税务执法人员符合法律规范的管理行为。纳税遵从反映了税收征管的质量和效率，是税收征管的最终目标。税收管理与纳税遵从是税收征管最本质、最核心的两大因素，在税收征管现代化的进程中，由于征纳双方各自利益最大化的差异性，再加上双方信息不对称等因素的长期客观存在，纳税遵从与税收管理两者博弈是一个永恒的话题。经济决定税源，但税源不等于税收，在税源一定、税法不变的前提下，税源转化为税收的多少主要取决于征管能力和水平的高低，而税收征管水平和纳税主体遵从程度是紧密联系的。

二、纳税遵从与税收管理博弈分析

在传统的纳税遵从经济学分析中，逃税问题通常被视为一种资产组合选择：申报的收入被看作是一种零回报的安全性资产，而隐瞒的收入则被看作是一种有回报的风险性资产。假定纳税人和税务机关的目标都是追求预期收益的最大化，纳税人所选择的遵从形式是向税务机关如实申报应税收入，所选择的不遵从形式是故意低报应税收入。故意低报收入被查获后不仅要补税，而且要受到处罚。为了便于分析，还假定税收管理便捷、高效，因而纳税人的遵从成本很小，可以忽略不计；税务机关的检查能力足够强，并且高度廉洁，依法治税，因而违法的纳税人不可能通过贿赂等手段使税务执法人员徇私舞弊。根据博弈论原理，可构建税务机关和纳税人的博弈模型，列出对应于不同策略组合的效用矩阵。

1、博弈模型基本假设。设纳税人的实际应税收入为i，向税务机关申报的应税收入为d（d小于或等于i），适用比例税率t（t1），纳税人的逃税概率为r，税务机关的查获概率或者逃税被查获的概率为p（0t），税务机关的检查成本为c，纳税人的预期收益以其税后净收入（或者税后可支配收入）来表示。首先来看纳税人的预期净收益。在欺骗税务机关的情况下，如果未受到查处，其预期收益为i-td；如果受到查处，其预期收益为（1-t）i-ft（i-d），而纳税人在诚实申报的情况下，不管是否受到检查，其预期收益均为（1-t）i（不考虑纳税人受到检查时的遵从成本）；再看税务机关的预期收益，在纳税人逃税的情况下，检查与不检查的预期收益分别为ti+ft（i-d）-c和td；在纳税人不逃税的情况下，检查与不检查的预期收益分别为ti-c和ti。

2、混合战略纳什均衡。根据双方博弈的假设条件，得到征纳博弈的收益矩阵，如表1所示。（表1）

在征纳博弈中，参与者所选择的战略既可能是纯战略，也可能是混合战略。在纯战略选择的情况下，由于检查概率和逃税概率要么为0，要么为1，因而征纳双方的博弈不存在均衡解。现在分析博弈双方选择混合战略情况下的均衡问题，即参与人以某种概率分布随机选择不同行动达到的均衡状态。对纳税人和税务机关而言，选择混合战略就是分别选择一定概率的遵从或者不遵从和一定概率的检查或者不检查，也就是说检查概率p和逃税概率r都不等于0。当纳税人在欺骗与不欺骗情况下所获得的预期收益相等，并且税务机关在检查与不检查情况下所获得的预期收益也相等时，两者间的博弈就达到了一种混合战略纳什均衡，可以求出两者间的均衡解。

（1）检查概率的均衡解。给定检查概率p，纳税人选择逃税和不逃税时预期收益分别为：

选择逃税时的预期收益：

g1=［（1-t）i-ft（i-d）］p+（i-td）（1-p）

选择诚实纳税时的预期收益：

g2=（1-t）ip+（1-t）（1-p）

令g1=g2，解得p=1/（f+l）

（2）逃税概率的均衡解。给定纳税人的逃税概率r，税务机关选择检查与不检查的预期收益分别为：

选择检查时的预期收益：

r1=［ti+ft（i-d）-c］r+（ti-c）（1-r）

选择不检查时的预期收益：

r2=trd+ti（1-r）

令r1=r2，解得r=c/t（f+l）（i-d）

根据求解结果可知，当税务机关以p=1/（f+l）的概率进行检查，纳税人以r=c/t（f+l）（i-d）的概率逃税时，征纳双方的博弈达到均衡状态。这一均衡解意味着，逃税程度随着税务检查的边际成本的提高而提高，随着处罚率的提高而降低。

3、博弈均衡的启示。首先，税收管理广度与纳税遵从度具有相关性，税务机关检查的概率越大，纳税人偷逃税的机会成本就越大，相对来说纳税遵从度越高；其次，税收管理深度与纳税遵从度有很大的相关性，查获率与偷税概率成反比；再次，处罚力度越大，违法风险越大，违法成本越高，纳税遵从度越高。在适度管理中，管理与遵从呈正比关系，在过度管理或管理不到位情况下，管理与遵从则呈反比关系。要在征纳博弈中取得最佳效果，必须正确把握管理与遵从的阀值，也就是博弈均衡点，使之从强制型遵从向自觉型遵从转变。

三、纳税遵从影响因素具体分析

征纳博弈的结果就是能够达成征纳双方都接受的一种均衡，但在现实中，纳税人对税务部门的行为、信息了解得比较清楚，而税务部门对纳税人的信息了解得相对不够，这种信息的不对称，使得纳税人有机可乘。有研究数据显示，在我国现有纳税人中，40%的纳税人自觉遵从税法，30%的纳税人通过辅导遵从税法，还有30%的纳税人遵从度不高。应当说，这一遵从度与发达国家相比差距不小，造成这一状况的因素主要有以下几个方面：

1、税收管理因素。在管理措施上，主要表现在征管力量分布不均，税源管理比较薄弱，征管力度不够，导致偷逃税成为部分纳税人经常使用的小伎俩，初犯转变成惯犯，形成心理适应。同时，影响原本具有良好税收遵从意识的纳税人，造成其心理失衡，从纳税遵从转变不遵从，形成恶性循环；在管理手段上，稽查查获率与涉案定罪率偏低，处罚率低。在现实征管中绝大部分都取最低限处罚，没有根据偷税性质、情节、数额大小等标准进行处罚，这对少数存在侥幸心理不依法纳税的企业，根本起不到震慑作用。

2、纳税遵从成本因素。纳税人遵从成本高而不遵从成本低是重要原因。征管业务流程较为繁琐，纳税人面对两税务征管机构，使遵从成本偏高。而纳税人不遵从成本较低，对不遵从税法所受到的处罚偏轻和罚款数量规定上的弹性安排，加之税管人员的主观随意性，使纳税人的不遵从成本微乎其微，在一定程度上助长了纳税不遵从的主观故意。

3、法制因素。税收法律环境是规范征纳关系的刚性环境，能促使税务机关依法治税，纳税人依法纳税，而我国还没形成良好的法律环境，表现为：税收法律制度不够健全和完备，这给了纳税人钻法律空子的机会，引发了懒惰性不遵从行为；税收执法程序不规范，税收执法手段软化，纳税人逃税成本小于遵从成本；税收司法保障体系不健全，纳税人偷漏税的侥幸心理增强。

四、基于税收管理影响提升纳税遵从的建议

尽管纳税遵从受到法律制度等客观因素的影响，但税务机关与纳税人的博弈分析告诉我们，优化税收管理能够有效提升纳税人的遵从度。理解税法是遵从的基础，降低办税难度是遵从的保障，而严厉打击不遵从则是对遵从的最好鼓励。

1、树立“人性化”征管理念，提供“专业化”税务咨询。提高纳税遵从首先要从税务人员理念的转变上着手，要建立有效的纳税人诉求和反馈机制，充分倾听并汲取纳税人的意见，以“更容易、更节省、更人性化”为核心制定遵从规划。要从方便纳税人办税而不是从方便内部管理出发来设计征管流程和相关信息系统。要本着公开、负责的态度与纳税人交流潜在的不遵从风险并指导其主动纠正，而不是利用信息不对称保持手中权力的神秘感。其次，税务部门应根据纳税人个体情况，从复杂的税法体系中梳理出适合的部分，提供“个性化、专业化、人性化”的辅导，并加强后续的跟踪管理。

2、开展流程再造，降低办税难度。办税流程越复杂，纳税人承担的时间成本、货币成本、心理成本等遵从成本就越高，纳税人遵从度也越低。因此，我们需要以纳税人为中心开展流程再造，简化纳税程序，统一报表资料报送要求，实现纳税人一次提交资料，后台信息共享。要加强业务部门之间的统筹，避免各业务部门与同一纳税人多点接触，多头管理，让纳税人在设定的办税流程中以较低的成本获得较优质的服务。要加强征管手段的信息化建设，扩大网上申报的税种，扩充申报表填写引导、自动计算、自动等功能。此外，应尽快完善信誉等级管理，通过为诚信纳税人提供“绿色通道”以显示对税收遵从者的鼓励。

3、加大查处力度，增强税法威慑力。纳税人受不完全信息和认知能力的限制，对一项税收不遵从行为将面临多大风险是无法完全准确判断的。如果纳税人能高估违法受罚的风险，那么其从事不遵从行为的风险爱好动机将减弱。这种高估，一方面取决于法定的处罚标准；另一方面根据其他违法纳税人实际受到的处罚程度来定，特别是在法定处罚标准弹性比较大的情况下更是如此。因而，要加强对故意不遵从的打击，对轻微的涉税犯罪，也不轻易放过，增大税收不遵从压力，使纳税人内化税收威慑。

主要参考文献：

[1]刘振彪.我国税收遵从影响因素的实证分析[j].财经理论与实践，2010.5.

标准式博弈的混合战略范文第2篇

关键词:农产品;质量安全;检测;博弈

中图分类号:F304.3 文献标志码:A 文章编号:1673-291X(2010)05-0246-03

经过三十年的改革开放,农产品领域的问题已由农产品短缺之忧转向了农产品安全之虞,并且这种现象会由于中国农产品生产经营者的众多且小而分散、经营主体的社会责任感缺失、监管机制及法律法规的不完善而难以在短期内根治。而解除农产品安全之虞事关社会和谐,政府部门应符合大众的要求,提升农产品安全的监管水平和监管效能。然而近年来,国内食品安全事件频发,如2006年6月的“福寿螺”事件、2006年9月上海发生的疑似散发性“瘦肉精”中毒事件、2006年末上海的“多宝鱼”药物残留严重超标事件、河北红心鸭蛋含“苏丹红四号”事件、2008年9月河北的“三鹿奶粉”事件,更是让世界对中国的农产品质量和安全产生了担忧;还有木耳用硫磺熏制、腌熏食物有防腐剂、蔬菜农药残留等各种农产品质量安全问题屡禁不止等等,农产品质量安全问题已成为社会关注的热点和焦点。那么,在国内农产品安全堪忧、监管体制沉疴难除、民众呼声日益高涨的情况下,如何有效地激励农产品生产者(企业)按照无公害农产品质量标准组织生产,提高农产品质量,是摆在我们面前一项亟待解决的重大课题。

出于问题本身的现实和理论价值,本文通过建立一个完全信息静态博弈模型,对农产品质检中心与农产品生产者的博弈进行分析,以期为政府加强生产环节的农产品质量安全管理提供一定的决策依据。

一、一个完全信息静态博弈模型的设定

按照信息经济学对市场商品特性的划分,可以将农产品的质量信息划分为搜寻品特性信息、经验品特性信息和信任品特性信息。在信息经济学的分析框架下,对搜寻品、经验品和信任品的质量甄别与信息利用方式是不同的(Nelson,1970;Darby & Karni,1973)。农产品的搜寻品特性,主要是指消费者在消费前就可以凭感官直接了解的特征,消费者辨识质量不存在障碍,信息搜寻成本极低,如农产品品牌、标签、价格、产地等外在特征以及农产品的颜色、光泽、大小、新鲜程度、形状等表面特征。农产品的经验品特性,无法在事前做出评价,主要是指消费者在消费后才能够了解的内在特征,如口感、味道等。农产品的信任品特性,主要是指即使消费之后也没有能力了解的有关安全和营养水平等方面的特征,如农产品的激素、抗生素、胆固醇、细菌含量和农药残留量、是否含转基因成分以及营养成分含量等。既不能由肉眼观测,也无法依靠消费体验在短期内确认其质量状况,对它的质量甄别需要特定的知识或检测手段。鉴于农产品质量难以辨别的特性,农产品质量安全检测便成为确保农产品质量安全的重要环节,因此,本文以农产品质量安全检测为切入点,设定如下模型。

在模型中,假设博弈的参与人包括农产品质检中心和农产品生产者(企业)两个参与人,两者均为理性人,信息是完美的,参与人的行动是可以观测到的。根据所分析问题的需要,本文把农产品质检中心标准化为一个行为人。农产品质检中心的纯战略选择是检查或不检查。同时,本文也把农产品生产者标准化为一个人。农产品生产者的纯战略选择是生产质量安全的农产品或质量非安全的农产品。表1概况了对应不同纯战略组合的支付矩阵。这里,α是检测成本,R是生产质量安全的农产品的生产者(企业)的正常利润,F是对生产质量非安全的农产品的生产者(企业)的罚款,C是生产质量非安全农产品的成本;R'是生产质量非安全的农产品的生产者(企业)的利润。如果农产品质检中心检验农产品生产者(企业)生产的农产品是安全的,他的农产品将被允许销售,将获得正常利润R,如果农产品质检中心检验农产品生产者(企业)生产的农产品是非安全的,他的农产品将被销毁,不仅投入的成本C不能收回,还要被罚款F。如果农产品质检中心不检查,质量安全的农产品与质量非安全的农产品都被允许销售,因为生产质量非安全农产品的成本要小于生产质量安全农产品的成本,所以在农产品价格P一定的情况下,生产质量非安全的农产品的生产者(企业)的利润R'要大于生产质量安全的农产品的生产者(企业)的正常利润R。本文假定α

二、农产品质量安全检测博弈过程和均衡分析

该博弈为完全信息静态博弈,找到混合战略纳什均衡点是问题的关键。

本文用θ代表农产品质检中心检测农产品的概率,γ代表农产品生产者(企业)生产质量安全农产品的概率。给定γ,农产品质检中心选择检查(θ=1)和不检查(θ=0)的期望收益分别为:

πG,(1,γ)=-αγ+(-α+F)(1-γ)=F-α-Fγ

πG,(0,γ)=0γ+0(1-γ)=0

解πG,(1,γ)=πG,(0,γ) ,

即:F-α-Fγ=0

得:γ*= 。

所以,如果农产品生产者(企业)生产质量安全农产品的概率小于γ*=,农产品质检中心的最优选择是检查;如果农产品生产者(企业)生产质量安全农产品的概率大于γ*=,农产品质检中心的最优选择是不检查;如果农产品生产者(企业)生产质量安全农产品的概率等于γ*=,农产品质检中心随机的选择检查或不检查。

给定 ,农产品生产者(企业)选择生产质量安全农产品(γ=1)和生产质量非安全农产品( γ=0)的期望收益分别为:

πp,(0,1)=Rθ+R(1-θ)=R

πp,(θ,0)=(-C-F)θ+R'(1-θ)=R'-(C+F+R')θ

解πp,(0,1)=πp,(θ,0),

即R=R'-(C+F+R')θ

得:θ*=。

所以:如果农产品质检中心检测农产品的概率小于θ*=,农产品生产者(企业)的最优选择是生产质量非安全的农产品;如果农产品质检中心检测农产品的概率大于θ*=,农产品生产者(企业)的最优选择是生产质量安全的农产品;如果农产品质检中心检测农产品的概率等于θ*=,农产品生产者(企业)随机的选择生产质量安全的农产品或非安全的农产品。

因此,混合战略均衡是:

θ*=,γ*=,

即农产品质检中心以θ*=的概率检测农产品,农产品生产者(企业)以γ*=的概率生产质量安全的农产品。这种均衡的另一种可能的解释是,农业生产中的众多的农产品生产者(企业),其中有γ*=比例的生产者(企业)选择生产质量安全的农产品,有1-比例的农产品生产者(企业)选择生产质量非安全的农产品;农产品质检中心随机的检测θ*=比例的农产品生产者(企业)的生产情况。

三、结论及对策建议

通过农产品质检中心与农产品生产者的博弈分析,本文得出结论:混合战略纳什均衡,

θ*=,γ*=,

即农产品质检中心检测农产品的概率是θ*=,农产品生产者(企业)以γ*=的概率生产质量安全的农产品。因此,为了提高农产品生产者(企业)生产质量安全农产品的概率γ*=,降低农产品质检中心检测农产品的概率θ*=,本文具体提出以下对策建议:

(一)适当提高对生产质量非安全的农产品的生产者(企业)的罚款

因为增大F在提高农产品生产者(企业)生产质量安全农产品的概率γ*的同时,降低了农产品质检中心检测农产品的概率θ*,例如,假设农产品的价格为P,生产质量安全农产品的生产成本为2C,生产质量非安全农产品的生产成本为C,生产质量安全农产品的利润率为20%,则生产质量安全的农产品的生产者(企业)的正常利润R=2C×20%=0.4C,农产品的价格为P=2+0.4C=2.4C,生产质量非安全的农产品的生产者(企业)的利润R'=2.4C-1C=1.4C。假设检测成本α=0.5C,对生产质量非安全的农产品的生产者(企业)的罚款F=2C和3C,γ*分别为:

γ1*===,

γ2*===,

显然γ1*

同理,θ*分别为:

θ1*===,

θ2*===,

显然θ1*>θ2*,即在其他条件不变的情况下,通过提高对生产质量非安全的农产品的生产者(企业)的罚款F,有效地降低了农产品质检中心检测农产品的概率θ*,从而降低了监管成本。

(二)开展检测技术研究,加强对国外先进检测技术和方法的引进和创新,努力降低农产品检测成本α

因为检测成本α的减小,可以使农产品生产者(企业)生产质量安全农产品的概率γ*提高。例如,假设农产品的价格为P,生产质量安全农产品的生产成本为2C,生产质量非安全农产品的生产成本为C,假设对生产质量非安全的农产品的生产者(企业)的罚款F=2C,检测成本α=0.5C和α=0.25C,γ*分别为:

γ1*===,

γ2*===,

显然γ1*>γ2*,即在其他条件不变的情况下,通过降低农产品检测成本α,有效的提高农产品生产者(企业)生产质量安全农产品的概率γ*。

(三)建立国家农产品质量例行监测制度

通过建立和实施农产品质量例行监测制度,既有效地发挥了政府的监管作用,增加了生产质量非安全农产品的生产成本为C,又缩小了生产质量非安全的农产品的生产者(企业)的利R'与生产质量安全的农产品的生产者(企业)的正常利润R之间的差距,从而降低了农产品质检中心检测农产品的概率θ*。例如,假设农产品的价格为P,生产质量安全农产品的生产成本为2C,生产质量安全农产品的利润率为20%,则生产质量安全的农产品的生产者(企业)的正常利润R=0.4C,农产品的价格为P=2.4C,如果生产质量非安全农产品的生产成本为C和1.5C,生产质量非安全的农产品的生产者(企业)的利润R1'=2.4C-1C=1.4C和R2'=2.4C-1.5C=0.9C。对生产质量非安全的农产品的生产者(企业)的罚款F=2C,θ*分别为:

θ1*===,

θ2*===,

显然θ1*>θ2*,即在其他条件不变的情况下,通过增加生产质量非安全农产品的生产成本为C,缩小生产质量非安全的农产品的生产者(企业)的利润R'与生产质量安全的农产品的生产者(企业)的正常利润R之间的差距,有效地降低了农产品质检中心检测农产品的概率θ*,从而降低了监管成本。

参考文献:

[1] 张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.

[2] 邢卫锋.影响农户采纳无公害蔬菜生产技术的因素及采纳行为研究[D].中国农业大学,2004.

标准式博弈的混合战略范文第3篇

[关键词] 会计委派制博弈囚徒困境制度

在市场经济体制的逐步建立和完善过程中,我国现行的会计人员管理体制存在很大弊端,主要表现为:会计职能弱化、会计缺乏监督力、会计信息严重失真、会计工作秩序混乱、违法现象不断发生等,一些企业以虚假的会计信息来达到其非法获利的目的,使会计诚信遭受到严重的践踏。为了防止会计信息失真,加强企业会计诚信建设,会计委派制应运而生。在大型企业内部,母公司对各子公司、二级单位的财务管理,大都实行会计委派制。其目的都是旨在通过加强对会计人员的管理整顿和规范会计工作秩序,加强会计监督,防止会计信息失真,维护财经纪律。

一、会计委派制的涵义

会计委派制是指由资产所有者向其所属的企业、事业统一委派会计人员,并对其所委派会计人员的任免、调动、考核、奖惩、工资和福利待遇等,进行集中统一管理的一种会计管理制度。其主要特点是企业的主要会计人员由政府或企业所有者委派,经营者不得干涉委派会计人员的工作。

二、会计委派制存在的问题

在我国,企业会计信息失真现象十分严重。有的学者认为是会计监督不力,并提出了“会计委派制”的对策。实行会计人员委派制,降低了受派单位负责人对会计人员的约束控制,使会计人员敢于进行会计监督,割断了会计人员与受派单位经济利益关联,降低了会计人员成为“内部人”的可能,从而加强了会计人员进行监督的意愿。然而,会计委派制在具体地实施过程中还存在着许多不足与问题,其作用只是停留在形式上, 实际效果并不突出。会计委派制作为一种过渡性制度安排,不可避免地具有以下主要缺陷:

1.会计委派与现代企业制度相背离

建立现代企业制度是企业改革的方向,现代企业制度的一个主要内容就是政企分开,要求政府部门为企业提出供一个宽松的经营环境。企业是市场的主体,应该有自主的经营权,当然也应有会计人员的任命权。而会计委派制将会计人员的任命权集中在上级手中,不利于政企分开,不利于现代企业制度的建立,势必会拖企业改革的后腿。

2.与当前一些法律法规相矛盾

《会计法》规定,单位负责人对本单位的会计工作和会计资料的真实性、完整性负责,单位其他人员对单位负责人负责的立法基本精神。这就赋予了单位负责人不可推卸的责任。但如果他无法管理单位会计人员却要其承担责任,显然有失公平。同时,《公司法》规定:公司财务负责人由经理提名,董事会聘任或解聘。而委派制的实施导致责任主体权利得不到实现,两种监管制度相互冲突。会计委派制没有法律法规来规范对委派会计人员的管理。

3.经营者与会计人员的责、权、利分配不均衡

会计人员同时接受上级和经营者的双重领导,与现代企业管理原则不符,会计人员必将处于两难境地。从经营者角度讲,由于利益驱动, 经营者往往会追求自身利益最大化, 从而将委派的会计人员摆在企业的对立面而将其架空, 使得会计人员虽有监督头衔却基本丧失了行使监督的权力。从会计人员角度讲,从表面上看,委派的会计人员是作为所有者的代表,以独立于经营者的身份参与企业经营活动,拥有相当大的权利和责任。而实际上在企业内部,会计人员的地位永远是个配角,这种双方权力上的失衡加上企业内部制约机制的弱化,根本无法制约经营者的行为。

4.会计委派制不利于充分发挥会计的职能

会计的职能有核算、监督、管理、服务等,而会计委派制使委派的会计人员与企业格格不入,只强调会计的监督,弱化了会计的管理、决策服务职能,使会计这一领导的参谋没有了用武之地,不利于会计管理职能的发挥。这样一来表面上强化了对被委派单位的会计核算和监督,但在一定程度上弱化了财务管理的功能,不利于提高经济效益。

三、会计委派制问题博弈分析

从博弈论的角度看,目前会计信息失真是由于各博弈方(所有者、经营者和委派会计人员)的目标函数存在差异,而制度缺陷使各博弈方能够利用不合理的博弈规则实现其利益最大化。而且它们各自的利益追求都可能是对立和冲突的,从而形成监督者与被监督者之间的博弈,而且博弈的纳什均衡很可能是囚徒困境。博弈主要是企业负责人与委派会计人员之间的博弈和所有者与经营者之间的博弈。

我们可以根据监督博弈的一般模型来构建企业负责人与会计人员之间的监督博弈模型。该模型是混合战略纳什均衡。企业负责人的纯战略有两个,即选择监督与不监督;会计人员的纯战略也有两个,即做假账与不做假账。这里设b是会计人员的做假账收益,s是企业负责人的监督成本,t是会计人员做假后的处罚成本。假设s

假设用α表示实企业负责人实施监督的概率,β表示会计人员做假账的概率。给定β,企业负责人选择监督(α=1)和不监督(α=0)时的期望收益分别为:

πm(1, β)=(b-s+t)·β+(b-s)(1-β)=β·t+b-s

πm(0, β)=0·β+b(1-β)=b(1-β)

令πm(1, β)= πm(0, β)=0,得β*= s/(b+t)

β*的经济含义在于:若会计人员做假账的概率小于s/(b+t),企业负责人的最优选择是不监督;若会计人员做假账的概率大于s/(b+t),则企业负责人的最优选择是监督。

给定α,会计人员选择做假账(β=1)和不做假账监督(β=0)时的期望收益分别为:

πa(α, 1)=-(b+t)·α+0×(1-α)=-(b+t)·α

πa(α, 0)=-b·α+(-b)(1-α)=-b

令πa(α, 1)=πa(α, 0),得α*= b/(b+t)

α*的经济含义在于:若企业负责人监督的概率小于s/(b+t),会计人员的最优选择是做假账;若企业负责人监督的概率大于s/(b+t)。则会计人员的最优选择是不做假账。

综合上面讨论,可以得出企业负责人与会计人员监督博弈的混合战略纳什均衡是[α*= b/(b+t),β*= s/(b+t)]。即企业负责人以b/(b+t)的概率选择进行会计监督,会计人员以s/(b+t)的概率选择做假账。因此,后续的重要问题是:怎样来增大α*以及怎样来减少β*。

所有者与经营者之间的博弈也是监督博弈,与企业负责人和会计人员之间的监督博弈模型类似,这里不在详细论述。

在监督博弈中,增大α*和减少β*可以通过制度来解决。按照安德鲁·肖特在其《社会制度的经济理论》中对制度做了描述和定义。按照肖特的博弈分析思路,制度的出现主要是为了解决人们社会生活中普遍存在的“囚徒困境”弈局和其他协调博弈问题。首先,如果一个社会反复地面临一种囚徒困境弈局,那么,一个有效率的做法是演化出一种行为准则,以避免反复出现的非效率的均衡策略的应用。另外,这样一个规则成为了一个社会惯例,它规定了重复博弈情况下当事人的行为,并且将被他们所遵循。例如:两辆小汽车相向行驶,且正接近十字路口,一辆车想直行,另一辆想转弯,他们都想尽快到达自己的目的地。但是,如果不协调他们的行动,那么就会出现撞车。最好的办法是颁布交通规则,并且强迫他们上街前学习,希望在路口转弯的司机必须在继续前行之前等待对面开来的直行车辆。转弯的人必须等待,这样决策将被低成本地协调。

由以上内容,我们可以归纳制度的特征:(1)制度是一种公理化;(2)制度具有昭示性;(3)制度是自愿平等基础上的权利与义务的集合;(4)制度是在囚徒困境博弈中自发形成的,其主要功能在于降低协调成本。

但是,会计委派制本身不符合“制度”的本质与特征。首先,它不是公理化的产物。该项制度所涉及的利益主体很多持怀疑态度。第二,它的昭示性不足,它虽然在一定程度上约束了会计人员的行为,但这种约束是勉强和脆弱的。第三,会计委派制是一种强制性,抹杀了企业的积极性。第四,会计委派制是非纳什均衡,是一种“抽刀断水”式的不理智决策,不是人人都愿意遵守。第五,会计委派制没有降低市场经济和社会活动中的协调成本,反而增加该成本。

因此,会计委派制是政府或企业为克服会计信息失真不得已而做出的过度性制度安排,其本身存在诸多矛盾和缺陷。会计委派制是通过改变现有利益分配关系,使一些人利益受损才能提高现有资源的产出水平的改进,是一种“非帕累托改进”的社会博弈过程的结果。会计委派制没有使会计信息失真、会计造假现象得以根本解决。

四、完善会计委派制的建议

1.加大社会监督的力度,加强违规处罚力度

受利益驱动,委派的会计人员与被委派单位可能结成同盟,共同造假,形成内部人控制。作为企业内部会计监督体系之一的会计委派制不能具备完全的监督能力,它的职能所起的作用需要与其他形式的会计监督( 如社会监督中的注册会计师, 政府监督等) 等相结合。同时,对于造假的会计人员和企业给予重处,从而促进并保障会计委派制的职能。形成一个综合性的、庞大的、严谨的会计监督体系才能较好地控制会计信息失真的泛滥现象。

2.会计人员回归企业,站在企业的立场为企业当好家,管好账,更多地发挥管理和服务的职能同时,应该像遵守交通法规一样,会计人员必须遵守公认会计准则以及制度约束与规范。因为会计制度是人人都愿意也必须遵守的均衡的产物。这是“纳什均衡”指导思想的具体体现,这才是解决会计信息失真的最诚实、最客观、最标准的态度与方式。

参考文献 :

标准式博弈的混合战略范文第4篇

[摘要] 本文主要在对无法律责任状态下以及严格法律责任状态下行受贿问题进行博弈分析的基础上，从经济学的角度观察行受贿的法律问题，为推动预防职务犯罪工作的深入开展探索一个新的理论视角。……

一、导言

在犯罪学史上，古典学派和实证学派就犯罪人是理性人还是经验人这一问题上分歧严重，两者的研究方法和理论体系也因此迥异。迄今为止，它仍是犯罪学中格外引人注目并有待进一步廓清的一个基本理论问题。假设犯罪人是非理性的，由此派生而出的预防策略自然更多地关注在如何设计一个法律制度的同时，通过优化包括道德伦理在内的各种社会手段，来促使犯罪人从非理性向理性转化，以求客观地达到预防犯罪的目的。假设犯罪人是理性的，犯罪和非犯罪各自产生的期望值，便自然是犯罪人权衡取舍的内心尺度，由此而及的预防策略似乎也就应更多地关注犯罪人内心尺度的形成。尽管如此，有一点是可以肯定的，“犯罪人与其他非犯罪人一样具有理性能力和相当的（或一定的）自由意志，他们的犯罪行为是他们在一定的环境之下做出的相对自由的选择” ，这便构成了社会（或国家）追究犯罪人的法律责任或道义责任的人性基础。

现代博弈理论的诞生，使我们的直觉更加敏锐并为我们观察熟悉的问题提供新的视角，其思想与方法正日益深入到经济学、政治学、法学、社会学等社会科学领域之中，对人类行为规律的系统研究产生了深远的影响。求解博弈，首先必须就参与人如何决策做出一个基础性的假定：参与人理性意味着他们总是偏好于更高收益的结果而不是更低收益的结果。在本文中，参与人就是行、受贿人，一个前提性假定是行、受贿人为理性人，这样它能使博弈理论为我们理解法律是如何影响人们行为提供洞察力。

二、无法律责任状态下的行受贿问题博弈

无法律责任状态下的行、受贿问题，是一个标准的两人两战略博弈，可以用表2（1）来表示。在无法律责任状态下，行贿人行贿和受贿人受贿不承担法律责任，这是一种假定的标准状态。实际上，当受制于证据等因素，法律对行贿人、受贿人的制裁不力时，相当部分行贿人、受贿人由于方式隐蔽可能逃避法律责任的承担，这种实际模式就会无限趋近于无法律责任的标准状态，因此，我们考察这一问题时就选择以标准状态为对象。

受贿人

行贿人受贿不受贿

行贿 10，10 5，0

不行贿 0，5 0，0

表2（1）

如表2（1）所示：因无法律责任，行贿人行贿和受贿人受贿都将获得10个利益单位而不产生负利益，行贿人不行贿的同时受贿人不受贿，双方都将不获利。如果行贿人（1）一方行贿、受贿人不受贿，由于行贿人（1）行贿的行为，使得受贿人即使未接受其贿赂，但相对增加了行贿人（2）、（3）······等的行贿成本，而造成受贿人受贿的期待利益增加，这样行贿人虽然不能获得10个利益单位，但有可能获得5个利益单位。同样地，受贿人受贿（索贿），行贿人（1）虽然不行贿，受贿人也将有可能获得5个利益单位。在这个博弈当中，行贿人和受贿人即使事先双方互不认识，但是不论受贿人是否受贿，行贿人采取行贿的战略都将占优，也就是说行贿人行贿的战略优于不行贿的战略。同样地，对于受贿方来说，受贿的战略是他的占优策略。不论行贿方是否行贿，受贿人采取受贿的战略都优于不受贿的战略。因此，受贿人受贿、行贿人行贿的策略是严格占优策略，而受贿人不受贿、行贿人不行贿的策略是严格劣战略。在这个两人的博弈当中，行贿人最终会行贿，受贿人最终会受贿，就是这个博弈的解。

通过求解这个博弈，我们就会发现，由于法律责任的缺失，行受贿问题将会泛滥。即使双方互不知道对方将如何行为，行受贿也是人们追求利益的一个必然选择。

三、严格法律责任状态下的行受贿问题博弈

在严格法律责任状态下，行贿人和受贿人都将承担相应的法律责任，这是一个标准的两人协调博弈。如表3（1）：

受贿人

行贿人受贿不受贿

行贿 10，10 -8，0

不行贿 0，-8 4，4

表3（1）

在这个博弈当中，行贿人行贿的同时受贿人受贿，双方都将获得10个利益单位。行贿人行贿而受贿人不受贿，行贿人可能因此遭受到8个利益单位的损失。行贿人不行贿而受贿人受贿（索贿），则受贿人有可能遭受8个利益单位损失。如果行贿人不行贿、受贿人不受贿，双方虽然在贿赂问题上不能获得利益，但是有可能各获得廉洁期待利益4个单位。行贿人和受贿人选择的战略是好还是坏，取决于对方怎么选择。如果行贿人确信受贿人欲获得10个利益单位而受贿，则行贿人也将行贿；如果受贿人确信行贿人欲获得10个利益单位而行贿，则受贿人将受贿。每个人获利的兴趣不冲突，但只有在对方选择最优反应时才有效，而实际上在双方互不认识的情况下，没有谁能确信对方会行贿（或受贿），除非事先双方达成一个稳定的协议。

为了更好地说明这一问题，用P1表示受贿人受贿的概率，则1―P1为不受贿的概率。不论受贿人以多大的概率P1受贿（或者不受贿），10×P1加上-8×（1－P1）的数值就会相应地决定行贿人是否行贿，如果这个数值大于4（行贿人不行贿的收益），即 P1的值大于2/3，也就是受贿人受贿的概率大于2/3的话，行贿人就有可能会选择行贿。

四、纳什均衡与帕累托改善

在表3（1）当中存在3个纳什均衡：两个纯战略均衡T（10，10）与T（4，4），以及一个混合战略均衡。在这些战略均衡中，我们如何预测参与人将选取什么战略并不是立即就能自我确定的。一种在不同的纳什均衡中进行选择的方法是考察不同的均衡并看它们中是否有一个均衡特别突出，这样的战略组合是一个聚点，它也被称为萨林点。在表3（1）中的T（10，10），即（行贿人行贿、受贿人受贿）这样的均衡就是一个萨林点。这与前面的论述是一致的：即使受贿人和行贿人事先不认识，一方并不知道对方将如何行为（无知之幕），但是只要行贿人确信受贿人将会有2/3的概率受贿，行贿人的胜算就已经很明显地超出。运用这一分析，我们也就能够较为清楚地得出一些领域行、受贿人事先并不认识却能很快达成相互一致的稳定协议，而成功地完成行、受贿的博弈。当然，这个无知之幕是一种理想状态。如果假定我们所研究的对象是一个功利主义者的话（尤其对于一个商人来说），他必然会去收集信息调查可受贿对象的受贿概率，尽管这会耗去其相应的信息成本，他也会尽可能地去揭开这无知之幕，除非当一个社会实际的博弈已经确立了相应的排除规则，或者行贿人所耗去的信息成本已经超过了他的期待利益。

我们再来研究一下表4（1）和表4（2）的博弈。

受贿人

行贿人受贿不受贿

行贿 10，10 -8，0

不行贿 0，-8 8，8

表4（1）

受贿人

行贿人受贿不受贿

行贿 10，10 -8，0

不行贿 0，-8 12，12

表4（2）

表4（1）与表3（1）相比较，博弈的参与人（不行贿、不受贿）的可得利益有相应的改善，虽然还没有超过（行贿、受贿）这一战略组合，但这已经加大了行贿人调查受贿人受贿概率的信息成本，相应地也就会降低行贿和受贿的期待利益，足以激励一部分人选择这一战略。在表4（2）中，（不行贿、不受贿）战略组合的期待利益已经实现了帕累托优超，这固然从根本上预防了行贿和受贿的发生，但是这又必然会耗去高昂的社会管理成本，不是一般国家所能够承受的。通过对这两个博弈的分析，我们可以进一步明确高薪养廉制度的利弊。转贴于

五、预防策略述评

上面论及的几种形态都是理论上的标准形态，实践中的形态往往比之更为复杂。但不论它的外在形式如何，我们都是可以简化成以上模式的，这将有助于我们分析行、受贿问题。据此，我们大致可以制定以下相应的预防策略，使得好人在他的有生之年终能胜出。

（一）行受贿的证据采信应适用过错推定的归责原则

现有法律对行贿和受贿两种犯罪的刑罚力度是有区别的，受贿最高可到死刑，行贿最高是无期徒刑。更值得关注的是，司法实践中行、受贿双方往往是一对一的两人秘密进行的模式。即使双方事先互不认识，但经过一方主动示意或者积极活动，基于对利益选择的互不冲突，也就是所谓的“双赢”，双方都能达成心照不宣的稳定协议。除非是一方事后未获得预期利益而打破两者的“协议”导致问题的暴露，否则一般情况很难调查搜集到相应的行受贿证据，这种情况就有可能造成接近于表2（1）的博弈结果。为此，有必要采取过错推定的原则来打击行受贿犯罪。具体地说，博弈的参与人有非正常接触事实，一方参与人（行贿嫌疑人）又获得博弈的实际利益，在法律上应当推定行受贿成立，除非当事人能举出相反的证据予以证明。这样检察机关追诉犯罪时只需举出存在非正常接触以及获得实际利益的证据，当事人则必须对其非正常接触予以合理的解释和说明。这里的难题是何为非正常接触？一般来说，利益决策人和利益参与人博弈前互不认识，而在任何非公务场合的接触都应当视为非正常接触；知道或者应当知道存在回避原因而未回避的也应视为非正常接触。通过这种方法的确立，博弈参与人无法揭开无知之幕而达成稳定的协议，同时也加大了参与人调查对方而付出的信息成本，这样，表2（1）的模式向表3（1）转化，而且使得双方最终因达不成协议而会选择（不行贿、不受贿）的战略组合。

（二）建立利益决策人和利益参与人事先隔绝制度

利益决策人和利益参与人如果博弈前能够很轻松地来往，那么双方不行受贿便只能源于道德约束。我们不可否认道德约束的力量，但也不能完全依靠于此。因此，必须建立一种隔绝制度，使得利益决策人和利益参与人的非隔绝状态非法，所有决策信息的获取，必须通过决策人的代言人进行以及第三方组织的客观评价。这个制度的建立必然会加大行受贿双方达成稳定协议的成本，比如集体决策制度、透明决策制度、评估人随机选择制度等等，单一决策人和参与人不直接对话，这种模式有助于激励严格法律状态下博弈参与人选择（不行贿、不受贿）的战略组合。当然这种模式在预防行受贿犯罪的同时，无疑会降低工作效率，提高管理成本，因此严格意义上说，此模式只适合于博弈利益较高的场合。博弈利益较低的场合，如果表3（1）（行贿、受贿）战略组合的期待利益不是10个利益单位，而是5个或者6个，和（不行贿、不受贿）战略组合的4个期待利益相比较，道德和纪律的力量就足以达到预防效果。

（三）建立健全社会信用评价体系，增加廉洁的社会期待利益

通过建立健全社会信用评价体系，及时有效地将博弈参与人的社会信用情况进行统计，果断淘汰社会信用较低的参与人。同时，在社会经济许可的范围内，增加廉洁的社会期待利益。如表4（1）和表4（2）所述，如果博弈参与人对（不行贿、不受贿）的战略组合有着很高的期待利益，在提高信用准入门槛的基础上，参与人选择（不行贿、不受贿）战略组合的概率就会很高。社会信用评价体系完善了，不见得就只有通过高薪养廉的方法才能提高（不行贿、不受贿）战略组合的期待利益，参与人的社会信用度往往就是一个金字招牌，虽然他在某个局部的博弈当中获利不高，但是在其他的博弈当中他有可能获得的利益往往就足以弥补这种利益差异。反过来，在一个局部博弈当中，参与人选择（行贿、受贿）的战略组合可能获得较高的当然利益，但是其社会信用度受损，就会影响到他参与其他博弈的期待利益，甚至于影响到他参与其他博弈的入局资格，这种一锤子买卖导致利益连续分散获取的损失是一般理性人所不会选择的，除非这种利益连续分散获取的时间超过了一个人有限的生命周期。当然也不可否认，排除其它因素的影响，诸如采取高薪养廉的措施，直观上提高（不行贿、不受贿）战略组合的期待利益，在单个博弈中对预防行受贿犯罪的发生也是有效的。

参考书目：

1、《犯罪学教程》，魏平雄等主编，中国政法大学出版社1998年7月第1版

标准式博弈的混合战略范文第5篇

关键词：声誉；招投标；合谋；约束机制

中图分类号：F294 文献标识码：A DOI：10.3963/j.issn.1671-6477.2012.06.007

一、引言

基于声誉约束的机制设计是当前博弈论研究中的一个前沿方向。Kreps和Wilson[1]运用声誉理论解决了Selten的连锁店悖论，Milgrom和Robert[2]在同一时间引入声誉机制来解释有限次重复博弈的囚徒困境，KMRW的理论被统称为声誉理论。Barro和Gordon[3]将KMRW声誉模型运用到政府货币政策博弈当中，以此来分析声誉对央行货币政策实行的影响。S Bikhchandani[4]对两个投标者在第二密封拍卖下的单期博弈和重复博弈进行了分析，Michael H.Rothkopf和Ronald M.Harstad[5]也在第二价格密封拍卖中引入声誉机制；Daniel Houser和John Wooders[6]通过对Ebay网上拍卖的实证分析，得出声誉对招标者比对投标者而言更为重要；Ming Zhou， Martin Dresner 和Robert J.Windle[7]对缺少声誉反馈机制和拥有声誉反馈机制的网上拍卖者的行为进行了分析，其结论是没有声誉机制的情况下，即使是好的招标者其合作行为也不会得以维持，而一旦考虑到声誉，情况就会改变。Yang Jian，Hu Xiaorui和Zhang Han[8]运用仿真模拟对CtoC环境下的网上拍卖的声誉反馈机制进行了分析，得出了类似的结论；Luis Cabral[9]站在拍卖者的角度，认为拍卖者建立自己的声誉会是一个漫长的过程，而毁掉声誉却只在一瞬间，这是因为一个声誉低下的拍卖者不得不以更低的价格和更低的频率来拍卖物品。国内也有一些文献谈到声誉因素在招投标中的应用，如Zhao Jia和Huang Jinghua[10]运用中国淘宝网上的数据，将声誉因素对网上拍卖者的影响进行了实证分析。

本文改进与完善了Barro与Gordon模型中的效用函数，将声誉机制引入到多回合的招投标分析。结果显示，基于声誉的博弈机制设计对投标人而言将会是一个很强的约束，只要重复博弈达到一定的次数（没有必要是无限期的），那么合谋类型的投标人也可能在相当长一段时期内表现得像非合谋类型的投标人一样，从而有利于招标人，并创造出更多的消费者剩余与社会总剩余。

二、模型假设与效用函数

（一）基本假设

假设博弈的双方为招标人和投标人。一般认为招标方的行为特征对于众投标人而言都属于公共信息或共同知识，因此，在本文中，假设招标人只有一种类型，它总是可以以自己认为合适的价格选择中标者，并且总能够保证自己的价格得以实施，即招标人是言行一致的，说到做到。

同时，本文把众多的投标人标准化为一个行为人，即投标者，并假设投标者有两种类型：一类是非合谋型，它是指投标者的品质是“好”的，不会参与招投标过程中的合谋；二是合谋型的，即该投标者的品质是“坏”的，在招投标过程中，会通过合谋来抬高标价，获取超额利润。

投标者属于何种类型只有它自己知道，对招标方而言，这是对方的私人信息，自己无从知晓。但是假设每次招标人与投标人进行完一次交易之后，招标人可以对投标人进行评价，即包括“差评”和“好评”。他们会为自身设置一个可承受的区间值，投标人在交易中的表现在其可接受范围之内时，招标者认为自己得到了正的效用，因此就会给予“好评”，一旦投标人在交易中的表现超出自身评价可接受的区间，招标人就会认为自己是吃亏的，那么就会给“差评”。同时假设招标人都是道德良好和理性的，能够在每次与投标人的交易中了解到自身是否遭受损失，同时也不存在恶意评价。通过这种评价反馈机制，每个投标者的表现会成为公共信息而存在于信息库中，招标者在下一期就会根据这些信息来判断投标者的类型。

（二）效用函数

假定V为投标人对招标人利益的实际侵占率，即投标人通过非法合谋，抬高标价所取得的超额利润；b为类型参数，代表投标者的类型，令b=0为投标者的类型为非合谋型；令b=1代表投标者的类型为合谋型；VE为招标者对投标者侵占率的心理预期，表示招标者对投标者的预期行为判断。显然有V与VE均大于0且小于1。构造投标者的效用函数如下：

U=-12V2+b（V-VE）+K

式中：K为常数项，且由于投标者的效用一般为非负的，故还应满足初始条件U≥0。对于上式有两点说明：若b=0，即投标者为非合谋型时，上式为U=-12V2+K，只有当V=0时，才能使其效用最大化，而V=0意味着投标者不侵占招标者的利益，这意味着，对于非合谋型的投标者而言，其行动是单一和明确的，不侵占招标者的剩余是它的最优选择，这与投标者的类型相吻合；若b=1，即投标者为合谋型时，U=-12V2+V-VE+K，他可以选择合谋，但是也可能为了长期利益的最大化而把自己伪装成“好”人。

三、均衡解

（一）单期博弈的均衡解

若博弈只进行一期，则有如下结论：

对于非合谋型的投标人而言，有b=0，其效用函数为U=-12V2+K，于是V=0时投标人取得最大的效用K，这意味着好品质的投标人不会通过合谋来获利，其行为始终是明确和合法的。

对于合谋型的投标者而言，有b=1，其效用函数为

U=-12V2+V-V2+K

由UV=-V+1=0得到当V=1时，投标人取得最大效用为U=K+12-VE；如果投标者不合谋，选择V=0，那么投标者的单期效用为U=K-VE，小于进行合谋时的效用。于是在单期博弈中，坏品质的投标人没有伪装成好人的动力。因此单期博弈的均衡解为：非合谋型的投标者选择不合谋，即V=0；而合谋型的投标者选择合谋，即V=1。

（二）多期博弈的均衡解

以上单期博弈的均衡结果在长期博弈中会改变，假定在t=0期b=0的先验概率是p0，b=1的先验概率是1-p0。若博弈重复T阶段，令yt为t阶段合谋类型的投标者选择非合谋策略的概率，xt为招标者认为非合谋类型的投标者不合谋的概率；在均衡的情况下，yt=xt。那么，在t阶段如果招标者对投标者的评价是“好评”，当这成为公共信息时，根据贝叶斯法则，招标者在t+1阶段认为该投标者是非合谋类型的投标人的后验概率是：

pt+1（b=0|Vt=0）=pt×1pt×1+（1-pt）×xt≥pt

式中：pt为t阶段招标者认为投标者为非合谋类型投标人的概率；1为非合谋类型的投标者不进行合谋的概率。这意味着如果投标者没有进行合谋，那么招标者认为他是非合谋类型的投标人的概率是向上调整的。而如果投标者进行合谋而被“差评”，这就会成为行业内的公共信息，此时有

pt+1（b=0|Vt=1）=pt×0pt×0+（1-pt）xt=0

这意味着一旦招标者得知投标者合谋过，他们就会在下一期定义该投标者是合谋类型的投标者。

首先考虑两个阶段模型的均衡解。在最后阶段，投标者建立较好的声誉已经没有了意义，合谋型的投标人的最优选择是Vt=b=1，招标者对投标人的侵占率预期为VEt=Vt×（1-pt）=1-p，此时合谋型投标人效用水平为

Ut=-12+（Vt-VEt）+K=pt-12+K

因为Utpt=1>0，所以合谋型投标人的效用是声誉的增函数，这也是合谋型的投标人在前若干期的博弈中有积极性建立声誉的原因。

再考虑t-1期合谋型投标者的策略选择。假定合谋型投标者在t-1阶段之前都没有进行合谋，那么招标者对投标者的预期侵占率为：

VEt-1=Vt-1×（1-pt-1）×（1-xt-1）=1×（1-pt-1）×（1-xt-1）

式中：1为合谋型投标者的最大侵占率；（1-pt-1）为投标者为合谋型的概率；（1-xt-1）为招标人认为合谋型投标者选择合谋的概率。令σ为贴现因子。在t-1阶段合谋型的投标者可以选择合谋的策略来实现单期效用的最大化，也可以继续建立声誉而把自己伪装成非合谋型的投标人。

如果合谋类型的投标人在t-1期选择合谋，那么他的总效用为：

U1=Ut-1+σ×Ut=（12-VEt-1+K）+σ×（K-12）

如果合谋类型的投标者在t-1期选择伪装，那么他的总效用为：

U2=Ut-1+σ*Ut=（K--VEt-1）+σ*（pt-12+K）

如果U2>U1，即pt≥12，则t-1期不合谋的总效用就会大于合谋的总效用，因此即使是合谋型的投标者也有合规经营的可能。因为在均衡情况下，招标者的预期xt-1等于投标者的选择yt-1，因此yt-1=1成为合谋类型的投标人不进行合谋的策略。

这说明如果在t-1阶段招标人认为投标人是非合谋型的投标人的概率不小于12σ，那么合谋型的投标人选择不合谋要优于合谋。因此该博弈的纳什均衡战略为，只要贴现因子σ足够大，合谋型的投标者在t-1期选择不合谋，在t期选择合谋。而且，如果投标人的声誉越好，它维持自身声誉的积极性就越高。这一点在混合战略均衡中更为清楚。如果pt=12σ，任何的yt-1∈[0，1]都是最优的。但因为均衡要求yt=xt，将pt=12σ带入贝叶斯法则并重新安排，得到：

yt-1=xt-1=（2σ-1）pt-11-pt-1

在该式中，假定σ>12，则

yt-1pt-1=2σ-1（1-pt-1）2>0

即招标者越认为投标者是“好”人，合谋型的投标者选择不合谋的积极性就越高。特别地，当pt-1时12σ，yt-11。

上述分析得知，合谋型投标者在选择t-1阶段的对策时，面临着眼前利益和未来利益之间的权衡。给定招标者不知道投标人的真实类型，如果合谋型为投标者在现期选择合谋，他在现阶段的效用

Ut-1=12-VEt-1+K>-VEt-1+K

但在声誉被毁之后，他下阶段的效用将会下降为

Ut=-12+K

因此，合谋型投标者面临的问题是究竟在现阶段利用自己的声誉还是在下阶段利用自己的声誉。如果pt-1充分大，即σ充分接近于1，那么其最优选择是下阶段而不是现阶段利用自己的声誉[11]。

容易证明，如果合谋型的企业在T-1阶段选择不合谋时的策略是最优的，那么，在所有t

该博弈均衡战略解的存在，必须满足pt-1≥12σ，即只要σ足够大，该式就能成立。因此，合谋型的投标者就会选择不合谋，即选择把自己伪装成“好”人的积极性就越高，这样就越有利于建立一个诚信的招投标环境。这也意味着，只要博弈是一直重复的（没有必要是无限期的），即使是合谋型的投标者也会有合规经营的动力。

四、仿真模拟

（一）不同类型的效用函数的比较

如前文所述，非合谋类型的投标人的效用函数为U1=-12V2+K，而合谋类型的投标人的效用函数为U2=-12V2+V-VE+K，将U1和U2定义为三维坐标的纵轴，而V和VE分别是两个横轴。根据假定，V和VE都在0到1之间取值，将K取常数1，V与VE均从0开始，按0.001的步长递增，做1 000次模拟，于是得到图1。

如图所示，图中黑色阴影部分曲面代表的是合谋型投标人的效用函数图，其效用函数为U2=-12V2+V-VE+K，而灰色的曲面代表非合谋型投标人的效用函数图，其效用函数为U1=-12V2+K。由图1可见，如果投标人是合谋型企业，那么其获得的效用将随着VE的增大而减少，即随着招标人对其侵占率预期的增大而减少；而对非合谋型的投标人来说，只有在V=0时其效用才是最大的，随着增加其效用也会逐渐减少。

由于这两个效用函数的图形形成相交的曲面，因而U1和U2之间的大小关系并不确定，这意味着随着V和VE取值的不同，有时候U1>U2，有时候U1

（二）不同类型企业的行为选择

那么怎样才能诱导合谋型企业选择非合谋的行为呢？下面建立一个多期博弈的仿真模拟来进行说明。

针对合谋型的投标人，其面临的效用函数为U2=-12V2+V-VE+K。假设在博弈的首期，招标人的态度中立，认为投标人是非合谋型与合谋型的先验概率均为p0=0.5。现在投标人有两种选择：要么在本期伪装成非合谋型企业，招标人在下期博弈中仍然维持对他的“好评”的预期概率；要么在本期选择合谋，招标人在下期博弈中将调低对他的“好评”的预期概率。基于此，我们分别计算出投标人在今后各期选择合谋策略和不合谋策略的单期效用和累积效用，通过模拟，得到图2与图3。

图2显示，在设定的数值下，投标人若选择合谋，那么他在t=4期的收益将达到最大，但是由于招标人基于投标人的合谋行为，调低了对投标人的“好评”的预期概率，所以投标人在t=5期的收益会急剧下降，并在后续的经济交往中，每一期的收益都会低于非合谋型投标人的每一期收益。

图3则显示，尽管在t=4期以前，合谋型投标人的累积效用会大于非合谋型投标人的累积效用，但是从t=5期开始，非合谋型投标人的累积效用将大于合谋型投标人的累积效用，并在以后的博弈中，两者的差距会越来越大。

从仿真模拟可见，其实并不需要进行无穷多期博弈，只要博弈的次数足够多，投标人选择不合谋所获得的收益将超过选择合谋所获得的收益。因此，在声誉机制约束之下，基于收益最大化，不论是合谋型投标人还是非合谋型投标人，都会选择不合谋的行为，这显然有利于维护招标人的利益，并提高消费者的福利。

五、结论

通过上文分析可见，基于声誉的制度设计对投标企业约束的重要性。招投标过程中，存在着各种利益的冲突，巨大的经济利润的诱惑可能会推动着投标者不自觉地触动自己的道德底线，朝着合谋的方向越陷越深。显然，一个有效健全的声誉约束机制可以规范和引导市场参与者的行为选择，使得投标者能够在实现自身利益最大化的同时不辜负整个社会对他们的道德期盼。由此可见，面对一个好的制度，即使是合谋类型的投标人也有不进行合谋而选择合规经营的激励，在整个宏观经济层面上，科学合理的激励约束机制可以有效诱导企业体现出更强的社会责任感与道德伦理观。

[参考文献]

[1] Kreps D M，Wilson R.Reputation and imperfect information[J].Journal of Economic Theory，1982，27：253-279.

[2] Robert M J Predation. Reputation， and Entry Deterrence[J].Journal of Economic Theory，1982，27：280-312.

[3] Barro R J，Gorden D B.A Positive theory of monetary policy in a natural rate model[J].The Journal of Political Economy，1983（4）：589-610.

[4] Bikhchandani S.Reputation in repeated second-price auctions[J].Journal of Economic Theory，1988，46：97-119.

[5] Rothkopf M H，Harstad R M.Modeling competitive bidding：A critical essay[J].Management Science，1994（3）：364-384.

[6] Houser D，Wooders J.Reputation in auctions：Theory，and evidence from Ebay[J].Journal of Economics & Management Strategy，2006（2）：353-369.

[7] Ming Zhou， Martin Dresner，Robert J.Windle.Online reputation systems：Design and strategic practices[J].Decision Support Systems.2008，44：785-797.

[8] Jian Yang， Xiaorui Hu， Han Zhang. Effects of a reputation feedback system on an online consumer-to-consumer auction market[J].Decision Support Systems，2007，44：93-105.

[9] Cabral L.The rise and fall of reputation[Z].2009，Working Paper.

[10] Zhao Jia，Huang Jinhua.An empirical research on taobao：Seller reputation's impact on auction price premium[C].Advanced Management of Information for Globalized Enterprises.2008，IEEE Symposium on，2008：1-5.

[11] 张维迎.博弈论与信息经济学[M].上海：上海人民出版社，1996.

Mechanism of Preventing Collusion Based on Reputation Constraint

MA Li，NIU Yong

（School of Economics and Management，Wuhan University，Wuhan 430072，Hubei，China）

标准式博弈的混合战略

标准式博弈的混合战略范文第1篇

标准式博弈的混合战略范文第2篇

标准式博弈的混合战略范文第3篇

标准式博弈的混合战略范文第4篇

标准式博弈的混合战略范文第5篇

AI文章写作

相关推荐更多

热门文章排行更多

相关期刊更多

标准生活

标准科学

中国药品标准

精品文章排行更多

在线服务