博弈论论文范例6篇

博弈论论文

博弈论论文范文1

博弈论又称为“对策论”，一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪，1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成，随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖，使博弈论在经济领域中的地位和作用得到权威性的肯定。

2．博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来，博弈论模型可以用五个方面来描述

G={P，A，S，I，U}

P：为局中人，博弈的参与者，也称为“博弈方”，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。

A：为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限，可分为有限博弈和无限博弈，后者表现为连续对策，重复博弈和微分对策等。

S：博弈的进程，也是博弈进行的次序。局中人同时行动的一次性决策的博弈，成为静态博弈，如齐威王和田忌赛马；局中人行动有先后次序，称为动态博弈，如下棋。

I：博弈信息，能够影响最后博弈结局的所有局中人的情报，如效用函数，响应函数，策略空间等。打仗强调“知己知彼，百战不殆”，可见信息在博弈中占重要的地位，博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息，如果博弈各方对各种局势下所有局中人的得益状况完全清楚，称之为完全信息博弈（gamewithcompleteinformation），例如齐威王和田忌赛马，各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈（gamewithincompleteinformation），例如投标拍卖，博弈各方均不清楚对方的估价。在动态博弈中还有一类信息：轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈（gamewithperfectinformation），例如下棋，双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”（gamewithimperfectinformation）。由于信息不完美，博弈的结果只能是概率期望，而不能象完美信息博弈那样有确定的结果。

U：为局中人获得利益，也是博弈各方追求的最终目标。根据各方得益的不同情况，分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。

还有另一类型博弈称为多人合作博弈，例如安理会投票表决，OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上，它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域，特征函数表示各个联盟的得益（N是局中人的数目），它的分配解必须符合一定的合理性和稳定性，它的解的概念也发展成多种多样，包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要，针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步，博弈论模型的求解目标就是使自身最终的利益最大化，这种解建立在对方也采取各自“最好策略”为前提，各方最终达到一个力量均衡，也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品，它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中，遇到很多前所未有的新课题，运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场，模拟的结果可能更加接近实际，为市场模式设计提供依据。另外，电厂或用电用户作为市场的参与者，可以用博弈论来分析市场，研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如：力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法；而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题：如何识别合作伙伴，结盟利益如何在联盟内分配。电力市场环境下，电网输电作为一项服务，它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解：稳定集，核心，核仁，Shapely值等，如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息，采用什么样的信息披露政策是设计电力市场模式的一个方面。例如：电厂竞价上网，一个成功的报价不仅取决于自己的实力，还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息，因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来，博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学，两者都有广阔的发展天地，两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中，拥有自备电厂的用户是一类特殊的市场参与者，它既是用电用户，也可以是电力的供应者。随着电力市场深入发展和工业的进步，自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户（NCP）对定价的影响作用。NCP既可以从公用电网购电，也可以自己发电来满足自身需求。为解决两者的冲突，作者提出了三种博弈模型：非合作Nash博弈模型，合作博弈模型和超博弈模型。作者构造了三个局中人：公用电网，普通用户，带自备电厂的用户（NCP），并且假设它们的需求函数、边际成本、收益函数等均是线性的，通过数字模拟得出了一些有趣的结果：①NCP的加入促使公用电网降低出售给NCP的电价；②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进：①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况；②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场，如果公用电网规模很大，NCP数目很多但规模小，考虑Stackerlberg模型更符合两者实际；③该文假设公用电网的目标函数是整个社会利益最大化，而并非是自身利益最大化，这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题，它重点放在自备电厂和公用电网相互作用的方式的选择：公用电网回购NCP多余电力（buy-backsystem）或者公用电网收取NCP运转电力的过网费（wheelingcharges）。该文分析了在不同市场环境下，各方的得益情况，得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析，得出双方都可接受的交换功率和交易价格。在此基础上，文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策，采取合作型对策，应用Nash谈判公理作为仲裁程序，决策出双方都可接受的交换功率和交易价格。应该指出，白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息，又应该如何分析处理呢？这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价，这个定价能够给网络使用者一个信号，以达到全网最优化；并且能够补偿网络的投资者，网损、变动成本、固定成本等费用在网络使用者中合理分摊；同时能够正确激励网络增容。节点实时价格（nodalspotprice）制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资，为了解决双边贸易中输电系统固定成本公正分摊问题，作者提出了基于多人合作博弈模型，可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点：①使用“核仁”而不用Shapely值，因为“核仁”处于核心，分配值更加稳定和易于被各方接受；②提供了一种激励，减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性，这些特点都给建模和计算造成困难，从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中，通常需要假设或者估计对方的信息，方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下，市场参与者相对于市场规模都显得很小，市场影响力很小。在这种情况下，优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场，单个市场参与者对市场是有影响力的，其模型本质上属于不完全信息的非合作博弈。例如：每个参与者只知道自己的成本信息，而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题：在无法完全了解对方的信息情况下，参与者如何投标（选择高价投标还是低价投标）才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类，并对每一类的可能性进行概率估计，形成一个概率意义上的期望收益矩阵，用Nash平衡点的概念求解矩阵，得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时，都同时执行以下两个步骤：①对可能的合作对象按照一定的指标进行优先排序；②按照谈判优先顺序，逐一进行讨价还价，谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类，并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作，互相交换共享所拥有的信息，联合成博弈的一方，剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值，作为与B合作的优先指标。对每个局中人都进行一遍以上计算，得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序，各方同时进行合作谈判，谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点：正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息，并用这种反馈来更新自己的知识库，提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点：计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场，文献[13]提出了多理论模型，解决贸易合作问题，文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段：①确定自身成本等信息；②与对方互相交换信息，互相寻求合作伙伴；③按照预先设定的准则和协议进行联合分组，形成一个谈判对象优先顺序表，这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表；④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行，直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况，但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下，竞争各方均以实现自身利益最大化为目标，旋转备用的约束变得软起来，PX（powerexchange）机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的，松弛旋转备用的乘子被看作是提供备用的价格信息，各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整（例如：为t时段负荷）。根据优化原理，如果拉格朗日函数存在鞍点，则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处，如以上公式所示。基于此想法，作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益，它控制的决策变量是p，u（p向量表示各机组分配的有功，u向量表示机组启停），目标是使整个系统成本最低。另一个局中人Q，是一个假想的发电商，它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价，最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论，作者设计了自适应的次梯度算法寻求平衡点，其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间（例如：5%Dt-%Dt，Dtt时段负荷），形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数，模型可细分为两种：Nash模型（不了解对方反应函数）和Stackelberg模型（Q了解P的反应函数），作者认为后一种模型掌握的信息较多，因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学，不过它更具有人的逻辑思维的色彩，融合了一些用别的方法难以表达的信息。

博弈论论文范文2

摘要财务风险管理对现代企业有着非常重要的意义。本文首先运用委托理论对企业财务风险管理进行了博弈分析，接着从建立短期财务预警系统、建立长期财务预警系统两个方面阐释了如何建立财务预警系统，最后从筹资、投资、资金回收、收益分配4个方面对如何加强企业财务活动的风险管理进行了分析介绍。[关键词]财务风险；预警；管理；博弈分析在市场经济条件下，随着各种金融衍生工具的日益增多，企业的融资渠道和空间越来越广阔，这一方面为企业扩大经营规模，获取更大利益提供了有利条件；另一方面，由于市场竞争和金融环境的变化莫测，带来了企业用货币资金偿还到期债务的不确定性，这种不确定性的结果就可能产生财务风险。一、企业财务风险管理中的博弈分析财务风险是指除非对经济实体的经营和结构实行大规模的重组否则就无法解决的严重变现问题，或者是指企业不能正常履行资金支付责任，在资金周转和运用方面出现了入不敷出的现象。大量研究表明，企业财务风险的形成经历了较长的潜伏期。许多企业在财务风险产生的初期不能实施有效管理的本质原因在于企业内部委托问题的存在。具体来说，由于信息不对称，经营者为了完成所有者下达的经营任务和实现自身利益的最大化，在面对是选择经营业绩至上还是控制财务风险至上问题时，可能更多地倾向于前者，而对后者更多地采取掩饰、隐藏等措施。从博奕论的角度分析，假设经营者与所有者之间的契约约定：经营者除了完成一定的经营业绩指标任务以外，还应及时揭示潜在风险并采取相关措施消除财务风险。此时经营者和所有者在契约中如同博弈集合中的两个游戏者，让我们关注一下经营者的收益矩阵。在完成指标的情况下，存在潜在财务风险时，如果经营者揭示风险，则会因为企业财务状况不符合所有者制定的风险控制指标而受到一定惩罚（用1表示）；如果尽力掩盖风险，所有者将因其完成各项经营指标以及财务状况质量好而给予一定奖励（用1表示）。在未完成指标情况下，因揭示风险进一步影响经营任务的完成，其将受到双重惩罚（用2表示）；如果掩饰风险，则只受到单项惩罚（用表示）。图1为经营者博弈的收益矩阵。从经营者博弈的收益矩阵看，无论其是否能完成经营指标，其对潜在财务风险的不揭示比揭示的收益都大，故不揭示是经营者纳什均衡的最优选择。并且，只要所有者全面有效监控机制未建立，该博弈在一些企业经营者中就将继续进行下去。待到风险爆发时，当期经营者已获得奖励和升迁，损失则由继任者或所有者来承担。二、建立企业财务预警系统造成上述博弈能够成立的原因在于人的有限理性、机会主义以及现行的财务风险管理机制存在静态性和滞后性的缺陷。由于人的有限理性和机会主义是客观存在的，因此，降低信息不对称和建立有效的财务危机预警系统才是解决问题的关键。财务危机预警系统，就是借助信息技术，构建一条经营者与所有者之间的信息桥梁，使所有者与经营者之间的信息鸿沟得以弥合，从而全面掌握控制财务风险的主动性。如果财务预警系统的效率极高，无论经营者是否具有揭示风险的积极性，企业潜在的财务风险都将被及时揭示，经营者都将承担当期的风险损失，风险的外部性问题将不会存在。1．建立短期财务预警系统与编制现金流量预算由于企业理财的对象是现金及其流动，就短期而言，企业能否维持下去，并不完全取决于是否盈利，而取决于是否有足够现金用于各种支出。预警的前提是企业有利润，对于经营稳定的企业，由于其应收、应付账款及存货等一般保持稳定，因此，经营活动产生的现金流量净额一般应大于净利润。企业现金流量预算的编制是财务管理工作别重要的环节，准确的现金流量预算，可以为企业提供预警信号，使经营者能够及早采取措施。为能准确编制现金流量预算，企业应该将各具体目标加以汇总，并将预期未来收益、现金流量、财务状况及投资计划等，以量化形式加以表达。应通过企业全面预算，预测未来现金的收支状况，应以周、月、季、半年及一年为期，建立滚动式现金流量预算。2．建立财务分析指标体系与长期财务预警系统对企业而言，在建立短期财务预警系统的同时，还要建立长期财务预警系统。其中，获利能力、偿债能力、经济效率、发展潜力指标最具有代表性。获利是企业经营的最终目标，也是企业生存与发展的前提。衡量企业获利能力的指标有：总资产报酬率、成本费用和利润率。衡量企业偿债能力的指标为：流动比率和资产负债率。经济效率高低一般采用应收账款周转率以及产销平衡率，衡量企业发展潜力则应选择销售增长率和资本保值增值率。企业应对难以预料的需要和机会，应该具备采取有效措施，改变现金流的流量与时间的能力，这就是财务弹性。反映财务弹性的指标有测定企业全部资产的流动性水平的营运资金与总资产比率，到期债务本金偿付率，实有净资产与有形长期资产比率，应收帐款及存货周转率。从长远的观点看，一个企业能够远离财务风险，必须具备良好的盈利能力，反映企业对外筹资能力和清偿债务能力的指标有总资产净现率、销售净现率、股东权益收益率。虽然，上述指标可以预测财务风险，但从根本上讲，企业发生风险主要是由于举债导致的，一个全部用自有资本从事经营的企业只有经营风险而没有财务风险。因此，要权衡举债经营的财务风险来确定债务比率，应将负债经营资产收益率与债务资本成本率进行对比，只有前者大于后者，才能保证本息到期归还，实现财务杠杆收益；同时还要考虑债务清偿能力，即企业拥有现金多少或其资产变现能力的强弱；债务资本在各项目之间配置合理程度。考核指标有：长期负债与营运资金比，资产留存收益率以及债务股权比率。三、企业财务活动的风险控制管理1.调整资本结构，控制企业筹资风险在市场经济条件下，筹资活动是一个企业生产经营活动的起点，管理措施失当会使筹集资金的使用效益具有很大的不确定性，并由此产生筹资风险。企业筹集资金渠道有两大类：一是所有者投资，如增资扩股，税后利润分配的再投资。对于所有者投资而言，不存在还本付息问题，可长期使用，自由支配，其风险只存在于使用效益的不确定性上；二是借入资金。企业在取得财务杠杆利益时，实行负债经营而借入资金，从而给企业带来丧失偿债能力的可能和收益的不确定性。筹资风险产生的具体原因：由于利率波动而导致企业筹资成本加大的风险，一旦筹集了高于平均利息水平的资金，可争取提前还债等补救措施。当然，其他风险还有资金和组织调度风险、经营风险、外汇风险。2.科学决策,控制企业投资风险企业通过筹资活动取得资金后，进行投资的类型有3种：一是投资生产项目；二是投资证券市场；三是投资商贸活动。然而，投资项目并不都能产生预期收益，从而引起企业盈利能力和偿债能力降低的不确定性，如出现投资项目不能按期投产，无法取得收益，或虽投产但不能盈利，反而出现亏损，导致企业整体盈利能力和偿债能力下降；虽没有出现亏损，但盈利水平很低，利润率低于银行同期存款利率；或利润率虽高于银行存款利息率，但低于企业目前的资金利润率水平。投资者所要求的超过资金时间价值，用于回报承担投资风险的那部分额外报酬，称为收益。在进行投资风险决策时，其重要原则是既要敢于进行风险投资，以获取超额利润，又要克服盲目乐观和冒险主义，尽可能避免或降低投资风险。在决策中要追求的是一种收益性、风险性、稳健性的最佳组合，或在收益和风险中间，让稳健性原则发挥出平衡器的作用。3.加强内部管理,控制企业资金回收风险企业财务活动的第三个环节是资金回收。应收账款是造成资金回收风险的重要方面，有必要降低它的成本。应收账款的成本如下：一是机会成本，常用有价证券利息收入表示；二是应收账款管理成本；三是坏账损失成本。应收账款加速现金流出，它虽使企业产生利润，然而并未使企业的现金增加，反而还会使企业运用有限的流动资金垫付未实现的利税开支，加速现金流出。因此，应在以下几方面强化应收账款的管理：一是要建立稳定的信用政策；二是要确定客户的资信等级，评估企业的偿债能力；三是要确定合理的应收账款比例；四是要建立销售责任制。4.着眼企业未来，控制企业收益分配风险收益分配是企业一次财务循环的最后一个环节。收益分配包括留存收益和分配股息两方面。留存收益是企业扩大规模的来源，分配股息是股东财产扩大的要求，二者既相互联系又相互矛盾。企业如果扩展速度快，销售与生产规模高速发展，需要添置大量资产，税后利润大部分留用。但如果利润率很高，而股息分配低于一定水平时，就可能影响企业股票价值，由此形成企业收益分配上的风险。主要参考文献[1]周首华，陆正飞．现代财务理论前沿专题（一）［M］．大连：东北财经大学出版社，2001．[2]张友棠．财务预警系统管理研究[M].北京：中国人民大学出版社，2004．[3]财政部注册会计师考试委员会．财务成本管理［M］．北京：经济科学出版社，2005．[4]薛祖云，刘金星．现代企业财务风险预警系统指标体系的构建［J］．财会通讯，2004，（8）．[5]胡小燕.企业财务风险管理中的危机预警系统研究［J］．企业经济，2005,（3）．

博弈论论文范文3

论文关键词：合作博弈;重复博弈;中美纺织品贸易

一、中美纺织品贸易从非合作博弈转向合作博弈的理论层面分析中美纺织品贸易长期进行，随着利益分配的变化，矛盾与冲突也将增多，形成重复博弈。但是为了长期的甚至永久的利益，双方合作达成协议的可能性就越大，协议规定保护资源，违反协议将受到惩罚，从而保证了协议的执行，这就构成了经济社会长期合作的基础。

(一)打破无效率非合作博弈均衡在博弈理论中，一次性博弈虽然博弈双方都努力寻求个体最好的结果，运用各自的“占优策略”，但是这种非合作博弈导致进入“囚徒困境”的纳什均衡僵局，得到的却是较差的结果，这是从个体理性出发所导致的集体非理性无效率均衡。因此一次性静态博弈无法实现帕累托最优选择。当一次性博弈扩展到重复博弈时，在有限次重复博弈中，每个阶段博弈出现的都是一次性博弈的均衡结果。有限次的重复博弈无法抑制投机行为发生，并不能使博弈双方都选择合作的帕拉托最优策略组合，最终结果通常也是非合作均衡，不能改变囚徒困境的均衡结果，因而也不是有效率的。尽管有限次博弈也通常产生非合作均衡，但是囚徒困境可以在无限次重复博弈中得到纠正。长期性的中美纺织品贸易博弈是一个与无限次重复博弈相似的随机结束的重复博弈，这种情况下博弈方分析和决策的思路与无限次重复博弈一致。因此只有推动合作、抑制投机行为，才能最终实现有效率的合作均衡。

(二)验证合作对重复博弈的效用在国际贸易环境中，如果中美两国视互利互惠、求同存异共同发展为最高价值，通过合理合法的手段与程序，在不损害或尽量少损害博弈对手切实利益或获利潜能的情况下，就能谋求自身的最大利益与最大可能的发展空间。同时，合作形成的良性博弈规则，在一段时间内有利于决策主受体良性互动与利益均衡协调的发展，为再次博弈、修正决策和适时展开新决策提供现实契机和合作的氛围。这是一种可持续博弈、共享互惠、共存共荣的长远决策。

第一，重复博弈的得益综合各阶段。任何博弈弈方策略选择的依据都是得益的大小，这在重复博弈中仍然成立。但问题是重复博弈的得益与一次性博弈有所不同，因为它们的每个阶段本身就是一个博弈，各博弈方都有得益，而不是整个博弈结束后才有一个总的得益，因此博弈方是根据哪个得益选择，是根据当前阶段得益还是其他什么得益选择就成了问题。如果博弈方都是根据当前阶段得益选择，那么等于把重复博弈割裂成了一个基本博弈，重复博弈就失去了意义。因此重复博弈弈方的行为、策略选择不可能只考虑本阶段的得益，而必须兼顾其他阶段的得益，考虑整个重复博弈过程得益的总体情况。

第二，重复博弈得益驱使合作策略。2005年诺贝尔经济奖的奥曼和托马斯•谢林两位经济学家，通过重复博弈与聚焦效应等合作博弈论研究，指出冲突各方基于必须在未来与对手不断地打交道(重复博弈)，基于重复博弈过程得益的总体情况，认识到“合作是有利于自身的好策略”，从而增加了合作的机会：在冲突双方起争端时，“强硬”与“让步”是两种可能的选择，双方均取“强硬”，则可能发生“战争”，两败俱伤。如果势均力敌的两方都坚信自己的实力，用“持久战”的办法尽可能拖垮对方，那么这种想法的结局导致“和平”与“合作”。

因此，尽管存在冲突，长期共存是可能的，和谐社会的建立非但有其必要性，而且完全是现实的。合作博弈理论对解决经济冲突、建立长期合作有着极其重要的指导意义。对于中美纺织品贸易重复博弈来说，竞争冲突的各方完全应该也有可能达成协议长期合作，以求得长期的稳定的收益。

二、中美纺织品贸易从非合作博弈转向合作博弈的现实层面分析

(一)合作的可能：国际化分工使两国相互依赖商品和劳务市场是实现交换的最重要的平台，其发展程度决定了专业化分工程度。商品和劳务市场的特点就是多样化：多样化的品位，多样化的人类技能、知识，多样化的自然资源，为交换提供了前提。在商品和劳务市场中，生产者不断生产产品，而消费者不断从相应产品中获得价值。在国际市场中，贸易双方的商品和劳务、生产者、消费者通过市场都彼此依赖，存在着微妙的相互关系链，市场要求各方在共同意愿的基础上制定社会交往的规则。

20多年来中美两国越做越大的贸易额充分说明了中美贸易的互补性。美国企业将产品外包给成本比美国低的中国，从而节省的成本可以投资于新技术，创造新的工作机会，并在全球市场保持竞争力。国外输入的劳动密集型商品能够有力地促进国内该行业技术升级，在生产转移到劳动力低廉的中国的同时，美国可以有更多的时间和精力用于研发、制定标准以及优化产品结构。因此，国际化分工中的合作给中美双方都将带来更大的好处。中美经贸关系的快速发展促进了两国经济的持续增长，中美双方互为第二大和第三大贸易伙伴，互利双赢符合两国的共同利益。物美价廉的中国商品给美国消费者带来了大量实惠，同时，中国又是美国增长最快的出口市场，是美国企业海外利润的主要来源地之一。

维护稳定的中美经贸关系无论是对中国，还是对美国都具有重要意义，因此应该继续鼓励、促进两国之间的经贸合作与交流。中美经济的互补性和经贸合作的互利性是决定中美经贸关系持久发展的基础，两国在长期的贸易博弈中保持“合作”策略，双方加强互信与合作，有利于双方的博弈赢得、有利于稳定和促进中美经贸关系、有利于共同的经济发展。尽管在这个重复博弈中的某一个阶段博弈中，还是要重视非合作博弈中的策略分析和选择，但更重要的是要看到中美双方在贸易博弈中由非合作博弈向合作博弈的转化是有很大必要性的。

(二)合作的必然：合作博弈正和结果实现双赢本文从现实和理论上都证明:在中美纺织品贸易博弈中，两国的合作收益大于不合作收益，因此两国决策模型的理想选择应该是引致正和赢得的合作博弈。由于合作博弈有利于贸易双方实现双赢，这种双赢结果正是驱动双方进行合作的激励动力。在2005年11月8日中美就纺织品贸易签订的协议，一方面使得美国对其纺织品行业实施了一定程度的保护，使其实现向纺织品一体化的顺畅过渡，并且在博弈效果方面美国还获得了有关人民币汇率等其他问题方面的进展;另一方面中国在协议期三年内的出口增长量以及市场份额比2011年都有提高，且美方明确承诺对协议外产品克制使用242条款。

从协议内容看，中美都对此前各自坚持的立场进行了修正，双方各有让步，表明两国都对维护稳定的贸易环境的重要性给予了充分考虑，在较大程度上照顾了双方企业的利益，因而可以说是一个双赢的协议。事实证明，加强中美经贸合作符合两国和两国人民的根本利益，平等互利的经贸关系，对新世纪中美关系全面健康发展具有重要意义。中国是世界上最大的发展中国家，市场广阔，发展迅速，劳动力成本低，但资金短缺、科技相对落后，美国是世界上最大的发达国家，经济总量大，资本充足，科技发达，但劳动力成本高。

从经济全球化视角审视这种差异性和互补性，显而易见，中美两国的纺织品贸易博弈存在着合作的必然。三、永恒的贸易博弈尽管2005年11月中美达成三年期限的协议，但从WTO规则来看，“多种纤维协定”取消以后，美国可以用来限制我国纺织品出口的法律依据不止一个，中国纺织品出口美国面临的不只是“242段条款”(有效期至2008年底)，还有“第16条”(有效期至2012年)、反倾销、反补贴、技术性贸易壁垒等等多种保护主义措施，另外，劳工权利、知识产权、反垄断法等问题也有可能在中美纺织品贸易中成为两国利益的冲突点。这些对于中美两国政府都是巨大挑战，因此，中美纺织品贸易的非合作博弈也可能随时发生，应对贸易壁垒，与形形色色的贸易保护主义斗争将是一项长期任务。

在这场长期与强势共存的国际环境和不公平的贸易规则下，与强势斡旋、争取本国公平贸易的利益，这是中美贸易之间一场永久的、不会有结束的博弈。中国需要认清自身在国际贸易博弈中的地位和形势，采取积极有效措施，提高中国纺织品及行业在国际中的竞争优势、增强中国纺织品在国际贸易中的博弈力量。从重复博弈理论和中美贸易高度互补的现实两个层面的分析，我们可以得出这样结论：尽管纺织品问题对中国与美国都很重要，但双方的纺织品贸易争端不应影响美国与中国长期的合作关系。

双方有必要为了建立可持续博弈、共享互惠、良好合作的氛围而打破非合作博弈的纳什均衡僵局，也只有实行合作、推动两国纺织品贸易从非合作博弈向合作博弈转化，才能实现有效率的合作均衡，实现纺织品贸易博弈的双赢，增进两国各自的社会福利。

[1]张维迎.博弈论与信息经济学[M].上海：上海人民出版社， 2002.

博弈论论文范文4

摘要中韩自建交以来经贸合作获得了长足发展，山东作为中国的贸易大省，与韩国有着较密切的贸易关系。但鲁韩贸易还存在着一些制约因素，如贸易不平衡，贸易摩擦等问题。因为人类的活动总是受资源稀缺性的制约，所以某一个经济主体的行为在有限的利益分配中对其他经济主体的行为及其预期产生影响，他们也以其他经济主体的预期为基础选择自己的行为策略，这种相互选择策略的过程形成“博弈”。本文就是针对如何进一步深化鲁韩经贸合作、扬长避短这一问题，运用博弈的理论进行的深入分析研究。关键词博弈；经贸合作；鲁韩 1问题的提出中韩两国正式建交后，山东省与韩国的经贸合作取得了明显的成效。据资料统计，2005年山东省与韩国的贸易额达157.5048亿美元，其中对韩国出口为65.6054亿美元，进口为91.8993亿美元。截止2005年底，韩国对山东省的投资累计合同金额113.8566亿美元，实际投入33.8538亿美元。双方的经贸合作已从探索性阶段进入实质性阶段。尽管鲁韩贸易发展势头强劲，但仍存在隐忧和障碍。从外部因素分析这些问题，主要表现为以下三个方面: （1）韩国贸易政策障碍山东在对韩贸易政策上相对宽松，尤其是对于投资拉动的贸易给予了相当优惠的待遇。以承接日韩产业转移为主要日标的胶东半岛制造业基地的打造更加速了对韩贸易的增长。而韩国的对外贸易政策则侧重于出口，1962年韩国就推出了“输出立国”的经济开发战略，对进口贸易实行一定的限制。如在关税保护方而.韩国的政策措施表现为:对进口商品，特别是农、副产品实行弹性关税制度，经常根据需要加征调节税。二是利用“特别保护条款”设置障碍。韩国政府通过修改《关税法》，对大麦等多种农、副产品实行特别保护条款，最高保护税率达986%。三是开征“特别紧急关税”。规定在某种产品进口激增或导致国内市场价格下跌时.自动课征“特别紧急关税”。四是反倾销调查。除此之外，韩国还制定一些非关税措施限制进口，尤其是技术壁垒手段。这都是韩国贸易政策所设障碍的表现。这种贸易政策的松紧不一、不协调同步势必造成贸易中的不平等和进出口额的不平衡。（2）贸易不平衡潜伏着隐患从近几年贸易统计数据看，山东的贸易逆差仍有继续扩大的迹象（见图一）。尤其随着半岛制造业基地的建设和承接韩国产业转移步伐的加快。这种投资拉动型的贸易将会进一步拉大进出口差距。当然，在一定时期内、一定条件下，发展地区经济不必苛求贸易的完全平衡。但长时期的贸易逆差又得不到有效抑制将会加深山东对韩的贸易依赖性，使山东处于被动地位，容易受到对方牵制。此外，进口贸易中投资产品过高，在一定程度上抑制了本地相同产品的成长和成熟。尤其是山东的塑料、纺织、化工产品。何况鲁韩贸易逆差还会加剧中韩贸易的不平衡，导致外汇收支失衡和中韩贸易关系脆弱，最终影响两国贸易合作的健康发展。（3）贸易摩擦将会增多韩国的加工制造业向山东转移的同时，也带来了海外市场转移，使得过去山韩国直接出口美国和欧洲的产品现在转山山东加工出口。加大了山东对美欧市场的贸易顺差.这就容易引起这些贸易伙伴的警觉和适度保护。因此，针对山东的非关税壁垒和反倾销案件也会逐渐增多。参加区域贸易协定的各方都有其经济动因，这就注定了此类贸易问题的不可避免。但如果都把个体利益放在区域利益之上，那么区域经济合作将很难取得太多实质结果。因此如何协调区域利益是贸易双方激烈博弈的领域，也是区域经济合作必须妥善处理的问题。 2选择韩国进行贸易合作的依据区域间经济利益的帕累托改进是区域合作的目标。然而，良好的合作目标并不能保证区域间的合作持续进行。正如在现实中看到的那样，有的合作只是流于形式。地区之间谈判商定的项目不少，但实际投入的项目却不多；有些地区之间的经济合作不能长期地进行下去。这实际上涉及到一个问题的两个方面:区域合作是否找对了对象以及是否有可持续发展的条件。具体到山东的合作战略来说，为何确立韩国为合作对象，又如何保持合作的可持续发展成为战略的重点所在。山东与韩国具有以下几方面的比较优势。 2.1经济发展战略的结合点，提供了双方大力合作的机遇根据比较优势理论，区域经贸合作的动机是建立在成本的差异上的，合作的实现促成区域分工的产生和发展，通过分工则可实现资源的再配置并有效的提高劳动生产效率。山东省经济基础较好，自然资源丰富、劳动力充足、市场广阔，但在其经济发展中却面临着资金短缺、技术落后、人才不足等问题，而且经济发展不均衡，产业结构不尽合理。而韩国作为新兴工业化国家，具有技术、资金、人才、产业结构等方面的优势，自然资源、劳动力及其市场却是制约其经济发展的主要瓶颈。因而，韩国与山东省都有着加强对外经济交往与合作的要求，双方开展经济合作，可实现优势互补，促进共同繁荣。这是两地发展经贸关系的前提。 2.2地理位置相近，交通便利，地缘优势明显山东与韩国隔海相望，两国间最短的距离为99海里，发展经贸往来不仅可节省运输费用，而且可减少中转环节而产生“近距效应”。山东交通运输发达，物流运输畅通完善，已初步形成集铁路、公路、水运、航空为一体的综合交通体系，并形成了方便快捷、运力充足的“交通走廊”，青岛至釜山的货运航线、威海至仁川的客运航线、烟台至釜山的客货航线、青岛至汉城的空中航线均已开通。青岛至汉城的空中航班甚至比通向国内任何城市的航班都多，这为双方经贸合作的不断扩大奠定了基础。 2.3环境的相似性及文化的相融性山东在自然地理、文化历史、社会心理等文化背景方面都有与韩国的相通、相融性。山东大部分地区气候温和、四季分明，特别是青岛、烟台、威海、日照的气候环境与韩国极其相似。山东与韩国在历史文化、生活习俗上具有许多相近之处。山东省与韩国历史上曾经有过长期的民间友好交往，经贸往来频繁，生活习俗、文化信仰等有许多相同之处。文化传统的相通，使贸易双方更容易沟通。这是与日韩进行经贸合作的潜在优势。 2.4双方的外部环境有较大改善，为扩大经贸合作提供了重要条件国际局势走向缓和，这对于韩国与山东省在新形势下发展经贸合作是重要的积极因素。随着世界经济区域集团化趋势的不断发展，东北亚地区有关国家日益重视区域性的经贸合作，东北亚地区中的各种经济圈，如“环日本海经济圈”、“环黄海经济圈”、“环渤海经济圈”等设想接连出台。而韩国和山东省同属于环黄海和环渤海经济圈，并在这两大经济圈中处于十分重要的地位，随着时间的推移，必将进一步带动韩国与山东省经贸合作的深入开展。 2.5中韩两国的政治、经济关系发展顺利，为扩大鲁韩经贸合作提供了保障中韩两国建交以来，往来越来越频繁。中韩两国政府先后签署了“科学技术合作协定”、“贸易协定”、“海运协定”等合作协议，并成立了“产业合作委员会”。目前，双方已在汽车、民用飞机、原子能等多个领域的合作上达成协议，双边经贸合作已进入了产业合作的新阶段。随着中韩政治、经济关系的顺利发展，山东省与韩国的合作交流不断扩大。所有这些，都为今后扩大山东省与韩国的经贸合作提供了保障和方便条件。 3鲁韩博弈的理想状态与必然选择－合作与双赢 3.1合作博弈与非合作博弈博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。在博弈模型中，根据局中人是否合作，博弈可分为合作博弈与非合作博弈。这是博弈论中最基本的一个分类，二者的根本区别在于博弈方的行为相互作用时，能否达成一个具有约束力的协议。如果能，就是合作博弈，否则，就是非合作博弈。非合作博弈是建立在“个体理性”(个体利益最大化)基础之上的，而合作博弈则是建立在“集体理性”(集体利益最大化)基础之上的。目前非合作博弈的成熟程度大大高于合作博弈，是博弈论的主流。但事实上，合作博弈同样是非常重要的博弈理论。因为，虽然从长期来看，合作是有条件和暂时的，但毕竟是普遍存在的一种经济活动行为；另外，从博弈的角度来看，非合作博弈强调的是个人理性，个人最优决策，其结果往往是低效率的甚至是无效率的；合作博弈强调的是团体理性、效率、公正、公平，合作博弈是一种“双赢”策略，它通常能获得较高的效率或效益。当非合作博弈呈无效率或低效率时，就说明了合作的可能性和必要性。 3.2合作—鲁韩双方博弈的必然要求在日趋激烈的竞争中，博弈双方有可能结成合作的同盟关系，这是一种“非零和博弈”，各参与方的收益之和为大于零的值。因此，通过合作博弈所能得到利益大于不合作所得到的利益，这正是战略联盟形成的基础。假设山东和韩国都有两种策略得以选择，积极的合作态度和消极的合作态度。如果韩国选择积极的合作态度而山东选择消极的合作态度，韩国预期将损失m个单位，山东将得到n个单位的预期收益(这里m>0， n>0)。在现实中可以理解为，韩国在山东投资后，山东没有积极地创造有利的投资环境，韩国对预期收益没有信心于是想退出，但由于退出壁垒造成了较大损失。山东却因此以低于市场价格的价格收购韩国那些固定资产而得益，但却只能是非重复博弈下的一次性得益，对鲁韩甚至是山东与其他国家和地区今后的贸易发展会产生极其不利的影响。而如果山东和韩国都选择积极的合作态度，双方均分合作的预期收益，各得预期收益为r个单位(r>0，为了简单起见，这里设合作双方均分合作的预期收益，按其它比例分配也可)。如果山东和韩国都选择消极的合作态度，双方的合作名存实亡。双方可能在名义上签订了许多合作项目，但实际上双方都没有付出努力使合作项目得到落实。从实际意义上讲，双方是不合作的，双方的收益都为零。如果韩国选择消极的合作态度而山东选择积极的合作态度，韩国可能将一些污染严重或面临着被淘汰的产业转移到山东，从而实现了自身产业结构的调整和产业的升级。山东却因接受了这些产业，环境受到了严重的污染，生态平衡遭到破坏，产业在市场上没有竞争力而遭受损失。韩国的预期收益为p个单位，山东的预期损失为q个单位(这里p>0， q>0)。并且我们假设r<n或r<p(如果r≥n且r≥p，我们会容易得出该无限次重复博弈的纳什均衡是山东和韩国都选择积极的合作态度)。鲁韩合作博弈的得益矩阵可以用下表来表示，其中第一个数字表示韩国的预期收益，第二个数字表示山东的预期收益。鲁韩合作博弈的得益矩阵韩国山东积极的合作态度消极的合作态度积极的合作态度 r，r -m，n 消极的合作态度 p，-q 0，0 如果双方的合作只进行一次，由于机会主义行为的存在，我们容易用重复剔除严格策略的方法来推得这个博弈的纳什均衡是山东和韩国都选择消极的合作态度，双方的收益都为0。但这个博弈是无限次重复博弈，博弈双方的积极合作是有可能建立并能持续进行的。假设在每次博弈结束之前，山东和韩国都有s的概率在下一阶段选择积极的合作态度，而且每次博弈的结果都不变。在给定韩国没有首先选择消极的合作态度并坚持触发策略(如果山东在博弈的某阶段选择了消极的合作态度，韩国将在随后的各阶段都选择消极的合作态度)的条件下，只要满足s大于一定的阈值，山东就没有积极性选择消极的合作态度。也就是说合作双方都选择积极的合作态度，合作得以持续进行。相似的，容易得出在给定山东没有首先选择消极的合作态度并坚持触发策略的条件下，只要s满足上述条件，韩国也没有积极性选择消极的合作态度，双方的合作同样能持续进行。因此，在以上给定的约束条件下，当s足够大时，合作的双方都没有积极性选择消极的合作态度。也就是说双方都以积极的合作态度参与合作，合作得以持续进行。这里我们定义u是山东和韩国都采取积极合作态度的门槛值。所以只有当双方在下一博弈阶段选择积极的合作态度的概率s>u时，鲁韩合作才会持续下去。合作预期收益r的值越大，合作门槛值s就越低。换句话说，当合作的预期收益r足够大时，博弈双方都会选择积极的合作态度。 3.3结论合作形成的必要条件是合作方之间的经济互补性，而充分条件是合作方能够通过有效磋商，协调彼此间的利益分配并最终达成有约束力的利益分配协议，约束彼此的经济行为。满足这些条件的经济合作一定会给各成员带来大于不合作时所能获得的利益。并且任何破坏合作的行为都会导致其收益下降，也即只有真诚地与所有合作者合作，才能获得更大的收益。对这样的区域经济合作，虽然各方都想通过有效磋商使自己的获益尽可能的多，表现出在利益分配上的冲突，但至少存在一种使各方均能接受的利益分配方案。只有双方都采取积极的合作态度才会有无限次重复博弈的出现。因此，通过合作博弈所能得到的利益大于不合作所得到的利益，这正是合作博弈的魅力之所在。足够大的预期收益是鲁韩贸易合作得以维持的条件。预期收益越大，鲁韩双方选择消极态度的可能性就越小。具有良好的合作基础是鲁韩经贸合作取得较大的预期收益的必备条件。但是，预期合作收益高的项目毕竟是有限的，因此，创造良好的投资环境来提高合作的预期收益才是合作得以持续的内在动力机制。对于山东来说，合作的重要目标是接受韩国的产业转移、吸引韩国企业家到山东投资、引进韩国先进的管理和技术等来发展山东经济。因此，为了达到这个目标，山东要采取积极的措施，创造良好的投资环境，提高合作的预期收益，以促进鲁韩的经贸合作持续发展。 4

博弈论论文范文5

针对噪声交易下证券交易者的博弈学习与演化方面的研究，国内外针对性强且严谨的文献较少，但对于噪声交易下证券交易者的博弈学习与演化的研究却非常必要，国内外目前相关研究主要集中在两个主要方面: 一是噪声交易者成因与生存机制研究，二是证券交易者交易行为的学习与进化研究。1．有关噪声交易者成因与生存机制研究噪声的概念最早由著名的金融学家 Black 在1986 年正式提出的，他认为噪声既是证券市场赖以生存的基础，也给证券市场带来了一定程度的摩擦，使资产价格时常偏离其真实价值，是交易者行为风险产生、价格与价值偏离的内在因素。正是噪声交易的双刃性，才使得现有市场的证券价格不断围绕价值波动，价格最终回归价值。从一定时期来看，噪声交易者可能主导整个市场，从而使市场效率消失，噪声交易者将获得比理易者较高的收益。但是，整个过程中，噪声交易者也将会不断遇到理易者的抗衡与制约，使资产价格接近于基础价值，并在这一过程中，噪声交易者会遭受损失，理易者则从中获利，最终致使价格趋于价值，噪声交易者被市场淘汰［1］［2］。而事实上，Black［3］; Delong、Shleifer、Summers 和Waldmann［4］; Froot，Scharfstein，Stein; Hirshleifer，Luo［5］; Scruggs［6］; Rahul Verma 和 Priti Verma( 2007) 等学者研究均说明，噪声交易者并非完全被市场淘汰，在一定时限内噪声交易者会与理易者一同生存下来。特别是 Delong、Shleifer、Summers 和 Waldmann 通过系列的研究，构架了噪声交易理论的基本模型框架，并在“Noise traderrisk in financial markets”一文中构建了噪声交易者风险模型，成为噪声交易理论研究中的经典之作，对噪声交易者风险进行了很好的刻画，对噪声交易者的生存机制及有限套利行为进行了深入研究。随后，我国学者王闻［8］; 胡俞越和高扬［9］; 张建伟［10］; 陈很荣和吴冲锋［11］; 杨胜刚和刘昊拓［12］; 杨胜刚和卢向前［13］; 李晓渝、苟宇; 苏冬蔚［14］; 张乐、李好好［15］等从不同角度，利用不同研究方法对噪声交易的内涵与外延结合我国市场进行了深入剖析，均从不同侧面证实了我国证券市场噪声交易者与国外市场噪声交易者拥有极其相似的生存机制。2．证券交易者交易行为的学习与进化研究20 世纪 90 年代以来，在 Binmore、Fudenberg、Young 等经济学家的直接推动和不懈努力下，博弈学习与演进理论获得了迅速发展，并成为当今经济学领域最富有挑战的研究方向之一。我国学者张道宏、张贺［16］运用进化博弈理论，构造证券交易者进化博弈模型，模拟市场中理易者与噪声交易者相互转换的过程，揭示了二者之间存在动态均衡，而且这种均衡受到交易者对证券收益的预期与噪声交易风险的影响。同时，证明了噪声交易行为是长期存在的。孟卫东、王永平［17］应用进化博弈方法，建立了开放市场条件下证券交易者交易行为演化的进化博弈模型，认为由于交易者策略行为的互补性，造成进化系统的路径选择和均衡点不是唯一的，而是具有存在多重均衡的特征。孙永征、孙经先和刘亮［18］根据股票市场交易者行为与蚁群觅食行为的相似性，建立了基于混合行为蚁群算法的股票市场投资行为演化模型，研究了“熊市”与“牛市”时不同交易者行为与市场稳定性的关系，并利用 Matlab 进行了模拟，证明了交易者行为与股票价格及市场稳定性之间存在复杂的关系。国内外专家学者从各个方面、各个角度对噪声交易成因、生存机制及现有市场交易者行为学习与演化进行了基础理论研究，为金融理论的不断完善和发展做出了贡献。但是，现有对噪声交易者生存机制的研究基本都限制在一定时限之内，而对噪声交易者长期生存的机制研究不够深入。同时，对证券市场交易者交易行为的大多研究还仅集中在交易者交易行为特征的静态分析与有限阶段或时限内，对交易者重复博弈行为的学习与路径演化研究不足。本文将在上述理论研究的基础上，利用演化博弈学习与演化理论和思想，通过构建噪声交易下证券交易者博弈学习与演化模型，研究长时期内噪声交易者以及其他交易者的学习与演化过程与路径特征，为以后更深入地研究交易者交易行为及其变动规律提供了新的思路，为保护交易者权益、促进证券市场的稳定健康发展提供理论依据。

二、证券交易者策略选择的演化博弈

模型经济学中的博弈演化是以有限理性为基础，突破了经典博弈论的理性假设的局限，从有限理性的个体出发，以群体为研究对象。它把既考虑个体之间的模仿、学习和突变等动态过程，更强调系统达到均衡的动态调整过程与路径，对研究证券市场中有限理易者的行为学习与演化具有很好的解释力和应用价值。

1．模型前提假设假设 1: 假定在证券市场上只存在两类交易群体，分别是理易者和噪声交易者，一般也称理易者为信息交易者，用 i 表示; 噪声交易者也称非理性的交易者，用 n 表示。同时，假设理易者与噪声交易者在市场中所占的比例分别为1 － x 和 x;假设 2: 假定证券市场上存在两种资产: 一种是无风险资产，它具有完全弹性的供给; 另一种是风险资产 u，它不具有完全弹性的供给，t 时期其价格为 pt。资产 s 真实回报率为 r 的利率支付，资产 u 拥有真实回报率为 π 的股利支付;假设 3: 假定在交易者所拥有信息集上，交易者追求效用最大化，且所有交易者都表现出完全的绝对风险厌恶，其关于财富 w 的效用函数为:U = － e－γw( 1)其中，γ 为交易者对风险的绝对规避程度，即绝对风险厌恶系数，γ  0，γ =U″( w)U'( w)，;假设 4: 假定理易者在 t 时刻以真实信息为基础，准确地知道其持有的风险资产所带来的收益分布。而噪声交易者由于其理性的有限性，会受到噪声或表面看似信息的伪信号影响。假定噪声交易者因为伪信号、认知偏差、情绪及心理行为等其他因素影响，在 t 时期对风险资产存在一个定价错觉 ρt，这种定价错觉偏离正确定价的程度服从独立正态分布 N( ρ*，δ2ρ) ，其中 ρ*为交易者情绪指数，表示噪声交易者的群体情绪水平。ρ*＞ 0 表示噪声交易者对自己的预测持自信态度;ρ* 0 表示噪声交易者对自己的预测持疑虑态度; ρt的大小与噪声交易者的认知水平 α 负相关、与市场中的噪声程度 θ 正相关、与交易者情绪指数 ρ*正相关;假设 5: 假定证券市场上存在两类风险，一种是噪声交易引起的市场交易者行为风险tδ2pt +1，也即交易者心理行为、情绪等导致的价格认知错误与市场波动等所形成的风险; 一种是由基本面等引起的固有的系统性风险 β，β 中不含噪声错误预期 ρt;假设 6: 假定证券市场上交易者对单位风险资产的需求小于供给时，噪声交易者的需求是关于理易者需求与交易者情绪指数的单调递增函数; 当交易者对单位风险资产的需求大于供给时，理易者的需求是关于噪声交易者需求与交易者情绪指数的凹函数。

2．证券交易者风险决策模型在上述假设条件下，当市场风险资产的收益为正态分布时，理易者的效益函数为:E( U) = C0+ λit［πt +1+tpt +1－ pt( 1 + r) ］－ γ( λit)2(tδ2pi +1) － γβ( λit)2( 2)噪声交易者的效用函数为:E( U) = C0+ λnt［πt +1+tpt +1－ pt( 1 + r) ］－ γ( λnt)2(tδ2pt +1) + λntρt－ γβ( λnt)2( 3)其中，C0为无风险投资固定收入; λιτ，λnt分别为理易者与噪声交易者所选择的单位风险资产数量;tpt +1，tδ2pt +1分别是交易者在 t 时期对风险资产的基本价格与方差的理性预期。因此，由( 2) 、( 3) 式可得到理易者与噪声交易者最优的风险决策为:λit=πt +1+tpt +1－ pt( 1 + r)2γ［(tδ2pt +1+ β］( 4) λnt=πt +1+tpt +1－ pt( 1 + r) + ρt2γ［(tδ2pt +1) + β］( 5)从( 4) 、( 5) 式可以发现，噪声交易者在持有风险资产决策中，其持有风险资产的数量比理易者多出对预期收益的错误认知 ρt项。当噪声交易者过高( 或过低) 估计预期收益时，就会需求持有更多( 或更少) 的风险资产。在证券市场上，市场的风格并不是保持平稳不变的，交易者对风险资产的需求并不能总是保持平衡，即供求平衡。一般来说，在牛市中需求往往大于供给; 在熊市中，需求往往小于供给。因此，当市场对单位风险资产的需求小于供给时，即( 1－ x) λit+ xλnt＜ 1 时，根据模型前提假设可以设:λnt= f( ρ*，λit) ( 6)其中，λntρ*＞ 0，λntλit＞ 0。当市场对单位风险资产的需求大于供给时，即( 1 － x) λit+ xλnt＞ 1时，根据模型前提假设可以设:λit= g( ρ*，λnt) ( 7)其中，gnρ*( ρ*，λnt) ＜ 0，gnλnt( ρ*，λnt) ＜ 0。即，理易者持有风险资产的单位数量是关于噪声交易者情绪指数水平与噪声交易者持有单位风险资产数量的凹函数。由于我国现有的市场并非完全有效，套利行为受到噪声交易者的行为所制约，理易者实现套利的方式就会根据噪声交易者持有风险资产数量及噪声交易群体的情绪指数水平来进行套利行为，实现有限套利效用最大化。这种行为在牛市中表现比较明显，也是理易者获取高额利润的潜在因素。当证券市场上供求平衡时，( 1 － x) λit+ xλnt= 1。因此，假设( 1 － x) λit+ xλnt= ，其中代表市场风格，＜ 1 表示市场为熊市发展风格，＞ 1 表示市场为牛市发展风格， = 1 表示市场为平稳发展的风格。则 t 时刻风险资产的均衡价格为:pt=πt +1+tpi +1+ xntρt－ 2γ［(tδ2pt +1) + β］1 + r( 8)因此，噪声交易者和理易者总收益的差异是持有的风险资产数量上的差异和每单位风险资产预期收益的乘积再加上理易成本，即:ΔUt= ( λnt－ λit) ［πt +1+tpt +1－ pt( 1 + r) ］+ ct( 9)即:ΔUt= ρt－xntρ2t2γ［(tδ2pt +1) + β］+ ct( 10)又因为tδ2pt +1= E［tpt +1－ E(tpt +1) ］2，结合( 8) 式可得:tδ2pt +1=( xnt)2δ2p( 1 + r)2( 11)从而证券交易者风险决策函数:E( ΔUt) = δρ*－xnt［( ρ*)2+ δ2ρ］2γ［( xnt)2δ2ρ( 1 + r)2+ β］+ ct( 12)其中，xnt为 t 时刻噪声交易者所占市场比例。( 12) 式右边第一项表现为所谓的“持多效应”。当 ρ*＞ 0 时，噪声交易者可以通过持有更多风险资产来获得更多的收益; 当 ρ*＜ 0 时，可以肯定噪声交易者无法获得比理易者更多的预期收益。同时，也反映了市场风格的“心理效应”，当＞ 1 时市场处于牛市风格，交易者持多效应更加明显，理性套利机会会大大减小; 当 1时市场处于熊市风格，交易者持多效应被消弱，噪声交易者获利机会会大大减小。右边第二项反映了“价格压力效应”和“Friedman 效应”，同时还反映了噪声交易者“创造空间效应”。

3．交易者风险决策策略选择的学习与演化模型演化博弈理论在方法论上既不同于博弈论将重点放在静态均衡和比较静态均衡上，也不同于早期的演化经济学忽视静态均衡分析的意义而流于动态的不可知论，演化博弈理论认为在一个系统中存在许多参与者，博弈参与者是有限理性的，不可能准确地知道自己所处的利害状态，它通过最有利的战略逐渐模仿下去，而最终达到一种均衡状态［19］，演化博弈理论也正是从有限理性的个体出发，以群体为研究对象，从优胜劣汰的进化论观点来研究群体的调整过程，采用从群体到个体的局部动态法分析市场参与者的行为［20］［21］。在演化博弈论中，最核心的概念是“演化稳定策略”( Evolutionary Stable Strategy，ESS) 和“模仿者动态”( Replicator Dynamics) 。ESS 表示一个种群抵抗变异策略侵入的一种稳定状态，而模仿者动态是描述某一特定策略在一个种群被采用的频率或频度的动态微分方程。根据演化博弈论原理，如果一个战略的增长率就等于它的相对适应性，那么只要一个战略的适应性比群体的平均适应性高，这个战略就会发展( Hofbauera ＆ Sandholmb，2007) 。

三、证券交易者策略选择的博弈学习与演化路径影响因素分析

在系统种群的学习与博弈演化过程中，系统种群的博弈学习与演化是长期的、持续的，而不是短暂的、固定不变的，其均衡状态并不是总收敛于最优的均衡状态，也不存在长期不变的稳定均衡策略。但是，系统种群以何种方式沿着哪一路径演化，这不仅与博弈双方的效用有关，也与交易者群体的财富水平、证券市场的风格、系统种群的初始状态、证券交易成本、证券市场固有的系统风险等因素有关。同时，各个因素变量的变化也会影响着系统种群演化的路径和最终的均衡状态。( 1) 系统种群的财富水平与种群的绝对风险规避心理。交易者初始财富水平将严格影响着交易者的风险规避心理，特别是种群的整体财富水平。当 xnl，xnh均存在时，有xnlγ＞ 0，xnhγ＜ 0，即随着 γ 的增加，xnl将增加，xnh将减小。在一般情况下，在路径( Ⅲ) 中，风险规避系数的增加系统将最终收敛于，此时噪声交易种群的比例也会增加; 在( Ⅳ) 中，风险规避系数的增加会使系统收敛于概率减小，而收敛于完全噪声交易的概率增加，而且收敛于 xnl时，噪声交易种群的比例会增加。事实上，财富的初始水平越高，交易者风险规避的程度越小，初始财富水平越低，其风险规避程度越大。因此，系统的博弈学习与演化动态均衡及路径选择主要取决于种群初始财富水平。( 2) 基本面风险 β，也即证券市场固有的系统性风险。由于证券交易者具有绝对风险规避心理，特别是理易者，其对市场上的风险反映比较敏感，对风险规避心理比较强烈，造成风险规避损失较为严重。Palomino( 1996) 研究发现，相对于理易者本身，恶性的噪声交易者更能伤害他，致使造成严重的风险规避损失。因此，但噪声交易种群较为乐观且基本面风险较大时，从长远来看，噪声交易种群将会在市场中占统治地位。( 3) 噪声交易种群的情绪水平指数 ρ*。由上面的分析可以知道，从长远来看，当情绪水平指数ρ*较低时，噪声交易将会逐渐被市场淘汰，市场将渐近趋于理易; 当情绪水平指数 ρ*过大时，交易者会过度乐观估计风险资产预期收益，理易种群将在市场中占统治地位; 当情绪水平指数 ρ*适度时，噪声交易种群能够在市场中生存，并能一定程度上不断扩大，将在市场中占统治地位。因此，情绪水平指数 ρ*将决定着噪声交易种群的生存能力，影响着系统演化路径的选择。( 4) 噪声交易风险 δ2ρ。当 xnl，xnh均存在时，有xnlδ2ρ＞ 0，xnhδ2ρ＜ 0，即随着 δ2ρ的增加，xnl将增加，xnh将减小。在一般情况下，在路径( Ⅲ) 中，噪声交易风险的增加会促使系统收敛于 xnl，此时噪声交易种群的比例也会增加; 在( Ⅳ) 中，随着 δ2ρ的增加会使系统收敛于 xnl概率减小，而收敛于完全噪声交易的概率增加，而且收敛于 xnl时，噪声交易种群的比例会增加。因此，较大的噪声交易风险有利与噪声交易者的生存。这便为噪声交易种群创造了自己的生存空间提供了基础，也反映了为什么市场反复波动的潜在原因。( 5) 理易成本 ct。当 xnl，xnh均存在时，有xnlcl＞ 0，xnhct＜ 0，即随着 ct的增加，将 xnl增加，xnh将减小。在一般情况下，在路径( Ⅲ) 中，理易成本 ct增加会促使系统收敛于 xnl，此时噪声交易种群的比例也会增加; 在( Ⅳ) 中，随着 ct的增加会使系统收敛于 xnl概率减小，而收敛于完全噪声交易的概率增加，而且收敛于 xnl时，噪声交易种群的比例会增加。因此，cl的存在限制了噪声交易向理易的回归，不利于市场的良性发展。( 6) 市场风格。当 xnl，xnh均存在时，有xnl＞0，xnh＜ 0，即随着的增加，xnl将增加，xnh将减小。在一般情况下，在路径( Ⅲ) 中，市场风格的转换会促使系统收敛于 xnl，此时噪声交易种群的比例也会增加; 在( Ⅳ) 中，随着市场风格的转换会使系统收敛于 xnl概率减小，而收敛于 xnl完全噪声交易的概率增加，而且收敛于时，噪声交易种群的比例会增加。因此，市场风格影响着证券市场交易者学习与演化路径的选择和演化方式。

四、结论

博弈论论文范文6

论文关键词：创新网络；协作与竞争；博弈分析

1引言

区域创新网络(regionalinnovationnetwork)是近几年来理论界、实业界和政府部门共同关注的热点，这与社会经济发展的时代背景直接相关。在这一时期，地方化特征明显加强，资源更加集中于那些具有良好创新环境的地区，学习与创新成为带动区域经济发展的重要力量。为保持区域的独特性和竞争优势，人们更加重视挖掘区域特色的知识和技能；为提高区域竞争力和创新能力，人们更加重视营造根植于地区特色的区域创新网络而竞争与合作又是企业创新的重要形式，在日益激烈和复杂的竞争环境中，众多企业和机构之间形成一种既竞争又合作的网络关系和创新氛围是创新本身的需要，也是网络式创新的一个显著特点。

区域创新网络是在区域创新系统的基础上提出来的。目前国内外的学者对于区域创新网络的定义大致可以归纳为以下三个阶段：(1)系统性创新的基本制度安排；(2)构建学习型区域进而推动创新的有效载体；(3)创新主体相互依存的集体学习环境。本文认为区域创新网络是指地方行为主体(企业、大学、科研院所、地方政府等组织及其个人)之间在长期正式或非正式的合作与交流关系的基础上所形成的相对稳定的系统区域创新网络的主要组成部分是某一专业领域内各种相关的企业，除此之外，创新网络还可纵向延伸到销售渠道和客户，横向延伸到提供互补品的供应商。尤其重要的是，区域创新网络还必须包括政府和其他机构．如大学(研究机构)、各种中介服务机构等，也就是说，区域创新网络实际上是由许多相互关联的企业以及各种机构听组成的区域共同体。

作为一种新兴的创新组织模式，区域创新网络具有开放性、合作性、创新性、相互依存性等特性。综合现有的文献来肴．大多数文献都在集中讨论区域创新网络的实质及功能、区域创新网络的构建及创新网络的绩效分析等。这些文献都从外部对创新网络进行研究，而针对创新网络内部企业与企业之奄"何合作、如何竞争及协作需要满足的策略等问题，较少有人研究，本文主要对创新网络内部企业之问如何合作与亳争进干亍研究，并建立博弈模型．找出企业协作创新的条件。

2博弈的基本模型

在区域西网络中有很多同质企业、关联企业和中介机构，合作关系可以发生在两个企业之间，也可能发生在多个企业之间，还可能是大学或科研机构之问。为了研究问题的方便，我们简化为两个企业的关系。网络内部各主体之问的协作与竞争是一个动态的过程，电是一种不断的选择过程，而在这些过程中存在两种基本状态——合作与不合作。

2．1博弈基本假设

假设1：假设企业A和企业B进行合作创新，每一次合作的总投入为I(包括人力、物力、财力及技术资源等要素投入，均用货币进行折算)；其中企业A投入的所占的份额为n，企业B投入的所占的份额为b，则a+b=1。

假设2：设企业A采取合作的概率为P，相应地采取自私行为的概率为1一P；企业B采取合作的概率为q，相喧地采取自私行为的概率为1一q。

假设3：如果合作双方相互信任．则企业采取合作行为．设企业合作创新的收益为，按投入比例分配．其收益R的大小与创新的合作效应系数(k>0)正相关；如果企业A、B都不互相信任，双方都采取自私行为，则认为没有任何合作，创新也就不会产生任何收益，此时双方的支付都为0；如果企业A合作，企业B不合作．可以认为企业A的投入完全被企业B获得，并导致今后不再合作，反之亦然。

假设4：设企业A．B之问的合作是受一种正反馈激励，用表示，合作的次数越多，合作就越默契。合作受到的激励具有累积性，存在一种时问传导的正向共同运动(PositiveCo—movement)，每一次合作的成功都会原来的基础上受到一次正的激励越大，合作效果就越好，收益就越大。

2．2构建支付距阵

根据以上假设，可以构造出企业A、B在第n(n为合作次数)次合作创新时的支付矩阵，见图1

下面从自然角度进一步分析企业A的行为及支付，有四种情况：

第一种情况，当企业A与企业B均合作时，企业A的支付矩阵为其投入比例所得的收益份额。

第二种情况，当企业A合作、企业B不合作时，企业A的支付矩阵为0。

第三种情况，当企业A自私，企业B合作时，企业A的支付矩阵为企业B投入的损失。

第四种情况，企业A，B均不合作时，企业A的支付为0。

3基于博弈模型的合作创新条件分析

下面分别讨论企业A和企业B选择合作时应该满足的条件。

3．1企业A合作创新条件分析

从企业A的角度考查支付函数，此时企业A对自己的行为具有完全信息，而对企业B有不完全信息。企业A是选择合作还是不合作，关键就在于它选择合作时(P=1)的期望支付与选择不合作时(P=0)期望支付之差的大小。显然，

由此可以看出企业A选择合作的条件为，根据式(5)，必满足：

分析式(6)可以得出：

第一，当一定时，如果k较大，n可以相对较小；如果k较小，则要求。相对大。由此得出企业A选择合作的第一个条件：当创新的合作效益比较大，即预期的创新收益比较大时，企业A即使在创新过程中主动性(指该企业所占投入比例的大小和按投入比例分配所得到的相应创新收益比例的大小，下同)较小，也愿意采取合作行为；当创新合作效益较小时，在创新过程中只有企业A的主动性较大时，它才愿意采取合作。

第二，当k一定时，如果比较大，a可以相对较小；如果较小，则要求a相对较大。可以得出第二个合作条件：当合作次数较多，建立一种信任关系以后，即使在创新过程中企业A的主动性较小，它也愿意合作；当合作次数减少时，企业之间还没有相互了解，缺乏信任时，在创新过程中只有企业A的支配性较大时，它才愿意选择合作。

3．2企业A、B共同合作策略分析

从企业B的角度分析。从理论上来讲，对局企业B的博弈行为与企业A的博弈行为在相同策略环境下的理性选择方式相同，因此，如同推导式(6)一样，同理可得企业B愿意合作的条件：

所以，企业A、企业B同时愿意合作的条件为:

从图3可以看出，在a+b=1的直线上，区间[D，E]为A、B两对局企业同时选择合作时的条件区间。[D，E]区间的长短与相关，越大，则越小，而[D，E]区间将越大。另一方面，D、E都沿直线a+b=1向对方延伸，显然有图解可以证明，只有在a=b=1／2时，即在点，当两个企业对等投入、对等承担风险和对等风向创新收益时，双方才最有长期或重复合作的愿望。由此，我们得出第三个合作条件：对等投入有利于合作。

另外，我们将式(5)对q求偏导数可得：

式(9)表明，是q的增函数。我们可得第四个合作条件：企业A的合作愿望随着对局企业B采取合作行为的慨率q增大而增加。由此，可以看出企业A、B之间的信任度越高，他们之问的合作就越稳定。

4结论与建议

区域创新网络中企业的创新行为实际上是行为主体的动态策略过程，各行为主体基于追求自己的利益的目的，贡献各自的创新资源而协作创新。根据前面的分析，认为应从以下几个方面来促进网络合作创新：

4．1提高预期的合作效应

预期的合作效应系数k越大，网络中的企业合作愿望就越强。因此，可以提高k值来改变企业间的合作态度。提高预期的合作效应系数有以下途径：一是改进合作方式，二是改善合作的结构，三是重视合作过程中的沟通，四是加强合作过程的管理。

4．2增加信任，提高合作次数

信任是一种新的创造财富的“社会资本”。通过信任可以降低网络内企业的交易成本，为企业合作创新提供动力。创新主体合作次数n越大，企业之间就越能够相互了解、相互信任，从而形成一种默契，减少了策略的不确定性，进而逐步建立稳定、长期的合作伙伴关系。

4．3提高合作的积极性，即增大激励因子

激励因子越大，企业越有合作愿望。我们应该从加强合作双方信息交流、建立公平机制、培育良好的合作环境等方面提高值。创网络中企业通过各种正式与非正式的方式进行交流，从而实现知识的流动，而这种信息的互动对技术创新尤为重要。

博弈论论文范例6篇

博弈论论文范文1

博弈论论文范文2

博弈论论文范文3

博弈论论文范文4

博弈论论文范文5

博弈论论文范文6

相关文章

相关论文

相关精选

相关期刊

玻璃艺术

船舶经济贸易

现代产业经济

今商圈