理性与感性的博弈范例6篇

理性与感性的博弈范文1

科学发展观的正理是精神与物质之间的博弈

人们对于情感只能粗略地分成两块:一块是精神,一块是感情。目前,人们还没有能力直接创建这种情感,只有根据以人为本,让精神利用人体携带的信息与外界沟通。科学发展观提倡建设精神文明和物质文明,正是在一个大国崛起之时,对文化进行更精准透彻的思考。如果放弃精神,社会就会变得贫乏。人们只要满足基本生存条件之后,就会将精神扩充到物质上来。

精神文明和物质文明像一根琴弦,琴弦上不同节段有不同的空间节律。主题瘾魂——人的精神——情感文化——物质文明,这是一个社会文化三节律。精神文明的力量是来自主体瘾魂的动量,主体的欲望感觉到的文明,都是琴弦三节律性的文明。《博弈圣经》上说:“感情是依赖,是瘾魂驱动欲望过程中的殷勤创作。”感情与精神是瘾魂的动态信息,能动的智慧功能是构成整体科学文化的开端,也是人与自然的能动功能,它会创造物质文明。物质是局部的科学基础,也是构成科技商品反应出价值的优势效应。所以,几百年来它构成了西方经济体系的基础,并且组成了西方的政治、经济、军事、文化、历史、国家等等。以上这些一旦形成一个博弈实体,任何人都会很自然地从周边向外扩张。人与物在场景中的三元实体结构(即精神与物质和第三空间的三元结构),是一种创新结构或二特性平行法则。以人为本对应的唯物主义是物的概念,也是实体的概念,这种人与物相比较的状态,是相信自我的主要原因。如果在这里追加无数的自我反映,有时觉得伟大,有时觉得渺小,这种复杂的情感和智力的文化在混沌的背景中,由于生物亲序的本性,会产生文明。《博弈圣经》对文明的解释:“文化进程里恩怨游戏的终结就是文明。”精神与物质之间用情感和利益创造了局部文明,人们把局部的文明奉为科学,把局部的利益奉为真理。

政治一旦形成了一个完整的博弈实体,就能够对人的精神和物质观念造成影响,其自身延续和社会持续发展会特别地稳定。人民安居乐业,大地物产丰美。一个和谐社会的依据就是稳定的博弈实体背景,它里面的各种关系合情合理地围绕着科学发展观的政治主题,所表现出来的真、善、美和高尚感,会促进和谐社会的发展。科学发展观主题的瘾魂对全民产生的精神影响一旦得到了传承,人人会得到博弈文明的教育,也会提升博弈文明的层级。确切地说,我们会把博弈的文明成果归为精神。自古以来,人的文明起源于神的教育,起源于的教育,起源于时代主题的教育。今日,我们接受的是科学发展观的教育,也是接受精神文明和物质文明弈正理的教育。在接受教育的过程中,不要用简单的矛盾论谈论精神文明和物质文明。人们不知道什么是博弈实体的结构,所以会错误地把博弈实体中的众多性质挑出来两个,让它们相互对立,就相当于错误地把资本主义和社会主义对立,再用粗略的矛盾论解释它,这样就会出现任何人都谈不清的悖论。

由于政治主题、精神和物质是三元实体结构,人们最终会引进国正论的哲学认识这个博弈实体,把它分为一大块一小块,这会引出许许多多博弈正理的概念。在科学发展观介绍中有一句话“第一,以人为本是历史唯物主义的一项基本原则。”应该改为“第一,以人为本对应的唯物主义才是一项博弈的基本原则。”科学发展观讲的以人为本对应的唯物主义才是一个完整的博弈结构。那么,这个结构的标准是什么呢?怎样确定里面的正理呢?其实,这里的标准就是博弈实体知识论,它可以用国正论区分出实体与性质。科学发展观的经济学本质,就是要给人的行为定性,区分出输赢与均衡,找到博弈正理。

(正理:在博弈中的终极真相是无法从生物特性得到的,留出了唯一的出路就是引进一种方法,并用一种策略行为与初择样本的直觉进行对抗,用定性分解找出它的最小单元,看清粒子行为的内部结构,建立决策粒子二特性对局,这是唯一成功通向破解奥秘的理论。)

其实,寻找博弈正理的方法早已存在于人类的各种文明之中,人们没有意识到它在文化进程中一直悄悄地进行着,我们今天突然明白它,也许就像认识古代神秘的文明一样,非常神奇。

假如你想预见这个时代对我们自己的影响,应该从学习实践科学发展观这个伟大的命题开始。

——摘自 人民网 《科学发展观在博弈世界中运动》

理性与感性的博弈范文2

关键词:博弈人;社会交往;生活世界;最优化;共同理念

管理总伴随着人性假设,因此,人性假设从理性经济人到社会人;从社会人到自我实现人再到复杂人,管理随之不断发生根本性变化。在社会交往日益复杂的形式下,管理也发生了根本性变化,其根据是人性假设的新变化:“博弈人”。

一、博弈人是社会交往与市场经济相互作用的产物

博弈人的形成因素很复杂,总归有二:一是社会交往的复杂化;二是市场经济的竞争性和微观领域的组织化。

1.社会交往复杂化

随着社会经济、政治的进步,社会交往日趋复杂,主要原因是:

(1)生活世界的复杂多变,决定了交往的复杂性。“生活世界是交往行为得以落实的基础,是交往行为得以进行的界面。”当今时代,人处于各种各样的关系中,生活世界千变万化。从内容上看交往复杂表现为:交往不仅是人与人之间的行为交往,更多的是通过符号传递各种各样的信息、观念、态度、情感等,从而使得人生意义得以确立和丰富;从形式上看,交往形式也由以前的单一的生产交往发展为人际交往、群体交往、大众传媒交往以及内心交往等。

(2)交往主体的行为和心理多样化对社会交往产生了重大影响。我们知道,社会交往是人与人之间的交往,因而交往主体是人。而主体的行为和心理会因生活世界的变化而变化;同时各个交往主体由于其差异性和个体性而对生活世界变化反映出来的行为和心理也是多样的,这就造成了交往过程中的各种有利和不利因素的出现。

(3)交往主体信息不充分是社会交往复杂化的催化剂。有人会问:我们生活的世界充满了信息,现在是信息时代,怎么会有人的信息不充分的现象出现?原因有二:其一,信息时代并不意味着每个交往主体都能获取全部信息;其二,我们对当今时代的信息的认知已经预设了一个错误的前提:我们的通讯和所有的传播媒介所传递的信息是充分而且准确的。

2.市场经济的竞争性及其微观领域的强组织性,是“博弈人”形成的直接原因

市场经济本身具有的竞争性是“博弈”概念形成的经济根源。人们在市场经济中,为追求利益最大化,这就是博弈。每个市场参与者均会从自身的角度来计算自己的利益最大化。因为市场参与者就是“博弈人”。

二、博弈人的特点

在生活世界中社会交往和市场经济本身所固有的特性和规范而形成的博弈人,具有他自身的独特特点。

1.“博弈人”是理性追求最优化的市场参与者

博弈人具有最原始经济人特性,即,理性且追求利益为目标,以囚徒困境来加以解释,如下图:

囚徒困境图

对于这个囚徒困境博弈的传统解释是:“两博弈双方各自的利益不仅取决于他们自己的选择策略,而且也取决于对方的策略”。同时也认为-5,-5和-1,-1的结果是较佳的策略选择结果。然而,在这些古典的分析中,我们忘记了两个罪犯是合伙犯罪的。既然是合伙,就已经具有组织的特点,同时,两人都是有理性的,不可能在实施犯罪前没有对后果有所预测。因此,他们在实施犯罪行为前已经有了理性分析,结论就是组织的延伸。基于以上的分析,其实,-5,-5和-1,-1是最不好的结果,因为一旦如此,组织就得中断;而0,-8或-8,0则为最优结果:对个人来说,出来后还有发展生存的空间;对组织来说,能够继续延续下去而不会中断。以上是对囚徒困境的新的解释,其实就是在高度组织化的生活世界中,博弈人所考虑的博弈结果是最优化的,而且是组织结果最优化的。

2.博弈人具有强烈的共同组织理念或团队精神

我们在分析博弈人形成原因时就已经提到,微观领域的强组织性是博弈人形成的直接原因之一。因此,现代博弈人一产生就具有组织的共同的理念,并在这个共同理念的指引下充分发挥自己的创造性。这种共同理念作用于“它帮助组织培养成员主动而真诚地奉献和投入,而非被动地遵循”。

3.博弈人的需求是多层次的和个性化的

现代生活世界的发展,人已不再是单一需求的人,而是具有多层次的、个性化的博弈人。博弈人的需求层次是以自我发展为核心的一个体系。在这个体系中,博弈人的最终目标是不断地实现自我的发展;同时,我们也应考虑到,博弈人的需求体系的重点是随生活环境的变化而变动的。随着现代技术的发展,社会交往方式日益个性化和多样化,这也决定了博弈人需求的个性化。

三、博弈人的管理

由于博弈人的特点,要求我们在管理中针对其特点而采取合理的管理模式,更要求我们的管理者具有全面的素质。

1.博弈人的管理模式应符合博弈人的特点而采取动态的、个性化和塑造共同理念的管理

(1)结构要合理。管理结构必须反映出管理所使用的权力。这种权力结构是由职务安排来确定的,是随着职位的不同而变化。

(2)要形成团队合作精神或共同理念。共同理念是一个组织长久生存下去的灵魂,如同人的心脏。

(3)管理方式个性化和多样化。博弈人的需求是多层次和个性化的,这是由其在生活世界的多重角色及其特点所决定的。“一种文明之所以会停滞不前,并不是因为进一步发展的各种可能性已被完全试尽,而是因为人们根据其现有的知识成功地控制了其所有的行动及其当下的境势,以至于完全扼杀了促使新知识出现的机会。”

2.博弈人的管理,对于管理者的素质要求是相当高且全面的

面对由博弈人所组成的团队或组织,管理者本身也是博弈人之一。因此,管理活动就是管理者与其他博弈人之间的一种博弈。具有以下三个特点:一是一种权力不对等的博弈;二是一种信息不对称的博弈;三是多层次、多阶段的智能博弈。这就要求管理者要有相当高的素质,人文关怀是管理者必须具有的一种素质,它体现的是一种高尚的道德风范,是管理者在与其他博弈人博弈过程中的感化力量,是一种“软领导”充分发挥这种“软领导”的威力,将比采用强制手段更为有效。

管理活动的变更是随人性假设而变化的,因此,发展到今天的人性假设――博弈人,要求我们的管理活动有一个根本性的转变,用一句时下流行的成语来说就是要“与时俱进。”

参考文献:

[1]郭咸纲.多维博弈人性假设.广东经济出版社,2003:16,22-23.38-41.

[2]迈克尔・H,莱斯诺夫.20世纪的政治哲学家.冯克利,译.商务印书馆,2002.364.

[3]哈罗德・D拉斯韦尔.政治学.杨昌裕,译.商务印书馆,2003.20-21.

理性与感性的博弈范文3

【摘要】本文分别对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,主要讨论有关知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景。

【关键词】知识型员工 监管激励 演化博弈 研究综述

1 前言

随着全球化竞争和区域竞争的到来和加剧,如何提高企业的核心竞争力是关系到企业生存发展的关键。但是,就目前在对知识型员工的管理即如何监督、激励等过程中仍存在不少问题。正是基于此,我们选择“企业中知识型员工的监管激励演化博弈分析模型”作为研究方向,针对企业中的实际情况,在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,对知识型员工的激励机制进行研究;在此基础上,设计可行的激励机制,激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定激励政策提供理论依据和决策参考。

2 知识型员工的定义和特征

2.1 知识型员工的定义

管理大师彼得·德鲁克首先提出知识型员工这一概念,即知识型员工是指那些掌握和运用符号和概念、利用知识或信息工作的人。

概括来说:知识型员工是凭借自己所受教育,实用脑力劳动创造价值,与一般员工相比,具备较强的学习知识和创新知识的能力,拥有知识资本和创新能力,利用现代科学技术知识提高工作效率为企业带来知识资本增值,并以此为职业的脑力劳动者。

2.2 知识型员工的特征

(1)强烈的自我价值实现愿望,他们往往更加在意自身价值的实现,并强烈期望得到社会的认可,他们往往更加热衷于具有挑战性的工作,希望展示自我价值。

(2)对权威的蔑视性,知识型员工由于渴望展示自己的价值,往往表现出权威的蔑视。

(3)具有高度的独立性。由于知识型员工拥有丰富的知识资本,因此往往主观上不愿受制于人。他们更强调自我控制、自我管理、自我引导和自我发展。

(4)学习愿望强烈,富于创造精神。他们喜欢做前沿性、挑战性的研究,在易变不完全确定的系统中发挥个人的资质和潜力,创新是他们体现自我价值的方式。

3 关于知识型员工监管激励的研究状况

3.1 国外知识型员工监管激励的研究状况

美国著名的管理学家彼得·德鲁克(2001)提出了知识工作的概念:知识型员工是指“那些掌握和运用符号和概念,利用知识或信息工作的人”。知识型员工一方面能充分利用现代科学技术知识提高工作效率,另一方面知识型员工本身具有较强的学习知识和创新知识能力。知识创新能力是知识型员工最主要的特点。此外,知识型员工的工作主要是一种思维活动,知识的更新和发展往往随环境条件的变化而有所适应,具有很大的灵活性。所以知识型员工兼具知识型、创造性、灵活性等方面的特征。加拿大的著名学者、加拿大优秀基金评选主审官弗朗西斯.赫瑞比(2000)认为:简而言之,知识型员工就是那些创造财富时用脑多于用手的人们。他们通过自己的创意、分析、判断、综合、设计给产品带来附加值。在西方发达资本主义国家,员工监管激励在管理界已经是一个相当古老的话题,早在十八世纪末,十九世纪出,企业界和管理界就对监管激励员工、提高劳动生产率进行广泛而深入的研究。

3.2 国内知识型员工监管激励的研究状况

国内学者张伶,张正堂(2008)认为虽然双因素理论和工作特性理论都说明与工作有关的内在激励因素对于员工行为重要的激励作用,但是,双因素理论因素中关于“激励因素”和“保健因素”的划分是模糊的,而不同学者对于工作特性唯独的划分也是模糊的,因此,他们基于知识型员工的特性分析,提出内在激励特性包括工作自、晋升机会、上级支持、人与组织匹配等4个方面,并建立了这些内在激励因素对知识员工工作态度、工作绩效影响关系的假设模型和以苏北地区企业的知识型员工为研究对象,通过实证检验发现,工作自、晋升机会、上级支持、感知的人与组织匹配通过工作满意度、组织承诺对工作绩效有正向显著影响。郝敏怀(2009)从如何培训开发、职业生涯规划和薪酬激励等方面针对企业专业技术人才这一典型的知识型员工的人才激励策略进行了探讨,同时认为按照马斯洛需求层次理论,为满足专业技术人员各个层面的需求还必须多种激励方式相结合,实现多渠道激励。余莉(2009)通过阐述激励的机制和基本理论,在分析研发人员个性特征和主导性需求的基础上,提出了针对研发人员的激励方法策略,其指出在物质激励中的薪酬激励的设计上,既要注重刚性工资的竞争性、成本性,更要突出激励性因素的作用,加大基于绩效的弹性工资力度,并且在这方面拉开差距。

3.3 对国内外知识型员工监管激励的评价

纵观国内外研究,我们可以看到目前对监管激励的研究主要是沿着监管激励的作用机理展开,在分析诸如专业技型员工,科技研发人员这些典型的知识型员工的特征的基础上,分析激励因素和激励过程,建立监管激励模型,监管激励模型基本上是在企业利润最大化和“经济人”的人性假设,以主客体的博弈研究各种监管激励机制。但目前对于监管激励模型的构建大多都是基于传统博弈论 ,传统博弈论假设行为主体都是具有完全理性即行为主体始终以自身最大利益为目标,具有各种环境中追求自身利益最大化的判断和决策能力,具有在存在交互作用的博弈环境中完美的判断和预测能力,不会发犯错,不会冲动,没有不理智。很显然,现实世界中这种假设通常是得不到保证的。同时,纵观国内外研究,我们发现,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工监管演化博弈机制尚不多见,因而本课题采用演化博弈论的方法,对行为主体采取有限理性的假设,即行为主体被假设为程序化地采用某一既定行为,他对于经济规律或某种成功的行为规则、行为策略的认识是在演化过程中得到不断地修正和改进的,成功的策略被模仿,进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下,行为主体获得“满意”的收益,这与现在情况更符合。因此,我们在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方面均具有有限理性的情况下,运用演化博弈的方法构建知识型员工监管的演化博弈模型,运用复制动态方程对企业和知识型员工的演化稳定策略进行分类讨论,找出政府、企业和知识型员工三群体类型比例变化复制动态关系,对如何有效监管和激励企业知识型员工提出对策和建议。

4 基于演化博弈论对知识型员工监管激励的研究思路

本课题将通过基于行为主体有限理性假设的演化博弈理论,打开对企业知识型员工监管激励的新思路。

4.1 演化博弈论基本理论的概述

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。

演化博弈论(evolutionary game theory)是近年来博弈理论的新发展,最初产生于生物学领域。它放弃了传统博弈论的充分理性假说,将生物体视为有限理性(bounded rational)的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成。随后,经济学家将之引入经济分析中,将人也视为有限理性的生物体,认为社会制度并非是人为设计的结果,而是大量有限理性的个人在相互博弈的基础上形成的一种适应环境变化和社会发展的均衡态,它们不断被保存下来,又不断向前进化,即在所谓适应性进化(adaptive evolution)的过程中产生并发展起来的。演化博弈论的产生、发展在本质上就是起因于博弈论中关于理人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。

4.2 基于演化博弈论方法的知识型员工监管激励的研究思路

纵观国内外的相关研究,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工的监管博弈机制研究尚不多见。正是基于此在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,构建知识型员工监管的演化博弈模型,运用演化博弈论的方法对相关职能部门、企业与知识型员工之间相互作用时的策略选择行为进行分析,对知识型员工的监管激励机制进行深入研究;在此基础上,设计可行的监管激励措施,从而能最大程度激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考。

5 结语

本文对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,在简要概述知识型员工的内涵及其特征的基础上,对知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景进行了探讨。特别需要强调的是,演化博弈理论摒弃了博弈论完全理性的假设,比博弈论能更好的解释和分析现实中的经济和管理问题,因此,期望通过对知识型员工监管的演化博弈模型的构建能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考,从而在对知识型员工的监管激励机制问题的研究上迈出更加深入的一步。

参考文献

[1] 弗朗西斯·赫瑞比:managing knowledge workers [m].机械工业出版社,2000.

[2] [美]约瑟夫m.普蒂.海茵茨.韦里奇.哈罗德·孔茨著.丁彗平、孙先锦译.管理学精要(亚洲篇) [m].机械出版社,2005:363.

[3] 斯蒂芬.p罗宾斯.组织行为学.中国人民大学出版社,1997:81-92.

[4] 余莉.研发人员个性特征与有效激励方法研究[j].中国钼业.2009.33(1).53-56.

[5] 胡恩华.刘洪.企业中知识型员工的监管博弈分析[j].工业技术经济.2005.24(4).53-55.[j].2009.23(1).10-13.

理性与感性的博弈范文4

[关键词]博弈论;认知无线电;频谱共享

中图分类号:TM743 文献标识码:A 文章编号:1009-914X(2015)22-0287-01

无线频谱是十分有限的资源,为了实现多种无线应用服务,频谱管理部门采用固定频谱接入方法排除了其他干扰因素,即将频谱分配给多个用户,让其单独应用,因此,只有经过授权的用户有资格使用频谱,对于大部分非授权用户而言,根本就无法应用频谱。通信技术的发展,使人们对无线频谱的需求量大量增加,由于可用频谱已经被完全分配,从而使频谱成为十分稀缺的资源。此外,由于频谱利用率比较低,大部分频谱都被白白浪费,由此可见,频谱短缺的问题除了资源少之外,还包括其较低的利用率。本文通过阐述认知无线电技术的现状,对其频谱共享问题进行分析。

一、认知无线电与频谱管理

认知无线电(CR)提出后,受到了人们的广泛关注。美国将认知无线电定义为能够随时根据无线环境变化,而发生动态改变、发射参数的无线电技术。因此,认知无线电可以密切感受附近环境的无线频谱状态,并且自动搜集利用率较低的频谱,按照相应的算法将其改变工作参数进行改变,以便适应外部环境的变化,使频谱的利用率得到提高。认知无线电通过接入空闲频谱(频谱空穴),能够对频谱合理进行利用,实现了DSA,具体如图1所示。

认知无线电技术能够在很大程度上提高频谱利用率,因而产生了认知无线电网络,其研究内容比较多,包括高层协议、网络社交,并成为了未来产业化研究的趋势。对认知无线电网络中的频谱管理进行进一步研究,可以使频谱资源得到更高效的应用。一般情况下,频谱管理的主要内容有频谱感知、判决、共享以及切换。

对于认知无线电的频谱共享问题,常选择基于图论的图着色的方法、基于注水算法以及基于博弈论的拍卖等方法。下文主要以博弈理论为前提,对认知无线电技术发展过程中存在的频谱共享问题进行分析。

二、认知无线电频谱共享

目前,存在很多动态频谱接入技术,分级接入模型和频谱管理政策是最兼容的,尤其是衬底式频谱共享可以机会式的使用空闲频谱,避免对网络用户造成影响。用经济学的方法分析频谱问题,可以提高空闲频谱共享的积极性,提高其利用率。博弈论方法能够更加清楚的分析认知无线电频谱共享问题,使其利用率最大化。

1.博弈论基本内容

博弈论的概念是有经济学中发展而来的,上世纪40年代后期,逐渐形成了合作博弈理论,通过对个体合作进行假设,对其最优策略进行分析。博弈论最初被应用在生物领域,之后逐渐发展为更多领域,包括工程学、社会科学以及计算机科学等,成为了分析个体之间合作、竞争性关系的十分有效的工具。传统博弈分析里边有一个基本假设条件,也就是参与者是完全理性的。一条信息P是共同知识,指群体G当中每个参与者都知道“P”,并且每个参与者都知道“每个参与者都知道‘P’”……不断循环。理性即参与者选择使自身效用最大化时的行动。在上述假设下,博弈的解便是参与者预测的结果。完全理性的接设条件在现实中很难满足,但博弈论的应用对象主要为计算机,因此可将其看做理性范围。

一般情况下,博弈类型主要为合作博弈、非合作博弈。非合作博弈是参与者根据效用函数选择的理智行动,每个参与者都需要利己,选择各自的策略。而非合作博弈的内容很多,可以应用在很多领域中。一个博弈之中,某个参与者的自身信息也许不被其他参与者知道,因此根据参与者彼此的了解程度可以将博弈分为两类,即不完全信息博弈、完全信息博弈。除此之外,一个博弈里边,参与者可能一起行动,也可能有顺序的行动,因此可以根据其行动次序分为动态博弈、静态博弈。静态博弈是参与者在不知道他人选择的情况下做出的策略决策,参与者完成决策后,表明博弈结束;动态博弈中,参与者难以获得参与者的全部信息,即为不完全信息动态博弈。

2.博弈论应用在频谱共享的可行性

因为频谱资源是十分有限的,但在通讯技术的发展下,人们对无线频谱的需求越来越大,而采用频谱共享技术解决这一供需矛盾,具有十分重要的意义。要想实现频谱共享问题,就要解决很多实际问题,比如网络基础设施差异、用户移动性及不同用户的行为等。在整个认知无线电系统中,网络授权系统和认知系统是共存的,每个系统中的用户都存在不同的行为,有些网络用户是互相协作的关系,在网络拓扑中能够完成传输任务,有些用户仅完成自己的通信任务,个别用户甚至肆意破坏别的用户的通信状况。只有系统分析网络用户的行为及相互作用,才能更好的实现频谱共享。博弈论主要研究彼此竞争或者合作的个体,和动态频谱共享问题的研究内容一样。可以采用博弈论分析频谱共享问题,并得到解决措施。结合认知无线电技术进行动态频谱共享时,博弈包括的要素主要有参与者、策略空间以及效用函数。

参与者是授权网络或者认知网络,也可以是两者的组成,根据参与者构成内容及数量,组成相应类型的博弈。因此,采用博弈论可以更好的解决认知无线电的频谱贸易问题。

三、性能仿真分析

1.参数设置

文章主要对重复库诺特频谱共享博弈模型进行分析。由主用户、次用户共享15MHz频谱的认知无线电环境,所有认知用户的目标BER均为,博弈动态模型为下列公式:

上述公式中,bi(t)是某个时刻t次用户i可以分到的频谱;ai是次用户i速度调整参数,ri是此用户i的收益,公式中则是此用户的传输速率;k是频谱密度效率,x与y都是非负常数,c大于等于1。主用户价格函数采用X=0,Y=1,c根据环境评估予以调整。主用户频谱价格w=1,则次用户收益ri=10。

2.仿真结果分析

由于信道质量存在较大差异,因此纳什均衡在不同点上,因为使用的是自适应调制技术,次用户能够在频谱一样的情况下,得到更好的传输速率及收益,对于次用户而言,要动态库诺特博弈中频谱共享轨迹能够说明次用户i速度参数为ai=az=0.14;在速度相同的参数下,纳什均衡点信道质量良好,能够使曲线出现更大变化。

图2是不同信道质量和稳定区域的关系,不同信道质量稳定范围在a1~a2上,若此范围的数值设置在此区域,可以确保频道共享的稳定性;若超出此范围,则说明共享不稳定,容易出现较大波动。

三、结语

认知无线电技术的发展,已经受到行业人士的广泛关注,其发展应用能够为通信技术做出重要贡献。进一步研究认知无线电技术,通过借助博弈论的相关内容,能够减少频谱资源有限带来的通信束缚,从而使无线通信技术得到更好的发展。

参考文献

理性与感性的博弈范文5

【关键词】 博弈论;慕课;教学应用;必要性;优势

一、博弈论教学

博弈论也称对策论,是研究在特定情境中互动决策问题的一门学科。著名的经济学家萨缪尔森说过,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”。

博弈论作为一门经济学专业重要的专业课,在各大高校经管类专业中都有开设,而且以专业必修课居多。而且博弈论的方法,在我们日常生活决策中有重要的应用。它教给我们一种理性思维去分析生活当中的事情。其实博弈论的思想在我们的生活当中已经广泛渗透。比如,小时候石头剪刀布的游戏;小学语文课本中“田忌赛马”的故事;生活中的讨价还价等,都是博弈思想。只是当时我们还没有接触到这个概念,没有系统完整的去学习。

大学课堂给了我们这个机会去更加深化思维,更深入的学习博弈知识,从而更好的在生活中应用博弈方法。但是目前博弈论课堂教学方法单一,主要依托讲授习题练习,结合案例。学生的参与不足,理论与实践的结合不足。所以怎样丰富博弈论课堂,加大信息量,更多的体验博弈论思想在生活中的积极应用,调动学生的积极参与,是博弈论教学改革的一个方向。而慕课不失为一种有效的手段。

二、慕课

慕课是二十世纪兴起的一种网络课程模式。以大范围,形式新颖等特点,为大家广泛地应用于现代教学中。目前慕课在国内外已经得到了长足发展,中国2014年在网注册的慕课学员已经达到60多万,这个数字还在继续增长。现在已经有很多专业从事制作慕课的团队,也完全能满足各类学员各类课程的要求。

三、慕课与博弈论教学的结合

慕课具有完整的知识体系。作为一种方便的自学方式,慕课完整的知识体系可以作为博弈论课程的补充。弥补传统课程课时不足,信息量有限的弊端。传统课堂一节课50分钟,各大高校博弈论课程安排34-51课时。有限的时间内,很难去更多地教授博弈论的知识,很难有更多的时间去体会博弈论思想在现实生活当中的应用。但如果能在传统博弈论课程当中结合慕课,那么部分知识,包括大量的案例,情景O定等都可以通过慕课来完成。

慕课具有范围广的特点。博弈论作为一门专业课程,在经管类院校中被广泛开设,基本上所有专业都要学习该课程。但是学校资源有限,老师的精力有限,而且各专业课时不一致,深度要求不同。仅凭传统课堂,无法完全满足学生的学习需要。慕课作为一种网络课程,范围广,不受时间地点的限制,学生只要网上报名就可以学习,可以很方便的去弥补传统课堂实体资源有限的缺点。完全可以满足全校所有专业学生同时学习的要求,既方便又快捷。

慕课具有开放性。慕课作为一种网络课程,对学员没有限制。任何学员只要在线注册就可以参与,有利于博弈论教学在全校的开展。虽然博弈论是经管类专业的专业课。但是很多非经管类专业的学生也有很大的需求想要学习该课程,所以当资源有限,不能全部安排课程的时候。慕课就起到了良好的作用,可以供任何专业的学生学习。同时去全民推广博弈论课程也有利于经济素养的提高,有利于国家政策的制定和执行。

慕课形式新颖。能方便的演示实验,模拟情境,可以充分激发学生的兴趣,能让学生更真实感受博弈思想在日常生活中的应用是怎么影响个人的决策,充分的体现理论应用实际的现实意义。比如一个很经典的博弈案例“智猪博弈”,博弈故事描述的是大猪和小猪谁去按食槽开关的决策问题。实际上,这样的博弈思想应用到实际生活中,可以模拟大小企业共存的问题。传统课程只是结合案例简单的分析了这种应用。如果在传统课堂讲授外能再更多的结合慕课深入案例,那么学习效果是事半功倍的。也可以让学生更多的去切实的融入到生活情境当中,感受博弈对决策的影响。

慕课具有自检性。学习不光要听,更要练习巩固。通过检验考察自己掌握的情况。传统课堂老师能面对面地观察学生,通过表情以及学生的课堂反应了解到学生的接受情况,并及时调整课堂具有高度的灵活性。还有课堂练习测验的方式,也可以很方便的考察学生。慕课作为网络课程也考虑到了这一问题。安排了作业,测验,在线讨论等方式,力求学生能尽可能地掌握所学。而且慕课的网络特点是可以重复播放任意片段,一旦有知识不理解的,学员可以反复听课,直到完全理解。

慕课具有约束性。注册慕课后,学员只有完全学完课程,完成课程安排的学习任务,并在考试合格后才能获得相应学分。这样的约束性可以保证学习的有效性。应用到博弈论教学当中,在全校学生都能学习的情况下,还能保证学习质量。确实可以作为传统博弈论课堂的补充。现在许多高校已经开始和特定的慕课平台建立合作培养,承认学员在慕课中心拿到的学分,并计如总学分。这样既有利于学生课程的学习,也有利于慕课在现代教学中的进一步推广。

四、结论

慕课的特点可以很好的将其结合运用到博弈论教学当中。去弥补传统的博弈论教学方式单一,课时有限的缺点。但是慕课作为一种新兴的网络教学方式,在发挥自己优势特点的同时,我们也要注意到它的弊端。首先,在没有老师的强制约束下,学生是否能自觉地独立完成所有课程。其次,学生虽然能够反复观看视频,反复理解学习内容。但是如果反复学习之后,仍然不能透彻理解时该怎么答疑解惑要怎么办。这都是网络课程所不能给予的,必须通过传统课程去更好地实现。再者,慕课对学生的考核包括测验,讨论等方式,合格的评判标准是什么,所有学员都采用同样的标准是否合理。这些都是将慕课应用到实际教学中面临的问题。所以必须要明确,慕课作为一种新型的网络课程,在帮助学员学习课程,辅助传统堂的时候。更多的只能定位为一种辅的学习方式,绝对不能代替传统课堂。

【参考文献】

[1] 何国平,杨云帆,陈嘉等.“慕课”在护理教学中的应用与展望.中华护理杂志[J].2014(49)1095-1099.

[2] 胡珊邢涛.慕课视域下“教育心理学”课程教学.现代教育技术[J].2015(24)78-82.

[3] 张长海,焦建利.地方高校大学生慕课接受度影响因素研究.远程教育与网络教育[J].2015(345)64-68.

[4] 姜泓冰.“慕课”,搅动大学课堂[N].人民日报,2013-07-15(15).

[5] 王思佳.幕课对我国高校思想政治理论课建设的启示研究[D].北京:首都经济贸易大学,2014.

理性与感性的博弈范文6

关键词:信念学习 实验经济学 虚拟博弈

中图分类号:F240 文献标识码:A

文章编号:1004-4914(2016)09-247-03

一、引言

随着博弈论在各门学科中的广泛使用,个体行为选择在学习中的作用也不断被学者们研究。North(1996)将心理学中个体的认知系统引入到经济模型中,有效解释了决策中信念及偏好的关系,并将两者融合为理性决策的基础,由此得出结论:信念是个人行为的准则,它是影响个人行为选择的重要因素。他人的认知、行动和信念是构建有用模型的先决条件。

随着重复博弈研究的不断加深,经济学家逐步重视学习信念行为,用以解释当重复整个博弈时行为往往变得更为理性的原因。随着实验经济学家对个体在重复博弈中的学习过程进行研究,信念的形成归纳为:自身学习以及外界互动。自身学习指自身经历不断强化使某种行为发生的概率上升,外界互动指通过观察别人行为的收益情况进而指导自身行为决策。在此基础上,Colin F.Camerer(2003)将信念学习模型定义为:“假设参与者根据过去的事件来更新他们认为别人会如何行动的信念,从而根据这些信念来决定哪种策略是最优的。”信念学习模型大致分为三类:信念学习模型,强化学习模型,经历-加权吸引模型(章平,2006)。

信念学习模型以Fundenberg and Levine(1998)和Cheung and Friedman(1997)的虚拟博弈模型为代表,该理论的基础是:参与人通过观察其他参与人在过去各期内采取的行动概率,由此做出自身预期收益最大化概率的行为。信念学习模型强调参与者始终牢记其他参与者以前的所有行动,并且还要求参与者对每一期对手过去的行动赋予相等的权重,以此来决定自己本轮的行为策略。该模型的观测经历主要来源于其他参与人过去的经历,即外界互动。强化学习模型以Bush-Mosteller Modle(1997)为代表,该理论基础是:心理学认为一旦一种行动得到了奖赏,那么个人在未来继续做出该行动的概率上升。如果是惩罚则未来做出该行动的概率下降。强化学习模型不强调参与者形成有关其他参与者可能行动的信念,因为参与者更关注自己过往行为的奖赏和惩罚,该模型的观测经历主要来源是自身经历,即自身学习。经历-加权吸引模型以Camerer and Teck Ho(1999)的Experience-Weighted Attraction Modle为代表,将强化学习模型和信念学习模型相结合,通过将自身奖惩和观察其他参与者的支付情况赋予不同的权重,拟合为吸引力指标,参与者对吸引力越敏感采取该行动的概率越大。

综上,本文通过对教学提问环节进行博弈化设计对信念学习模型进行研究,检验在重复博弈下该模型是否有效?探讨行为博弈、信念形成及制度设计方面的相互关系。

二、理论模型

在序贯二元决策场景的重复博弈下,通常假设对手的行动集合为C(c1,c2・・・ci・・・ck),在t轮博弈之中,参与者对于其他参与者选择行动ci所赋予的信念权重不断更新为:

bt(ci)=bt-1(ci)+1 在t期对手选择行动ci,信念权重相应的增加1bt-1(ci) 在t期对手选择行动ci,信念权重相应的增加1

则在t期,参与者形成的其对手选择行动ci的概率与信念权重之间的关系:

μt(ci)=

在给定其他参与者选择各种行动的概率的信念下,参与者计算出自己可供选择的每一个纯策略ai(参与者的策略空间为A)的期望支付π(ai/μt),则参与者在t+1期选择纯策略ai的概率为:

P =

同样地,参与者选择具有最大概率值的策略为自己的最优响应。

三、实验设计和实施

(一)实验设计

实验在教学提问环节进行博弈化设计的背景下,通过多次重复博弈使本次回答问题的学生在充分了解其他参与者(之前回答问题的学生)的支付、以及对手(教师)的行动基础上,来决定自己本轮的行为策略。

所谓教学提问环节的博弈化设计是指:将每次课堂提问作为一次博弈局,博弈的参与者是老师和学生,由于课堂提问内容和教学内容息息相关,两个参与者都能够充分掌握背景信息,信息对于两者来说是充分的。实验的行动是教师让学生起来回答问题,教师根据学生的回答质量,依据公开透明量化的考核标准对学生回答进行打分。该分数作为学生的支付,最终体现在期末成绩中占有一定权重。为保证博弈的公平性、有效性,实验过程采用摇号的方式随机选取同学起来回答问题。即,在课堂提问出来之后,教师和学生都不知道谁将起来回答问题。本实验中的行动次序固定为教师先提问然后随机选择学生回答问题最终依照量化标准打分的序贯博弈,并且相同的博弈局在每次课都会整体重复出现,在下一周也会重复出现。因此,学生有充分长的时间来搜寻对手的行动、其他参与者之前的行动,从而形成信念指导自己的行动。实验的信念传递过程如图1(见下页)所示。

实验的参与者是从课题组老师教授的某一门课程中选取2个班级对教学提问环节进行博弈化设计教学,实验的对比组是另外几个平行班沿用传统的教学提问设计教学。

实验的支付是学生回答问题获得相应的分数,最终体现在期末成绩中。为保证支付的公平和有效性,试题根据难度和题型的不同被赋予不同权重,例如:单选题权重为0.8,A类简答题权重为1,B简答题权重为1.2,A类案例分析题权重为1.2,B类案例分析题权重为1.5。为保证学生对支付的敏感性,按照每次课平均10%的同学参与博弈的数量安排每周的实验次数。作为重复博弈,为保证非合作行为的发生设计了惩罚策略,促使学生采取合作策略,最终实现合谋性的均衡结果。

教师行动集为:处罚、0分、60分、80分、100分。因此,教师行动集的效用为(-1,0,1,2,3)。学生的行动集为:不回答、答非所问式回答、预期能力以下式回答、与预期能力相匹配的回答、超预期能力的回答。因此,学生行动集的效用为(-1,0,1,2,3),如表1所示。

从上述策略及收益矩阵不难看出:通过惩罚性策略,学生一般将采取回答问题的合作策略。本实验的最佳均衡是学生充分思考提问内容,在现有的评定标准下超预期能力回答问题,同时教师的教学效用也达到最大化,教学效果显著提高。

(二)实验实施

为避免学生沿用大学课程回答问题的思维惯性,课题组优先考虑大一新生为实验参与者。为更好地进行题目设置和量化考核,课题组优先考虑使用开放性知识点、专业通识性课程作为样本,最终选取会计专业第一期学期课程《财政与金融》作为实验样本。作为一项长期的行为学实验,与之前许多论文中在实验室内短时期内完成数轮虚拟博弈的计算机模拟不同,本实验实施中存在很多的不可控因素和需要剔除的影响因素。因此,本实验先后进行过两次大规模的实施。2014年9月到12月课题组甄选2014级会计专业2个教学班进行了初次实验。经过初次实验,课题组对实验设计的细节进行优化,修改了量化评分体系,对数据搜集和数据可比性进行了完善。2015年9月到12月课题组再次对2015级会计专业2个教学班进行了第二次试验。本文第四部分数据分析将主要对第二次实验的有效样本数据进行分析。

实验具体实施方案如下:任课教师于第一次课时对受验班级学生介绍如下规则:每节课将不低于6次提问(每个班级人数约60人,按照10%的概率随机抽取人数进行实验),采用摇学号的方式随机抽选同学起来回答问题。详细介绍单选、简答、案例分析三类提问的量化评分标准、分数权重。实验的前两个有效周让学生熟悉实验的流程、熟悉实验的评分规则。实验数据从第三个有效周开始提取,由于总学时12周且中途有国家法定节假日等不可控因素影响,实际提取合计7周的数据(包含1周实验熟悉周)用于分析比较,并且该7周(包含1周实验熟悉周)的数据尽可能做到了提问内容基本一致。所谓实验的有效周,是指受验的2个班级在本周都同时有课,且教学进度基本一致。本次实验获取样本数据132个,其中有效样本数据84个。

四、实验结果分析及启示

(一)实验结果分析

1.一般的信念学习模型存在并收敛。通过对实验有效样本数据进行处理,对第二部分信念学习模型的结论进行验证。从每周平均分(如图2所示)和分题型周平均分(如图3所示)来看,加权平均分和未加权平均分均呈收敛趋势,说明教学环节的博弈化设计有效并收敛,重复博弈存在纳什均衡。随着实验次数的增加,参与者对其他参与者选择行为ci的经验愈来愈丰富,自己的最优决策bt(ci)不断优化,平均分值随实验次数增加呈稳步上升趋势。说明图一所示的外界互动对参与者自身信念bt+1(ci)的信念传递过程存在,一般的信念学习模型存在并有效。

在《财政与金融》课程为期12周的教学(累积132回合的虚拟博弈),有8人在不同的教学周(不局限于有效实验周)中累积2次被随机抽取参与虚拟博弈,有1人累积3次被随机抽取参与虚拟博弈,重复参与人数占比11%。重复参与人的次间分差如图4所示,累积9人中有6人出现明显的进步,3人保持现状。说明参与者自身信念bt+1(ci)更新有效率达到67%,强化学习模型存在并有效。

2.一般的信念学习模型有效性验证。在一般的信念学习模型参与者的预期支付π(ai/μt)与实际支付的有效性验证方面,本文通过查询学生当期期末总评成绩排名预测学生的预期支付π(ai/μt)。通常情况下,期末总评成绩排名靠前的学生,其期望支付就越高。结合往年经验和课堂实际采访情况,本文将期末总评排名1~10名的同学期望支付定为85分,11~20名的同学期望支付定为80分,21~40名的同学期望支付定为70分,41~60名的同学期望支付定为60分。处理后整个实验期望差值情况如图5所示。在实验提取的7周数据中第1周为实验熟悉周,第2周起为正式实验周,在实验前2周,12位参与者中约40%左右的人支付情况与预期不一致,出现负支付情况。在其后的2周中,参与者的支付情况与预期一致的比例稳步提升,稳步提升至50%以上。从第5个实验周开始,参与者的超预期获得正支付的比例明显提升,并且正的期望差值数额不断扩大,第6和第7周时,90%以上的参与者获得正支付,且期望差较前几周扩大。说明一般的信念学习模型能有效改进参与者的决策、获得超额支付。

(二)实验结果的启示

1.信息对称及制度建设的重要性。信念是行为互动过程中完全理性决策的主体的主观概率。完全理性决策的先决条件是信息对称。在信息不充分的情况下,参与者无法做出完全理性的决策。将2014年不成熟的实验和2015年的实验对比来看:评定细节越详细、行为决策过程越明晰,参与者(老师)的决策过程信息披露越充分,后续参与者的表现越好。与2014年相比2015年的本次实验中,评定信息的公开使学生回答问题的质量明显提高,对评定细则的详细讲解以及成绩评定剖析后学生的成绩有效提高。因此,博弈决策选择的概率通常与决策过程相关,特定细节制度的设计,将有效引导决策行为,为参与者提供系统分析制度性和结构性变量的理论效用的方法。

2015年实验结束后,本课题组进行了满意度调查。学生对该实验的满意度为92%,学生认为实验有效性的占90%,认为最大收获是“学会并掌握答题思路”的占73%,对重要因素的排序分别为:评分细则讲解、先手示范、自我表达能力。因此,在一般的信念学习模型(虚拟博弈)中,完善的制度和对手在t-1期中的决策过程越明晰,局中参与人学习先手经验在t期中行为的bt(ci)权重越大,做出完全理性决策的主体的主观概率显著提高。

2.拟博弈信念学习模型构建的建议。信念学习模型主要来自博弈互动实验的证据。“信念学习模型”研究的是行为互动中参与者最优策略的选择问题。本实验通过教学问答环节博弈化设计模拟该模型,通过实验充分阐述和论证了虚拟博弈信念学习模型的存在性、收敛性、有效性在,此处不在赘述。

常见的基于虚拟博弈信念学习模型要求参与者始终牢记另一个参与者以前采取每种策略的相对频率,从而主观概率的采取某一策略,达到预期收益和实际收益的均衡,实现参与者双方的效用最大化。那么重复博弈多少次合适?参与者从第几次开始学习效果开始显现?根据实验数据来看,周平均成绩和分题型平均成绩都从第3个有效实验周波动降低开始呈稳态向上趋势,说明参与者对于对手的行动经验μt(ci)一般需要学习两期之后开始有效,自身行为策略Pt+1ai自从第3期开始有效,即t≥2时一般信念形成,开始指导参与者行为。因此,在虚拟博弈信念学习模型中重复博弈的次数应该不少于三次。

简单博弈行为参与者的决策具有较高确定性,但是在行为互动过程较复杂的博弃中,或者是长期内的重复博弈过程中,参与者出现随机性、非理性决策的概率大大提高。虚拟博弈信念学习模型要求参与者记住前手采取该策略的概率,因此,在虚拟博弈信念学习模型构建中过往行动人的一方要严格按照博弈制度进行决策和支付,形成稳定的、可靠的“选择频率”,才有利于参与者形成信念,指导决策。

3.信念权重设定的启示。信念权重形成于参与者对过往参与者以前采取每种策略的概率和获得的支付,学习过程形成的信念可以有效提高策略上的优势影响最终支付,但是自身能力与最终支付之间的相关性也不应该被忽略。在进行数据比较和分析时,要充分强调预期支付,对预期支付进行有效的界定和评估,将最终支付和预期支付进行比较才能获得真实、相较客观的学习成果描述。例如,本实验中对于题目难度的划分、结合期末排名对每次博弈结果的加权处理等。脱离参与者自身能力一味强调信念学习的效果,实验将不能更好的还原现实生活中行为决策过程。

信念权重除了取决于上述条件外,还取决于参与者对支付的敏感程度。重复博弈过程中,参与者的后向学习能力,例如归纳、推理,使得重复博弈的结果越来越理性,但是仍然会出现一定比例的与模型预测相悖的结果,此时就必需要关注参与者对支付的敏感程度。在今后的模型构建中,应对支付结果的表现形式进行多样化设计。参与者的决策行为影响因素众多,多样化的支付结果能更好地还原现实生活情况,更好的模拟决策行为。本实验中,支付结果的表现形式较为单一,因此采取惩罚性措施,增加参与者对现有支付的敏感度,降低非理性在行为决策中的干扰。例如,本实验在2014年的初次实验早期未设计惩罚性措施,造成参与者对支付不敏感出现非合作的不理。同时,惩罚性措施在理论上还可以有效避免重复博弈中常见的合谋性均衡结果。因此,今后在构建该类模型中建议适当引入惩罚性措施能有效提高参与者对支付结果的敏感程度。

4.外界环境对于实验的影响。信念的学习过程还来源于对外界环境的界定,外界环境提供的信息不可忽视。在始终牢记参与者以前采取每种策略的相对频率的同时,参与者会对信息进行选择性加工,加强自身认同信息的权重,弱化不认同信息的权重,对于那些会有效甄别信息的参与者,其信念的学习就好,反之亦然。在信息的甄别过程中,由于参与者始终牢记前手的决策,所以在虚拟博弈信念学习模型中容易出现“羊群效应”。例如,在2014年和2015年的两次实验中,有的受验班级周平均成绩长期一致略微差于对比班级,有的受验班级间长期存在某种莫名的情绪左右影响到参与者的最终行为决策。个体决策行为除了博弈制度、博弈对手的影响,还存在外部评估的过程。因此,个体行为存在异常决策,如若个性异常行为频繁出现,实验者需思考,频繁非理性决策背后是否存在非公平、非道德、非合法等隐形缺陷存在。因此,在今后的实验构建和实验数据分析中应当考虑到群体行为对个人决策行为的影响。

[基金项目:四川省教育厅人文社科一般项目(项目编号:15SB0373)。]

参考文献:

[1] 章平.信念调整、学习行为和均衡收敛的博弈模型研究进展[J].南京社会科学.2009(1)

[2] 章平,戴燕.个体决策与学习行为:有限理性建模综述[J].南开经济研究,2006(3)

[3] Douglas D. Davis ,Charles A. Holt.验经济学[M].北京:中国人民大学出版社,2013

[4] 科林・凯莫勒.行为博弈(对策略互动的实验研究)[M].北京:中国人民大学出版社,2006

[5] C Camerer,T Ho.Experience-Weighted Attraction Learning in Normal Form Games[J].Econometrica,1999(67)

[6] Fudenberg D , Levine.The Theory of Learning in Games[M].The M.I.T. Press, Cambridge,MA,1998

(作者单位:四川华新现代职业学院经济管理系,四川广播电视大学高职院 四川成都 610045)