时间:2023-08-30 16:25:57
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇博弈分析方法范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
关键词:博弈论图书馆数字资源资源共享
中图分类号:G251 文献标识码:A 文章编号:1009-3044(2016)29-0017-03
随着大数据时代的到来,信息的互联互通成为提高信息服务能力的重要前提,任何一个图书馆都难以同时满足不同学科专业、不同层次用户的信息需求,也不可能实现对所有资源的收集和管理,数字信息资源共享就是为了解决个体图书馆信息资源的有限性和信息需求无限性的矛盾而采取的图书馆间合作建设与发展的策略。现阶段,我国文献信息资源共享的理论研究主要集中在文献资源的布局和配比方面,因此多将信息资源共享效率低下的症结归于管理体制的不完善、技术手段的落后和宏观调控的缺乏。信息资源共享是追求自身效用最大化的过程,是一种分析投入成本和产出收益的博弈过程,通过借鉴博弈论的研究方法,从图书馆个体利益和共享集体利益的关系出发进行研究,可以进一步认识阻碍数字信息资源共享的因素,并找到解决这些问题的方法和措施。
1博弈论概述
1.1博弈论的涵义
博弈论,也称对策论,英文为Game Theory,是根据信息分析及能力判断,研究多个决策主体之间行为的相互影响作用,以取得收益或效用最大化的一种对策理论。其中的“博弈”是指个人、队伍或组织,在一定的环境条件及规则下,同时或先后、一次或多次,根据环境和竞争对手的情况变化,从各自允许的行为或策略中进行选择、加以实施,并从中取得相应结果的过程。中国早在几千年以前就已存在博弈思想,田忌赛马的故事就是较好的博弈论案例。自20世纪80年代,博弈论得到了广泛的应用,尤其对信息经济学的发展做出了重要的贡献。
1.2博弈论“囚徒困境”经典模型分析
博弈论经典模型囚徒困境建立在一个假设之上,即甲、乙两人被怀疑是合伙的偷盗犯,警方虽逮捕了他们但没有掌握充分证明两人犯罪行为的证据,警方将其分开单独审问,双方不能进行信息的交流。警方对这两个嫌疑犯的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人判5年刑。如果两人都不坦白,则警方由Tile据不足,只能对每个人各判刑2年。表格1中的框图体现了这个博弈的分析过程,左方是甲的可选择策略,上方是乙的可选择,双方均可做出坦白和不坦白两种选择。其中包含数字的格对应甲乙的一个策略组合,每格第一个数字代表甲的报酬,第二个数代表乙的报酬。比如第二个数字格是指当甲坦白,乙采取不坦白的策略时,甲的报酬为-1,乙的报酬也是-7。图中的报酬均为负数,以表示判刑的年数。
在警方交待了量刑原则以后,会从自身利益出发进行分析,选择坦白或不坦白的策略,此时双方展开了博弈的过程。首先分析甲的思考过程,当甲进行决策选择的时候一定会先考虑乙的想法。根据图表1的矩阵图可见,当囚犯乙选择了坦白的策略时,囚犯甲坦白则获刑5年,不坦白获刑7年。由此,当乙选择坦白时,甲必然选择坦白(因为5
如果仔细分析囚徒困境报酬矩阵,甲乙双方若都作出不坦白的决定,会得到更好地结果,即各判刑2年。可是因为没办法进行信息沟通,每一方都会担心对方坦白但自己不坦白时会受到重判(即对方坦白获刑1年,自己不坦白则被判7年)。因此,每个囚犯都从个人利益出发考,最终的结果都会选择坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡结果。
囚徒困境的结论折射出的道理发人深省,从个体的视角思考做出的占优策略决定(-5,-5),显然劣于做出合作策略的选择(-2,-2)。换句话说,从单个个体的角度出发得出的占优策略,从整体而言得出的却是最不理想的结局。囚徒困境最终达到的策略均衡,体现出了个人理性和集体理性的矛盾冲突。目前,图书馆在数字信息资源共享问题上也存在着类似的矛盾,我们将“囚徒困境”的博弈分析方法运用到资源共享问题上,也可以解释合作的不稳定性及相关问题。
2图书馆数字信息资源共享的博弈分析
2.1数字信息资源共享的静态博弈
数字信息资源共享一直是图书情报界关注的重大课题,每个图书馆都有资源共享的愿望,图书馆信息资源的共享,可以实现整体效用的最大化。假定参与共享合作博弈的图书馆为A、B两个,分析图2矩阵可以发现,如果A、B馆都选择合作策略,每个参与者均可获得收益为10,总报酬最大为20;如果A、B两者中有一方选择合作,而另一方选择不合作,参与者报酬分另4为6、12,总报酬为18;倘若A、B两馆都做出不合作的选择,那么各馆报酬都是8,总报酬16是最小值。可见(合作,合作)策略是团体利益最大的策略选择(20>16)。
事实上,一些图书馆为了自身的利益,往往从个人理性角度出发,最终与团体利益冲突,陷入“囚徒困境”。类似于囚徒甲、乙的决策过程,A馆会根据B馆的决策选择策略,当B选择合作策略时,A若选择合作可得10,A若选择不合作,既省去了共享资源需付出的成本,又无偿享受了B馆提供的信息资源,报酬是12。因此,A必然不会合作(显然12>10)。同理可推得,B做出了不合作的选择时,A仍然会选择不合作策略(因为8>6)。显而易见,无论B做出合作或者不合作的选择,A都会采取不合作策略。同样的分析结果对B馆也是适用的,最后的博弈结果为(不合作,不合作),这时总报酬16,小于最优策略的总报酬20。
这一博弈矩阵可以看出,大家最初都希望达到(合作,合作)总报酬为20的结果,但是通过报酬矩阵分析可见,即便已经签订合作协议,各自馆也会抱有“搭便车”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自违背共享约定,形成了图书馆资源共享博弈的(不合作,不合作)结果。
上述两种博弈均为一次性博弈,参与博弈者都只能进行一次选择决定,另外博弈参加者在做出自己决定的时候并不清楚对方的决定,大家都是同时决定自己的一次性策略选择。处在这样的前提之下,参与者都做出了自己的策略选择时便已完成了一个完整的博弈过程,并得出了最终结论,这种博弈称为静态博弈。在静态博弈中,出于个人理性的策略选择往往导致了从整体而言的最坏结果。一方面,在达成合作协议以后,参与者都会有投机的心理,并从自身利益出发暗地选择了不合作的做法。另一方面,对于一次性的博弈,只要参与者做出了最终决定便完成了博弈过程,对于违反约定的行为没有补救和惩罚的有效措施,无法通过后续的博弈进行调整和制约。
2.2数字信息资源共享的动态博弈
实际上,博弈通常为一系列重复进行的运动,即相对静态博弈而言的动态博弈,在连续进行的动态博弈中,上面结果会有所不同。
2.2.1数字信息资源共享的无限次重复博弈
无限次重复博弈是指相同结构的博弈可以无限次地重复进行下去。如果设定在数字资源共享的无限次重复博弈中,不管哪一方图书馆在其中的一轮合作博弈中采取了不合作的行动,在以后的博弈中便会遭到其他馆“不合作”的报复策略,而且这一不合作策略会在未来的所有博弈中重复下去,长此以往,首先违约的一方便永远失去了与另一方合作的机会。因为在无限次重复博弈中,存在着对欺骗和违约行为报复的机会,因此参与合作的各方会担心采取不合作策略给自己带来的长期损失,不会主动选择不合作的策略,使得数字信息资源共享合作得以维持。
继续用图2加以说明,对于图书馆A,各馆如果一直处于合作的状态,便可以长期获得报酬10,累积起来10+10+10+…,但如果抱有机会主义的想法,打破约定选择了不合作的策略,他的确获得了一次性的利益,得到报酬为12,但在以后的无限次重复博弈中,均会受到对方不合作的报复行动,收益只能为8。为了一次性的好处,使得日后的收益从原来合作策略时的10+10+10+…下降为不合作策略时的8+8+8+…。显然,任何一个图书馆在数字信息资源的无限重复博弈中,为防止被报复而丧失长期的经济效益,都会遵守协议,采取合作的策略。
2.2.2数字信息资源共享的有限次重复博弈
在有限次重复博弈中,假设事先约定只合作5次,用逆推法进行分析,各方均知道第5轮博弈是最后一轮博弈,因此这一轮博弈便同静态博弈无异。根据前面的分析,这一轮的违约不可能在以后受到惩罚和损失,那么,每个图书馆出于个人理性出发选择的占优策略就是不合作的结果。逆推到第4轮,因为大家都可以推算出第5轮不合作的结果,因此第4轮博弈也会采取不合作的策略。由此类推直到第1轮,都可以得到同样的结果。显然,在有限次重复博弈中,图书馆数字信息资源的共建合作是不稳定的,博弈的最终均衡策略为(不合作,不合作)。
3用博弈论的思想解决数字信息资源共享问题
在现实生活中,参与博弈的各方合伙的机会必然是有期限的,信息组织间的合作共享是否根本无法实现呢?显然在现实生活中是存在着长期合作的共同体。事实上,无限次重复博弈的主要界定标准在于参加者均不清楚哪一轮博弈会是最后一轮,合作各方担心违约会遭到日后的“报复”便会把合作策略坚持下去。在有限次的重复博弈中,如果合作双方不确定哪一轮是最后一轮,参与者会认为日后还要继续打交道、博弈状态会继续维持,这便同无限次重复博弈无异。所以,在不能确定终止期的有限次重复博弈的图书馆数字信息资源共享博弈中,合作解是可以存在的。当然,为了维护合作模型的稳定性,更好的实现团体利益的最大化,必须配合以必要的措施。
3.1建立信任机制
图书馆信息资源共建共享机制的成功建立,取决于成员间的相互信任和对于联盟内部规则的遵守程度,能够取得收益同时实现持续的发展,其中成员馆之间的信任是至关重要的。成员间除了应相互理解对方的行为和立场,尊重对方的观点,还应加强组织内的交流,达成对某些问题的认识。另外,信任评审机制的建立也十分必要,通过建立完备的综合性、长期性评估测试标准系统,对成员的联盟策略及行动影响因素进行持续地跟踪测评,通过完善细致公平的执行制度,形成稳定可靠的运行机制。
3.2建立监督机制
对于合作中的各馆,都希望采取最优于自己的策略,以期得到最好的结果,因此为了达到合作团体利益的最大化,应该对各成员进行有效监督,维护合作协议的顺利执行。要在建立领导协调组织和健全监督机制上下工夫,在明确各成员权利义务的基础上,监督各成员的行为。对于损人利己的倾向和行为,及时采取措施,必要时对违反合作协议的成员进行制裁,甚至终止合作。
3.3建立保障机制
因为各图书馆之间的规模与发展水平不均等,建设规模大、信息丰富的图书馆往往很难与信息量相对较少的图书馆实现资源共建共享,另外数字信息资源共建共享经常发生“搭便车”的问题,这些都需要通过建立保障机制加以制约。在内部评估制度规范的基础上,对贡献大的图书馆要采用奖励的办法进行收益补偿,同时针对慵懒的图书馆,通过采取惩罚的方式实现督促作用。
在具体的实施上,以惩罚措施为例,在成员馆签订共享协议时,规定不合作的一方会受到经济制裁,报酬减3,在矩阵图2的基础上可以得到新的报酬矩阵(见图3)。按“囚徒困境”的分析思路,如果A馆选择共享,B馆选择了不共享,B得报酬为9而不是原来的12,因为B馆不共享受到了事后的经济制裁(12-3=9),小于(共享,共享)中的报酬10,可见,B怕受到惩罚得不偿失必然选择共享。对于A的分析也是如此,最后的博弈均衡状态一定是(共享,共享),克服了欺骗或违约行为,达到了信息资源共享的目的。
一、博弈论思想与纳什均衡
“博弈”,为“对策”之意。具体而言,博弈就是一些个人或组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中取得相应结果的过程。博弈论关注决策主体之间行为的相互影响及决策均衡问题,博弈中的任何一个局中人的决策都会受到其他局中人行为的影响,反过来他的行为也成为其他局中人决策的基础。在博弈过程中,博弈各方可能会达成一定的协议。美国数学家、经济学家纳什提出了著名的“纳什均衡”。“纳什均衡”是一种比较满意的均衡,即如果所有的参与者都预测到某个均衡会发生,所有参与者都不会故意去违背它,没有愿望不去遵守它,体现了战略博弈行动的稳定状态。
二、审计博弈均衡分析方法的提出
(一)审计博弈均衡分析方法的内涵。博弈论是一种方法,一种观念,可以将博弈论思想及纳什均衡应用到审计理论及实践问题的分析研究上,于是便形成了审计博弈均衡分析方法。审计博弈均衡分析法主要用来分析审计决策主体的行为发生直接相互作用时的决策组合以及决策组合的均衡问题,即一个审计决策主体是如何影响其他审计决策主体以及又是如何受到其他决策主体的影响,进一步研究审计决策主体之间的行为能否达到一种相对稳定的均衡状态及其条件,以及当达到一种有利的均衡状态时如何维持该均衡状态。
(二)审计博弈均衡分析方法的基本程序。审计博弈均衡分析方法的基本程序分为五步,具体如下(基本程序的运用本文在后面将给出一个典型的例子):第一步:定位审计问题(审计矛盾或冲突),判断并描述博弈特征;第二步:在约束条件下给出支付矩阵;第三步:进行审计博弈均衡计算结果;第四步:给出审计博弈分析结论;第五步:针对该审计问题(审计矛盾或冲突),设计有效的制度安排。
三、审计博弈均衡分析方法的应用
审计博弈均衡分析方法作为一种新的审计研究方法,对于审计工作、审计研究中的相关问题,可以从一个新的角度和视野来分析和研究它们,真正找到解决问题的根本途径。下面笔者以审计监管问题为例,采用审计博弈均衡分析方法,分析审计监管问题的症结,并提出解决监管问题的合理化建议。
(一)模型建立与分析。加强审计监管,可以从会计师事务所与上市公司博弈、会计师事务所与监管机构博弈、上市公司与监管机构博弈中进行分析。
1、基本假设。建立模型成立的基本假设,具体有:
(1)上市公司、会计师事务所以及监管机构均为理性的经济人,均追求利润最大化。
(2)由于本文主要探讨监管机构的行为和政策,可假设会计师事务所有足够的能力发现上市公司的舞弊行为,即不存在着审计风险。所以,在被审计单位舞弊的情况下,会计师事务所有两种可能的策略,即合作与不合作。
(3)监管机构的监管成本与监管效果正相关,即监管机构花费越多的时间和精力,监管效果越好。监管机构有两种可能策略,即高度监管和低度监管。
(4)只有当上市公司存在着披露虚假财务报告的企图时,会计师事务所才有可能默认其造假行为或与之串谋进行造假。
2、两方博弈模型
(1)会计师事务所与上市公司。假定会计师事务所有足够的能力发现上市公司管理当局舞弊。会计师事务所可能的做法就有:合作和不合作;被审计单位(上市公司)有两种策略:舞弊和不舞弊。
设P为监管机构发现的概率,q1为监管机构对会计师事务所的罚款(或处罚),q2为监管机构对上市公司的罚款(或处罚),r为被审计单位的贿赂,W为被审计单位支付的审计费用,d为上市公司的舞弊收益。(表1)
可见,在信息不对称的困境中,会计师事务所的行动取决于舞弊、合作下的得益:w+r-p×ql。如果它的得益大于w,即:w-w时,上市公司会选择舞弊,即纳什均衡为(舞弊,合作),而这是监管机构所不愿意看到的。
这种情况下:w0
从这种分析中会发现,会计师事务所的选择与上市公司的贿赂、监管机构发现舞弊的概率的大小及惩罚力度有关。而上市公司当舞弊收益一定时,他的行为受到贿赂的多少及监管机构发现舞弊概率的大小及惩罚力度的影响。因此,一个自然的想法便是加大监管的力度及惩罚量。
以上的模型是短期的一次性博弈,当注册会计师较为注意长期的利益,而且会计师事务所还考虑诚信带来良好声誉的收益,那么上面的模型可变化为表2。(表2)
表2中的B代表注重长期利益,良好声誉所带来的收益。
如果w+B>w+r-p×q1时,那么会计师事务所存在不合作这个上策,上市公司便会选择不舞弊,新的均衡将为(不舞弊,不合作),这是监管机构所愿意看到的。
但是,如果w+B-w时,上市公司便会选择舞弊。
这种情况下:w+B0
从这种分析中会发现,会计师事务所的选择与上市公司的贿赂、监管机构发现舞弊概率的大小及惩罚力度和长期形成诚信的良好声誉的收益有关。而上市公司当舞弊收益一定时,他的行为受到贿赂的多少及监管机构发现舞弊概率的大小及惩罚力度的影响。因此,与前面相比,除了加大监管的力度及惩罚量还可以引导社会及会计师事务所对诚信的认同度,从而通过加强会计师事务所的行业自律来防止合谋。
(2)会计师事务所与监管机构。在这种博弈中,会计师事务所的策略有:串通和不串通。监管机构的策略有:高度监管和低度监管。这里假设监管机构的监管成本与监管效果正相关,即监管机构花费越多的时间和精力,监管效果越好。那么,高监管下,发现舞弊的概率P1较大,但是监管成本C1较高;低度监管下,发现舞弊的概率P2较小,但是监管成本C2较低。同样假设q1为监管机构对会计师事务所的罚款(或处罚),r为被审计单位的贿赂。(由于无论何种情况,会计师事务所总可以得到一份稳定的审计费用收入w,故在此可简化令w=0)。那么,会得到以下的博弈矩阵。(表3)
这时对会计师事务所而言,他的策略选择受r-q1×p1的影响(这里注意到r-q1×p10,那么也有r-q1×p2>0,会计师事务所存在上策,他会选择串通,而如果q1×p1-C1>q1×p2-C2时,监管机构会选择高度监管,因此他们的均衡为(高度监管,串通);如果q1×p1-C1
如果r-q1×p2>0(有r-q1×p1
如果r-q1×p10,那么会计师事务所不存在上策。这时如果q1×p1-C10,且r-q1×p2
综上所述,会计师的行为受到管理当局的贿赂大小、监管机构罚款以及监管机构的效率(发现错误的概率以及监管的成本)的影响。并不像我们平时所认识到的高监管就会不串通、低监管就会串通。
(3)上市公司与监管机构。和会计师事务所与监管机构的博弈类似,上市公司与监管机构的博弈表示为表4的博弈矩阵。还是假设监管机构对上市公司的罚款(或处罚)为q2,r为被审计单位的贿赂,d为上市公司的舞弊收益。这里仍假设监管机构的监管成本与监管效果正相关,即监管机构花费越多的时间和精力,监管效果越好。那么,高监管下,发现舞弊的概率P1较大,但是监管成本C1较高;低度监管下,发现舞弊的概率p2较小,但是监管成本C2较低。(由于无论何种情况,上市公司总要支付一份稳定的审计费用w,故在此可简化,令w=0)(表4)
与上文分析类似,对上市公司而言,他的行为受到舞弊的利益、贿赂的费用、监管机构罚款以及监管机构的效率(发现错误的概率以及监管的成本)的影响,并不像我们平时所认识到的高监管就会不串通、低监管就会串通。
(二)提出建议
1、加强监管机构在博弈中的力量。一种做法是增大罚款的金额,那么上市公司和审计师事务所都会采取合法的策略。还有一种做法是提高监管的效益,在一定的成本下,努力提高监管机构发现舞弊的概率,这对监管机构要求较高。这就要求我国提高监管机构的整体素质,采用科学合理的监管手段。也可以同时采取增大罚款金额和提高监管效益的做法。
2、提高监管机构监管的动机。给予监管机构一定的压力,使得他们不得不设法主动改变博弈中他们不利的地位,从而充分发挥他们的主动性,设法提高监管的效率及效果。比如,如果上市公司和会计师事务所一方运作不合法时,可以给予监管机构一定的压力,使他们不会安于现状。也可以通过立法规定监管机构的职责,给予他们一定压力;同时,给予监管机构一定的认可,从而增加博弈中他们在上市公司不舞弊时的得益。比如,当上市公司和会计师事务所都良好运作时,可以对监管机构的努力给予一定的社会认可。
博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。
博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。
2. 博弈论的基本原理和方法
文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述
G={P, A, S, I, U}
P: 为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。
A: 为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。
S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。
I: 博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(game with complete information),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(game with incomplete information),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(game with perfect information),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(game with imperfect information)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。
U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。
还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。
不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。
3、博弈论与电力市场
博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。 用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。
正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。
博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。
博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。
4、博弈论在电力市场中的应用
4.1自备电厂与公用电网之间的交易
开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。
文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。
文献[ 6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-back system)或者公用电网收取NCP运转电力的过网费(wheeling charges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。
4.2区域间输电交易分析
互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用 Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。
4.3转运市场中电网的固定成本分摊问题
运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodal spot price)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。
4.4 基于Pool或PX模式的多边贸易市场
电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。
在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。
文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。
该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。
对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。
4.5用博弈论解释和实现算法
文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(power exchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。
作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子 被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。
鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数 该函数将 映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。
用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。
[关键词]博弈论;认知无线电;频谱共享
中图分类号:TM743 文献标识码:A 文章编号:1009-914X(2015)22-0287-01
无线频谱是十分有限的资源,为了实现多种无线应用服务,频谱管理部门采用固定频谱接入方法排除了其他干扰因素,即将频谱分配给多个用户,让其单独应用,因此,只有经过授权的用户有资格使用频谱,对于大部分非授权用户而言,根本就无法应用频谱。通信技术的发展,使人们对无线频谱的需求量大量增加,由于可用频谱已经被完全分配,从而使频谱成为十分稀缺的资源。此外,由于频谱利用率比较低,大部分频谱都被白白浪费,由此可见,频谱短缺的问题除了资源少之外,还包括其较低的利用率。本文通过阐述认知无线电技术的现状,对其频谱共享问题进行分析。
一、认知无线电与频谱管理
认知无线电(CR)提出后,受到了人们的广泛关注。美国将认知无线电定义为能够随时根据无线环境变化,而发生动态改变、发射参数的无线电技术。因此,认知无线电可以密切感受附近环境的无线频谱状态,并且自动搜集利用率较低的频谱,按照相应的算法将其改变工作参数进行改变,以便适应外部环境的变化,使频谱的利用率得到提高。认知无线电通过接入空闲频谱(频谱空穴),能够对频谱合理进行利用,实现了DSA,具体如图1所示。
认知无线电技术能够在很大程度上提高频谱利用率,因而产生了认知无线电网络,其研究内容比较多,包括高层协议、网络社交,并成为了未来产业化研究的趋势。对认知无线电网络中的频谱管理进行进一步研究,可以使频谱资源得到更高效的应用。一般情况下,频谱管理的主要内容有频谱感知、判决、共享以及切换。
对于认知无线电的频谱共享问题,常选择基于图论的图着色的方法、基于注水算法以及基于博弈论的拍卖等方法。下文主要以博弈理论为前提,对认知无线电技术发展过程中存在的频谱共享问题进行分析。
二、认知无线电频谱共享
目前,存在很多动态频谱接入技术,分级接入模型和频谱管理政策是最兼容的,尤其是衬底式频谱共享可以机会式的使用空闲频谱,避免对网络用户造成影响。用经济学的方法分析频谱问题,可以提高空闲频谱共享的积极性,提高其利用率。博弈论方法能够更加清楚的分析认知无线电频谱共享问题,使其利用率最大化。
1.博弈论基本内容
博弈论的概念是有经济学中发展而来的,上世纪40年代后期,逐渐形成了合作博弈理论,通过对个体合作进行假设,对其最优策略进行分析。博弈论最初被应用在生物领域,之后逐渐发展为更多领域,包括工程学、社会科学以及计算机科学等,成为了分析个体之间合作、竞争性关系的十分有效的工具。传统博弈分析里边有一个基本假设条件,也就是参与者是完全理性的。一条信息P是共同知识,指群体G当中每个参与者都知道“P”,并且每个参与者都知道“每个参与者都知道‘P’”……不断循环。理性即参与者选择使自身效用最大化时的行动。在上述假设下,博弈的解便是参与者预测的结果。完全理性的接设条件在现实中很难满足,但博弈论的应用对象主要为计算机,因此可将其看做理性范围。
一般情况下,博弈类型主要为合作博弈、非合作博弈。非合作博弈是参与者根据效用函数选择的理智行动,每个参与者都需要利己,选择各自的策略。而非合作博弈的内容很多,可以应用在很多领域中。一个博弈之中,某个参与者的自身信息也许不被其他参与者知道,因此根据参与者彼此的了解程度可以将博弈分为两类,即不完全信息博弈、完全信息博弈。除此之外,一个博弈里边,参与者可能一起行动,也可能有顺序的行动,因此可以根据其行动次序分为动态博弈、静态博弈。静态博弈是参与者在不知道他人选择的情况下做出的策略决策,参与者完成决策后,表明博弈结束;动态博弈中,参与者难以获得参与者的全部信息,即为不完全信息动态博弈。
2.博弈论应用在频谱共享的可行性
因为频谱资源是十分有限的,但在通讯技术的发展下,人们对无线频谱的需求越来越大,而采用频谱共享技术解决这一供需矛盾,具有十分重要的意义。要想实现频谱共享问题,就要解决很多实际问题,比如网络基础设施差异、用户移动性及不同用户的行为等。在整个认知无线电系统中,网络授权系统和认知系统是共存的,每个系统中的用户都存在不同的行为,有些网络用户是互相协作的关系,在网络拓扑中能够完成传输任务,有些用户仅完成自己的通信任务,个别用户甚至肆意破坏别的用户的通信状况。只有系统分析网络用户的行为及相互作用,才能更好的实现频谱共享。博弈论主要研究彼此竞争或者合作的个体,和动态频谱共享问题的研究内容一样。可以采用博弈论分析频谱共享问题,并得到解决措施。结合认知无线电技术进行动态频谱共享时,博弈包括的要素主要有参与者、策略空间以及效用函数。
参与者是授权网络或者认知网络,也可以是两者的组成,根据参与者构成内容及数量,组成相应类型的博弈。因此,采用博弈论可以更好的解决认知无线电的频谱贸易问题。
三、性能仿真分析
1.参数设置
文章主要对重复库诺特频谱共享博弈模型进行分析。由主用户、次用户共享15MHz频谱的认知无线电环境,所有认知用户的目标BER均为,博弈动态模型为下列公式:
上述公式中,bi(t)是某个时刻t次用户i可以分到的频谱;ai是次用户i速度调整参数,ri是此用户i的收益,公式中则是此用户的传输速率;k是频谱密度效率,x与y都是非负常数,c大于等于1。主用户价格函数采用X=0,Y=1,c根据环境评估予以调整。主用户频谱价格w=1,则次用户收益ri=10。
2.仿真结果分析
由于信道质量存在较大差异,因此纳什均衡在不同点上,因为使用的是自适应调制技术,次用户能够在频谱一样的情况下,得到更好的传输速率及收益,对于次用户而言,要动态库诺特博弈中频谱共享轨迹能够说明次用户i速度参数为ai=az=0.14;在速度相同的参数下,纳什均衡点信道质量良好,能够使曲线出现更大变化。
图2是不同信道质量和稳定区域的关系,不同信道质量稳定范围在a1~a2上,若此范围的数值设置在此区域,可以确保频道共享的稳定性;若超出此范围,则说明共享不稳定,容易出现较大波动。
三、结语
认知无线电技术的发展,已经受到行业人士的广泛关注,其发展应用能够为通信技术做出重要贡献。进一步研究认知无线电技术,通过借助博弈论的相关内容,能够减少频谱资源有限带来的通信束缚,从而使无线通信技术得到更好的发展。
参考文献
关键词:博弈论;博弈模型;旅游;综述
中图分类号:F2文献标识码:A文章编号:1672-3198(2012)15-0009-02
随着旅游业的蓬勃发展,国内旅游研究也经历了近30年的快速发展历程。期间,学者们不断引进各大学科的方法和理论,以充实旅游研究的理论基础。近年来,博弈论作为旅游研究的重要方法被广泛使用,丰富了旅游研究的内容。本文主要从博弈模型运用的角度对博弈论在旅游研究中的文献加以梳理,希望对相关研究者有所裨益。
1 综述基础和主要领域
1.1 综述基础
笔者以“旅游、博弈”为关键词或者题名在维普科技中文全文数据库检索,检索期从1989年至2011年12月29日,共有全部期刊文献225篇,其中在核心期刊上发表的共有67篇,其中有效文献(有效文献指真正运用具体博弈模型的文献)58篇,具体分布如表1:
从表1可以看出,博弈论在旅游研究中的运用开始于1996年,至今已有15年,由最初的零星运用期演化到至今的相对稳定期。其中核心期刊上的论文分布与总体趋势相吻合,故笔者主要对核心期刊上的67篇文献进行仔细研读,对其中58篇有效文献进行详细的分析和梳理。
1.2 博弈论在旅游研究中的主要运用领域
纵观近15年的旅游博弈研究,学者们着眼于旅游业的各个领域,透过不同角度进行研究。其中主要的研究领域如图1所示:
由图1可知,区域旅游是旅游博弈论研究中运用最多的领域,共有14篇,占全部文献的24.13%。该领域的文献主要集中于“长三角”、“泛珠三角”、“京津冀”、“红三角”等国内主要的经济区,从区域旅游的竞争合作入手,指出区域内政府间合作的必要性和重要性并且提出相应对策。其次是旅游市场的博弈研究,其主要分析买卖双方之间由于信息不对称而导致旅游市场的低效率,并且从政府和企业两方面提出改善产品质量和信誉机制的建立等提高旅游市场效率的方案。再则,乡村旅游的博弈研究是近期关注的焦点之一,主要从社区参与的角度研究乡村旅游的发展,关注社区农民的利益保障问题,而乡村旅游中的环境保护问题也是学者的关注点。另外,环境保护、旅游商品供应链、景区开发等问题也是博弈方法运用的主要领域。
2 旅游博弈研究中的博弈模型运用情况
运用博弈论研究旅游最主要是博弈方法和模型的运用对旅游现象的解释和说明,所以对博弈模型运用的梳理显得尤为重要。笔者将以博弈的基本分类为基础解读博弈模型的使用情况,具体分布如图2:
2.1 非合作博弈模型的运用
(1)完全信息静态博弈的运用。
完全信息静态博弈是是四种类型中相对简单也是运用最普遍的类型,故运用这一博弈类型的文献共有34篇,占全部文献的58.62%。
完全信息静态博弈的经典模型有囚徒困境、智猪博弈、斗鸡博弈、市场争夺战博弈、古诺模型和勃特兰寡头博弈等,通常以矩阵形式展现。在旅游研究的文献中运用这一博弈的类型的学者多数是将这些经典模型运用到具体领域中。
①囚徒困境:囚徒困境模型是在这类博弈中运用最普遍的模型,通常用来证明博弈双方在各自理性的情况下无法达到帕累托最优。于岩平运用此模型解释旅游企业和核心员工之间的忠诚度问题,得出一次双方唯一的均衡解是各自不忠诚,一次博弈难以维系两者之间心理契约的忠诚缔结。吕兴洋等分淡旺季在旅游供应商和中间商之间的合作与否进行单次博弈,无法达到帕累托最优。罗富民等通过此模型说明区域旅游合作中的政府公共产品供给不足的问题的存在,又通过斗鸡博弈模型证明公共产品供给失衡问题的存在。另外,此模型也可以运用到新景区开发以及旅游产品价格竞争问题等。
②智猪博弈:此模型主要运用于实力不均衡的博弈主体之间弱者的搭便车现象。如在旅游地形象促销问题中,运用此模型说明大企业着力促销而小企业搭便车收益的问题。
③勃特兰寡头博弈:将此模型运用于旅游研究中一般体现在旅游产品的价格竞争和决策问题上。任宁宁等将此模型运用于旅游商品的生产企业之间,说明旅游企业的价格竞争,得到的均衡解为两企业以最低价格生产并均分市场。
④古诺模型:此模型的运用主要解决博弈主体所提品的量的选择问题。王居凤等运用此模型解释两寡头生产产量的选择方式并且将此扩展到n个企业,说明为了维持联盟稳定性而建立协议的必要性。
⑤Hotellin品决策模型:李洪娜等通过对此模型的具体表述和分析阐述了同质旅游产品间的竞争问题,分别提出了通过产品差异化策略和打造品牌旅游产品来提高竞争能力。
(2)完全信息动态博弈的运用。
完全信息动态博弈的经典模型有海盗分宝博弈、斯塔尔伯格寡头博弈、蜈蚣博弈等。运用该类型的文献有13篇,占文献的22.4%。
①斯塔尔伯格寡头模型:此模型其实是古诺模型的动态化,将同时决策的俩寡头演变为先后决策的领导者和跟随者之间的产量决策博弈。杨树等将此模型改良后运用到旅行社的服务质量决策问题中,并且分析得到在一次次的质量决策博弈后总能得到最优策略。
②海盗分宝博弈:饶勇等将此模型运用到旅游开发商和社区居民间对旅游资源收益的分配问题上,但是仅仅阐述了模型,没有对此进行详细分析和解答。
[关键词]进化 博弈 文献综述
一、进化博弈的基本理论
进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。
二、进化博弈理论的应用研究
1.社会行为领域
Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Sandholm对个体行为偏好的进化进行了动态分析。Juang从进化的视角研究了规则的进化与均衡的选择问题。Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。
2.制度的演化
青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。他们认为:任何一种经济体制的产生都具有一定的惯性,并随着经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化。吴炯、彭飞以进化博弈的复制动态方法为工具解释了公司治理结构演进过程中的“两极化”现象。邱中华等通过演化博弈模型考察委托人和人在委托过程中行为策略的自发演化过程,发现这一博弈过程的所有均衡都是鞍点,从而得出委托人和人之间的监察博弈没有进化稳定策略。Kandori和Rafael运用进化博弈理论研究了两种具有网络外部性的技术之间竞争的博弈过程,提出了解决“花车效应”问题的对策,论证了后发技术取代主导技术的可能性。
3.经济行为的演化
Routledge基于Grossman和Stiglitz提出的经济模型,探讨了金融市场上个体行为人是如何通过适应性和进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Cowen和Kroszner利用进化博弈理论研究了在自由竞争易货贸易经济中,在存在交易成本的情况下,交易媒介的选择问题。罗发友等对集群内企业技术创新行为构建了鹰鸽博弈、鹰鸽反击者博弈和鹰鸽应变者博弈三个模型,并得出集群内企业创新行为不存在纯策略进化稳定均衡,但存在混合策略进化稳定均衡和行为策略进化稳定均衡,反映了集群内企业创新行为的协同竞争性以及这种协同竞争创新行为的进化稳定特性。
三、借鉴意义
1.进化博弈论从有限理性人出发,强调系统达到均衡的过程而非均衡本身。进化博弈理论是完全摒弃传统理论中非现实的“理性人”假设,直接从有限理性参与人群体出发而提出的一种全新的动态分析方法,该方法认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程。
2.进化博弈论纳入了系统到达均衡的时间因素,有利于决策者控制系统向目标的进化。进化博弈理论的动态分析方法中一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程。这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。
3.进化博弈理论引入突变因素较好的解决了多重均衡的选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态。进化博弈理论的基本均衡概念――进化稳定均衡,描述了当经济系统一旦进入到某一均衡的吸引域内,系统就会对其他的突变策略具有一定程度的抵抗力。
参考文献:
[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)
[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998
[3] 青木昌彦 奥野正宽:经济体制的比较制度分析.中国发展出版社,1999
[4]邱中华 金翔:基于进化博弈论研究的一类监察博弈. 南京邮电大学学报(自然科学版),2006,26
一 博弈理论简介
(一)博弈论的名称
博弈论,英文名称为Game theory是研究各方策略相互影响的条件下,理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时,曾有过多种译法。有的学者根据其英文名称,直译为游戏理论;有的学者则从该理论本身的研究对象出发,转译为对策论或对策运筹论。近年来,学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外,更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。
(二)博弈的要素
一个完整的博弈应包含如下四项要素:1,博弈的参加者(player)。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可视作一个博弈方。比如柯达与富士公司的竞争,就可看作一个有二个博弈方的博弈。一般说来, 博弈的参加者越多,情况就越复杂,结果越难预料。2,策略空间(strategy space)。是指各博弈方可选择策略的集合。strategy直译应为战略,不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多,博弈就越复杂。3,进行博弈的次序(the order of play)。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间,先后决策并行动和同时决策行动,其结果是大相径庭的。 4,博弈的信息(information)。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如,在各博弈方同时决策的博弈中,必须保证不能让对手知道自己采取何种策略,否则自己将永远是博弈的输家。得益(play off),也称支付,是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素,一个博弈也就随之确定了。值得注意的是,博弈论特别强调“理性人”的前提假定,即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要,否则不会考虑其他博弈方或社会利益。
(三)博弈论的结构
由于一个完整的博弈需具备上述四要素,因此博弈可以从不同的角度划分成不同类别:1,按博弈方划分,可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方,所以它已退化为一般的最优化问题。经济学中常见的求最优问题,实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂,而且两人以上的博弈会出现合作博弈问题。这样,多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中,竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献,即在非合作博弈方面。2,按策略空间划分,可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果,所以从理论上讲,有限策略博弈的结果必然是有限的,而无限策略博弈的结果则有无穷多种可能。3,按进行博弈的次序划分,可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然,严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此,同时决策是指可近似地看作同时作决定的过程,如乒乓球团体赛的出场顺序,虽双方决策可能有早有晚,但一旦敲定便谁也不许变更,因而可看作同时决策。各博弈方不是同时决策,而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈,双方的每一步都将取决于前面的情势。4,按信息划分,如按得益信息分类,可分为完全信息博弈与不完全信息博弈。完全(complete)信息,是指各方对自己每种策略的得益情况完全清楚,否则是不完全信息;在动态博弈中,如按博弈进程信息分类,可分为完美信息动态博弈与不完美信息动态博弈。完美(perfect)信息,是指博弈方在决策前对其他博弈方的行为完全了解,否则是不完美信息。5,按得益情况划分,可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失,这样的博弈叫零和博弈,零和博弈的博弈方始终是对立关系;各方都会有收益,但收益总和是一固定常数,这样的博弈为常和博弈;各方不同的策略组合会有不同的收益,这样的博弈称变和博弈。显然,零和博弈是常和博弈的特例,常和博弈是变和博弈的特例。6,综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准,可将博弈分为:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。
博弈论 (Game Theory),是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此,博弈论又称为“对策论”,也就是说当一个主体,比如一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上,博弈理论又译为“决策理论”。博弈论创立于20世纪40年代,到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域,而妾包括政治学、军事、外交、国际关系、公共选择等各个领域,因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域,具体分析反垄断法规则的制定过程。
二、反垄断法的博弈分析
(一)政府和企业之间的博弈分析
1, 政府和企业博弈的根源
企业,作为市场运行主体,在市场经济中具有强烈的追求利润的理性意识;企业的理性就是实现利润的最大化。企业一切经济活动的出发点和归宿都要以这个目标为指导。在利润最大化目标的指导下,企业必须研究市场上其他主体的战略并确定自己的战略,从而市场上各个经济主体都是企业博弈的对象。企业决策往往具有局部性、个体性和短期性的特点。与之相对,政府作为市场运行的监管主体,是社会理性的当然代表,其决策往往带有全局性、整体性和长远性。由于政府制定的各种市场运行规则客观上限制了企业理性的发挥;尤其是当社会理性和企业理性发生冲突时,作为被管理者的企业只能寻求“次优方案”。当然,企业也并非只是一味地妥协,也可以与政府进行博弈从而影响相应的法律、法规的制定。由政府所代表的社会理性和企业理性的冲突及其在现实经济生活中的具体表现——政府所代表的社会利益与企业追求自身利润最大化的矛盾,决定了二者都将对方视作自己的博弈对象,从而使具体的法律、法规,尤其是反垄断法的制定过程,表现为政府和企业的博弈过程。
2,政府和企业参与博弈的目的
企业,作为盈利性的经济组织,是以实现利润最大化为其根本宗旨的;并且在这一根本宗旨的指导下组织各种经济活动。只要能够降低企业的生产成本,提高企业的利润,企业都不惜一试,包括采取垄断的方式。但是,垄断的存在,不仅侵害了广大的消费者的利益(具体表现是通过垄断价格,将相当大的一部分消费者剩余转化为超额利润。),而且凭借其“市场势力”阻碍了有效的竞争,打破了市场竞争的均衡状态。政府,作为社会利益的代表,具有保护消费者的合法权益和维护市场有效的竞争秩序的当然职能;其可通过制定法律影响着企业决策的“可选择集”,即企业只能在法律许可的范围内进行选择。显然,“可选择集”越大,对企业越有利;而决定企业“可选择集”大小的恰恰就是政府。因为政府通过确定其产业政策和竞争政策的具体内容和相互关系,影响认定垄断的界限,并通过反垄断立法决定了企业可选择范围的大小,从而间接地决定了企业的盈利空间。企业参与博弈的目的就是通过影响政府的反垄断法规,实现对企业行为的有效规制,进而最大限度地保护社会公众的利益。
3,反垄断法的博弈分析
反垄断法指的是国家为了保护竞争,针对一些限制竞争行为所规定的法律规范的总称。其目的就是政府通过法律的手段限制企业有碍于竞争的经济行为。政府在决定是否将一种企业的经济行为列入受限制之列前,政府要作如下的博弈分析:保持企业退出
政府面对一种限制竞争行为有两种选择:干预,即将其限制于合理的范围之内;或者放任自流。政府要进行干预需要支出相应的费用,设费用为5,占总收益10的一半,那么经政府干预给社会带来的净收益是5(总收益10减去干预费用5)。此时,企业针对政府的干预政策有两种策略:其一是保持原有的状态不变,继续从事具有垄断性质的经济活动。但是,由于法律的强制性,如果企业采取此策略无异于自取灭亡。此时,企业不但不会盈利,相反还会被强制清除出场。其二是企业选择退出。此时,企业只需要付出沉淀成本,设其为收益的一半为5;在这种情况下,企业的收益为-5.政府还有另外一种选择,就是放任自流。这样,如果企业保持原来的垄断状态,就将获得全部的利润所得,社会公共利益为0;如果企业选择退出,那么全部利润将自动流向政府所代表的社会公众,此时,企业还要支付相应的沉淀成本。由于政府干预经济的目的就是为了将“垄断利润”返还给广大的消费者,(0,10)所代表的状态正是政府介入的原因,并且是政府所要竭力改善的初始状态。(10,-5)所代表的是企业自动放弃高额的垄断利润,并且还要为此承担相应的前期投入,即沉淀成本。这是不符合企业追求利润最大化的理性目标的,因而是不现实的。由此,政府只能选择干预策略。企业根据其对政府选择的分析判断政府介入的可能性,然后在(5,-10)、(5,-5)和(0,10)三种状态中进行选择。由于(5,-10)的高成本和(0,10)的不现实性及由此决定的高风险性,迫使理性的厂商选择(5,-5)所代表策略。这样,可以将损失降低到最低。政府经过上述博弈分析,最终决定将该经济行为纳入禁止之列;而企业也会选择放弃该垄断行为。至此,反垄断法的目的得以实现。
4 对反垄断法进行经济分析的意义。
对反垄断法进行博弈分析的意义在于揭示反垄断法的制定过程从某种意义上讲就是政府和企业的博弈的过程,反垄断法律规范的具体规范则是政府和企业的博弈结果在法律上的认定。所以,在反垄断法的制定过程中,应该站在企业的立场上考虑企业可能做出的策略选择,然后再确定法律是否对该行为进行规制及如何规制。这样,才能保证制定出的法律能有效地规制企业的行为,有效地保证竞争。
(二)企业间通过价格等垄断协议的博弈分析
在寡头市场上,当寡头数量很少时,从理论上说,他们很容易通过谈判实行勾结定价,即像一个垄断者那样用高价格来宰消费者。这样做,交易费用(寡头进行价格勾结谈判达成协议所需要的费用)并不高,而勾结定价可以为参与者带来共同的利益。但为什么这种勾结定价在现实中成功的很少呢?尽管许多国家“反垄断法”中有禁止勾结定价的条款,但实际上这个条款的作用极为有限,因为寡头之间可以采用不易被发现的隐蔽性勾结——默契。我们可以用博弈论的分析来说明现实中的勾结定价难以成功的原因。
我们假设某地牛奶市场由两家寡头瓜分,这是寡头中最简单的寡头——双头,也是最容易达成价格勾结协议的寡头市场。如果这两家寡头(A与B)之间没有任何勾结,各自按成本最低时产量进行生产,各生产3000磅牛奶,成本为每磅6元。这时,市场总供给量为6000磅牛奶,价格为6元。各家都没有经济利润(经济利润为零)。
现在这两家寡头达成价格勾结。要实现高价必须减少产量。现实中寡头之间的价格勾结总是以限产为前提的(以后要谈到的欧佩克就是这样)。如果这两家寡头把产量确定为 2000磅牛奶,这时成本为每磅8元。市场总供给量减少为4000磅牛奶,需求并没有变,价格上升至每磅9元。在这种价格时,每家寡头可获得经济利润 2000元。当然,勾结起来对双方都是有利好的。
如果达成协议方有一方违约会有什么结果呢?如果一方违约,生产3000磅牛奶,它的每磅牛奶成本约为6元,另一方守约生产2000磅牛,每磅牛奶成本为8元。这时市场总供给量为5000磅牛奶,价格为7.5元。市场价格只有一个,是整个市场的供求总量决定的。违约的一方,成本仅6元,价格为7.5元,每磅牛奶的利润为 1.5元,总计经济利润为4500元。守约的一方,成本为8元,价格也是7.5元,每磅牛奶亏损0.5元,2000磅牛奶共亏损1000元。
这两个寡头的价格勾结协议的实施并没有法律保障,因为这种协议是非法的。守约的一方无法对违约的一方提出诉讼,即缺乏有效的惩罚。是否守约完全取决于各自的意愿。他们是否会守约呢?一方守约与否的结果还取决于对方是否守约,协议并没有保证对方守约的硬约束,因此,各方都有守约与违约两种选择,而对方到底会选择什么,无法确定,这时就可以用博弈论来分析各自的决策了。
我们来看A的决策过程。A要分析在B不同的选择下,自己的选择会有什么结果。A先假设B是守约的,这时A选择守约可以赚2000元,如果选择不守约可以赚4500元。两者相比,A守约时,B的占优战略是不守约。A再假设B不守约,这时A选择守约要亏损1000元,如果选择不守约可以不赔不赚(经济利润为零)。两者相比,A不守约时,B的占优越略也是不守约。A的结论是,无论B守约还是违约,对自己最有利的还是不守约。B的分析方法和结论与A完全一样。结果A、B都选择了不守约,价格协议成了一张废纸。
在这种情况下,A、B如何才能实现勾结呢?研究者发现,如果就是这两个寡头,同样的博弈会多次进行。双方最终会发现,达成勾结的条件是采用一报还一报的策略,即对方这次守约,我下次也守约,如果对方这次不守约,我下次也不守约。这种情况下,双方会发现,从多次博弈的结果看,违约是不利的,从而自觉守约。这种一报还一报就成为有效的惩罚。但在现实中这种情况极为罕见——只有两个寡头,而且多次重复同样的博弈。在常见的多头博弈,而且同样的博弈很少反复进行的情况下,价格勾结就难以成功了。
这种分析与现实一致吗?一个最常用的例子就是欧佩克(石油输出国组织)的价格勾结。欧佩克是一个限制产量并提高石油价格的寡头价格联盟(又称“卡特尔”)。他们在70 年代的成功更多的是共同的政治动机。但经济利益在长期中是高于政治的。随着时间流逝,博弈论分析的情况就出现了。各成员国都想,无论其他国家是否守约,我违约对自己是有利的,于是纷纷打破限产规定,增加生产,结果到80年代,石油价格就大幅度下跌了。以后的石油价格上升不是价格协议起作用,而是供求关系变动的结果
在任何一种市场上,决定价格的最基本因素还是供求关系。在供大于求的情况下,任何价格勾结都不能长远地提高价格。在供小于求的情况下,无需价格勾结,价格也会上升。在价格决定中,价格勾结是无用的。过去我国出现过的汽车行业自律价和民航的禁折令等形式的价格勾结,哪一个实现了?人为的价格勾结当然阻挡不了供求决定价格的客观规律。博弈论分析的结论与现实是一致的。企业还是不要玩这种小权术,老老实实提高自己的市场竞争。
三、小结
本文通过对反垄断法的制定过程进行简要的博弈分析,旨在说明法律的制定不仅是立法机构的单方行为,还是一个规制者与被规制者——政府和企业相互博弈的互动的过程。如果在法律的制定过程中忽略了这一点,就很容易导致法律对于现实生活的无效和“无能为力”,从而不能有效地实现其价值。
参考文献
[1]张维迎。博弈论与信息经济学[M].上海人民出版社,1996。
[2]冯涛。程瑜。微观经济学[Z].西北大学出版社,1998。