合作博弈调度范文

2024-06-21

合作博弈调度范文（精选6篇）

合作博弈调度第1篇

水是万物之源。没有水, 社会将寸步难行。然而生活中, 总会由于各种原因导致临时停水, 给人们生活和生产带来不便。解决不可控因素下多方供水需求, 单独的救急中心远远不够, 必须调度多个救急中心的应急资源。由于各需水点对应急资源存在竞争关系, 因此, 寻找一种能够反映各个需水点的缺水严重程度和救助响应时间的应急资源调度策略和模型, 以达到利益均衡是一个值得研究的课题。

二、调度策略的非合作博弈模型建立

(一) 模型假设

在解决本文提出的不可控因素发生时对应急资源合理调度的问题前可以做出如下假设:

1.对各子系统在相同情况下对应急资源的需求量做出分级, 1表示严重缺水, 2表示重度缺水, 3表示中度缺水, 4表示轻度缺水。

2.现实中单一救急中心往往无法解决所有需水点对水资源的需求, 因此需联合多个救急中心。假设当某一区域的应急资源难以解决问题时, 可从邻近区域调水。

3.成本函数作为一个多元复合函数, 其影响因素包含很多, 比如本事件中子系统的缺水程度, 资源调度到救援响应的时间以及需水点到救急中心的距离等。因此在解决问题前需要对各子系统 (即需水点) 对救急中心的调度成本进行从大到小的排序。

(二) 博弈模型的相关参数与数学表达式

1.调度成本函数Cik

理论上以其为调度策略的依据。Cik的函数表达如下所示:

公式中, Hi表示需水点i的缺水级别, Yik表示需水点i到救急中心k的距离。

2.效益函数Pi

在实际调度过程中, 收益函数等于调度成本的倒数:

其中k∈M。公式中, △Cp表示需水点i在救急中心k未能得到资源而从其他救急中心进行资源调度而产生的额外成本。需水点i从全部救急中心集合M中调度其所需资源的效益函数满足叠加定理。

三、非合作博弈模型的算法求解

(一) 求解水资源调度的非合作博弈模型Nash均衡解的步骤

1.对救援资源初始分配, 确定各需水点向救急中心调度资源所产生的成本;

2.不考虑各救急中心可提供水资源的上限, 按成本最小化原则向各需水点分配资源;

3.考虑各救急中心实际资源量, 若可以满足同一级别各需水点, 则按需分配。若不能, 同级别各需水点对该救急中心的资源将产生竞争, 形成博弈;

4.构造非合作博弈调度模型, 求解Nash均衡解, 并按Nash均衡解对救急中心的水资源进行调度;

5.同一级别的需水点若存在按照Nash均衡解分配后仍不满足需求的部分, 则按成本最小化原则从其他救急中心调度资源, 直到满足需求;

6.重复步骤 (3) 。

(二) 求解纳什均衡

根据纳什均衡的定义, 对所有纯策略组合进行逐一检验, 得出纯策略纳什均衡。应用最多的一种算法称为迭代算法。

在实际迭代计算中可以从任意的s (0) ∈S (策略空间) 开始, 假设初始点s (0) 与纳什均衡点s*之间的距离为d (0) , 经过m次迭代以后, d (s (m) , s*) ≤ζ0d (s (0) , s*) =ζ0md (0) , 因为0≤ζ0≤1, 因此可以采用迭代公式s (m+1) =Xs (m) 来任意逼近纳什均衡点s*。

四、实例计算与分析

问题描述如下:现因某地区发生山体滑坡塌方, 导致自来水厂源水浑浊度超标, 从而导致城市G临时停水, 期限不明。城市G有四个区a, b, c, d, 分别报告了不同的缺水程度。城市G市内只有一处救急中心A, 邻市F有两处救急中心B、C。为了不影响市民的日常生活, 现有关部分组织进行水资源救助工作。数据假设如下。

现假设四个区域向各救急中心调度水资源所产生的成本是相同的。运用3.2提出的求解纳什均衡解的迭代方法可以求出该博弈的纯策略Nash均衡解:

将上述数据代入公式可求得:

总成本Ci, p=Ca, q+Cb, q+Cd, q=10+15+17+18=60是为最优化成本调度策略。

根据公式可求得此组合策略的各个收益函数, 将各个需水点的收益函数代入公式, 可得总的效益目标函数为:

综上所述, 利用迭代算法求得的Nash均衡解:

s*a= (10, 0, 0) ;s*b= (1, 5, 2) ;s*c= (2, 5, 1) s*d= (0, 0, 6) 可以实现向区域a, b, c, d进行水资源公平合理调度, 并且能够保证调度策略的成本最小, 效益最优。

五、结束语

该论文本着实用性原则针对日常生活中常见的临时供水不足问题进行了相关研究, 论文方法通俗易懂, 且延展性较强, 相关的思想方法也可以用来处理类似求解最优化组合的问题, 比如解决自然灾害发生时, 不同地区受灾点的资源调配问题或者用于公司经营中解决客户售后服务的技术人员调配问题, 商业中物流配送问题等。不足之处仍然存在, 但客观讲, 本文思想方法仍具有一定的理论及现实意义, 具有较好的可操作性, 值得广泛推广。

摘要：现实生活中, 突发事件的发生防不胜防, 由于突发事件而导致的供水不足问题频繁存在, 不当的处理可能会对居民以及工业生产产生严重的影响。因此当突发事件发生后, 在救急资源有限的情况下, 如何对缺水地区进行合理的资源调度是一个非常现实而棘手的问题。本文基于如上现实场景, 将其抽象为存在纳什均衡解的非合作博弈调度模型, 从而把资源调度问题转化为求解非合作博弈调度模型的Nash均衡点问题, 并给出了相关求解方法。

关键词：资源调度,非合作博弈模型,纳什均衡,迭代

参考文献

[1]Sun J, Xu WB.A global search strategy of quantum-behaved particle swarm optimization[C].Proceedings of IEEE Conference on Cybernetics and Intelligent Systems, 2009.:111-116.

[2]HWANG H-S.A food distribution model for famine relief[J].Computer and industrial Engineering, 2011, 37 (1/2) :335-338.

[3]Wan Xiaoyu, Pu Yifei, Li Bingjun, Fractional Differential Amplitude Hierarchical Feature of MPSK Signals[G].8tth INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS, 2010,

[4]王万良, 蒋一波, 李祖欣等.网络控制与调度方法及其应用[M].北京:科学出版社, 2009.

[5]杨继军.面向非常规突发事件的应急资源博弈调度模型与优化策略研究[D].上海:同济大学经济与管理学院, 2009.

[6]姚杰, 计雷, 池宏.突发事件应急管理中的动态博弈分析[J].管理评论, 2005 (3) :46-50.

[7]吴增军.高校就业统计中的非合作博弈问题研究[J].职业教育研究, 2009 (3) .

鱼与青蛙是博弈还是合作第2篇

——《人是如何学习的》读后感

金山中学张有蔚

说实话，《人是如何学习的》这部由16位美国学习专家合写的论著，不是一部让人容易接近的专著，学术性太强，象牙塔味道太重，初读者、尤其是教学实践者，会望而生畏，会感到距离我们的课堂、学情，甚至校情、国情，距离太大。可是一旦读进去，则会有茅塞顿开大悟之感。

“鱼就是鱼”的故事，是整部书的定调——主题所在：现代的学习观是人们基于原有的知识建构新的知识以及对新知识的理解。“有一条鱼，他很想了解陆地上的事，却因为只能在水中呼吸而无法实现。他与小蝌蚪交上了朋友。在小蝌蚪长成青蛙之后，便跳上陆地。几周后，青蛙回到池塘，向鱼汇报了他所看见的。青蛙描述了陆地上的各种东西：鸟、牛和人。鱼根据青蛙对每一样东西的描述做了想象中的表征：每一样东西都带有鱼的形状，只是根据青蛙的描述稍作调整——人被想象成用鱼尾巴走路的鱼，鸟事长着翅膀的鱼，奶牛是长着乳房的的鱼。”

这个故事，旨在告诉我们：

1、学习者（鱼）基于其已有的知识，在学习过程中，同时会“建构”新知识，对知识（对鱼来说，陆地上的事）既学习，更“建设之、改进之，而且在不确定的情形下做出决定”。比如我们在电视中看的“外星人”，其形象不管多么丑陋，都是以人的摸样为基础的，都有眼睛、嘴、耳朵、胳膊、腿这些人类的器官。

学生的学习是以原有的经验为基础的，教师应该注意这些经验对学习（接受知识、或再传布）的影响。例如，十几年前，当“话题作文”问世时，学习者面对“弯弯的月亮像 ”给出的回答，不再是循规蹈矩的“像小船”，而是“像香蕉”“像蚊帐钩”“像弯刀”“像弓弩”“像镰刀”“像缺口”等等。显然，这种种物象与月亮的结合，是学习者的建构、改进。你说谁的答案对还是不对，谁的创见好还是不好？

当我们读到“鱼的故事”时恍然：本该如此。

2、传授者（青蛙）作为学习者和知识的桥梁，是沟通者，也是创造者（他的描述当然也经过了基于自己认知的过滤和选择），学习者与传授者唯有合作，才会有一个和谐的“新天地”。

在阐述各自观点时，《人是如何学习的》的作者还给我若干启悟，或者新知，或者思考，也就带来若许变化。

原先与教育联系不深的学科，比如认知科学，已经渐渐与教育实践联系起来，在真实的教学实践中检验理论；，多种研究方法以及研究技术的同时使用；不同学科的知识逐渐融合在一起。信息以及知识的发展突破了人的想象，正以不可逆转的力量改变着整个教育界。正如书中指出的，“求知”的意义已经从传统的能够记忆和复述信息转为能够发现和利用信息。从内省法的应用到行为主义的盛行再到认知科学的诞生最后到建构主义的出现，学习的研究实际上走过了一条从猜测到科学的道路。

在19世纪后期，人们尝试通过内省法可以反映出思维过程，并对人类的意识进行精确的分析。到20世纪，行为主义出现。行为主义者把学习的概念界定为刺激和反应之间形成的连接。由于他们把目光仅仅放在刺激条件以及与这些刺激条件相联系的行为身上，行为主义也没有得到进一步的发展。到1950年之后，在对人类以及其生存环境进行充分认识以后，一个新领域──认知科学出现了。认知科学主要从多学科的视点来研究学习问题，并且运用一些新的实验工具、新的方法论以及新的理论假设，能够检验理论而不是仅仅对思维和学习进行简单的推测。

理解性学习是新的学习科学的显著特征。理解性学习强调在原有理解的基础上，运用基本知识和学科原理框架对新经验和新知识建构新的理解。理解性学习既需要个体认知，也需要小组的协作，它是个体心智运作和社会文化中介的多元化意义建构的过程。理解性学习是关注过程的学习，重在获得对学科核心概念和原理的深层理解，是一种有效学习，也是有意义学习，理解性学习是学习者运用原有的知识，在新的情境下进行个体心智运作和社会文化中介的交互的意义建构，并不断获得理解的探索和发展过程。学习过程的本质是理解的探索和发展，而不是事实内容的记忆和积累，因此关注学生学习的过程，促进深层的理解是很重要的一个步骤。学生在学习的过程中获得了学习内容的深层理解，才是真正的理解，才能获得意义拓展和价值生成。总而言之，理解性学习研究重点在于使学习者应变成问题的解决者、创造性的思维者，要能看到正在学习的知识的多重可能性，要学会如何操作自己的知识。

过去包括现在我们的许多课程都强调记忆而非理解，课本包含的都是需要学生去记忆的事实，而测验是对学生记忆能力的测量。

在理解性学习这一节中提到一个概念是“迁移”，简单的理解“迁移”，可以认为是学习的知识在实践中的运用。

迁移在心理学上也称学习迁移也称训练迁移，是指一种学习对另一种学习的影响。迁移不仅存在于某种经验内部，而且也存在于不同的经验之间。比如，数学学习中审题技能的掌握可能会促进物理、化学等其他学科审题技能的应用；语言学习中丰富的词汇知识的掌握将促进阅读技能的提高，而阅读技能的提高又可以促进更多的词汇知识的获得。知识与技能之间相互迁移。

对“教育”的含义的理解，是对传统观念的一种近似“颠覆”：教育的目的是提升学生能力，并且探求对复杂知识的理解，能力的提升是以原有的知识为基础建构的，学习者是主动的，而不是传统意义上的被动学习者，能够把在学习中学到的知识应用到真实的情境中，强调“反思”，包含教什么，如何教，以及如何评价学习

这是一门不断发展的学科，新的研究方法会不断的诞生，有时候这样的发展是以否定原有的成果为条件。研究的范围更加的广泛，综合性更强。研究中应用到的技术越来越与时俱进。研究的范围越来越宽泛。

特别是书中所论述的“发展”的概念，对当下教师、教育工作者，甚至所有成人，都是一种启迪和矫正。传统的观点是，幼儿知道的能做的事情极少，但是随着年龄的增长和经验的增加，他们的能力不断加强，学习就是发展发展就是学习。经过研究之后，一部分学者认为，发展是克服信息加工的限制，幼儿在发展的过程中会习得各种各样的策略。幼儿主动的了解世界，在特惠领域具有接受快学得易的倾向，能为早期的学习提供条件，但是在这些领域他们仍有很多的东西要学。早期知识对婴儿的学习有重要的作用，对于这部分知识其中常常包含着错误的概念。错误的信息会阻碍学生学习，所以教师应充分意识到影响儿童理解的背景知识；

儿童需要明白学习意味着什么，作为学习者他们应该如何去计划、修正、反思自己与别人的学习。儿童既是问题的提出者，又是问题的解决者。儿童试图解决呈现在面前的问题，同时又寻求新的挑战。经过一次次失败，他们会不断改进解决问题的策略

教师（成人）的作用就是作为津渡和桥梁，帮助学生（儿童少年）建立新旧情境之间的联结。

正是新的学习观、儿童观的建立，教师观自然也就有了全新的架构。为了应付更具挑战性的任务，教师传统的角色被颠覆，教师需要通过不断地学习来提高自身的能力。对于教师学习的研究是一个很新的话题，通过对教师学习的研究，不仅能提高教师自身的能力，同时也能够将理论应用于学生身上。

在教师的学习过程中，会出现这样的现象，教师的能力达到一定的程度之后，一般是在能够满足教师需要之后，就会停滞学习，满足于现状。因此，提供给教师的学习机会必须包含适当的反馈，能够提供给老师反思的机会，促进老师的教学实践，教师围绕学习内容以及学生的学习情况展开合作，共同分享教学经验。

《人是如何学习的》是“专家”的“研究”成果，有的甚至只能说是一家之言，但是正如书中观点：“了解专家的重要之处不是因为我们期望所有的学生都成为专家，而是因为专业知识使我们对有效学习的结果有了富有价值的见解。”无论是知识的组织还是知识的提取，专家们显然都更胜一筹。就知识的组织来说，专家的知识不仅仅是对相关领域的事实和公式的罗列，相反它是围绕核心观念或“大观点”组织的，这些概念和观点引导他们去思考自己的领域。在情境与知识提取方面，专家为了找到相关知识，并非把所有知识都搜寻一遍。专家不但获得知识，而且能熟练提取与具体任务相关的知识。专家与新手的差别不能简单归结为记忆力或智力能力上的差异，也不是运用一般策略方面的区别，而是专家获得了广泛的知识，这些知识影响他们所关注的事物，影响到他们在环境中如何组织、表征和理解信息，这反过来又影响他们记忆、推理和解决问题的能力。

专家能识别新手注意不到的信息特征和有意义的信息模式；专家获得大量的内容知识，这些知识的组织方式反映专家对学科的理解深度；专家的知识不能简化为一些孤立的事实或命题，而应反映应用的情境；专家能够毫不费力地从自己的知识中灵活地提取重要内容，能应用灵活的方法应付新情景和新的挑战。

除了知识本身，“方法”也是一种学习和促进。

合作博弈调度第3篇

管道流量泄漏在线监测对流媒体监控系统的要求非常高, 包括清晰度稳定、刷新率高、具备实时性等。当大量的监控系统组成一个网络的时候, 如何保证监控系统的有效运行成了非常突出的问题, 而管道流量泄漏在线监测子系统可以来自局域网、无线局域网、移动设备、广域网等各种网络, 此时监控网络的整体特性就存在很大的不确定性, 包括子系统的数量、数据突发性、流量阻塞时间、丢包等。如何对泄漏流媒体监控网络的资源分配状态进行估计和调整是非常棘手的问题, 如今端到端系统总是采取尽量占用更多的网络资源策略来保证自身的工作质量, 但是这种作法将导致网络整体性能的下降, 在研究这些网络调度与优化算法时, 有必要引入新的研究方法和理论, 而博弈理论为该类研究提供了坚实的数学基础。本文在分析管道流量泄漏在线监测系统中流媒体监控特点的基础上, 对视频压缩算法和监控网络的特点进行数学抽象, 根据流媒体监控系统中调度策略的特点建立非合作博弈模型, 并设计子系统的效用函数, 讨论和证明Nash均衡点的特性, 给出优化的解算方法, 最后对仿真结果进行分析。

1 流媒体监控问题描述

监控网络包含多个子系统, 每个子系统都完成一系列的视频监控过程, 每个子系统不知道监控网络中是否存在其他子系统, 也无法获得其他子系统的状态信息。子系统工作过程中将按照自己的需求占用网络资源, 并尽可能地使自身达到最佳运行状态, 在监控网络资源受限的情况下, 多个子系统之间需要通过竞争来抢占网络资源。监控网络的数学描述:设子系统数量为n, 需要考察的子系统集合为N={Si|1≤i≤n}。子系统采集的原始视频数据量非常巨大, 需压缩后才能进行网络传输, 视频编码压缩通常采用去除时空域相关性的帧内/帧间预测、离散余弦变换量化和熵编码技术, 以达到较高的编码效率。为了在传输中得到稳定的数据输出比特率, 流媒体传输中普遍采用基于缓冲区的码率控制方法, 而码率控制算法就是动态调整编码器参数, 得到目标比特数。码率控制有二种模式VBR和CBR, 其中VBR模式是一种开环处理, 由于实际视频序列中的图像复杂度是不断变化的, 比特率也相应变化;CBR模式是一种闭环处理, 动态得到符合要求的码率。本文讨论的视频监控系统采用CBR模式, 在设计一个视频监控子系统时, 可以准确估计出其位于最佳工作状态所需的网络资源, 即最佳视频流发送比特率。

设监控网络中所有子系统的最佳视频流发送比特率集合为Bmax={βi |1≤i≤n}, 可以知道在子系统si中仅存在唯一的Bimax。为了适应可用带宽不断变化的网络, 大量的研究致力于端到端视频流比特率的自适应优化算法[1], 其目的是使视频传输在带宽低于最佳比特率的情况下适当降低视频质量, 而不至于停止工作。因此子系统si存在唯一的允许工作比特率下限Bimin, 且Bimin∈[0, Bimax], 当Bimin = Bimax时表示子系统只能工作在最佳比特率下。设子系统si工作中可采用的比特率为βi, 且βi∈[βimin, βimax], 则监控网络中所有子系统的可用比特率集合为B={βi |1≤i≤n}。

尽管不同的码率控制算法会使子系统表现出不同的端到端的QoS数据发送特征, 但是总体满足以下特点: (1) 尽可能在βimax的带宽上传输数据; (2) 如果可用带宽低于Bimin, 则停止工作[2]。因此每个子系统的特性可用比特率βi的概率分布为函数fi (βi) , 设子系统的可用比特率概率满足概率分布函数:

$f_{i} (β_{i}) = {\begin{cases} 0 β_{i} < β_{i}^{\min} \\ (\frac{β_{i} - β_{i}^{\min}}{β_{i}^{\max} - β_{i}^{\min}}) β_{_{i}}^{\min} \leq β_{i} \leq β_{i}^{\max} \\ 1 β_{i} > β_{i}^{\max} \end{cases} (1)$

式中i>=1, 可在分析具体子系统时进行调整, 由式 (1) 可知, 传输比特率集合满足的概率密度函数为[3]:

$g_{i} (β_{i}) = {\begin{cases} 0 β_{i} < β_{i}^{\min} \\ \frac{t (β_{i} - β_{i}^{\min})^{t - 1}}{(β_{i}^{\max} - β_{i}^{\min})^{t}} β_{_{i}}^{\min} \leq β_{i} \leq β_{i}^{\max} \\ 0 β_{i} > β_{i}^{\max} \end{cases} (2)$

当子系统使用固定输出比特率时, 即βimax = βimin, 分布函数fi (β $_{i}^{\max}$ ) =fi (β $_{i}^{\min}$ ) =1, 其他情况等于0, 表示该系统只能工作于一个固定的比特率。传输比特率分布函数fi (x) 的数学期望Efi可以反映出子系统的平均带宽占用值, 根据式 (2) 得到:

$\begin{array}{l} E f_{i} = \int_{- \propto}^{+ \propto} β_{i} g_{i} (β_{i}) d β_{i} = \int_{β_{i}^{\min}}^{β_{i}^{\max}} β_{i} \frac{t (β_{i} - β_{_{i}}^{\min})^{t - 1}}{(β_{i}^{\max} - β_{i}^{\min})^{t}} d β_{i} \\ = \frac{t β_{i}^{\max} + β_{i}^{\min}}{t + 1} (3) \end{array}$

2 调度方法的非合作博弈模型

监控网络能提供的总带宽是有限的, 任何一个子系统所占用的带宽资源对其他子系统来说都是负面影响。每个子系统不能仅仅依靠提高自己的带宽占用率来提高自身的工作质量, 因此监控网络中的各个流媒体子系统之间就形成一个非合作博弈过程。根据对监控网络中视频子系统问题的特性分析和数学描述, 构建流媒体调度方法中的非合作博弈模型。该模型为一个三元组, 即Γ= (N, P, ui) , 其中P为监控网络分配给子系统的传输比特率集合, 即P={pi|pi= (bi, βi) , i=1, …, N}, bi∈[β $_{i}^{\min}$ , M]是监控网络预分配给子系统si的比特率, M是监控网络的最大带宽, β $_{i}^{m a x}$ ≤M;ui为子系统si效用函数, 效用函数ui是一个从传输比特率集合P到实数集合R的映射:u→R。当且仅当u (p $_{i}^{*}$ ) >u (p $_{i}^{* *}$ ) , 子系统si在p $_{i}^{*}$ 的工作质量高于p $_{i}^{* *}$ 的工作质量, 基于流媒体调度中的非合作博弈模型, 本文构造子系统效用函数ui (pi) ⇔ui (bi, βi) 如下[4]:

ui (bi, βi) =

${\begin{cases} \frac{(e^{\frac{b}{E f_{i}}})^{τ} [c_{i}^{2} - (β_{i} - E f_{i})^{2}]}{e \frac{Τ b}{E f_{i}} c_{i}^{3}} 0 \leq b_{i} \leq E f_{i} \\ [1 - (\frac{b_{i} - E f_{i}}{E f_{i} - β_{i}^{\max}})^{ω}] \frac{[c_{i}^{2} - (β_{i} - E f_{i})^{2}]}{c_{i}^{3}} E f_{i} < b_{i} \leq β_{i}^{\max} \end{cases} (4)$

式中:τ∈{2, 3, 4, …, k, …}和ω∈{2, 4, 6, …2k, …}是经验常数, 可依据具体的系统进行设定, 用于调整效用函数的函数变化率。ci是子系统可选比特率与比特率分布的数学期望间的最大偏差, 即:

$c_{i} = \max (| β_{i}^{\min} - E f_{i} |, | β_{i}^{\max} - E f_{i} |) (5)$

效用函数是一个分段函数, 当带宽取0≤bi≤Efi时, 函数为一变形的Sigmoid函数, 该特征反映视频监控子系统对带宽占用需求率的变化;当带宽取Efi<bi≤β $_{i}^{\max}$ 时, 效用函数值展现减小趋势, 反映监控网络分配的带宽超过子系统传输比特率的数学期望时的效用抑制。效用函数还受可选传输比特率的影响, 与子系统比特率分布的数学期望间差值相关, 差值的绝对值越大则效用函数值越小。评估监控网络时, 预先分配给监控网络的总带宽是确定的, 设监控网络带宽上限为M, 因此所有子系统占用的总资源必须符合如下约束:

$\sum_{i = 1}^{n} b_{i} \leq Μ (6)$

监控网络为流媒体监控系统提供所有带宽资源是不实际的, 网络还需要为其他功能预留资源, 设计时需要考虑流量高峰或过载情况, 提前避免可能出现的网络服务性能下降, 甚至拥塞状况, 因此引入百分比V表示监控网络预留给其他功能的带宽资源比例, 式 (6) 约束修正为如下形式以适应实际工程分析:

$\sum_{i = 1}^{n} b_{i} \leq Μ (1 - V) (7)$

3 调度策略的Nash均衡存在性

Nash均衡是博弈论中分析非合作博弈的重要手段, 其描述为在策略组合中, 所有的参与者面临这样一种情况:当其他人不改变策略时, 他此时的策略是最好的, 即此时如果他改变策略他的支付将会降低。在Nash均衡点上, 每一个理性的参与者都不会有单独改变策略的冲动, 根据流媒体调度策略中非合作博弈的Nash均衡定义如下:在n个视频子系统参与的非合作博弈中, 如果监控网络分配给子系统的传输比特率组合{p $_{1, \dots,}^{*}$ p $_{n}^{*}$ }, 满足对每一个子系统si, p*是 (至少不劣于) 其针对其他n-1个子系统所选{p $_{1}^{*}$ , …, p $_{i - 1}^{*}$ , p $_{i + 1}^{*}$ , …, p $_{n}^{*}$ }的最优传输比特率, 则称监控网络分配的传输比特率组合是该系统博弈的一个Nash均衡。采用式 (4) 所述的效用函数描述该均衡如下:

u1 {p $_{1}^{*}$ , …, p $_{i - 1}^{*}$ , p $_{i}^{*}$ , p $_{i + 1}^{*}$ , …, p $_{n}^{*}$ }≥

ui{p $_{1}^{*}$ , …, p $_{i - 1}^{*}$ , p $_{i}^{*}$ , p $_{i + 1}^{*}$ , …, p $_{n}^{*}$ } (8)

对于所有子系统{s1, …, sn}都成立, 转化为如下最优化问题的解[5]:

$\begin{array}{l} \max_{i_{1} \dots i_{n}} \dots u_{i} (b_{i}, β_{i}) \\ s . t . \sum_{i = 1}^{n} b_{i} \leq Μ (1 - v) \sum_{i = 1}^{n} w_{i} = 1 b_{i} \geq β_{i}^{\min} (9) \end{array}$

在该调度策略的优化问题中, 求解最优策略等价于查找博弈模型中的Nash均衡点, 进一步分析调度策略博弈模型Nash均衡点的存在性和唯一性。在上述流媒体调度策略的非合作博弈中, N个视频子系统参与网络资源分配, 如果子系统si的效用函数由式 (4) 定义, 那么整个博弈系统的Nash均衡点存在且唯一。

4 非合作博弈调度方法的遗传算法

设计监控网络负荷分配的核心问题是要找到一组最优的子系统分配方案, 分配方案要做到对每个子系统均能保证其正常工作, 并使得整体性能达到最优, 不会出现个别子系统独占大量网络资源而导致其他子系统拥塞。流媒体监控网络的资源分配问题是一个包含多约束的非线性优化问题, 通过建立非合作博弈模型, 可以将资源分配问题转化为求解博弈模型中的Nash均衡点。遗传算法在求解非线性约束优化问题上得到广泛的应用, 可以较快地求得全局最优解, 因此采用遗传算法对该博弈模型进行求解, 查找网络负荷分配的最优方案。参照遗传算法的工作逻辑, 并根据流媒体监控网络的非合作博弈模型机理, 设计GA解算模型的运行逻辑可分为如下步骤: (1) 将流媒体监控网络资源分配的非合作博弈模型映射为遗传算法中的基因模型和种群模型, 并设定初始种群; (2) 根据相应的约束规则执行选择、交叉、变异、评价和产生新种群; (3) 判断每个个体的最终适应度值, 选择最优或近似最优个体作为该解算模型的最终结果。根据实际情况, 确定监控网络及其子系统参数, 种群中个体数为m, 基因个数为n。基因使用实数形式表示, 数值与bi对应, 个体结构为包含该组所有基因的向量gi= (b1, b2, …, bn) T, 建立基因矩阵GeneTable, 描述如下:

$G e n e Τ a b l e_{m \times n} = [\begin{array}{l} b_{1}^{1} b_{2}^{1} \dots b_{n}^{1} \\ b_{1}^{2} b_{2}^{2} \dots b_{n}^{2} \\ \dots \dots \dots \dots \dots \dots \\ b_{1}^{m} b_{2}^{m} \dots b_{n}^{m} \end{array}] (10)$

博弈模型中使用子系统的效用函数来确定其效用, 效用函数值越大表示其资源分配越接近均衡点, 根据一组监控系统的效用函数建立解算模型的适应度函数, 即:

$F i t n e s s (g_{k}) = \sum_{i = 1}^{n} u_{i} (p_{i}^{k}) (11)$

在解算过程, 描述当前代的整体适应度函数为:

$\begin{array}{l} G e n e r a t i o n F i t n e s s = \sum_{k = 1}^{m} \sum_{i = 1}^{n} G e n e Τ a b l e_{m \times n} \\ = \sum \sum u_{i} (p_{i}^{k}) (12) \end{array}$

其中适应度函数值越大, 表示一组分配方案的效用函数之和越大, 越接近流媒体传输中非合作博弈模型的均衡点, 则该组基因所描述的分配方案是网络资源的最佳分配方案。个体选择机制采用最佳个体保存法和适应值比例方法相结合的选择方法。在群体交叉、变异之前, 先选出最佳个体, 直接复制到下一代中;其余个体的选择采用最基本的比例选择法, 即各个体被选择的概率与其适应度值成比例。如果变异概率Vm∈ (0, 1) , 交叉概率Vt∈ (0, 1) , 且在选择前保留当前最优解的遗传算法可收敛于全局最优解, 因此该解算模型可以收敛于全局最优解。有效性评价函数依据各种约束对个体的有效性给出判断, 如果在变异和交叉过程中产生满足模型约束条件的个体, 则直接从种群中删除, 并随机产生新的个体添加进种群。

5 仿真分析

通过仿真对流媒体调度策略中的非合作博弈模型进行运算和评价, 考察在特定的监控网络环境中优化算法解得的网络负荷分配方案。设定视频子系统数量N=8, 端节点数目为16, 子系统输出比特率要求范围 (β1min, β1max) → (β8min, β8max) 分布见表1所示, 经验常数t=4, τ=6, ω=4, 监控网络预分配给流媒体系统的资源M (1-ν) =1000Kbps。

通过遗传算法进行寻优计算, 当整体适应度数值趋于稳定时停止计算, 得到结果β1→β8={98, 58, 30, 146, 139, 142, 35, 352} (单位:Kbps) 。统计输出比特率下限、预留比特率和输出比特率上限的比例图 (见图1) , 图1展示预留比特率在输出比特率上限与下限之间的设定比例, 从计算结果可发现, 使用本系统的博弈模型进行优化的视频资源具有明显的公平性, 能够在有约束的状态下找到合理的解, 并有效限制大流量子系统的网络资源占用率, 使监控系统的整体性能保持稳定。

为了更好地观察实际效果, 建立试验性的监控网络, 包含10组流媒体监控系统, 分别采用H.261、H.264和MPEG4三种视频压缩算法, 且每个子系统都拥有端到端QoS控制和CBR码率控制, 设定总的流媒体带宽为1Mbps, 通过计算得到网络资源分配方案, 然后在流媒体服务器上设定QoS策略。实验运行4h, 数据采集周期为1min。实验结束后, 统计流媒体服务器记录的各个子系统传输数据量, 获得流媒体监控网络的总传输比特率变动图形 (如图2所示) 。

通过仿真发现, 使用博弈模型进行优化的流媒体资源调度策略模型可以有效地满足资源受限监控网络的需要, 在受到干扰的情况下仍然可以使系统稳定工作在设定带宽与带宽下限之间, 保证各个子系统之间使用有限带宽的公平性, 调度效果优于先进先出, 优先队列调度和加权公平队列等调度策略。

仿真数据对随机生成的每10组样本数据取均值, 作为测试点, 算法的空间复杂度由图3体现, 其中图3a测试属性数不变的情况下, 对象数与格规模的关系, 横坐标为对象数, 初始情况取对象数为20个, 依次递增20个对象数, 到对象数为200个时为止;纵坐标为生成格的节点数。图3b测试在对象数不变的情况下, 属性数与格规模的关系, 横坐标为属性数, 初始属性数为4个, 依次递增2个属性数, 到属性数为20个为止;纵坐标为格中节点数。算法的时间复杂性由图3c和图3d体现。图3c表现在对象数为20个时, 属性数与运行时间的关系曲线, 图3d表现属性数为5个时, 对象数与运行时间的关系曲线。

6 结论

研究流媒体监控系统调度策略的特点, 对其进行数学抽象和描述, 提出流媒体监控系统中调度策略的非合作博弈模型, 设计子系统的效用函数, 进一步定义Nash均衡, 并论证在该非合作博弈中Nash均衡点的存在性和唯一性。把Nash均衡的求解等价于网络资源分配的最优化问题, 给出基于遗传算法的解算方法, 并进行仿真, 结果表明该模型能够有效地反映子系统间的资源竞争, 可以求得优化的带宽分配方案。随着我国西部大开发及西气东输工程的实施, 将有大量的油气管道投入建设和运行, 为将泄漏事故造成的各种危害减少到最小, 需要研究泄漏在线监测技术的算法, 而在线监测系统的非合作博弈调度模型设计对提高泄漏监测灵敏度和定位精度具有直接影响和决定作用。本设计在线监测系统在开封仪表有限公司已经投入生产, 每年带来经济效益达1500万元, 完全符合工业现场要求, 具有很大的实际意义和应用价值。

参考文献

[1]Marti P, Fuertes J M, Fohler G, et al.Improving quality of control usingflexible timing constraints:Metric and scheduling.In:Proceedings ofthe 23rd IEEE Real-Time Systems Symposium, Texas, USA, 2002, 91-100.

[2]Cervin A, Henriksson D, Lincoln B, et al.How does control timing af-fect performance?Analysis and simulation of timing using Jitterbug andTrue Time.IEEE Control Systems Magazine, 2003, 23 (3) :16-30.

[3]蒋仕章, 蒲家宁.石油天然气长输管道泄漏检测及定位方法[J].油气储运, 2000, 19 (3) :50-52.

[4]常景龙, 李铁.输气管道泄测检测技术的选择和优化[J].油气储运, 2000, 19 (5) :9-13.

如何用博弈论促进合作第4篇

时隔将近20年之后，张维迎教授再次把研究方向转向博弈论，今年出版了新书《博弈与社会》（北京大学出版社，2013年）。贯穿于该书的主题是：人类如何才能更好地合作？从经典的囚徒困境到闻名于世的纳什均衡，从讨价还价到声誉机制，从信息不对称导致的逆向选择到道德风险和激励体制的设计，从法律和社会规范到轴心时代制度企业家的出现，该书系统地介绍了博弈论的基本方法和核心结论，同时运用这些方法和结论分析各种各样的社会问题和制度。其中特别关注的是人们为什么有不合作行为，什么样的制度和文化有助于促进人与人之间的合作。近日，本刊副主编柯恩专程拜访了张维迎教授，和他一起探讨了这个话题。

囚徒困境的概念大家都很熟悉了，人类为什么会陷入这种困境？

所谓“囚徒困境”，说的是个体理性和集体理性发生冲突。比如，小孩子的课外补习问题，我们设想一下，如果所有的学生课外都休息，考上好大学的会是最聪明的孩子。但是，有人开始周末补课了，他可能就会超过那些聪明但是不补课的孩子。每个家长理性思考的结果是，现在所有孩子都在休息时间补课，最后考上好大学的还是那些最聪明的孩子。这种无用的竞争（大国之间的军备竞赛也是这样）对社会来说不是最优的选择。

囚徒困境有两个原因：

首先，作为理性的个体，我们每个人都有自己的利益，都在追求自己的幸福。这是天性使然，没有什么力量能够改变。但社会的进步只能来自人们之间的相互合作，这是我们应有的集体理性。但是，基于个体理性的决策常常与集体理性相冲突，导致囚徒困境的出现，不利于所有人的幸福。

除了个体利益之外，妨碍人与人合作的另一个重要原因是人类的“无知”。我们人类短视、傲慢、狭隘、自以为是，经常不明白自己的真正利益所在。正是由于我们的无知，才导致了人类社会的许多冲突。许多看似是利益的冲突，实际上只不过是理念的冲突。事实上，大部分损人利己的无耻行为本质上也是无知的结果。损人者自以为在最大化自己的幸福，但结果常常是“聪明反被聪明误”，既损人又害己。有些人心地善良，一心为他人谋幸福，但由于无知，也给人类带来不小的灾难。

几千年来，人类发明了各种各样的技术、制度、文化，克服囚徒困境的障碍，不断走向合作，由此才有了人类的进步。诸如语言、文字、产权、货币、价格、公司、利润、法律、社会规范、价值观念、道德标准，甚至钟表、计算机、网络等发明，都是人类走出囚徒困境、实现合作的重要手段。当然，每一次合作带来的进步，都伴随新的囚徒困境的出现。比如互联网为人类提供了更大范围合作的空间，但它也为坑蒙拐骗提供了新的机会。人类文明史就是一部不断创造囚徒困境，又不断走出囚徒困境的历史。

可否概括一下人类用于促进合作的方法？

第一，是私有财产制度，这是人类克服囚徒困境最重要的制度。有私有产权了，博弈就发生了变化。产权制度是先于国家和政府而存在的，它是一种自然权利。只有尊重私人产权，才能阻止“公地悲剧”*。市场经济制度是人类合作最有效的机制，它促进了陌生人之间的合作，通过重复博弈和声誉机制，解决了“无耻”和“无知”的问题。但是我要强调的是，市场制度有三个基础，就是自由、产权和企业家，缺一不可。

其次是法律和社会规范。它们可以改变游戏规则，限制人们的理性选择，改变人们的偏好，还会协调人们的预期，传递个人信号。比如，开车靠左还是靠右，通过法律这种形式可以快速让人们在路上实现合作。

最后一种促进合作的力量是社会规范的内化，也就是道德伦理，人们的廉耻观念。这种内在的精神力量可以不需要借助第三方的监督而节约大量的交易成本。比如大多数国家的主流价值观都会对合作行为做出价值上的肯定。甚至是黑社会，也会对自我牺牲的行为予以推崇。

书中谈的较多的是整个社会中人与人的合作，怎么促进企业和企业间的合作呢？

博弈论最有成就的地方在哪儿？我的个人感受是研究“长期博弈”当中人与人之间的合作，这对企业来讲也是非常重要的。一个企业如果只追求短期利润，就可能不注重产品质量，不注重自己的声誉，陷入囚徒困境。但如果你想要和消费者、合作伙伴、竞争对手等进行长期的博弈，就要看得更远，更重视未来。企业之间的竞争不是简单的你死我活，而是有很多双赢的机会。比方说，商场上有很多商业规矩，一旦被破坏，整个市场的信任度降低，所有的企业都会受到伤害。比如一个有道德问题的职业经理人被企业开除了，竞争对手为了挖墙脚或者探听对方的商业秘密，反而雇用了这个人。这种行为伤害的是谁？伤害的是所有的企业。职业经理人市场会因此变得混乱，传递出错误的信息。

中国有些企业之间的恶性竞争很厉害，甚至会上升到人身的武力冲突，为什么会这样呢？

有些企业是因为缺乏安全感，做事情没有长远眼光，属于短期行为。还有些企业是出于无知。其实，我们人类有很多行为是很无知的，我们之间的利益冲突远远比我们认为的要小得多。当然，企业其实并不做决策，是企业里的人在做决策。人有七情六欲，有偏见，会犯错误，会情绪化，这些都会影响到人的决策。这是一种普遍现象，所以人类才需要学习。所以我们的知识，包括我写的这本书才是有用的。知识对人的理念影响很大。当然，你说的情况可能更复杂，涉及到地方政府的关系。这种情况下，我们社会对不守规矩的人或企业应该有一定的制裁措施，甚至需要以牙还牙，否则社会就混乱了。

nlc202309040509

相信很多企业家看到这本书之后，首先想到的是如何促进企业内部员工之间的合作，你有什么建议吗？

企业里每个人都在追求自己的利益，这是正当的。但如果陷入了囚徒困境，互相不合作，甚至互相伤害，就会影响到组织的成功。企业如果能够解决这个问题，成功的可能性就大多了。

如何促进员工合作，和企业的激励制度有关系。仔细想想我们会发现，合作问题的实质就是一个激励问题。如果我们希望人们经由个体的理性选择来实现集体理性，获取合作红利，就需要对个人的行为进行激励和诱导。对合作行为给予奖励，对不合作行为予以惩罚。这样，就会使不合作行为带来的回报低于合作行为得到的回报，从而激励个人选择合作。比如部门的奖金不能只依赖本部门的表现，还要考虑其他部门和企业整体的业绩。

你谈到的小孩子上补习班这种没有意义的“军备竞赛”，怎么才能破解这种无用的东西？

修改社会的游戏规则。因为我们现在的社会规则是高考按分录取，所以孩子上学就是为了考一个高分，最后一定会形成现在这样稳定的博弈结果。在有些国家，大学入学考试一年考很多次，学校自主招生，不光招分数高的，还要看学生的领导力、合作精神，人们就不会把考试看得那么重了。问题是，如果中国改成这样的制度，大家会担心有人走后门。为什么我们会不放心大学自主招生呢？这和我们的整个体制相关，如果你看到当官的以权谋私，做企业的能捞就捞一把，你想让大学校长和老师有好的职业精神，肯定也比较难了。但是我相信一点，我们唯一的出路，就是让这个社会更自由，有更多、更公平的竞争。

书中提到了生物学界对博弈论的广泛运用。在你看来，人的天性是愿意合作的还是不愿意合作的？

人们讨论人性本善还是本恶，我更倾向于认为它是中性的。一方面，人有自然生存的要求，必须关心自己。不关心自己的人是没法生存的，在长期的生存博弈战中一定会败下阵来，被自然淘汰掉。但另一方面，人类发明了很多制度把关心自己的动机变成相互合作，比如私有产权制度，我觉得它是人类合作最重要的基础，在实行私有产权制度的国家，人的合作精神就比较高。在人类社会的长期博弈中，不具有合作精神的团体，在社会竞争中就会慢慢被淘汰，而合作精神比较高的群体就会慢慢发展壮大。

你可以回想一下，在过去的人民公社和国营企业体制下，表面看起来是集体主义的社会，实际上所有人都生活在囚徒困境中，在这种制度下，人们最没有合作精神，总想占别人和公家的便宜，人们没有积极性工作，没有积极性创新，也就没有公平正义，没有道德底线。所以，中国需要继续改革，只有真正建立起基于私有产权的市场经济，中国才能变成一个合作社会，才会有良好的社会秩序，中国人才会有良好的道德水平，才会有博爱之心。

社会制度对人们合作精神的影响是巨大的，比如三聚氰胺事件，有人说，我们连放心奶粉都生产不出来，而奶粉是处于竞争较为充分的市场，这说明市场经济制度的无效。这恰恰说错了，当人们对奶粉质量不放心时，他们选择去美国、欧洲，还有香港买奶粉，这是为什么呢？这是因为那里的市场经济最发达。只有真正的市场经济制度建立起来，我们才会有真正放心可靠的产品。

我感觉生活中人们不愿意和别人合作，通常是觉得不合作对自己更有利，比如说大家都在排队时，总有人想去插队。

排队是一个社会现象，但是我们要放在整个大的环境里面来看。人一定有机会主义的诱惑，但是假如插队时别人都用鄙视的眼光看我，那我就不敢了。这种惩罚多大程度起作用呢？有时候跟违规的人数多少有关。如果很多人都插队，这就会形成一个坏的均衡。腐败现象也是这样，当腐败人数很少时，官员的脸皮会比较薄，当腐败人数上升时，每个人的脸皮都会变得厚起来。我一直强调一点，就是语言腐败对社会带来的伤害。人守信、说话算数，是人类合作的基本要求，但是在我们的社会里，很多人说的话是自己完全不相信的。托马斯·潘恩（Thomas Paine）说过，当一个人堕落到宣扬他所不信奉的东西，那么，他已经做好了干一切坏事的准备。比如，在经济学者看来，宗教是促进合作的一个有效手段，因为神无处不在，神总有办法惩罚你。但是当宗教变成垄断之后，就变得相当腐败了。中世纪欧洲教会宣传的东西和高级神职人员的行为完全是两码事，一个人在教堂上布道的时候可以讲的很神圣，自己的生活却很糜烂，这就破坏了人们的信任。只有自由的信仰体制才是健康的。

人的合作意愿是不是也和社会经济发展程度有关呢？比方说从狄更斯或者雨果的小说里看，西方社会在经济刚开始发展的时候，道德水平和合作意愿也比现在差很多。

我相信有一定的关系，这是一个长期过程，需要不断淘汰那些不讲诚信的企业、不讲诚信的人。你想一想，一个有庙的和尚和一个没有庙的和尚，哪个更值得信任呢？我相信给人们自由，使人们感到安全，竞争的结果一定是整个社会越来越有序。早期坑蒙拐骗都是干一锤子买卖的人，一旦有了庙，就能把他约束起来。有恒产者有恒心。

还有一种观点，说中国的国情是地少人多，资源太稀缺了，不赶上这波，下波可能就没机会了，所以很多人不肯合作，要把别人挤掉。

恰恰因为资源稀缺我们才需要好的游戏规则。中国的资源稀缺，那怎么大家不去商店里抢东西呢？中国古代有一位思想家也举过一个例子，说你看人家家里养的兔子很安全，没有人去抢，但是大街上要是有只兔子，大家都去抢。正是因为资源有限，我们才需要一种财产制度的保证，使游戏规则很明确，大家都知道我应该做什么，不应该做什么。如果我们资源很充裕，反倒不需要这种游戏规则了。经济学的基本假设就是资源是有限的——由于资源是有限的，怎么有效利用资源，怎样使人更有积极性创造财富，我们才需要建立一整套好的游戏规则。

乡村精英合作博弈分析第5篇

1 乡村精英合作博弈中的联盟

根据特定博弈中参与者能否形成约束性的协议, 以便集体行动, 博弈可以分为合作博弈和非合作博弈。“所谓合作博弈是指参与者从自己的利益出发, 与其他参与者谈判达成协议或形成联盟, 其结果对联盟各方均有利。”合作博弈采取的是一种合作的方式, 这种合作是在谈判基础上的一种妥协, 它以联盟各方共同努力产生的合作剩余为基础, 围绕合作剩余的分配, 彰显博弈参与者的力量对比和技巧运用。

在乡村精英合作博弈中, 由于允许乡村精英之间相互交流信息, 也可以订立各种形式的契约, 保证博弈后合理地分配所得的利益, 所以, 乡村精英之间必然会寻求各自的合作伙伴, 作为一个整体共同参与乡村社会事务的博弈, 以期获得更高的总利益, 完成乡村社会发展的某项事务。因此, 乡村精英在影响乡村社会发展的过程中会形成不同形式的联盟 (coalition) , 一旦某个乡村精英的联盟形成以后, 其成员都将齐心协力, 以保证该联盟最终目标的实现, 这种联盟的状态, 既是乡村精英获取自身利益的需求, 也是获取乡村社会发展中的支配权力, 有效影响乡村社会发展的有效策略选择。

在特定村落L中, A、B、C三个乡村精英分别能够获得村庄人口总数36%、30%和34%的支持。当村庄面临重大事务的决策时, 一项提案要获得通过, 必须有2/3以上的村民同意。在这种情况下, A、B、C三个乡村精英要使自己的提案能够通过, 必须寻求其他乡村精英的支持, 单靠某一乡村精英的力量是完全不行的。在这种情况下, A、B、C三个乡村精英的联盟就会形成。

在很多情况下, 一个乡村精英联盟能获得的支付依赖于其他乡村精英所采取的行动。v (S) 有时被解释为乡村精英联盟S独立于乡村精英联盟N-S的行动可保证的最多支付, 可以用 (N, v) 表示参与博弈的乡村精英集为N, 特征函数为v的合作博弈。

显然, 本质的乡村精英博弈是变和博弈, 有形成联盟的必要, 在这种情况下, 特定村落L中的不同乡村精英群体会努力寻求联盟, 在很多问题上努力达成一致, 谋求共同的利益;对于非本质的乡村精英博弈, 则没有形成联盟的必要, 在这种情况下, 特定村落L中的乡村精英群体处于分散的状态, 乡村精英将不再关心乡村公共事务。

2 乡村精英联盟博弈的解

乡村精英联盟的每一个成员都不偏好于劣分配方案, 因此研究乡村精英博弈过程中如何剔除乡村精英联盟中的劣分配方案也是很有意义的。

这种情况下, 乡村精英之间的博弈实际上是一种帕累托有效性的状态, 即如果一个可行的策略, 其结果使得不可能有别的可行策略会使一部分参与人更好, 而不使另一部分参与人更差。

如果核心C (v) 不能满足线性规划 (L) 有解, 也即乡村精英之间的博弈达不到帕累托有效性的状态, 那么乡村精英的的博弈就超出了合作博弈的范围, 成为一种非合作博弈。

3 乡村精英联盟博弈的稳定集

为了解决乡村精英博弈核心为空的问题, 我们可以使用vonnNeumann和Morgenstern提出的稳定集的概念, 并将稳定集作为乡村精英博弈的解。

乡村精英博弈过程中, 受各方面因素的影响, 很多时候即使在存在博弈核心C (v) 的情况下也达不到帕累托有效性的状态, 研究乡村精英联盟博弈稳定集的概念, 有利于为乡村精英博弈提供诸多的策略选择, 使得乡村社会发展过程中的决策模型由理论上的最优决策向实践中的满意决策转换, 有利于乡村事务合理有效的解决。

4 乡村精英联盟博弈的Shapley值

乡村精英联盟博弈的Shapley值是给出乡村精英合作博弈的一种新概念, 它实质上是乡村精英联盟支付的一种分配方案。

乡村精英联盟博弈Shapley值的第一条性质表示i的值是乡村精英博弈载体的值的一种分配;第二条性质表示乡村精英联盟博弈Shapley值具有不变性, 与参与乡村精英博弈的乡村精英编号顺序无关;第三条表示乡村精英联盟博弈Shapley值具有一种可加性, 相当于n个乡村精英同时独立进行两个乡村精英博弈, 而每个乡村精英联盟的收益刚好等于两个乡村精英博弈分别进行时的收益之和。

在制定和实施影响村落发展的决策过程中, 乡村精英博弈的特征函数为

5 乡村精英联盟博弈的讨价还价集

假设乡村精英联盟博弈过程中讨价还价者R享受的支付与支付成比例, 即如果R的支付加倍, 那么, 他的享受也加倍, 因为他是风险中性的。用代数的术语来说, 讨价还价者R的效用函数是x。另一方面, 乡村精英联盟博弈过程中讨价还价者C是相当不同的:他是风险规避的, 因此, 钱的每单位增量对他的效用产生越来越小的增量。在代数上, 他的效用函数表现为 (100x) a, 这里0≤a≤1, 蛋糕的大小为100。因为纳什解 (x*, 100x*) 最大化x (100x) a。令x (100x) a关于x的一阶导数等于0, 可解得纳什解。

根据纳什解, 乡村精英R的份额是x*%[100/ (1a) ]%。这意味着a越小, 乡村精英R的份额越大。假设a=1/2, 纳什解给讨价还价者R总蛋糕的66.6%, 而当a=1时, R获得总蛋糕的50%。换句话说, 给定当a小于1时, 乡村精英C是风险规避的解释, 我们发现, 根据纳什解, 风险规避的参与人乡村精英C获得比风险中性的乡村精英R要少。

乡村精英联盟博弈的讨价还价集刻画了特定乡村范围内乡村精英群体内部的稳定安排, 在乡村精英群体里任何参与博弈的乡村精英对某个分配x做的任一评价采取下列形式:在分配x中我若得到太少而j得到太多, 则我能形成一个排除j的且每个人都比在x中更好的联盟。如果参与人j的反应如下, 你的需要是不正当的, 我能形成一个排除你的联盟, 其中每个人都至少与他们在x中一样好, 同时加入到你的联盟中的参与人至少可获得与你提供给他们的一样多, 那么, 只要涉及讨价还价集, 则这种评价是无效的。

乡村精英博弈的实践中, 讨价还价的谈判过程往往是非常漫长的, 而且一般都是按照特定村落L中的潜规则进行, 乡村精英博弈的过程也就是各种乡村精英通过谈判达成协议并最终形成联盟的过程。在各方谋求乡村精英博弈的核心和稳定集以表达自己合理性要求的同时, 乡村精英联盟博弈Shapley值所追求的公平分配往往很难实现, 最终的结果是在讨价还价的基础上形成一种各方力量的妥协与平衡。

参考文献

[1]王慧, 祝苏东, 付少平.乡村精英博弈与乡村民主的发展[J].农村观察, 2007, 9 (2) :32-36.

[2]John Harsanyi.Rational choice models of behavior versus functionalist and conformist theories[J].Worldpolitics, 1969 (22) :513-538.

[4]田江南.合作博弈下的和谐社会[J].环球财经, 2012 (12) :100-101.

高职院校校企合作博弈探究第6篇

一、现阶段高职院校校企合作存在的困境

受到各种因素的影响, 目前我国校企合作现状不佳, 这应该引起相关部门的注意, 通过相关措施解决这一问题。以下对现阶段高职院校校企合作存在的困境进行分析。

( 一) 存在囚徒困境。对于企业来说, 通过校企合作是一种投资行为, 可以达到延期收益的目标。在校企合作的基础上可以培养具有专业技能的优秀人才, 可以作为企业未来发展的人才储备。但是企业的这种投资有不确定性。因为虽然企业通过大量成本的付出培养了专业性强的人才, 但是这些学生不一定留在这个企业工作。因为一旦有薪酬更高的企业看中这些优秀人才, 他们很可能会跳槽选择薪酬更高的企业, 那么这个企业前期的投入就无法获得应有的回报, 这就是校企合作中存在的“囚徒困境”。在我国市场经济发展的基础上形成“囚徒困境”, 参与市场竞争的企业自由经济体, 如果对于投资, 企业没有完全的把握, 获取最大利益的方式就是降低成本。企业生产经营的最终目标就是获取最大利益。校企合作需要大量物力和人力的投入培养人才, 获取的收益不具备稳定性, 而且这种收益是一种不明显的延期收益。与其这样企业还不如通过低廉的代价获得类似的收益。因此很多企业在校企合作方面存在顾虑。面对这种困境, 高职院校需要加强与企业协会和政府的合作, 将这一困境打破。

( 二) 博弈主体的信息存在不对称的现象。博弈过程中经常存在的困境就是信息的不对称现象。信息不对称指的是交易一方不了解另一方的现象。信息不对称导致博弈过程中人们做出的选择是错误的。通过对校企合作博弈模型的分析可以看出, 最佳的博弈结果是对于合作策略, 双方都进行选择, 最大化实现整体收益。由于校企双方在实践中的信息存在不对称的现象。高职院校和企业对另一方的选择不明确, 双方缺少一致的共识, 在选择方面只能按照对方的假设和自身收益进行选择, 难以顺利推行校企合作。

( 三) 博弈主体义务缺乏平衡性。高职院校承担的使命是培养人才, 高职院校要培养高级应用型人才, 校企合作是非常重要的。如果校企无法合作, 就无法对合适人才进行培养, 就业率和社会评价也会降低。高职院校因此承担的社会责任非常繁重。相对于高职院校, 在职业教育方面承担的社会责任也比较少。大部分企业对教育的理解是认为教育是学校的事情, 在职业教育方面不愿意投入太多, 高职院校和企业义务存在不平衡的现象, 导致在校企合作中高职院校所处的局面比较被动。在人类社会上, 每个人的行动规律都不同, 也不同于立法者施加的规则。如果他们的一致性相同, 人类社会的博弈结局就会非常圆满。但是两者如果相互抵触, 就会取得比较苦的博弈结果。为了保证校企合作的顺利推进, 要对校企合作的义务和责任进行明确。

( 四) 博弈主体的资源存在不均衡性。在某种程度上, 博弈主体的权利和义务是不均衡的。资源的不均衡造成了义务的不均衡。高职院校的目标是高素质劳动者和高级应用性人才的培养。这一目标的实现, 需要有作为支撑的实践。相对于高职院校, 企业在机械设备, 工作环境等方面对学生的实践技能和学习需要被满足, 高职院校在这方面是比较欠缺的。企业的优势是占有资源, 但是在职业教育的责任和义务方面比较欠缺。高职院校职业教育的优质资源也比较欠缺, 但是对于职业教育的义务却是必须要履行的, 这样的矛盾冲突对校企合作的顺利进行会产生严重的影响。

二、高职院校校企合作走出困境的措施

面对高职院校校企合作的困境, 需要采取措施走出困境, 提高高职院校校企合作质量。

( 一) 行业协会加强校企合作的协调。德国在这方面的贡献非常突出, 在校企合作方面, 工商协会和德国行业协会对校企合作模式的作用是领导者。同时在校企合作过程中, 各类行业协会扮演的角色是审核者和监督者。目前, 我国各行业协会的发展速度不快, 影响力不高, 在校企合作方面的行动力和号召力不足, 因此现阶段国内行业协会缺乏对校企合作的组织和引导。为了使这个问题得到解决, 政府相关部门应该加强帮助, 可以通过行政方式将权限下放到行业协会, 再组织开展校企合作, 同时考核和监督行业协会。行业协会可以通过协调推动高职院校校企合作的开展。

( 三) 对大企业的示范效果进行发挥。大企业的优势非常明显, 可以促进校企合作。因为大企业的资金非常雄厚, 需要更多的未来人才, 在教育领域投资的心理和物质基础比中小企业高, 同时大企业可以吸引更多的高职院校毕业生。因为高职院校毕业生更希望就职大企业, 相比之下他们不愿意在小企业就职。因此大企业对潜在收益回收的概率更大, 这样的投资预期可以吸引大企业积极参与校企合作。国内高职院校也要和各行业的领军企业联合, 实现校企合作。高职院校要找到课程设置和人才培养方面的重要突破口, 建立在储备后备人才目的的基础上, 各大企业参加校企合作的愿望会更强烈。

( 三) 将政府的资助有效利用起来。德国行业协会在校企合作模式上取得了巨大的成功, 取得成功的原因和政府的资助密切相关。在政府投入的基础上可以对行业协会进行鼓励, 让他们开展校企合作。对于行业协会来说, 政府投入增加了物质基础, 可以监督和审核校企合作。现阶段, 我国在高职教育方面投入的侧重点是学校, 忽略了企业利益。因此在政府投入力度不断增加的基础上, 企业并没有真正得到实惠, 缺乏参与校企合作的意愿。

( 四) 通过双赢机制的建立开展校企合作。高职院校可以设置特色专业, 这个可以针对行业急需技术进行设置, 吸引更多的企业参与校企合作, 这也是吸引校企合作的重要突破口。企业也可以通过签订合同的方式对学生进行培养, 加强对学生各方面的约束, 保证企业在培训完成后能够得到相应的稳定回报。高职院校和企业可以协商, 对潜在的合作项目进行挖掘, 使企业和高职院校能够实现双赢。

( 五) 对校企合作加强宣传。企业和高职院校对校企合作策略的选择, 基本上是从短暂利益出发的。对校企合作的长远意义缺乏深刻的认识。校企合作的人才培养模式是一种科学的人才培养模式, 可以使学生的实践操作能力增强, 有助于学生的就业, 使高职院校的竞争力增强, 能够为企业培养素质较高的劳动者和应用型人才。我国走向制造业强国的重要途径就是培养高素质的优秀人才。政府应该积极宣传校企合作, 使高职院校, 企业和全社会对校企合作的理解更深入。政府可以经常举办一些关于校企合作的博览会, 使校企合作更加顺畅, 对学校和企业进行鼓励, 让他们对自己进行展示, 对政府关于校企合作的优惠政策进行宣传, 对高职院校和企业的心声要积极听取, 对校企双方的利益诉求进行了解, 这将成为企业制定政策的重要参考和依据。

( 六) 对高职院校的教学质量不断进行提高。企业选择合作伙伴的重要依据就是高职院校的教学质量。高职院校只有在提高自身办学质量的基础上, 对企业的吸引力更强。高职院校要树立科学的质量关, 才会对学生的职业能力和认知能力进行培养, 办学要积极面向市场, 和企业紧密联系, 和企业的沟通交流也要加强, 对企业的用工需求要及时掌握, 对实训和专业建设要不断加强。教育部颁发的相关文件提出了改善高职院校办学条件的重要措施就是加强实训和实习基地建设, 从而使办学特色突显出来, 教学质量才能提高。教育教学改革是非常重要的, 打破传统的灌输性教学模式, 采用多样的教学方法, 对学生的主体地位进行突出, 保证教学体系的完善性, 从而保证高职院校教学质量的提高。

三、结语

综上所述, 校企合作是高职院校培养人才的重要方式。对于学生来说可以提高他们的实践技能, 为以后更高的投入社会打好基础。但是在校企合作方面, 企业还存在一些顾虑, 影响着校企合作的顺利展开。本文主要从囚徒困境, 博弈主体信息的不对称、博弈主体义务平衡性的缺乏和博弈主体资源的不均衡性等方面分析了高职院校校企合作存在的问题, 并从行业协会对校企合作的加强, 大企业示范效果的发挥、对政府自助的利用、双赢机制的建立、校企合作宣传的加强和高职院校教学质量的提高等方面提出了保证校企合作顺利开展的措施, 希望通过本文的研究对校企合作的顺利开展有所帮助。

摘要：我国实行的是市场经济, 推动校企合作发展的纽带就是利益机制。实际上高职院校校企合作是一场博弈, 可以实现校企双赢。但是学校和企业不存在较强的利益兼容性, 尤其从高职院校的角度来说, 企业和高职院校的合作缺乏动力。因此要真正实现校企合作, 需要采取措施对我国高职教育进行发展, 政府对相关法律和政策要进一步健全。高职院校要找到企业愿意开展校企合作的需求, 在双赢的合作基础上, 实现企业和学校的共同发展。本文根据相关工作经验, 主要探究高职院校校企合作博弈, 供大家参考和借鉴。

关键词：高职院校,校企合作,人才培养

参考文献

[1]陈海燕.高职校企合作的博弈分析[J].职教通讯, 2007, 3:22~25

[2]胡茂波, 吴思.博弈论视野下高职教育校企合作的困境与对策[J].教育与职业, 2012, 23:11~13

[3]朱海静.基于博弈论的高职院校校企合作评价体系探究[J].太原城市职业技术学院学报, 2014, 11:1~3

[4]梁凌洁.论高职院校实施校企合作的博弈[J].亚太教育, 2015, 13:209

[5]付俊薇, 梁艳清, 杨志伟.博弈视域下高职教育校企合作长效机制的构建[J].职业技术教育, 2015, 9:53~57

本文来自 99学术网(www.99xueshu.com)，转载请保留网址和出处

【合作博弈调度】相关文章：

合作博弈论文题目04-07

基于合作—非合作博弈的快递柜合作模式研究02-14

高职教育产学合作的博弈分析09-11