博弈均衡算法范文

2024-05-24

博弈均衡算法范文（精选7篇）

博弈均衡算法第1篇

近年来, 负载均衡算法已成为一个研究热点[1,2,3,4,5,6]。本文通过将拍卖模型引入到LTE系统模型中, 建立竞拍双方的效用函数, 并在总负载一定的情况下求出均衡解, 最大化其效用函数, 通过调整切换参数改变小区大小, 合理将过载小区的负载转移到目标小区。该方案并不会改变小区覆盖范围, 并不会带来信号覆盖空洞。仿真结果证明了算法是有效的, 该方案可以合理有效地解决小区间负载不均衡问题、优化网络资源和提高资源利用率。

1 模型设计

1.1 下行链路模型

LTE系统中, 正交频分复用 (Orthogonal Frequency Division Multiple, OFDM) 载波被分成物理资源块 (Physical Resource Block, PRB) , PRB是可以分配给用户的最小资源[7]。

首先, 对将用到的符号进行定义:X (u) 为用i=X (u) 表示用户u的服务基站是基站i;Pi为基站i的传输功率;Liu为用户到基站i的路径损耗;N为每个PRB的高斯白噪声功率;ρi为基站i的无线负载;R (SINRu) :每个资源块可以提供给用户的数据速率;每个资源块的信干噪比 (Signal Interference Noise Ratio, SINR) 为[8]

定义基站中一个用户所需求的数据速率为Du, 每个资源块可以提供给用户的数据速率为R (SINRu) , 其中R (·) 在给定SINRu的情况下, 可根据香农定理计算得到。那么用户需求的资源块数量为

假设LTE系统中每个基站拥有相同数量的PRB可供分配, 设每个基站拥有Ntot个PRB。那么一个用户的负载可定义为

式中:αu表示用户u的负载, 即在一个基站里用户分配到的PRB占基站所有PRB总数Ntot的百分比。

那么在基站i的总负载为

其中X (u) =i是一个连接函数, 表示用户连接在基站i上。理论上一个基站所能承受的最大负载为1, 否则会影响用户Qo S。当ρi<1时, 所有基站i内所连接的用户的Qo S都可以得到满足;当ρi>1时, 将会有部分用户的Qo S得不到满足。整个网络中未满足Qo S的用户的数量Z为

式中:Mi为连接基站i的用户数量, n为整个网络中基站的数量。

1.2 拍卖模型

小区结构采用7小区结构, 如图1所示, 每个小区由一个基站和若干的移动台组成。假设中心小区基站为过载基站, 即ρi>1。当ρi>1时, 需要进行负载均衡操作, 过载基站超出的负载可表示为X= (ρi-1) , 过载小区的用户xi的负载为αxi, 理论上过载小区需要切换出去的用户数n需要满足时, 这样, 在负载均衡操作以后, 过载小区内用户的服务质量可以全部得到满足, 但是如果周围的目标小区无法容纳过多的负载, 过载小区在负载均衡以后, 依然处于过载状态。

过载基站相邻小区的基站可容纳的负载为Yi=max (0, 1-ρi) , 目标小区基站要根据可容纳的负载Yi的情况来接收用户, 理论上只有当Yi>0时, 才可以接收过载基站切换过来的用户。

为了将过载用户切换到相邻负载较轻的小区基站中, 现在提出一种基于博弈论的负载均衡算法, 建立拍卖模型方案如下:

1) 拍卖方, 即中心过载基站;

2) 竞拍方, 即中心基站周围6个相邻基站;

3) 拍卖商品, 即中心基站的用户。

在这个拍卖模型里, 最多可能有6个竞拍方参与竞拍, 即i=1, 2, …, 6。bi是竞拍方的出价, vi为拍卖物品对竞拍方的价值。显然vi应该和竞拍方原有的用户数量Ui有关, 即和基站的负载有关, 设vi=λYi, 其中λ是一个相关系数, 取值在0到1之间。当Yi越大时, 基站的空闲资源块就会越多, 那么用户数量越少, 拍卖物品对竞拍方的价值就越高, 投标价就可能越高, 中标的机率就越大, 可能得到更多拍卖商品;当Yi越小时, 说明基站的空闲资源越少, 竞拍方本身拥有的用户就越多, 拍卖的用户对竞拍方的价值就越小, 竞拍价就可能越低, 中标的机率越小;当Yi=0时, 说明基站没有空闲资源, 至少是满负荷, 很有可能发生过载, 竞拍方拥有的用户很多, 拍卖的用户对投标方没有价值。

根据文献[9]可得到, 在拍卖模型中, 竞拍方的最优出价策略为。在这个招标模型中有6个投标人, 即n=6。那么出价函数应为, 即。

在这里设置一个高负载门限ρmax=0.9, 当基站负载高于高负载门限时, 为防止基站超载, 基站拒绝相邻基站负载均衡切换过来的用户, 所以出价函数设定为b (v) =0i, (0≤Yi<0.1) 。那么竞标方的出价函数表达式为

拍卖方的收益函数表达式为

式中:U0为拍卖方小区原有用户数量;x0为切换出去的用户的数量;αx0切换出去的用户的负载;Z0为小区中未满足Qo S的用户数;μ为一个惩罚因子。对于这个收益函数而言, 当Yo=0, 即基站过载时, 应该尽可能多地切换出去用户, 随着切换出去用户越多, u0的值是不断增大;当Yo<1时, 即基站不超载, 如果继续切换用户出去, u0的值则开始下降。所以u0取得最大值时应该是基站再切换一个用户出去后, 则Yo<1时。

竞拍方的收益函数表达式为

式中:Ui为投标方基站原有用户数量;xi为切换过来的用户的数量;αxi为切换过来的用户的负载;Zi为基站中未满足Qo S的用户数;μ为一个惩罚因子。对于竞拍方来说, 只有当Yi大于0时, 它的收益才是不断增加的。如果Yi=0, 即, 并且ρ'i>1, 收益函数开始下降。所以ui取得最大值时应该是基站再切换一个用户进来后, 则Yi=0时。

2 算法分析

拍卖用户的选择:主要选择小区的边缘用户, 因为小区的边缘用户适于切换到相邻目标小区。首先热点小区收集用户信息, 比较边缘用户到相邻小区的RSRP值[10,11], 找出适合切换到目标小区的用户, 并建立用户列表。

算法流程:

Step1, 检测小区自身负载情况, 如果超载, 则计算小区内过载的用户数Zo, 初始化xo=0, 准备向目标小区拍卖用户, 并建立拍卖用户列表, 并向周围6个目标小区发送消息请求汇报负载情况。

Step2, 热点小区根据目标小区的负载情况计算出目标小区的报价, 并找出最高报价小区, 如果报价大于0, 则在拍卖用户列表中寻找边缘小区是否有可以向最高报价目标小区切换的用户, 如果有用户则将该用户添加到切换列表中, xo=xo+1, 并且更新该目标小区的负载情况, 将该用户给目标小区带来的负载增加到该目标小区;如果没有用户可以向该小区切换, 则将小区负载更新为满负载。然后执行Step3。如果最高报价为0, 则执行Step4。

Step3, 判断Zo和xo, 如果xo

Step4, 热点小区将切换列表中的用户通过调整切换参数全部切换至其对应的目标小区。

3 仿真结果评估

3.1 仿真环境

在这部分对本文提到的负载均衡算法进行了仿真评估, 利用MATLAB软件, 首先生成一个如图2所示的7小区场景, 并设定仿真的参数如下:相邻小区的距离设定为500 m, e NB的最大传输功率为43 d Bm, 系统带宽为10 MHz, 每个e NB有50个PRB, 各小区初始用户数设置为7[12]。每个PRB同一时间只能分配给一个用户使用, 在这里设定每个用户正常情况下分配2个PRB[13,14]。设置中心小区为热点小区, 用户范围为25~50个, 周围6个小区为目标小区, 用户从10~25个, 用户随机分配到小区各处。

3.2 仿真结果分析

图3所示为中心热点小区呼叫用户从25增加到50时, 该数值表示在不使用负载均衡和使用两种负载均衡算法情况下, 网络中不满意用户数量。从图中可以看出, 在热点小区用户数量大于25并不断增加以后, 不满意用户数量开始上升, 这是由于小区内资源有限, 无法容纳更多的用户。在中心小区的用户数量小于29个时, 可以明显看出在负载均衡过后, 热点小区的不满意用户数下降为0。当用户数量大于29个时, 随着热点小区的呼叫用户数不断上升, 可以明显看出基于博弈的负载均衡算法的表现要优于基本算法, 并且随着热点小区负载量的增大, 基于博弈的负载均衡算法效果越明显。

图4所示为中心热点小区呼叫用户从25增加到50时, 在不使用负载均衡和使用两种负载均衡算法情况下, 网络中的资源利用率。从图中可以很明显看出, 在使用两种负载均衡算法后, 整个网络的资源利用率有一定的提升, 随着中心热点小区的用户数量不断增多, 在使用负载均衡后整个网络资源利用率不断上升, 最后趋于平衡, 基于博弈的负载均衡算法要优于基本算法, 资源利用率在65%左右, 比不使用负载均衡时高了大约5个百分点, 比基本算法高了大约3个百分点。这说明在使用两个负载均衡算法后, 可以有效地将热点小区的负载转移到相邻的目标小区, 整个网络的资源利用率得到一定的提高。

4 结束语

博弈均衡算法第2篇

21世纪以来, 中国经济社会发展进入一个新阶段, 经济社会的复杂性、全球自然资源和环境约束对中国发展的稳定性产生了重大影响, 铁矿石和石油等国际大宗资源商品的对外依存度不断提高, 不但影响了我国产业的健康发展, 而且资源安全对国家安全的影响巨大。在“两种资源、两个市场”指导下, 研究铁矿石国际贸易特征, 了解铁矿石资源定价机理, 进行策略研究具有重要意义[1]。

自2003年以来, 从合同定价、长协定价到指数定价方法, 铁矿石价格飞涨, 有关国际铁矿石贸易定价权和影响因素的研究较多。这些研究可分为三类: (1) 研究价格变化的统计学规律和趋势预测。李华等人对我国进口铁矿石价格变动的影响因素与实证进行了分析, 分别构建了进口铁矿石价格与国际原油价格、进口铁矿石价格与波罗的海指数之间的计量模型, 并分析了存在的合理性[2];杨春晖分析了矿物资源产品供给弹性与议价[3];赵福杰运用小波分析对铁矿石海运价格非平衡时间序列进行了预测[4];董方军研究了我国铁矿石价格联动的因果关系:现货价与长协价的同方向变动趋势、中小铁矿商较高的供给弹性和生产成本、现货价与长协价差的变化[5]。 (2) 研究铁矿石定价形式机理和影响因素。张晶研究了国际铁矿石价格变动对我国钢铁产业的成本、产量、利润以及产品结构的影响[6];董方军研究了基于契约安排频谱的铁矿石市场价格机制[7];郭梨、任翔、段振华等分别研究了铁矿石价格影响因素、全球铁矿石定价机制中的中国因素、国际铁矿石定价机制对我国钢铁行业的影响[8,9,10]。 (3) 基于动态博弈分析研究铁矿石定价过程中的参与主体行为、影响因素和策略。汪俊采用博弈论分析方法, 对多方博弈条件下的铁矿石定价机制进行了模拟研究, 分析了钢铁企业参股铁矿石供应商的原因, 以及铁矿石资源的控制对铁矿石定价的影响因素[11];王明喜分别从短期和长期两个角度对铁矿石定价做出分析, 以博弈论的纳什均衡、贝叶斯均衡、复制动态均衡为工具建立新了理论模型和研究框架, 所得结论显示:短期内, 在我国钢铁行业集中度较低的情况下, 钢企之间的博弈结果是“囚徒困境”均衡, 这在一定程度上解释了我国铁矿石进口价格“逢谈必涨”的迷局, 铁矿石进口价格短期下跌是矿商营销策略的可能性较大;而长期内在我国钢铁行业集中度较高的前提下, 铁矿石价格下跌是钢铁行业发展周期的客观趋势[12]。

综上所述: (1) 由于铁矿石定价问题涉及经济社会系统的复杂性, 所以统计学研究结论的作用机理分析不够; (2) 在机理机制研究上, 由于学科、研究视角的差异, 得出的结论不够系统; (3) 在动态博弈均衡和主体行为分析上, 有些研究应用模型不当。本文在双寡头所组成的铁矿石贸易二级供应链中, 通过构建需求函数和运用Stackelberg动态博弈模型具体分析此二级供应链主体收益和定价情况, 研究非合作博弈和合作博弈定价下各主体的收益、对策与稳定性。

2 Stackelberg博弈二层规划模型

在Stackelberg博弈模型中有两类参与者, 分别是leader和follower, 他们进行的是数量和定价竞争。leader先行选择产量和定价, follower观察到leader的选择后再做选择。在此类决策过程中, leader自上而下进行决策, follower在leader决策的前提下可在其管理范围内行使一定的决策权。这种决策权处于从属地位, 但每一级都有自己的目标函数。这一决策过程可通过多层规划数学模型来表示, 多层规划就成了研究Stackelberg博弈问题的重要工具[13]。

在讨论铁矿石定价博弈问题时, 典型的Stackelberg主要对策博弈特征为: (1) 三大铁矿石生产商 (简称“矿商”) 在全球铁矿石贸易中具有寡头地位, 发达国家的资本相互参与在一定程度上使其具有较一致的利益目标, 中国钢铁企业 (简称“钢商”) 进口铁矿石占全球2/3左右, 参与决策主体有自己的决策可控变量, 因此这一市场结构具有寡头特征。 (2) 在铁矿石二级供应链中, 矿商和钢商的决策是相互影响的。 (3) 铁矿石定价决策系统为主从递阶结构, 矿商的定价影响钢商, 钢商的对应决策也影响矿商。 (4) 由矿商和钢商共同做出的最后决策应当是双方均可接受的满意决策。

本文运用Stackelberg博弈二层规划模型来研究铁矿石国际贸易二级供应链的定价问题[14]。我们假定铁矿石定价是由一个双寡头二级供应链构成, 矿商将铁矿石卖给钢商, 钢商加工铁矿石后把钢铁卖给消费者, 矿商和钢商都可自由制定各自的价格。由于铁矿石可生产不同的钢材产品, 面对不同的消费市场, 具有不同的需求函数, 设定钢商的生产成本为零。

我们设定:钢商i, i∈ (1, m) , 矿商给钢商i配送铁矿石数量为qi、铁矿石单价为wi和单位铁矿石运输成本ci, 矿商的单位铁矿石成本为co, 钢商i将单位铁矿石生产钢材产口后的销售价格为pi、面对的需求函数Di=Di (pi) 。钢商面对矿商的最大铁矿石产量限制为, 矿商对钢商i的铁矿石价格限制为, 钢商销售单位铁矿石生产的钢材价格pi≥wi、, 矿商为了保持与钢商的供应关系, 需要给予钢商i的最低铁矿石供给量, 由于不存在铁矿石库存, 所以qi=D (pi) 。

矿商的利润函数:……………………………………………… (1)

钢商的利润函数:……………………………………………… (2)

3 混沌搜索算法模型

混沌搜索算法具有普遍性, 可以对搜索区间的点进行不重复搜索, 所以能实现概率1收敛的全局最优[15]。混沌搜索算法不需要确定下层反馈函数的准确形式, 对上层目标函数也没有约束, 只需要知道变量的取值区间。本模型设计将矿商的铁矿石销售价格和数量作为混沌变量传递给钢商, 钢商在矿商决策后做出对应决策。

本文的混沌搜索算法步骤为[16]: (1) 初始的混沌变量。根据公式yi, n+1=4yi, n (1-yi, n) 产生m个不同的初始变量值yi, 0。式中, yi, 0不等于0、0.25、0.5、0.75、1, 生成混沌变量{yi, n}。 (2) 载波。把矿商的变量wi (wi∈[ai, bi]) 转换成混沌变量xi, n (xi, n∈[0, 1]。其中, xi, n=ci+diyi, n, ci、di为常数, ci=ai-ε1, di=bi-ai+ε2, ε1<ε2, ε1、ε2为极小值正常。 (3) 初始k=0, 迭代步数N, 给上层目标一个小数Fo。 (4) 将矿商混沌变量xi, n代入到钢商决策函数中, 利用SQP方法求解钢商的决策, 得到当前最优决策yi, k, 矿商再用yi, k来得到目标函数值Fk。 (5) 循环终止。如果Fk≥fo, 则令Fk=Fo、xio=xi, k、yjo=yj, k, 否则令k=k+1, 返回第4步骤。 (6) 如果终止, 则k=N时的决策最优为xo、yo、Fo。

4 案例分析

对矿商和钢商的二层规划供应链博弈, 我们分别以信息公开、运用混沌搜索算法来分析对策与收益。分三种情况: (1) 信息已知, 不考虑钢商合作的Stackelberg均衡解, 矿商目标收益最大化、钢商收益最大化的二层决策[17]。矿商的利润函数:;钢商的利润函数:。 (2) 二层供应链信息共享, 共同合作寻求供应链收益最大化。二层规划供应链利润函数:。 (3) 矿商寻求供应链收益最大化, 钢商寻求自身收益最大化。矿商和钢商的二层规划供应链利润函数:;钢商规划利润函数:maxΠi (pi) = (pi-wi) Di (pi) 。

为了研究方便, 我们以一个矿商和三个钢商组成的二层铁矿石供应链作为实例研究, 设定三个钢商独立无关联, 构建一主三人无关联二层规划铁矿石供应链博弈模型[18]。本文给出的假设案例仅作为计算和验证结论用, 因此没有量纲。根据以上确定的模型, 我们对相关参数设定为:c1=5、c2=7、c3=8、co=10、q1=20、q2=20、q3=30、、20≤w1≤20、20≤w2≤35、20≤w3≤35、λi∈[1.1, 1.5], 需求函数分别为:D1=200-4p1、D2=250-5p2、D3=300-6p3。运用上述混沌搜索算法模型对案例进行处理, 得到不断决策类型的结果 (表1) 。

5 结论

本文通过构建一主三从二层的Stackelberg博弈铁矿石供应链模型来分析铁矿石供应商和钢铁生产商在博弈对策下的收益、均衡情况。数据表明:铁矿石生产商决策的Stackelberg博弈均衡解没有实现整体最优和个体最优, 但如果没有合作却是均衡结果;整体最优实现了铁矿石供应商和钢铁生产商的收益优化, 但却没有实现均衡, 因为钢铁生产商有改进决策增加收益的可能性来背离合作;钢铁生产商改变全局最优会损害铁矿石生产商的收益, 降低整体供应链的收益。

结论: (1) 对铁矿石供应链上的企业, 铁矿石供应商自主决策铁矿石价格并不是最优决策, 对铁矿石供应商和钢铁生产商有合作的必要来增加各自的利润, 国际贸易的现实是价格不断变化, 谈判在不断进行中也表明双方有谈判的必要[19]。 (2) 对铁矿石二层供应链, 全局集中决策优于分布决策[20]。 (3) 在铁矿石供应链定价博弈过程中, 存在相互信任和背离合作的动态博弈过程, 再加上市场需求、生产成本等的不断变化, 合作与非合作将是一个不断变化的过程[21]。

摘要：构建了二层规划的铁矿石贸易双寡头二级供应链Stackelberg博弈模型, 运用混沌搜索算法进行了案例分析。案例数据表明:铁矿石生产商决策的Stackelberg博弈均衡解没有实现整体最优和个体最优, 但如果没有合作却是均衡结果;整体最优实现了铁矿石供应商和钢铁生产商的收益优化, 但却没有实现均衡, 因为钢铁生产商有改进决策增加收益的可能性来背离合作;钢铁生产商改变全局最优会损害铁矿石生产商的收益, 降低整体供应链的收益。

寻找均衡:征地制度中的博弈分析第3篇

关键词：征地制度,博弈,公共利益,私人利益

一、现行征地制度中公权与私权的博弈分析

虽然社会利益是多种多样的, 但宪法确认和保护的利益是其中基本的和主要的部分, 这部分利益实际上就是从宪法学和经济法学的角度来看的社会整体利益。从宪法学和经济法学角度认定的这种社会整体利益, 可分为两个相互区别开来的组成部分, 其一是社会成员的共同的利益即社会的公共利益, 其二便是社会成员个体的利益 (包括自然人、法人及其组织集合体) , 也即私人利益;[1]公共利益与国家政权相联系, 私人利益与公民权利有关, 国家权力和公民权利在外观上是社会整体利益的两个方面即法定的公共利益和私人利益的体现。故我国征地制度中公权与私权间的博弈在内容和实质上就体现为公共利益与私人利益间的一种争夺和对抗。

1.博弈的主体分析

征地制度通常与“公共利益”相联系, 在我国现有征地制度中, 公共利益的实现和行使依附于国家强制力, 而在大多数情况下, 公共利益的执行者本身 (或化身) 就是国家公权力机关或其授权机关, 因此其本身就是一种强制力。而征地制度的被动者就是以村社集体组织为单位的农民;征地制度所指向的对象就是农村集体所有的土地, 而以这种简单和不规范的村社集体组织为代表的集体利益实际上是农民单个利益的组合体, 在法律上其实也是一种私人利益, 所以, 我国现行征地制度中矛盾双方或者博弈双方其实主要就是行政主体与农民。有人提出“压力集团”说[2]或者叫做“利益集团”, 以共同主张或维护农民利益, 其实在真正的农民合作组织未建立起来之前, 农民利益集团是个相对模糊的概念, 由于被概念性地围入这个群体之中的成员的各自位置、受行政决定的预期影响和伤害补偿程度等并不相同, 因此受到的被迫的博弈动机也就难免参差不齐, 再加上乡镇组织和村社集体中的个别所谓的“代表”有不乏为了谋取自己私利而损害集体或他人的动机, 农民利益集团的代表作用实际上被大大地削弱了。

2.博弈的动因与条件分析

(1) 博弈的物质基础——社会资源的稀缺性。

博弈的物质基础是指相关社会资源的稀缺性, 在一定社会历史时期, 社会资源的稀缺性决定了以调整由行政主体所代表的公共利益与相对方所代表的私人利益之间的利益关系。尽管特定社会资源并不稀缺, 但获取这一社会资源的交易成本过高从而限制了部分资源的占有和使用。行政权力是一种有着支配特定社会资源旨在提供公共物品的功能的权力, 在此意义上, 行政主体代表着公共利益, 相对方代表着私人利益。国家为了必要的公共建设的需要, 对农民的土地实施征用, 而农民迫于本能的私利性, 必然竭力维护自己的土地权利或在已尽自己最大的努力仍然不得不放弃的情况下转而争取从土地财产权利的损失中获得最大化的利益补偿。

(2) 博弈的动力——积极动力与消极动力。

作为征地的策划者和发起者, 博弈的一方政府无疑在其中扮演重要且居于主导地位的角色, 除个别行政机关或部门或者个别公职人员利用权力资源设租、寻租, 实行个案腐败之外, 行政主体必定抱着积极乐观的态度寻求着每一个可能带来公共利益正当化增值的机会。与之相对应的是, 农民及其利益集团在与政府博弈过程中缺乏实际参与的动力, 只有那些预期收益或者损失比较确定值得去博弈的成员才有足够的博弈动力。[3]

(3) 博弈的地位——不平等性。

一般而言, 行政主体因拥有强制权而在相互关系中居于强势, 行政相对方农民要在征地过程中进行正当博弈就会受到诸多限制。[3]“双方平等参与博弈, 平等表达与论证观点, 对行政决定产生平等影响”还存在诸多形式上或实质上的难度, 当然, 笔者并不是否认平衡论者主张的而且实践中也越来越多的“程序公开化、信息透明化、决策民主化”的整体趋势, 但只是作为一种趋势, 与实践中迫切需要的完善而合理的征地程序还相差甚远。

3.博弈的结果分析

博弈理论中的结果其实也叫做均衡, 在征地制度中, 由于作为博弈的一方农民主体在博弈过程中权利资源拥有量的不利处境、积极动力的缺乏和事实上法律地位的不平等, 导致农民平等参与博弈遇到重重阻碍。虽然博弈过程中权利有时基于追逐最大利益的本性使然也具有恶意扩张的可能, 但对于该一主观上的动机和即使客观上的结果状态, 可以通过公权力的设计、安排予以规范, 确切的说, 也就是大部分权利的不正当行使还是可以通过行政主体的行政权力来予以规范。综合来看, 相对于拥有较高组织程度和社会威望、健全的组织形式, 享有较多的权利资源的公权力来说, 农民主体在博弈过程中处于不平等的地位。而这往往导致农民的权益不断被侵犯却又得不到补偿或恢复。这也是为什么现实中只会出现农民个体屡访屡败、屡败屡访和农民个体据理力争、拒不搬迁的现象的原因。而一旦作为中国最大主体的农民主体的权利得不到保障, 最终也将不利于权力——权利统一体的有效运行, 不利于社会中间层组织的构建和法治国家的形成。

如上文所述, 事实上由于往往存在假借“公共利益”之名或各种不正当的、非理性因素参与博弈和竞争导致的非正当均衡。一部分利益往往被实施这类行为的主体所获得, 对于此类导致社会正当利益流失和不利于社会整体利益发展的行为, 应从制度设计和安排上加以规范和打击。

二、征地制度中实现博弈平衡的具体安排

综合以上分析, 要实现征地中的博弈平衡, 首先应在兼顾私人利益基础上以社会整体利益为目标, 为一切行为作出的出发点和落脚点。鉴于农民合作组织在征地博弈中保护农民权益方面的虚无和疲软无力, 应探寻能够有效规约公权力、保护农民权益的社会中间层主体——农民组织的构建。

1.构建具有现实意义的农民组织

现有的农村合作经济组织, 由于家庭经济的分散性和市场发育程度的不充分, 并不是完全意义上的农民自己的经济组织。因此, 应改造现有的“农村集体经济组织”为能够代表农民进行政策决策和经济博弈的“农村集体组织”, 使之融政策职能和经济职能为一体, 兼具企业法人和机关法人、事业单位法人和社会团体法人的性质, 当然, 农村集体组织的建立还存在规模大小、实力薄弱、管理制度不健全和稳定性较差等缺陷, 应从制度设计上予以合理安排与规划。待条件成熟时, 农村集体组织应升级为农民社区组织。以期能够更好的为农民的经济发展权、政治发展权、社会发展权和文化发展权服务, 以利益与利益机制为基点, 权利与权益维护为核心, 形成一整套基于农民权益保护的有利于完善农村社区相关政治制度、发展农村社区经济、培育农村社区文化和优化农村社区治理结构的有效的农村社区发展体系。

2.农村社区经济的形成和发展

博弈平衡除了应巩固和重新分配固有的权利资源格局之外, 还应为农民不断开创新的权利之源。构建新型的农村社区组织, 需要相对完善的农村社区经济计划和相对发展的农村社区经济。调整落后生产经营方式, 增强农民面对市场的风险意识和维护自身利益的权利意识。新时期, 建设社会主义新农村应严格贯彻中国共产党“多予、少取、放活”的工作方针, 核心在“多予”, 应加大对农村经济的投资力度, 减少农村经济的直接的资金输入, 培养其形成循环可持续发展的能力, 建立合理的农村经济投入分担使用机制, 促进农村社区经济的高速发展。农村社区建设应依据农村的内外部环境, 充分发挥地理资源优势, 调动广大农民的积极性, 以农业产业化为基础, 加强对农业衍生品的加工, 积极进入第二、三产业, 从而建立以农村社区企业为主体、多种经济组织形式并存的农村经济发展模式。[4]

3.完善补偿安置机制

要使农民有博弈的愿望和积极的博弈动力, 就应该完善补偿安置机制。现行土地征用按土地原用途并以农民生活在农村为标准进行补偿, 显失公平。土地在征用过程中发生流转, 产权主体和使用用途发生变化, 无论是“农转建”还是转为其他用途, 土地价值发生增值, 而这种增值如若不能体现在合理的补偿上, 将于无形中大大的损害了农民的应得利益。对于征地补偿款, 建议改由行政征收主体来承担或由征收主体与实际享有公共利益建设权利和利益并获得好处的商业实体来共同合理分担行政征地补偿费用, 这样做的好处是:一则使行政征收主体由权力主体变成义务主体, 政府在审批征地申请, 作出征收决定时不得不从自身利益角度衡量并持谨慎态度, 将大大减少和扼制政府寻租行为和个别公职人员的腐败动机。由国家财政支付国家义务部分是因为国家负有保障其社会成员基本生活权利并促进其发展的义务和动用全社会资源为少部分的社会弱势群体的生存和发展买单的权力。二则政府内部上下级之间和政府部门之间将形成一种互相监督和有效制约的压力。在现有经济水平和能力条件下, 应根据市场价格标准和土地增值幅度适当提高农民征地补偿标准, 归还农民应得利益并改革现行的社会保障制度, 将失地农民纳入社会保障体系之中, 而不是《中华人民共和国物权法》中简单的安排被征地农民的社会保障费用, 确立征地补偿长效机制, 培育农村内生力量。在对失地农民的安置问题上, 应效仿美国的做法建立就业扶持机制:通过资金转移支付的办法加强对失地农民的教育和职业培训, 以减少或取代直接的失业保险基金的支出, 培养其寻求新的利益增长源泉的技能, 同时政府或集体经济组织应严格按照城市规划要求, 兴办二、三产业, 发展集体经济, 解决失地农民的就业和生活问题, 并为以后农村社区向城镇社区过渡创造条件。

4.公力救济的完善

公力救济作为征地博弈过程中的一种有效平衡, 依托于公权力的行使和公力救济的完善。而征地往往与“公共利益”相连接, 要实现权力对农民权利的救济, 公权力机关通过公权力的行使和公力救济的完善界定与规制“公共利益”, 间接调整双方地位的不平等性和博弈动力的差异, 间接实现博弈的平衡并实现对权利主体利益的补偿和救济。

(1) 立法上填补相关空白。

对公共利益作出界定是必要而且必须的。因此, 应采取概括化和原则化的方法在宪法中对“公共利益”作出界定, 同时, 发挥具体的单行法 (如土地管理法、房地产管理法和物权法) 在调整特别的公共利益内容、事项方面作为特别法律、法规的功能和作用, 由这些特别法来对公共利益予以具体化。具体做法为:①在以后新的宪法修正案中将现有第十条第三款“国家为了公共利益的需要, 可以依照法律规定对土地实行征收或者征用并给与补偿”修改为“国家为了公共利益的需要, 可以依照法律规定对土地实行征收或者征用并给与正当的补偿和安置”。②在《中华人民共和国土地管理法》中安排“土地征收”专章, 具体规定土地征收范围和内容、权限和程序、注意事项和征地补偿标准及其计算办法等。同时, 发挥其它单行法在相关规定方面的重要作用。

(2) 行政上严格行政征收权限和程序。

借鉴国外的做法, 在作出土地征收决策之前, 应先向社会公告土地征用用途、范围和事项, 听取各方意见特别是被征地农民和其他相关利益主体的意见、建议并反馈;设立“公共利益”的认证程序, 组织专家讨论和评估该决策的合理性。应通过举行听证会、座谈会、论证会等形式集思广益、共商良策, 并邀请有关农民利益代表或农民利益团体参加并发表意见和针对特定问题提出质疑, 在此之后将决策过程和结果向社会公众公开、回收意见和建议并予以修改和完善, 并报上级土地主管部门批准;按照事先通过民主化决策作出的补偿价格给予被征地农民以补偿并作出妥善安置。

(3) 司法上健全司法救济体制。

即解决如何在权利遭受侵害之后通过法律的最后救济来获得补偿并保障这些补偿能够给受损者带来某种心理上的安慰。首先, 就应该坚持司法独立, “法官除了法律就没有别的上司。法官有义务在把法律运用于个别事件时, 根据他在认真考察后的理想来解释法律, 独立的法官既不属于我, 也不属于政府。”[5]其次, 对于行政诉讼, 应扩大其诉讼范围, 由于行政复议本身局限于行政主体内部的局限性, 应尽量为行政复议转化为行政诉讼提供便利条件;再次, 开辟“绿色通道”, 对于此类涉及征地矛盾和纠纷的重大行政案件应该给以优先审查、审理。赋予法官更大的主动依职权调查、取证的权力, 提倡“法庭入乡、法官入户”, 了解民情、体察民情。

参考文献

〔1〕童之伟.法权与宪[M].济南:山东人民出版社, 2001.

〔2〕荣敬本等.从压力体制型向民主合作体制的转换——县乡两极政治体制改革[M].北京:中央编译出版社, 1998.

〔3〕〔4〕宋功德.行政法的均衡之约[M].北京大学出版社, 2004.

〔5〕李长健, 伍文辉.基于农民权益保护的社区发展权理论研究[J].法律科学, 2006, (06) .

机构投资者撤资速度博弈均衡解第4篇

近年以来, 中国证券市场上价值投资理念逐渐被投资者接受, 但机构投资者与普通投资者投机行为决定了证券市场内在特征。一般来说, 基金有更加理性的价值投资取向, 但一方面, 基金资金的不同来源对基金投资取向有不同的影响, 当市场出现更有利的投机机会时, 会有资金抽离基金进行投机行为;另一方面, 中国证券市场中上市公司质量较低, 符合价值投资理念的上市公司相对较少, 由于投资证券市场资金量的庞大, 必然有大量投机资金存在。此外, 还有大量的券商资金及其他资金的存在, 中国股市必然存在大规模资金投机 (机构投资者) 及中小投资者投机行为。加大对机构投资者投机行为的监管与查处, 必须研究机构投资者与中小投资者间的博弈的行为模式, 从其内在行为规律着手进行监管, 才会取得更好的效果。机构投资者的经济行为也是以经济利益最大化为目的的理性经济行为, 所以, 分析机构投资者的经济行为可以为规范股票市场秩序的政策制定提供一些有益思路, 同时, 普通投资者也可通过对机构投资者行为的理性分析制定相应对策, 普通投资者的重要投资策略是跟随机构投资, 因此, 分析机构投资者行为模式特别是其从投资的某一股票撤离资金速度对普通投资者操作策略非常重要。本文建立了机构投资者撤离资金阶段的两个博弈模型, 着重分析了机构投资者撤离资金的博弈均衡解, 及其撤资速度与持股量的关系, 为研究机构投资者行为特点进而为规范股票市场作一些有益探索。股票投资是一种特殊的投资。由于投资过程牵涉许多经济利益主体, 这些主体的投资利益往往又相互交错, 因此, 每个主体不仅要分析自身情况, 还要深入研究其它主体的情况, 经济博弈论改变了传统的经济分析方法, 认为经济过程充满了博弈, 经济结果几乎都是各个局中人相互选择策略, 相互进行博弈的结果。每个局中人的决策除考虑自身的利益外, 还要考虑其他局中人的决策对自身决策的影响。同时, 自己的决策也会对其他局中人的决策产生影响。在股票市场交易操作上, 普通投资者无时无刻不在观察, 分析机构投资者的动向来决定自己的行动, 所以机构投资者的每一步行动也必然要考虑普通投资者的反应, 在此基础上考虑如何使自己利润最大化。机构投资者在撤离资金时也必然把普通投资者的反应考虑在内, 然后再决定自己的最佳撤离资金方式。下面分两个部分分析机构投资者在撤离资金时是如何与普通投资者博弈的。在完全信息静态博弈中, 利用机构投资者考虑了普通投资者反应的利润函数模型分析了机构投资者如何使自己利润最大化问题, 及纳什博弈均衡;在信号传递博弈模型中, 研究了在普通投资者不知道机构投资者信息的情况下, 机构投资者如何传递有利于自己的信号, 及此时的分离与混同博弈均衡及其条件。

一、文献综述

国外研究中, 著名经济学家Jean.Jacques Laffont和Eric S.Maskin.在 ([J].Journal of Political Economy, 1990.98.70-93.) 一文中, 假设风险证券的收益r=θ+ε。其中θ是一个取两个值θ1, θ2, (θ1<θ2) 的离散随机变量, 将其理解为机构投资者所掌握的内幕信息是“利空”还是“利好”, 分别得出分离均衡及混同均衡下机构投资者的定价及普通投资者股票持有量策略, 且说明了当θ1, θ2相距不远时, 大户与散户都偏好混同均衡。张永鹏、靳景玉在《大户与散户在证券市场的博弈》 (《重庆工商大学学报》2003.10) 中沿用了拉丰这一模型, 但将散户的效用函数改成了常系数绝对风险厌恶的负指数形式, 给出了机构投资者与普通投资者偏好混同均衡的关于θ1, θ2距离的一个具体范围。

我国尽管博弈论的应用分析的文章很多, 但对中国这个特殊的股票的博弈研究的专业论文比较少。谢炽予 (2002, 《股市投机的群体行为博弈和系统科学分析》, 《数量经济与技术经济研究》) 从群体行为博弈角度出发, 得出个股价格运行具有很强内在不稳定性, 不仅有暴涨暴跌的内在机制, 也有价格运动方向突然逆转的可能性。耿志民 (《中国机构投资者研究》中国人民大学出版社) 分析了机构投资者的投机行为与庄家特征中, 对单阶段完全信息静态博弈利用股票价格下跌概率及预期收益得出:市场上机构投机者与个人投机者数量之比越大, 信息中所含噪声越大, 机构投机者获利越大, 个人投机者则正相反。在不完全信息动态博弈中, 用δ代表机构投资者耐心程度, 只要T-1阶段个人投资者认为机构投资者会继续抬高价格的概率不小于1/2δ, 有套利意图型机构投资者会假装抬高价格, 该博弈纳什均衡为:机构投资者在T-1阶段会继续抬高价格, 在T阶段买出。李华、杜莉 (2002, 《中国股票市场博弈分析》, 《上海金融》) 分析了上市公司、机构投资者、中小股民等博弈策略, 用支付矩阵说明了上市公司采取投资策略, 主力机构采取投资策略的情况下, 股票市场无大风大浪, 散户也没有大的投机机会, 其投机收益也小于投资收益。担当上市公司没有多少投资价值可言, 无利润可分可送, 主力机构要想获利也必须采取投机策略, 其投机收益大于投资收益, 由于上市公司无投资价值, 散户同样只有投机才能获取收益。汪建坤 (2002, 《中国股市的博弈分析》, 《财贸经济》) 分析了中国股票市场上交易所、庄家、散户和政府之间的博弈。在庄家与交易所博奕中, 用囚徒困境的支付矩阵说明了庄家和交易所在实现纳什均衡时的战略是:庄家做中等交易量, 交易所不控制, 此博弈的结果是, 庄家和交易所均增加了收益, 同时也没有恶性炒作个股现象。在庄家与散户的博弈中, 用“智猪博弈”及支付矩阵, 分析了庄家的行为常常具有欺骗性, 所以在博弈中, 只有少量有分析能力的散户才能赢利, 大部分散户将会屡屡上当而亏损。在庄家与庄家的博弈中, 用潜在进入者与在位者间的博弈, 加上支付矩阵, 说明了在低价格情况下, B将选择与A一起做庄;在高价格情况下, B将选择另外的个股去做庄。分析了每个庄家最优化的一阶条件表示纳什均衡时所有庄家的最优交易量。王国顺、李桂珍 (1998, 《股票市场博弈分析》, 《工业技术经济》) 分析了股票市场某只股票炒作过程中庄家与散户之间的斗争与妥协, 讨论了散户根据对庄家吸货还是吐货的概率判断来决定最优策略。肖艳颖、邱菀华在《风险投资博弈分析与项目评价》 (《预测》2001年第5期) 一文中研究了企业生存可能性对投资者决策的影响, 投资者根据观测到的企划书水平决定企业的预期获利水平Q (A) , 因为信息不对称, 投资者只根据公开信息给企业以市场评价。类似于用负债比例显示企业质量的模型 (Ross, 1977) 见张维迎的《博弈论与信息经济学》。

本文与拉丰的研究都集中在机构投资者与普通投资者的博弈关系上, 但拉丰研究的是机构投资者的股票定价与普通投资者的持有量策略, 而本文研究了机构投资者如何撤离资金的策略和普通投资者的最优反应策略, 及机构投资者持股量与最佳撤离资金速度的比较静态分析, 同时研究了机构投资者撤离资金过程中信号传递博弈的分离与混同均衡。

二、完全信息静态博弈均衡解及其比较静态分析

在完全信息下, 假定普通投资者知道机构投资者一切信息, 这虽然与事实不符合但可作为我们分析的开始, 后面我们将取消这一假设。在完全信息下机构投资者在决策时是如何在考虑普通投资者反应的基础上确定自己的最优有行动呢?

我们可以用机构投资者撤离资金速度v对股票价格的影响, 来描述机构投资者在撤离资金时是如何把普通投资者反应考虑在内的。假如普通投资者不对机构投资者行动做出反应, 股票价格只是由于机构投资撤离资金影响供求而使价格下降, 现在握有该只股票的普通投资者因观察到机构投资者撤离资金而抛出手中股票, 则会使股票加速下跌, v越大价格下降速度越大, 所以机构投资者撤离资金速度v会另有机构投资者撤离资金数量以外对股票价格的影响, 而这个影响就是普通投资者对机构投资者的反应.我们的模型也据此建立。

设机构投资者撤离资金开始时拥有某股票数量为Q0, 机构投资者在考虑普通投资者基础上的撤离资金速度为v, 在某一时间点上机构投资者已售出股票数量为Q, 此时股票价格为p, 则p是v的减函数, p=f (Q, v) , 鄣f (Q, v) / (v<0, 鄣2f (Q, v) /鄣v2, 即f (Q, v) 是递减的凹函数, 以下假定各函数均连续, 可导且导数连续。

设机构投资者利润为M, 假设机构投资者家完全使用自有成本, 则:

满足机构投资者利润最大化的一阶条件为:

下面证明上式解的存在性:

当v→0时, v的变化对价格的影响比对边际拉抬成本的影响小, ∴G>0.

而当v→∞时, c′ (v) =0 (无须拉抬) , 而上式中的第一项为负∴G<0。

上式中的一项为负, 而c° (v) >0, ∴G (v) <0。

∴, 一阶条件有唯一解, 这个解定义了一个出货速度v与机构投资者持股量Q0之间的一个值函数关系:v=h (Q0) 。此博弈的纳什均衡为:机构投资者以v=h (Q0) 速度撤离资金, 由于普通投资者只能接受市场价格, 所以其均衡策略为尽快出货。下面对机构投资者策略进行比较静态分析.

上式说明为保持利润最大化, 机构投资者撤离资金速度应该与持股数量成反比。

以上分析表明, 在考虑普通投资者反应的情况下, 机构投资者在撤离资金阶段的撤离资金速度决策要考虑持股阶段所筹集的股票数量, 所筹集的股票数量越多则撤离资金速度应越慢;反之亦然。

下面看一个简单的具体例子。

设p=p0 (a+v2) Q, 其中p0是机构投资者撤离资金时的股票价格, a>0.b (Q0) =b (Q0, b>0.c (v) =vd, d>0。

三、不完全信息下混同均衡及分离均衡解——基于信号传递模型

以上分析是在普通投资者对机构投资者信息具有完全信息的基础上进行的, 下面分析普通投资者具有不完全信息的情况。一般情况下, 普通投资者可以根据技术图形分析机构投资者是否撤离资金, 但是机构投资者完全可以故意做出某种图形引诱普通投资者。我们从另一角度来分析。

现在假定机构投资者持有股票数量Q0已定, 随之有一最佳撤离资金速度v, 但由于普通投资者对机构投资者是否撤离资金具有不完全信息, 只能根据对机构投资者撤离资金速度v的观察进行判断。这时撤离资金速度v则可作为机构投资者向普通投资者发出的信号, 进行信号传递博弈。这时机构投资者必然选则发出对自己最有利的信息, 即表示自己不是在撤离资金而是在震荡调整, 那末机构投资者速度必须足够小才能达到这一目的。但是这受到一定条件限制, 如筹借资金还款日期等, 超过还款日期要遭到惩罚损失, 因资金问题而失败的例子屡见不鲜。机构投资者只有在因传递震荡信号而多得收益超过损失时, 才会传递这样的信号以额外受益。下面分析这个信号传递博弈的数学模型。

若机构投资者以很慢的速度撤离资金以传递震荡整理的信号, 股票价格基本维持原来水平p0, 此时机构投资者多得的收益为:

而多付出的成本为拉抬成本和逾期还款惩罚:

只有当多得收益大于或等于多付出的成本, 机构投资者才会这样做。所以:

下面分析混同均衡与分离均衡存在的条件。

经济解释为: (1) 当v较小时, 为传递震荡信号而维持p0股价所得收益小, 不足以支付成本, 所以不模仿震荡调整行为。 (2) 当v较大即撤离资金较快时, 为不引起普通投资者跟抛, 选择模仿震荡调整行为, 此时所得收益大于成本。

完全信息下, 只有机构投资者最佳撤离资金速度v大于或等于混同均衡最小值v0时, 他才会模仿震荡行为, 此时普通投资者贝叶斯修正概率与先验概率相同, 无法根据机构投资者行动得出新信息。

四、结论与建议

1. 机构投资者筹资行为特征决定了他在证券市场上投资行为的行为模式, 而其行为模式决定了他对证券市场的影响方式。从本文可看出机构投资者持股数量很大就决定了他抛出股票的速度会比较平缓, 因而对股票市场震荡的影响也会是平缓的。因此, 培育资本市场上的大型机构投资者对稳定证券市场波动有很重要意义。

2. 有理论模型可见机构投资者筹资成本对其行为模式有很大影响, 筹资成本越高, 机构投资者抛售股票速度越平稳, 对市场波动越能起到平滑作用。利用市场差别化利率, 根据金融投资风险较大特点提高机构投资者筹资成本, 机构投资者投资决策会更谨慎, 同样对稳定证券市场波动有重要意义。

摘要：著名经济学家Jean Jacques Laffont利用博弈分析得出分离均衡及混同均衡下机构投资者的定价及普通投资者股票持有量策略, 但对二者后续行为模式及行为规律没有进行分析。而这一行为过程中, 机构投资者撤离资金速度是其行为模式的关键, 因为机构投资者撤离某只股票速度直接影响股票市场震荡幅度及频度。分别在完全信息和不完全信息下建立了机构投资者撤离资金速度的两个博弈模型, 得出了机构投资者撤资速度分离均衡及混同均衡博弈均衡解, 及其撤资速度与持股量的关系, 为研究机构投资者行为特点进而为规范股票市场作了有益探索。

关键词：完全信息静态博弈,信号传递博弈,比较静态分析

参考文献

[1]Varian H R.Microeconomic Analysis (third edition) [M].New York, Norton, 1992.

[2]Spence.A.M.Market signalling[M].Harvard, Harvard University Press, 1974.

[3]Jean-Jacques Laffont, and Eric S.Maskin.The Efficient Market Hypothesis and Insider Tradeing on the Stock Market[J].Journal of Political Economy, 1990, (98) , 70-93.

博弈均衡算法第5篇

关键词：矩阵博弈,严格优势策略,纳什均衡

2×2矩阵博弈是一类被广泛地应用于政治、经济、军事等人类生活方方面面的重要博弈类型,它是指在博弈过程中只有两个参与人(参与人1和参与人2),且每个参与人只有两个可选策略。经典博弈诸如囚徒困境、性别战争、古诺双寡头垄断、贝特兰德双寡头垄断等博弈都可以归为此类博弈。因此,对2×2矩阵博弈的深入研究,特别是对2×2矩阵博弈中纳什均衡的讨论是十分有必要的。

本文分析了一般形式下2×2矩阵博弈中的纳什均衡的特征,讨论了此类博弈的纯策略纳什均衡和严格优势策略,得到了在没有严格优势策略且存在唯一纳什均衡的2×2矩阵博弈中,纳什均衡必为混合策略组合。最后通过具体的2×2矩阵博弈,给出此类博弈纳什均衡的讨论方法。

考虑一般形式的2×2矩阵博弈。对于参与人1和参与人2,参与人1的可选策略为U和D,参与人2的可选策略为L和R。他们的收益情况如下:

(1)当参与人1选择策略U且参与人2选则策略L时,他们的收益分别为a和b;

(2)当参与人1选择策略U且参与人2选则策略R时,他们的收益分别为c和d;

(3)当参与人1选择策略D且参与人2选则策略L时,他们的收益分别为e和f;

(4)当参与人1选择策略D且参与人2选则策略R时,他们的收益分别为g和h。

我们可以用如下的矩阵表示:

其中第一列表示参与人1的可选策略,第一行表示参与人2的可选策略,收益中前者为参与人1的收益,后者为参与人2的收益。

设参与人1选取策略U的概率为x,参与人2选取策略L的概率为y。这样,参与人1选取策略D的概率为1-x,参与人2选取策略R的概率为1-y。

可见,对参与人1而言,选取策略U的期望收益为ay+c(1-y),选取策略D的期望收益为ey+g(1-y),于是参与人1选取策略U和策略D无差异当且仅当ay+c(1-y)=ey+g(1-y)。令r1(y)表示参与人1对参与人2随机化概率y的反应函数。则

类似地,对参与人2而言,选取策略L的期望收益为bx+f(1-x),选取策略R的期望收益为dx+h(1-x),于是参与人2选取策略L和策略R无差异当且仅当bx+f(1-x)=dx+h(1-x)。令r2(x)表示参与人2对参与人1随机化概率x的反应函数。则

由于纳什均衡是每个参与人对其对手策略选择的最优反应,则在2×2矩阵博弈中,纯策略纳什均衡具有如下特征:

(U,L)是纳什均衡当且仅当a≥e且b≥d;(U,R)是纳什均衡当且仅当c≥g且d≥b;(D,L)是纳什均衡当且仅当e≥a且f≥h;(D,R)是纳什均衡当且仅当g≥c且h≥f。

在博弈中,严格优势策略与纳什均衡不同。参与人的严格优势策略是使得参与人选取该策略所获收益严格大于选取其他策略所获收益。在2×2矩阵博弈中,严格优势策略具有如下特征:

对参与人1而言,策略U严格优于策略D当且仅当ay+c(1-y)>ey+g(1-y);策略D严格优于策略U当且仅当ay+c(1-y)<ey+g(1-y)。

对参与人2而言,策略L严格优于策略R当且仅当bx+f(1-x)>dx+h(1-x);策略R严格优于策略L当且仅当bx+f(1-x)<dx+h(1-x)。

定理在2×2矩阵博弈中,如果不存在严格优势策略,且存在唯一的纳什均衡,则此纳什均衡必为混合策略组合。

证明(反证法)假设此博弈中唯一的纳什均衡是纯策略组合,设为(s1*,s2*),不失一般性,取(s1*,s2*)=(U,L),对策略组合(U,R),(D,L)和(D,R)可类似地讨论。由于(U,L)是纳什均衡当且仅当a≥e且b≥d。对此分情况进行讨论。

(1)a>e且b>d。由于对参与人1而言,策略U不严格优于策略D,则ay+c(1-y)≤ey+g(1-y),于是c≤g;对参与人2而言,策略L不严格优于策略R,则f≤h。于是策略组合(D,R)是博弈中的一个纳什均衡,这与(U,L)是唯一的纳什均衡矛盾。

(2)a=e且b>d。此时b-d>0,则(b-d)+(h-f)>h-f,于是存在θ∈[0,1]使得θ[(b-d)+(h-f)]>h-f,即θb+(1-θ)f>θd+(1-θ)h,从而令参与人1选取策略U的概率为θ,可见混合策略组合σ=(σ1,σ2)是博弈的一个纳什均衡,其中σ1表示参与人1以概率θ选取策略U,以概率1-θ选取策略D,σ2表示参与人2选取策略L。这与(U,L)是唯一的纳什均衡矛盾。

(3)a>e且b=d。此时a-e>0,则(a-e)+(g-c)>g-c,于是存在θ∈[0,1]使得θ[(a-e)+(g-c)]>g-c,即θa+(1-θ)c>θe+(1-θ)g,从而令参与人2选取策略L的概率为θ,可见混合策略组合σ=(σ1,σ2)是博弈的一个纳什均衡,其中σ1表示参与人1选取策略U,σ2表示参与人2以概率θ选取策略L,以概率1-θ选取策略R。这与(U,L)是唯一的纳什均衡矛盾。

(4)a=e且b=d。此时若策略组合(U,R)不是纳什均衡,则c<g;若策略组合(D,L)不是纳什均衡,则f<h。这样策略组合(D,R)是博弈的一个纳什均衡,与(U,L)是唯一的纳什均衡矛盾。

综上可知,策略组合(U,L)不是此博弈的纳什均衡,从而此2×2矩阵博弈的纳什均衡必为混合策略组合。

最后,我们考察如下的2×2矩阵博弈。

设参与人1选取策略U的概率为x,参与人2选取策略L的概率为y。

于是参与人1的反应映射r1y和参与人2的反应映射r2(x)分别为(见图3):

参考文献

[1]车竞,钱炜祺,和争春.基于矩阵博弈的两机攻防对抗空战仿真[J].飞行力学,2015,33(2):173-177.

[2]马国勇,石春生.基于博弈矩阵模型的企业研发策略[J].统计与决策,2012,1:54-55.

[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall,1994.

[4]D.Fudenberg,J.Tirole.Game Theory[M].MIT Press,1991.

[5]张维迎.博弈与社会[M].北京大学出版社,2013.

[6]W.K.Harold.Classics in Game theory[M].Princeton:Princeton University Pres,1997.

[7]R.Myerson.Game Theory:Analysis of Conflict[M].Cambridge and London:Harvard University Press,1991.

2×2矩阵博弈中的混合策略均衡第6篇

均衡是博弈论一个重要研究对象。均衡是一种策略组合, 使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。1951年纳什提出著名的纳什定理, 即在矩阵博弈中一定存在均衡。这里的均衡可能是纯策略均衡, 也可能是混合策略均衡。

2×2矩阵博弈是一类最基本且被广泛应用的重要博弈类型, 它是指在博弈过程中只有两个参与人 (参与人1和参与人2) , 且每个参与人只有两个可选策略。经典博弈诸如囚徒困境、性别战争、古诺双寡头垄断、贝特兰德双寡头垄断等博弈都可以归为此类博弈。

本文分析了2×2矩阵博弈中的混合策略均衡, 讨论了此类博弈的严格优势策略和纯策略均衡, 得到了在没有严格优势策略且存在唯一均衡的2×2矩阵博弈中, 均衡必为混合策略均衡。

考虑2×2矩阵博弈。对于参与人1和参与人2, 参与人1的可选策略为U和D, 参与人2的可选策略为L和R。他们的收益情况如下:

(1) 当参与人1选择策略U且参与人2选则策略L时, 他们的收益分别为a和b;

(2) 当参与人1选择策略U且参与人2选则策略R时, 他们的收益分别为c和d;

(3) 当参与人1选择策略D且参与人2选则策略L时, 他们的收益分别为e和f;

(4) 当参与人1选择策略D且参与人2选则策略R时, 他们的收益分别为g和h。

我们可以用如下的矩阵表示:

其中第一列表示参与人1的可选策略, 第一行表示参与人2的可选策略, 收益中前者为参与人1的收益, 后者为参与人2的收益。

设参与人1选取策略U的概率为x, 参与人2选取策略L的概率为y。这样, 参与人1选取策略D的概率为1-x, 参与人2选取策略R的概率为1-y。

可见, 对参与人1而言, 选取策略U的期望收益为ay+c (1-y) , 选取策略D的期望收益为ey+g (1-y) , 于是参与人1选取策略U和策略D无差异当且仅当ay+c (1-y) =ey+g (1-y) 。令r1 (y) 表示参与人1对参与人2随机化概率y的反应函数。则

类似地, 对参与人2而言, 选取策略L的期望收益为bx+f (1-x) , 选取策略R的期望收益为dx+h (1-x) , 于是参与人2选取策略L和策略R无差异当且仅当bx+f (1-x) =dx+h (1-x) 。令r2 (x) 表示参与人2对参与人1随机化概率x的反应函数。则

在博弈中, 参与人的严格优势策略是使得参与人选取该策略所获收益严格大于选取其他策略所获收益。在2×2矩阵博弈中, 严格优势策略具有如下特征:

对参与人1而言, 策略U严格优于策略D当且仅当ay+c (1-y) >ey+g (1-y) ;策略D严格优于策略U当且仅当ay+c (1-y) <ey+g (1-y) 。

对参与人2而言, 策略L严格优于策略R当且仅当bx+f (1-x) >dx+h (1-x) ;策略R严格优于策略L当且仅当bx+f (1-x) <dx+h (1-x) 。

由于均衡是每个参与人对其对手策略选择的最优反应, 则在2×2矩阵博弈中, 纯策略均衡具有如下特征:

(U, L) 是均衡当且仅当a≥e且b≥d; (U, R) 是均衡当且仅当c≥g且d≥b; (D, L) 是均衡当且仅当e≥a且f≥h; (D, R) 是均衡当且仅当g≥c且h≥f。

定理在2×2矩阵博弈中, 如果不存在严格优势策略, 且存在唯一的均衡, 则此均衡必为混合策略均衡。

证明 (反证法) 假设此博弈中唯一的均衡是纯策略组合, 设为 (s1*, s2*) , 不失一般性, 取 (s1*, s2*) = (U, L) , 对策略组合 (U, R) , (D, L) 和 (D, R) 可类似地讨论。由于 (U, L) 是均衡当且仅当a≥e且b≥d。对此分情况进行讨论。

(1) a>e且b>d。由于对参与人1而言, 策略U不严格优于策略D, 则ay+c (1-y) ≤ey+g (1-y) , 于是c≤g;对参与人2而言, 策略L不严格优于策略R, 则f≤h。于是策略组合 (D, R) 是博弈中的一个均衡, 这与 (U, L) 是唯一的均衡矛盾。

(2) a=e且b>d。此时b-d>0, 则 (b-d) + (h-f) >h-f, 于是存在θ∈[0, 1]使得θ[ (b-d) + (h-f) ]>h-f, 即θb+ (1-θ) f>θd+ (1-θ) h, 从而令参与人1选取策略U的概率为θ, 可见混合策略组合σ= (σ1, σ2) 是博弈的一个均衡, 其中σ1表示参与人1以概率θ选取策略U, 以概率1-θ选取策略D, σ2表示参与人2选取策略L。这与 (U, L) 是唯一的均衡矛盾。

(3) a>e且b=d。此时a-e>0, 则 (a-e) + (g-c) >g-c, 于是存在θ∈[0, 1]使得θ[ (a-e) + (g-c) ]>g-c, 即θa+ (1-θ) c>θe+ (1-θ) g, 从而令参与人2选取策略L的概率为θ, 可见混合策略组合σ= (σ1, σ2) 是博弈的一个均衡, 其中σ1表示参与人1选取策略U, σ2表示参与人2以概率θ选取策略L, 以概率1-θ选取策略R。这与 (U, L) 是唯一的均衡矛盾。

(4) a=e且b=d。此时若策略组合 (U, R) 不是均衡, 则c<g;若策略组合 (D, L) 不是均衡, 则f<h。这样策略组合 (D, R) 是博弈的一个均衡, 与 (U, L) 是唯一的均衡矛盾。

综上可知, 策略组合 (U, L) 不是此博弈的均衡, 从而此2×2矩阵博弈的均衡必为混合策略组合。

摘要：本文分析了2×2矩阵博弈中的混合策略均衡, 讨论了此类博弈的严格优势策略和纯策略均衡, 得到了在没有严格优势策略且存在唯一均衡的2×2矩阵博弈中, 均衡必为混合策略均衡。

关键词：矩阵博弈,严格优势策略,均衡

参考文献

[1]车竞, 钱炜祺, 和争春.基于矩阵博弈的两机攻防对抗空战仿真[J].飞行力学, 2015, 33 (2) :173-177.

[2]马国勇, 石春生.基于博弈矩阵模型的企业研发策略[J].统计与决策, 2012, 1:54-55.

[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall, 1994.

[4]D.Fudenberg, J.Tirole.Game Theory[M].MIT Press, 1991.

钢铁企业兼并重组中的博弈均衡分析第7篇

一、同时博弈

假设市场上只有两家钢铁企业, 提供完全相同的产品, 企业的决策变量是产量, 并且两个企业同时决定这一策略。市场上价格p是这两个企业产量之和的函数, 即需求函数是p=p (q1+q2) , 其中q1是第一家钢铁企业的产量, q2是第二家钢铁企业的产量。两个企业都以利润极大化作为目标, 当一家企业对另一家企业的产量做出预测之后, 便基于利润极大化对本身的产量进行决策。对企业1, 预测第二家企业的产量为q2e (e表示期望) 。如果企业1决定生产q1, 则市场上供给的产量就为q1+q2e, 相应的市场价格就为p (q) =p (q1+q2e) , 从而, 企业1的利润极大化问题就可以写成:

max (q1) {p (q1+q2e) q1-c1 (q1) }, 其中c1 (q1) 为企业1的成本函数。对于任一给定的企业2产量的预期q2e, 都会有相应的企业1的产量选择q1, 于是, 企业1的最佳产量就是其对于企业2的产量预期q2e的函数, 即q1=f1 (q2e) 。反之, 企业2的产量q2也是对于企业1产量预期q1e的函数, 即q2=f2 (q1e) 。如何决定企业1和2的产量q1、q2?需要解联立方程组

求出产量组合 (q1*, q2*) , 即为二者的最优产量, 也就是古诺 (Augustin Cournot) 均衡解[1]。

二、序列博弈

假设市场上存在一家支配企业和若干家小企业, 小企业等待支配企业宣布其产量计划后, 相应地调整自己的产量。假定市场上的价格决定仍与前者一样, 即价格是由支配企业1的产量q1和小企业的产量q2之和q1+q2来共同决定。假定支配企业宣布了自己的产量计划, 对于小企业来说, q1就是既定的量, 这样小企业2的问题就是:

max (q2) {p (q1+q2) q2-c2 (q2) }, 其中c2 (q2) 为企业2的成本函数。解这一问题, 可得到小企业利润极大化的一阶条件, 由一阶条件, 可以解出小企业的产量为q2=f2 (q1) 。同时, 一旦支配企业知道它给出了q1会导致q2=f2 (q1) , 它就会给出一个对自己利润极大化目标有利的产量q1去影响小企业的产量q2=f2 (q1) , 从而使自己的利润极大化[2]。于是, 支配企业的问题就是:

把q2=f2 (q1) 代入, 则支配企业的问题变为:

即支配企业会充分利用自己先走一步的优势, 去影响小企业做出对支配企业有利的反应。联立方程组, 求出产量组合 (q1*, q2*) , 即为二者的最优产量, 就是斯塔克博格 (Stackelberg) 均衡解。

三、串谋博弈

前面两种情况是非合作博弈, 但是现实生活中也存在合作博弈的情形。非合作博弈的特点是参与博弈的每一方都只为自己打算, 分散决策, 相互竞争, 只追求个人利益的极大化。合作博弈的特点是参与博弈的各方在决策过程中联合起来, 先追求共同利益的极大化, 然后在分配这个已经极大化了的共同利益, 串谋就属于合作博弈[3]。

假设市场上只有两家钢铁企业, 提供同样的钢铁产品。市场价格仍取决于两家企业的产量之和, 即p=p (q1+q2) 。但两家企业的成本函数可能不同, 分别为c1 (q1) 和c2 (q2) 。如果两家企业是串谋的, 相当于一家大公司的两家工厂, 两家工厂会谋求其利润总和的最大, 而不是每家工厂只求自己利润的极大。于是, 问题就成为:

解联立方程组, 求出产量组合 (q1*, q2*) , 即为二者的最优产量, 也就是串谋解。

四、算例

假设钢铁市场需求函数为p=100-q1-q2, c1=5q1, c2=q22, 求古诺均衡解、斯塔克博格均衡解、串谋解, 并求出对应的利润π1, π2。

1. 古诺均衡解

2. 斯塔克博格均衡解

3. 串谋解

可以看出, 在古诺均衡解和斯塔克博格均衡解中, 总产量是不同的, 总产量在企业1和企业2之间分配也是不同的。由于斯塔克博格均衡解中, 企业1是支配企业, 会比它在古诺均衡解中多出, 这便是先行一步给支配企业带来的优势。

将串谋解与古诺均衡解和斯塔克博格均衡解进行比较, 发现串谋之后, 市场上的总产量大大减少, 而均衡价格则上升, 总体上看, 企业的总利润却大为提高。在我国钢铁行业利润普遍偏低的情况下, 这具有重要意义。

五、结论

我国钢铁工业所面临的来自市场的压力、企业自身的动力, 以及国家产业政策驱动力正在积极形成合力, 共同推进钢铁企业的兼并重组。近年来, 随着钢铁行业产能的迅速扩张, 上游铁矿石资源供给的压力加大;一些小型钢铁企业发展困难加大, 大型钢铁企业又亟待进一步巩固市场优势地位;产业政策对钢铁企业在做好节能减排、发展低碳经济方面的要求越来越高, 一系列因素将共同促进钢铁产业兼并重组步伐的加快。钢铁企业在完成兼并重组和资源整合后, 应尽快将宝贵的资源投入到技术创新、质量提升、节能减排等方面, 这样才能实现企业竞争力的全方位提升, 真正推动产业发展。

钢铁工业是一个规模经济非常显著的行业。规模的扩大对现代钢铁企业的成本降低有着重要影响, 因此, 做大做强对我国钢铁企业的发展极为重要, 应该大力培育和发展钢铁龙头企业, 并培育一批市场竞争力强的新型市场主体, 促进加工企业与原料基地紧密结合、上下游产品有机衔接、产加销一体化经营。增强开拓市场的观念和品牌意识, 钢铁企业在扩大国内消费需求的同时, 应通过多种方式利用外资, 开拓国外市场, 有比较优势的应“走出去”对外投资, 带动商品和劳务出口, 形成一批有实力的跨国企业和著名品牌。

钢铁工业兼并重组后, 需要着重做好以下几项工作:一是重组后的企业要大力实施技术创新和技术改造, 尽快形成具有自主知识产权、适应未来国际竞争需要、支撑钢铁工业转型升级的核心关键技术和高附加值产品。二是重组后的钢铁企业, 应加大关键钢材品种、钢铁新材料的研发力度, 不断创造新的市场需求, 促进钢铁产业升级。三是重组后的钢铁企业应适应低碳经济发展趋势, 实现行业的可持续发展。

参考文献

[1]张维迎.博弈论和信息经济学[M].上海:上海人民出版社, 上海三联书店, 1996:50-92.

[2]周慧, 严以新.港口企业双寡头价格质量博弈分析[J].河海大学学报:自然科学版, 2004 (4) :470-473.

本文来自 99学术网(www.99xueshu.com)，转载请保留网址和出处

【博弈均衡算法】相关文章：

LMS自适应均衡算法06-11

基于直方图均衡化的水下图像增强算法09-10

博弈系统05-10

寻租博弈05-27

博弈机制05-28

博弈仿真06-21

信息博弈06-27