多阶段决策优化

2024-07-25

多阶段决策优化(精选8篇)

多阶段决策优化 第1篇

图论中的最短路问题是研究多阶段决策问题的可行办法, 关键在于将多阶段决策问题转化为最短路问题, 构造出相应的图, 使图的顶点、边、权值分别反映原问题的相关要素, 从而清晰直观地显现出问题的实质, 再通过求解图中某些顶点间的最短路来确定原问题的多阶段决策。这一问题可以利用现成的Dijkstra算法和Floyd算法来解决。

二、最短路问题

最短路是一条路径, 它的任意一段也是最短路。从某一点出发到其余顶点的最短路会构成一棵以该点为根的树, 可以采用树生长的过程来求指定顶点到其余顶点的最短路。Dijkstra算法可以实现这一过程。

设G为赋权有向图或无向图, G边上的权均非负, S表示具有永久标号的顶点集。对每个顶点, 定义两个标记 (l (v) , (v) ) , 其中l (v) 表示从顶点到v的一条路的权, z (v) 表示v的父亲点, 用以确定最短路的路线。算法的基本思想就是在每一步改进这两个标记, 是最终l (v) 达到从顶点u0到v的最短路的权。

三、多阶段决策问题的转化

在生产过程中需要考虑生产设备的更新问题。随着设备使用时间的增长, 累积效益也会增长, 同时维修费用也随之增加, 而购买新设备的所需费用越来越多, 旧设备的折旧费却越来越少。因此, 要合理利用某一设备就需要考虑在该设备的使用年限内计划其更新问题, 以使得生产效益达到最优。这就是一个多阶段决策过程。

例1:某学院数据中心有一组教学设备, 需要在每年年初进行评估, 决定是否更换新设备。该设备每年年初购置价格如表1所示, 不同时间折旧费和维修费用如表2所示。其使用年限为五年, 现要求制订一个设备更新计划, 使得五年内学院对该教学设备所支付的总费用最少。

要将该问题转化为最短路问题, 先构造加权有向图G (V, E) , 该图为完备图K6, 如图1所示。

图1中有顶点集V={vi, i=1, 2, 3, 4, 5, 6}, 其中vi表示第i年 (i=1, 2, 3, 4, 5) 年初购置新设备的决策, v6表示第五年年底的情况;边集E={ (vi, vj) , i=1, 2, 3, 4, 5;i

写出带权邻接矩阵为

迭代步骤如表3所示。

通过迭代得到从v1到v6的最短路径为v1-v2-v3-v6、v1-v2-v4-v6、v1-v3-v6, 权值为26。也就是说有三种设计方法更新设备所需费用都最省, 最省费用为26万元。

类似的还有生产策略问题。合理安排生产率对生产效益会有决定性的作用:生产率高了, 一方面剩余产品会有积压损坏, 另一方面流动资金不能及时回笼;生产率不够, 供不应求, 利润明显达不到最大值。所以, 生产部门应该密切注意市场需求的变化, 适时调整生产率, 以获取最大利润。该问题要转化为最短路问题, 关键在于设置合理的点集和边集, 计算出准确的边的加权值。

例2:某加工厂生产某种产品, 该产品在年初的需求量为60万单位并以每月10万单位递增。供大于求时, 该厂每月花费0.2元保管剩余单位产品;供不应求时, 该厂每月单位产品的短期损失费为0.4元。预计每调整一次生产率需要花费10万元的费用, 现设计合理的年生产策略, 使工厂的总损失最小。

同样的要先构造加权有向图G (V, E) , 该图仍为完备图K13 (图略) 。用顶点vi表示第i月 (i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12) 月初的决策, v13表示第12月月底的情况;用边 (vi, vj) (i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12;i

每月之间的库存保管费和短期损失费的算式为M1= (x-60) *0.2, 显然最小值为0, 下个月的产量调整费用为10万元, 所以边 (vi, vi+1) 的权值为10, 特别的 (v12, v13) 权值为0。

每两个月之间的库存保管费和短期损失费的算式为: (1) M1= (x-60) *0.2; (2) 如果 (2x-60) ≥70, 则赋值M2= (2x-130) *0.2, 否则赋值M2= (130-2x) *0.4, 解得M1+M2的最小值为1, 所以边 (vi, vi+2) 的权值为11, 特别的 (v11, v13) 权值为1。

同理可得 (vi, vi+3) 的权值为14, (v10, v13) 权值为4; (vi, vi+4) 的权值为20, (v9, v13) 权值为10; (vi, vi+4) 的权值为30, (v8, v13) 权值为20; (vi, vi+5) 的权值为42, (v7, v13) 权值为32; (vi, vi+6) 的权值为59, (v6, v13) 权值为49; (vi, vi+7) 的权值为82, (v5, v13) 权值为72; (vi, vi+8) 的权值为112, (v4, v13) 权值为102; (vi, vi+9) 的权值为150, (v3, v13) 权值为140; (vi, vi+10) 的权值为194, (v2, v13) 权值为184; (vi, vi+11) 的权值为235。

于是可以得到带权邻接矩阵, 通过迭代得到从v1到v13的最短路径为v1-v4-v7-v10-v13, 权值为46。也就是说该加工厂应该在4月初、7月初和10月初改变生产率总损耗最少, 该方案的损耗费用为46万元。

Dijkstra算法的计算过程, 除了可以直接用邻接矩阵迭代求解, 也可以编写matlab程序实施。所以。把多阶段决策问题转化为最短路问题能客观形象地展示问题本身, 同时轻松有效地解决实际问题。

参考文献

[1]赵静, 但琦.数学建模与数学实验[M].北京:高等教育出版社, 2003.

[2]刘晓妍, 麻兴斌, 王晓明.基于最短路的设备更新问题的数学建模[J].河南教育学院学报:自然科学版, 2013 (04) .

多阶段决策优化 第2篇

4.1建立了实业公司生产设备投资多目标优化决策体系

根据上述经济效益指标、设备质量指标、环境指标,建立实业公司生产设备投资多目标优化决策体系(如图1所示)。

4.2实业公司生产设备投资多目标优化决策主要指标控制

4.2.1经济效益指标的控制。在对企业生产设备投资做出正确决策时,应该首先考虑其经济效益,因为经济效益是决定企业生产设备投资的重要决策依据。针对生产设备而言,如何评价其经济效益,主要从设备经济寿命、净年值、获利指数、内部收益率四个方面评价。设备经济寿命是指设备的有形损耗和无形损耗,从经济学理论来看,也就是设备的最佳适用期限。设备经济寿命是决定设备更新期限的核心依据。净年值是指项目在计算期内每期的等额超额收益。获利指数是指项目投资后价值与初始价值对比。内部收益率是指从静态资金的时间价值考虑设备投资项目的实际收益水平。如2010年实业公司先后投资购置了2台GWC2800型钢筋网焊接成型机,采用数控伺服控制系统,精度高、速度快,全自动连续生产,设备经济寿命为15年,年产量约500000m2。同比传统的手动点焊机,设备经济寿命增加1/3,减少人力成本约70%,工人劳动强度得到大幅降低,年利润增加约2/3。

4.2.2设备质量指标的控制。设备质量是指设备的一组固有特性满足要求的程度。设备质量主要包含设备的性能、可靠性、安全性、使用价值四个方面,但是设备的可靠性和安全性是评估设备质量的两个重要指标。可靠性是评估设备基本质量的指标之一,设备的可靠性关系到国家与企业的经济效益,直接影响到国家和企业安全与品牌声誉,可靠的设备能够防止事故发生,维护社会稳定。安全性是指设备在使用、运输、销售等过程中对人体健康、财产等没有任何伤害。设备安全性直接关系到企业的经济效益,提升设备安全性是促进企业经济效益提升的关键和必然要求。2008年实业公司购置的钢塑复合假顶网编织焊接机,主机电气设计采用电脑PLC和变频器控制,减少有接触点电气组件,提高了设备电气的可靠性;主机设立了多个动程检测点,使自动工作时的误动作减少到最低程度,确保了设备的安全性。

4.2.3环境指标的控制。一是经济环境。企业做出正确的生产设备投资,必须掌握全面的投资环境。经济环境主要是从市场环境的层面考虑的,主要涉及到市场供应量、市场购买力、同类产品的竞争力、市场价格。从企业内部经济环境来看,企业自身的财务环境、融资渠道、成本、税务负担、优惠政策等都至关重要。设备投资还与资源环境相关,比如良好的人力资源、土地资源以及原材料供应都能够为设备投资加分。二是自然资源。自然资源主要包含地理地质条件、天气环境、区域位置、气温气候、水文条件以及自然文化风光等。三是社会环境。社会环境主要是指企业所处的政治社会环境,主要包含社会体制、社会秩序、社会诚信价值体系、社会文化以及社会公共服务等方面,这些是影响企业生产设备投资的重要安全保障。实业公司在投资纯水冷却机设备时,考虑到徐州地区与内蒙古鄂尔多斯地区的不同自然环境和社会环境,同样业务设备投资时,采购了不同类型的设备:在徐州地区冬季平均气温在-2.3℃,投资的纯水冷却机是安装在室外的;在鄂尔多斯地区,由于冬季气温均在-20℃左右,投资的纯水冷却机是安装在室内的。

5结语

实业公司利用多目标优化决策法,具有矿用支护、加工制造、建筑材料、工程服务等产业的技术与经验,逐步与国内外多家科研院校建立了合作伙伴关系,拥有各种专业的技术力量。在市场中已经占据一定的位置,产品已经销往全国各地,并形成了一条固定的销售链条。多目标决策优化法克服了现有企业决策单一的缺陷,从企业的经营发展提供更加科学、全面以及实用的决策评价方法,实业公司就是典型的例证。

参考文献:

[1]程江,唐应辉.修理设备可以更换的三部件串-并联可修系统的可靠性[J].西南大学学报(自然科学版),2010,32(1).

[2]杨山波.基于多目标施工机械购置决策分析[J].福建建材,2010,(3).

[3]王维刚.基于可靠性的维修技术在铁路信号设备中的应用[J].科技传播,2010,(5).

[4]程世清,盖宗源,王莹.动态规划法在设备更新问题中的应用[J].软件导刊,2009,8(1).

★ 公司内部控制优化研究论文

★ 生产质量管理研究论文

★ 房地产会计核算工作优化研究论文

★ 修井机设备研究论文

★ 智慧景区资源保护决策支持系统建设研究论文

★ 浅谈基于移动搜索的网页设计优化研究论文

★ 语文课堂教学实践优化措施的研究论文

★ 栀子黄色素提取工艺优化及品质评价研究论文

多阶段决策优化 第3篇

关键词:分阶段,库存,动态规划,模型

厂商的库存需求取决于网络结构和顾客服务期望的水平。从理论上讲, 厂商会在仓库中储备每一种销售产品, 以致力于为每一位顾客服务。但是, 因为这种储备会增加总成本, 而且对厂商来说, 也有一定的风险, 因而很少有哪种经营作业能承担得起如此耗资的库存义务。库存的目的是要以始终与最低的总成本相一致的最低限度的库存义务来实现所期望的顾客服务。虽然过度的库存可以用来弥补物流网络的基本设计中的不足, 但在某种程度上却降低了物流管理的质量, 而且, 把过度的库存用于向顾客提供服务, 将最终导致更高的物流总成本。库存管理应该特别考虑从服务水平和经济效益出发来确定库存量以及如何保证补充的问题。

1 动态规划的一般模型及求解思路

动态规划的一般模型为:

其中:sk为第k阶段的状态变量;xk 表示在第k阶段的状态为sk时的决策变量;系统某阶段的状态一经确定, 执行某一决策所得的效益称为阶段效益, 它是整个系统效益的一部分, 是阶段状态sk和阶段决策xk的函数, 记为dk (sk, xk) 。fk (sk) 表示从状态sk出发到达终点的最优效益, N表示可将系统分成N个阶段。

用枚举的方法从所有可能的决策序列中去选取最优决策序列可能是较费时的笨拙的方法, 但利用最优性原理去找出递推关系, 再找最优决策序列就可能使得枚举数量大大减少, 这就是动态规划方法设计算法的主要思路。

作为所有阶段的最优化策略具有这样的特性:不管前面阶段的状态和决策如何, 对前面阶段的决策所形成的状态来说, 后面子过程的策略必须构成最优策略。利用这个特性, 可以将多阶段决策问题的求解过程看成是一个连续的递推过程。由后向前逐步计算, 最后可以求得整个过程的最优解。

2 库存动态规划模型的建立及求解

某服装厂生产某品牌皮夹克, 1年中4个季度对该品牌皮夹克的需求量见下表。

企业生产该品牌皮夹克的费用与产品数量的平方成正比, 其比例系数是0.05, 生产出来的成品存储费用为每套每季度10元。因为产品的材料成本不变, 对寻求最优解无影响, 所以不予考虑。如果按需求量来组织生产, 总的费用为:

0.05× (300) 2+0.05× (420) 2+0.05× (360) 2+0.05× (840) 2=55080 (元) (2)

这里因为每季度按需生产, 故没有存储费用发生。下面用多阶段的动态规划思想对上述案例进行优化, 这是一个典型的多阶段决策问题, 每季度为一个阶段。

取第k季度初具有的产品数为状态变量sk。

取第k季度需要生产的产品数为决策变量xk。

由状态sk采取决策xk 后的状态转移方程显然为:

sk+1=sk+xk- Dk (3)

其中Dk为已知, D1=300, D2=420, D3=360, D4=840。

阶段效益 (费用) 为:

d (sk, xk) =10 sk+0.05xk2 (4)

若用fk (sk) 表示从状态sk出发, 采用最优策略到4季度结束时的最小费用, 则有如下的动态规划模型:

undefined

f5 (x5) =0, k=4, 3, 2, 1 (5)

下面求解以上模型。

(1) 先考虑最后1个季度k=4, 求极值问题

undefined

据 (3) 式, 其中s5=0, 应取x4=840-s4, 于是得:

f4 (s4) =10s4+0.05 (840-s4) 2

=35280-74s4+0.05sundefined (6)

(2) 再考虑k=3, 求极值问题

undefined

为求极值, 对x3求导, 令

undefined

又 s4=s3+x3- D3, 即s4=s3+x3-360, 代入上式:

undefined

得x3=600-0.5s3, 代入f3 (s3) 得:

f3 (s3) =10s3+0.05 (600-s3) 2+35280-

74 (0.5s3+240) +0.05 (0.5s3+240) 2

=0.0625sundefined-80s3+38400 (7)

(3) 再考虑k=2, 求极值问题

undefined

又 s3=s2+x2- D2, 即s3=s2+x2-420, 代入上式:

undefined

为求极值, 对x2求导, 令

undefined;

得x2=530-0.5s2, 代入f2 (s2) 得:

f2 (s2) =0.028125sundefined-59.625s2+44401.25 (8)

(4) 最后考虑k=1, 求极值问题

undefined

又 s2=s1+x1- D1即s2=s1+x1-300, 为求极值, 对x1求导, 令

undefined, 注意到s1=0, 得x1=489.6。

将x1代入f1 (s1) , 得:f1 (s1) =68702.6元, 由此得到该生产—库存管理系统各季度的库存量和最优策略序列分别为:s1=0, s2=189.6, s3=204.8, s4=342.4, s5=0;x1=489.6, x2=435.2, x3=497.6, x4=497.6。即1~ 4季度分别生产489.6套、435.2套、497.6套、497.6套, 应用这一策略, 既能满足用户的订货需求, 又能使总费用最少, 为68702.6元, 而没有采用动态规划模型时费用为91800元, 相比较, 节省23097.4元。

3 结 论

该动态规划模型是建立在商品物资分阶段存储基础之上的, 并且假定了各阶段的需求是确定不变的, 实际市场需求总是在不断发生变化, 应根据市场需求的实际变动对模型求出的最优解进行修正, 以更好地指导生产。

参考文献

[1]涂晓红.基于库存计划的供应链最短交货期模型[J].现代商贸工业, 2008 (6) .

[2]潘玮, 等.基于供应链管理的制造业库存管理系统研究[J].东华大学学报, 2002 (2) .

多阶段决策优化 第4篇

关键词:负荷恢复,系统频率,冷负荷特性,灰色决策,多目标优化,遗传算法

0引言

随着电力系统互联规模趋于复杂、大规模储能装置和可再生能源的应用以及电力市场竞争机制的引进,系统运行方式变得更加复杂,存在发生大停电事故的可能[1,2,3,4]。 近年来,世界上大停电事故频发,如美加大停电事故[5]、欧洲多国大停电事故[6]、海南电网停电事故[7]等,造成了巨大的经济损失和社会影响,引起了社会的普遍关注。

负荷恢复是电力系统恢复的关键部分,也是系统恢复的最终目的。 负荷恢复在系统恢复前期的主要作用是平衡机组出力,维持系统功率平衡,保证系统频率和电压满足要求;在后期的主要目标则是在足够大发电容量的基础上,大规模恢复重要负荷,减小停电损失。 对于负荷的投入方式,现有文献给出了一些指导性原则。 文献[8]将负荷恢复问题松弛为考虑系统稳态频率约束的0 -1规划问题并通过“扩展的潮流计算”求解;文献[9]分时步恢复负荷,对待恢复负荷进行预选,采用层次分析法确定其综合权重,利用贪婪算法求解得到各时步恢复的负荷及线路;文献[10]把电力系统的负荷恢复问题建模为包括多约束条件的0 -1背包问题,并设计了一种改进混合遗传算法来求解问题;文献[11]基于遗传模拟退火算法,采用罚函数处理各种约束,通过适应值函数确定最优恢复路径和最大允许恢复负荷量。 目前,国内外的研究大多集中于负荷的全面恢复时期, 通过采取不同的方法实现负荷恢复的智能优化,对于停电负荷的冷负荷恢复特性、发电机组的运行特性、系统频率对机组与负荷的影响以及系统实际运行中厂站的出线情况未能进行详细研究与考虑。

因此,本文针对系统网架重构完成后的负荷全面恢复的智能优化进行研究。 鉴于负荷恢复过程是一个多目标多约束的复杂连续过程,很难对其进行全过程的统一优化,本文将负荷恢复过程按恢复时段进行划分,得到一个时间离散模型,根据发电机组的爬坡特性,分时步来完成负荷投入。 综合考虑待恢复负荷的冷负荷恢复特性和发电机组的实际运行特性,将厂站的实际出线作为独立节点,建立包括可恢复负荷量、节点负荷重要度和系统频率变化水平在内的多目标函数,考虑冷负荷特性约束、计及频率特性的稳态潮流约束等约束条件,建立基于频率变化的发电机组出力和负荷恢复模型,通过带精英策略的快速非支配排序遗传算法NSGA-Ⅱ(Non-dominated Sorting Genetic Algorithm -Ⅱ)求取Pareto最优解集 , 根据信息熵权法确定各属性的客观权重,利用未确知有理数确定各属性主观权重,通过最小二乘法计算主客观组合权重,最后根据灰色关联决策模型对各方案进行决策得到最终方案。 以新英格兰10机39节点系统为算例验证所提方法的有效性。

1负荷恢复优化模型

1.1目标函数的建立

在负荷恢复时间离散化的模型中,把整个负荷恢复过程划分为一系列的恢复时步,通过对每一时步的负荷恢复方案进行次序优化从而完成全过程的负荷恢复。 假设各时步系统的初始频率一致,负荷的投入一般会导致系统频率逐步降低,当投入负荷不满足约束条件的要求时停止投入,该时步结束。 然后,通过系统调频作用调节频率使其上升,等待系统频率恢复到正常值时再开始下一时步的负荷恢复, 从而解决这一复杂的工程优化问题[12]。 本文针对某一时步的负荷恢复决策进行建模求解,恢复原则是尽可能恢复可恢复量大、重要程度高以及使系统频率变化水平小的负荷,据此建立每个时步负荷恢复的目标函数。

(1) 可恢复负荷量。

负荷恢复阶段的主要目标是快速全面地恢复剩余负荷,本文将本时步负荷恢复量最大化作为目标,为了计算方便,取负荷恢复量的负值作为目标函数,表达如下:

其中,ci表示节点负荷及其出线i是否投入,若投入取值为1,否则为0;Li为待恢复节点负荷及其出线i的可投入负荷量;nL为本时步系统中全部待恢复的节点负荷及其出线数。

(2) 节点负荷重要度。

节点所有的负荷中,Ⅰ类负荷所占比例越高,该节点的重要程度越高,应优先选择。 节点负荷重要度指节点负荷中Ⅰ类、Ⅱ 类和 Ⅲ 类负荷的相对权重之和[13],取节点负荷重要度之和的负值作为目标函数,表达如下:

其中,KiⅠ为节点负荷及其出线i中的全部Ⅰ类负荷在该负荷中的比重;KiⅡ为节点负荷及其出线i中的全部Ⅱ类负荷的比重;1.0、0.6、0.2分别表示Ⅰ类、Ⅱ 类和Ⅲ类负荷的相对权重,根据文献[13],Ⅰ类负荷所占比例越高,优先级越高,故重要负荷比例高的节点其权重越大。

(3) 系统频率变化水平。

一般情况下,负荷的投入会导致系统频率降低, 因此可以将频率作为衡量系统是否稳定的重要指标。 本文将本时步投入某负荷后的系统频率与额定频率差值作为目标函数,表示为:

其中,fN为系统的额定频率,fN= 50 Hz; fi为投入节点负荷及其出线i后的系统频率,由增广潮流计算得到。 将频率引入潮流分布,考虑系统稳态频率对发电机组出力、负荷恢复影响的计算称为增广潮流计算[14]。

综合可恢复负荷量、节点负荷重要度和系统频率变化水平3个负荷恢复时的目标函数,负荷恢复的总目标定义如下:

1.2约束条件

负荷恢复的过程中,需要综合考虑冷负荷特性约束、计及频率特性的稳态潮流约束、机组出力约束以及系统单次投入负荷量约束等。

1.2.1等式约束

(1) 冷负荷特性约束。

冷负荷恢复问题是指停电事故发生后的恢复过程中,系统中自动控制恒温的负荷同时启动,导致负荷恢复瞬间所消耗的有功功率远大于其额定功率的问题[15]。 本文采取图1所示基于分段线性的简化模型对冷负荷进行拟合,可表示为:

其中,t0 i为冷负荷i的投入时刻;Td i为冷负荷i恢复过程的持续时间;L0 i为冷负荷i的初始功率;KPL i为冷负荷i恢复时期的过载系数。 由图1可知,冷负荷恢复具有基于时间变化的特性。 本文采用最极端情况即每时步初投入冷负荷时的负荷恢复量作为标准,在机组出力约束和单次投入负荷量约束中进行校验。 如果满足约束要求,则该冷负荷可被选择恢复。

(2) 计及频率特性的稳态潮流约束。

发电机模型:

负荷模型:

其中,PGi0、QGi0为发电机的额定功率;PLi(t)、QLi(t)为考虑冷负荷特性的负荷功率,这里采用每时步结束时刻的冷负荷功率;kG i为发电机调速器静态调节系数; kpi、kqi为负荷频率特性系数;api、bpi、cpi、aqi、bqi、cqi为负荷电压特性系数;fd为频差标幺值, fd=( f - fN) / fN;式 (8)中变量含义参考文献[11]。 在实际系统恢复方案的制定过程中,通常把0.5 Hz作为系统频率下降的最大值,每次允许同时投入的最大负荷量不应使频差有名值下降超过该阈值[16,17]。 因而本文设定增广潮流计算中系统稳态频率的变化量应小于0.5 Hz。

1.2.2不等式约束

(1) 机组出力约束。

负荷恢复与机组出力关系密切,已恢复负荷及当前时步待恢复负荷所需的功率之和应小于已启动发电机组所能提供的功率之和,同时大于已启动发电机组的最小稳定出力之和,一般规定,机组的最小稳定出力是其额定功率的30%[18],即:

其中,nG为已启动的发电机组数;LL l为已恢复负荷; nLL为已恢复负荷数。 PG j可由图2的简化机组启动曲线确定。

由图2得:

其中,TS j为机组j的启动时刻;T′S j为机组j从启动运行时刻到同步合闸开始时所需的时间;T ″S j为机组j从开始爬坡向外输出功率到最大稳定出力所需的时间;KPG j为机组j的最大爬坡速率;PMj为机组j的额定出力。

(2) 系统单次投入负荷量约束。

各时步系统投入的负荷可能是一条甚至多条线路同时投入[19]。 系统的稳态频率是限制单次投入负荷最大量的主要因素。 本文采用文献[20]的方法计算当前时步系统单次投入负荷最大量。 由于网架重构阶段已结束,各发电机组都已启动并网,故当前时步的单次投入负荷最大量仅与负荷率有关。 通过对当前时步单次投入负荷量的计算完成负荷的预选。

经计算,汽轮机机组的单次投入负荷最大量占已启动机组容量的5% 左右。 相比之下,各时步单次投入负荷最小量是一个相对固定量。 各厂站内部出线仅由电网调度管辖,不能孤立地恢复某些重要负荷。 因此单条线路的负荷恢复量即为当前时步厂站单次投入负荷最小量。 不同厂站的单次投入负荷最小量可能不同,与其所带负荷总量、出线数等因素相关。

2基于NSGA-Ⅱ的负荷恢复的多目标优化

NSGA-Ⅱ[21]有以下优点:提出基于个体非劣解水平分层的快速非支配排序方法,降低计算复杂度;提出拥挤距离的概念,作为个体的比较标准使个体较均匀地分布在整个目标空间;引入保优机制即精英策略,提高种群的整体水平。

负荷恢复的智能优化是一个多目标多约束的问题,负荷预选使恢复方案满足系统当前时步单次投入负荷量约束和冷负荷特性约束,计及频率特性的稳态潮流约束可以通过对负荷恢复方案的增广潮流计算进行校验。 最终,该时步的负荷恢复问题松弛为由多目标和机组出力约束组成的0 / 1背包问题。 具体过程如下。

(1) 构造基因链。

根据负荷状态编码基因,1表示投运,0表示断开。 将负荷状态赋予染色体,染色体长度即为所有负荷及其出线数。 随机产生初始种群,一种负荷恢复方案由一个染色体表示。 对当前种群内各染色体对应的负荷恢复方案进行增广潮流计算,得到多目标函数的适应值。

(2) 快速非支配排序和拥挤距离计算。

根据个体的适应值进行非劣解水平分层,在同层个体中选择拥挤距离大的染色体。

(3) 选择、交叉、变异。

根据锦标赛制选择父代个体,优先选择序值较小、拥挤距离较大的个体。 通过分散交叉和正态变异,得到子代个体。

(4) 精英保留策略及校验。

合并父代子代种群个体形成过渡种群,对过渡种群基因解码,逆转编码原则,得到新的负荷恢复方案。 对新的负荷恢复方案进行增广潮流校验以验证其可行性。 计算过渡种群个体适应值并非劣排序, 经修剪种群个体个数后形成新的父代种群,完成一次迭代过程。 达到迭代次数要求时,输出最优负荷恢复方案。

基于NSGA-Ⅱ当前时步的负荷恢复多目标优化流程如图3所示。

3基于主客观组合赋权的多属性灰色决策

通过基于NSGA-Ⅱ的负荷恢复多目标优化,可以得到当前时步的Pareto最优解集。 由于Pareto最优解集中可能包含多个方案,故需要结合实际情况和决策者的偏好进行决策。 本文针对可恢复负荷量、 节点负荷重要度和系统频率变化水平3个属性,首先根据信息熵权法[22]确定各属性的客观权重,然后利用未确知有理数确定主观权重,通过最小二乘法计算主客观组合权重,最后根据灰色关联决策模型对各方案进行决策。

3.1信息熵权法确定客观权重

首先构造决策矩阵A=(ai j)N×M,其中N为可供选择的方案数量,M为属性数。 效益型指标包括可恢复负荷量和节点负荷重要度,其属性值越大越好;系统频率变化水平属于成本型指标,其属性值越小越好。 根据指标所属类型不同,对其规范化得到R=(rij)N×M。

效益型指标:

成本型指标:

其中,I1、 I2分别为效益型和成本型属性的下标集。 对R进行归一化处理,得到归一化矩阵R*=(ri*j)N×M,其中计算属性uj的信息熵,即:

规定当ri*j= 0时,ri*jln ri*j= 0。

计算属性权重向量u=(u1,u2,…,uM),其中uj为:

3.2未确知有理数确定主观权重

本文采用未确知有理数赋权法确定各指标主观权重[23]。 未确知有理数指对于任意闭区间[a,b],a= x1< x2< … < xn= b,如果函数 φ(x)能够满足

且, 则称 [[a,b],φ (x)] 构成一个n阶未确知有理数。 其中 α 为总可信度,[a,b]为未确知有理数分布区间,φ(x)为主观可信度分布函数。 具体过程如下。

(1) 根据专家的职称、工龄、学历和能力选定W名专家,确定其综合可信度。

(2) 各专家对于M个评价指标权重的重要程度进行打分,分值应在0~10之间。

(3) 每个指标的得分为xw,将xw对应的可信度与专家综合可信度相乘得到该指标关于xw的实际可信度 αw。 不同专家的打分具有相同的xw时,将其实际可信度合并,最后得到该指标的未确知有理数Aj,Aj= [[x1,xk],Aj(x)],其中k为某指标j得分的个数,Aj(x)为未确知有理数Aj的主观可信度分布函数。 计算未确知有理数的均值、标准差和变异系数, 如式(16)—(18)所示:

(4) 通过判断未确知有理数变异系数大小,判断专家的共识程度。 如果变异系数较小,则专家意见较为统一,共识程度高。 反之,专家意见没有达到共识,此时重复步骤(2)—(4),直到变异系数处于可控范围内,按照式(19)计算指标权重。

3.3最小二乘法确定组合权重

客观权重体现了属性的信息量,主观权重体现了属性的价值量。 主客观权重的组合实现了信息量和价值量的统一。 本文使用最小二乘法[24]确定主客观组合权重。

假设各属性客观权重为U= [u1,u2,… ,uM]T,主观权重为V= [v1,v2,… ,vM]T,则根据最小二乘法确定组合权重为W = [ω1,ω2,… ,ωM]T,W可由式 (20) 求得:

其中,数据规范化后得到矩阵R = (rij)N × M;A、e、B如式(21)—(23)所示。

3.4基于灰色关联决策模型的多属性决策方法

多目标决策的常用方法有灰色决策法、层次分析法、模糊评价法等。 本文采用灰色关联决策法[25]对多目标进行决策。

(1) 确定比较序列和参考序列。

比较序列:Xi={xi1,xi2,… ,xi M}(i =1,2,… ,N),其中M为属性数,N为可供选择的方案数量。 本文中取[X1,X2,…,XN]T= R。

参考序列:X0={x01,x02,…,x0 M}。 参考序列为理想的比较标准,本文取其为所有待选方案中相应属性的最优值。

(2) 建立比较矩阵。

比较矩阵为比较序列和参考序列相应值之差。 即Y= |Xi- X0|。

(3) 计算灰色关联系数:

其中,ρ(0,1)为分辨系数,通常取为0.5;minmin(Y) 为两级最小差;max max(Y)为两级最大差;Yj, i为矩阵Y中第i个方案的第j个属性值。 如果参考序列为属性最优值时,关联系数越大越好;反之,关联系数越小越好。

(4) 计算灰色关联度。

将各元素的关联系数与相应的属性权重相乘后求和即为每个方案的灰色关联度。

4算例分析

以图4所示的新英格兰10机39节点系统为例,验证负荷恢复多目标优化的可行性。 根据文献 [26]的方法重构网架 ,设发电机总出力恢复到最大出力的30 % 时完成系统网架重构阶段。 各机组具体参数如表1所示。

电力系统参数设置如下:发电机调速器静态调节系数kG= 30,负荷频率特性系数kp= 1.5、kq= 0[27]; 负荷电压特性系数ap= aq= cp= cq= 0.3、bp= bq= 0.4且ap+ bp+ cp= 1、aq+ bq+ cq=1[11]。 由文献[27],冷负荷持续时间取Td= 20 min, 冷负荷过载系数KPL= 2; 在通过已启动机组恢复停电区域内的节点时,考虑到人为因素和倒闸操作等原因,一个节点恢复到稳定状态大约需要5~15 min,取步长为 Δt = 20 min;负荷及其出线参数见表2。 NSGA-Ⅱ参数设置如下:种群大小为50,交叉概率为0.9,变异概率为0.1,最大迭代次数为100。 基于NSGA-Ⅱ的负荷恢复多目标优化Pareto解空间如图5所示。

由图5所示,负荷恢复多目标优化的第一时步共有3个待选方案,因此需要对其决策。 首先根据信息熵权法确定各属性的客观权重,按照效益型和成本型指标格式对决策矩阵规范化,确定客观权重U= [0.299 7,0.307 0,0.393 3];然后利用未确知有理数确定主观权重,假设未确知变异系数为15 %,选择5名专家对3个属性重要程度进行评分得到主观权重V=[0.4968,0.2805,0.2227];接着通过最小二乘法计算主客观组合权重W=[0.3982,0.293 8,0.308 0];最后根据灰色关联决策模型对各方案进行决策,结果如表3所示。

表3列出了负荷恢复多目标优化的3个互不支配的方案,其中可恢复负荷量和节点负荷重要度属于效益型指标,系统频率变化水平属于成本型指标。 根据灰色关联决策模型得到灰色关联度d2> d1> d3, 方案2为当前时步负荷恢复多目标优化的最优方案,即第一时步恢复的负荷及其出线为4号节点负荷的2、4号出线,12号节点负荷,16号节点负荷的1、2、3号出线以及31号节点负荷 。 其中 ,4号节点负荷的4号出线中包含10% 的冷负荷,故恢复初期所需功率大于负荷的额定功率。 由于其符合各约束的限制,故满足要求。 采用方案2恢复负荷时,系统稳态频率为49.88 Hz,符合稳态频率要求。 按照上述方法,可以得到如表4所示的新英格兰10机39节点系统负荷及其出线恢复方案。

负荷恢复的多目标优化,既保证了尽快恢复负荷,减少经济损失,又兼顾了所恢复负荷的重要程度和系统的稳定性,为电力系统恢复计划的制定提供了更合理的参考和选择。

5结论

多阶段决策优化 第5篇

矿井通风系统整体优化应包括系统优化和网络优化两方面的内容,只有正确、合理地确定了通风系统,进行网络优化才有意义。

新建矿井在进行通风系统设计或生产矿井进行通风系统技术改造设计时,根据矿井的地质条件、矿床开拓和生产布局可拟定出多种设计方案,并且各个方案各有优缺点。要从众多的方案中确定出最优的通风系统方案,必须首先确定矿井通风系统的评判指标。

如何定义系统评价指标?怎样评价?原冶金工业部和原中国有色金属工业总公司共同制定了《冶金矿山矿井通风系统鉴定指标》,提出6项基本指标和4项辅助指标,但是其中大部分指标是针对投产运行后的通风系统而定义的,即“事后把关”,因此在系统设计阶段进行方案比较时,不宜直接采用它们,而要定义、补充与之相关的技术指标,这样系统方案才有比较的标准,对系统优化才有意义。

通常,一个通风系统的好坏常取决于若干指标,而且不同的指标对通风系统的总体影响不同,即各指标重要性不同。从非定量表示的指标中确定出各自指标的重要性是困难的。采用Delphi法虽然可以确定矿井通风系统的评判指标,但这些评判指标对矿井通风系统影响的重要程度并不同,不能同等对待。为了确切地反映出各评判指标对矿井通风系统影响的重要程度,要选用一定的数值来量化指标,这些数值称为“权值”或称为“重要系数”。如何科学地确定评判指标的重要性和权值,是矿井通风系统优化的一个重要步骤。

2 矿井通风系统的评判指标

2.1 矿井通风系统评判指标的确定

表明矿井通风系统的指标较多,且每一类中也有较多的指标,如果直接用这些指标对矿井通风系统进行评判则太繁琐,并且有的指标物理意义相同,只是从不同的侧面说明同一个问题而已,如矿井风阻和矿井等积孔都是用来说明矿井通风难易程度的。为了从这些指标中确定出评判矿井通风系统的指标,采用了Delphi法,即把事先印制好的“矿井通风系统评判指标征求意见表”发给专家,请专家们根据实际工作经验、知识和综合分析能力,对矿井通风系统指标进行评议和打分,依靠专家们的经验、知识和综合分析能力,确定评判矿井通风系统设计方案的指标。

矿井通风系统是否优良,主要取决于以下三个方面:(1)技术合理性;(2)经济效益性;(3)安全可靠性。根据确定的指标必须符合多数专家的意见,指标能够确切地反映出矿井通风系统的状况和质量特征,指标应有独立的物理意义并符合科学、可测、可比和简明等原则要求。

2.2 表征技术合理性的指标

(1)矿井总等积孔

它是评价矿井通风难易程度的指标。矿井等积孔越大,井巷通风越容易;反之,井巷通风越困难等积孔A(m 2)的计算式为

多风机并联作业系统的矿井等积孔计算式为

多风机多级机站通风系统等积孔计算式为

式中,T为系统机站级数,一般T=3或4;Bi为第i级机站的井联装机点数。

(2)风量分配合理度

风量分配合理度Er是反映扇风机的工况点风量与其设计要求负担的风量之间差异程度大小的指标,我们提出它的计算式为

式中,Nf为系统装机点数;Qqi为第i个装机点的设计风量,m3/s;Qi为第i个装机点的工况点风量,m3/s。

明显地,Er越大,风量分配越不均衡,合理程度越差;反之则越均衡,合理程度越好。Er=0的充要条件是Qqi=Qi(i=1,2,…,Nf),即每个装机点的工况点风量正好达到设计要求。

(3)风机种类及型号

对于多风机多级机站通风系统,风机种类越多,型号越杂,则管理维修工作量越大,当系统建成运行后,突出的问题就是系统管理复杂。因此,一个好的多风机多级机站通风系统应当使风机种类及型号尽量简单统一。

(4)系统管理

这是一个定性指标。我们提出它的定量化计算式为

undefined

式中,Zn为增阻风窗数;Jm为降阻扩帮数;Jf为降阻局扇数;Fg为通风构筑物数(主要指风门);Na为可调节风道数;Nf为系统装机点数;Re为系统通风管理人员数;No为系统附加设备总数(如空气幕);Nt为需要建设或清理的主要通风井巷数;Mt为系统年材料消耗项数;Ks为风机扩散器总数;Fs为风机防腐设备总数;Nb为系统总风道数;Gt为系统年产矿石量,万t。

由式(5)可见,系统管理是一个综合指标,它全面反映了本系统管理工作的各个方面,如风窗、局扇、通风构筑物等的管理和布局。在给出式(5)时,我们考虑了如风窗、局扇、通风构筑物等12项分指标在Sg中所占的相应权重,即它们给系统管理所带来的工作量之大小是不一样的,如式(5)中的15、9、12、……所示。

2.3 表征经济效益性的指标

(1)总装机功率,(2)年通风成本,(3)年经营费用,(4)基建总投资。明显地,总装机功率、年通风成本、年经营费用和基建总投资四个评判指标都是经济性指标。关于经济性指标,人们对此作了大量的讨论,因此不再赘述。

2.4 表征安全可靠性的指标

(1)调节设施及构筑物

原则上,系统内的调节设施及构筑物应越少越好。但为了保证供给作业面足够的新鲜风量,以减少漏风和避免风流紊乱,又必须安装足够的调节设施和砌筑必要的通风构筑物。因此,这一指标反映了系统安全可靠性的高低,其计算式是Dk=25Zn+20Jm+30Fg+10Na+15Jf (6)式中各变量的意义与式(5)同。

(2)风机总台效

一般我们总是希望系统内的风机安装得越少越好,然而为了降低系统的总装机功率和减少年经营费用,且能更有效地控制系统内的压力分布状态,随着系统生产时期的变化风量调节灵活,又总是避不开多台风机串、并联运行,因此,这一指标也用于评价系统安全可靠性。

(3)风机串、并联作业

多风机多级机站通风中风机运转稳定性问题,涉及到同一断面多台风机并联运转的稳定性及全网络中多台风机运转的稳定性。这一定性指标的定量化计算式为

式中,Nei为同一断面并联风机的稳定性评价值,单台工作最好,则Nei=0.90;两台并联作业次之,Nei=0.60;三台并联作业最差,令Nei=0.30。Mei为同一装机地点串联风机级数的稳定性评价值,单级最好,Mei=0.90;两级串联最差,则Mei=0.30。

(4)风机运行稳定度

在风机合理有效运行区域内,我们定义

undefined

式中,ε为该通风系统风机运行稳定度。显然,ε越太,可靠性越高;Qd min i、Qe max i分别表示第i台扇风机性能曲线有效工作压段的最小和最大风量值,m3/s;Hd max i、He min i分别表示第i台扇风机性能曲线有效工作区段的最高和最低风压值,Pa。

至此,我们采用Delphi法确定了矿井通风系统的三大类12项评判指标。但是上述评判指标对矿井通风系统影响的重要程度并不同,不能同等对待。为了确切地反映出各评判指标对矿井通风系统影响的重要程度,本文运用模糊群体决策,给出了确定以上各项指标的重要性及权值的一种有效方法。

从个体的优先次序出发得到群体的优先次序,从而作出决策,称之为群体决策,又叫意见集中,群体决策有着广泛而深刻的实际背景。

3 模糊群体决策法

模糊群体决策法假设有n个方案(指标)可供选择,构成决策问题的备择方案集,参与决策的m个个体(专家)构成一个群体,个体的意见都可以表示为某个效用函数,如果m个专家的效用函数为f1,f2,…fm,则群体的效用函数为undefined即f=(f(u1),f(u2),…,f(un)) 如果undefined,则称f是差分正规的,令

undefined

其中k是满足Uipuj的uj的个数,则构造的模糊矩阵R=(rij)是严格模糊偏好矩阵。

设m个个体决策由严格模糊偏好矩阵表示为Rp,p=1,2,…,m 群体决策R可由下式定义undefined可由严格模糊偏好矩阵的性质得到群体决策的优先次序。

取undefined,即可得到U上的一个完全的优先次序,即undefined。

4 矿井通风系统评判指标的重要性及权值

4.1 评判指标重要性序列的标准化

应用Delphi法,根据专家们意见划定各指标的重要性序列。指标共12项,则最重要的为12分,其它依次为11,10,…,1,见表1。

4.2 个体决策的严格模糊偏好矩阵RP

RP=(rundefined)式(10)实质为

undefined

;i,j=1,2,…,12] 对于式(11),fp(ui)=k/n,因为k从数值上来说与表1中标准化过的元素值Api相同(虽然意义不同),故可用Api来代替式(11)的k,即fp(ui)=Api/n (13) 将式(13)代入式(10),得undefined

4.3 群体决策的严格模糊偏好矩阵R

将式(14)代入式(12),得undefined

本文所讨论的矿井通风系统,n=12,m=24,因此

undefined将表1中的数据代入式(15)可得严格模糊偏好矩阵R,对严格模糊偏好矩阵R取1/2截矩阵得

undefined

由于pi=undefined,i=1,2,…,n,所以经过简单计算,得

p=(0.08,0.83,0.33,0.58,0.33,0.67,0.75,0.50,0.42,0.17,0.83,1.00)

由此可得各评判指标重要性排列为

即,风机运行稳定度,风量分配合理度,风机串并联作业,年经营费用,年通风成本,系统管理,基建总投资,调节设施及构筑物,风机种类及型号,总装机功率,风机总台数,矿井总等积孔。

根据上述计算结果,我们得到矿井通风系统评判指标的权值,见表2。由表2可得各类指标(技术合理、经济效益、安全可靠)的权值,见表3。表3中,权值如用aj表示,则

undefined

5 结束语

模糊群体决策法是一种新的科学决策方法。在使用时可根据所需解决问题的实际情况,来构造严格模糊偏好矩阵处理解决问题,它不仅适用于复杂的工程技术方案选定、有关指标的重要性及权值的确定,而且也可用于其它领域,如经济、社会等重大问题的决策,是一种具有生命力的决策方法。

矿井通风系统优化决策涉及的许多问题中,评判指标的确定及其权值的计算占据重要的位置,直接影响到设计方案决策的科学化。本文主要针对非煤矿山通风系统应用多风机多级机站通风方法的特点,探讨了多个设计方案优化决策时的评判指标体系,并在中条山有色金属公司胡家峪铜矿多风机多级机站通风系统优化布局研究中得到应用,获得了较满意的结果。

参考文献

[1]汪培庄等.应用模糊数学.北京:北京经济学院出版社.1989:231~248

[2]谭允祯.矿井通风系统优化.北京:煤炭工业出版社.1992:34~43

[3]谢贤平等.矿井通风系统的决策与评价模型体系研究及其应用.云南冶金.1993(1):1~4,15

[4]谢贤平等.矿井通风系统多目标模糊优化的数学模型.河北理工学院学报.1996,18(3):1~7

[5]赵伏军等.基于层次分析法-模糊综合评价[AHP-FCE]模型优化矿井通风系统的研究.中国安全科学学报.2006,16(4):91~96

[6]邱进伟等.基于模糊优选的矿井通风系统决策研究.煤矿安全.2007(4):1~4

多阶段决策优化 第6篇

最近10多年来, 进化计算方法在解决多目标优化问题上, 体现出极好的优点, 因为其能在一次循环中找出多个Pareto解, 并能很好地收敛到Pareto前沿, 同时分布较均匀。现在进化计算方法与决策理论结合在一起, 在多目标决策中发挥作用, 是一个重要的研究热点。其特点是不再注重于近似整个Pareto前沿, 而是集中于决策者所关心的那些Pareto最优解, 使得搜索的效率更佳。

但多目标进化算法应用于群体决策方面的研究还非常缺乏[4]。文献[4]中介绍了解决群体决策问题的一种遗传算法方法, 决策者的偏好用参考点 (概念详见2.1节) 表示, 再通过分层排序或者距离引导种群向群体解进化。而在决策支持系统中, 有关群体决策的研究已经较为深入。但是其中大部分研究都是基于以下两点不是很符合实际问题的假设:其一, 大部分情况下, 只有少数几个可选方案, 而在这几个方案中必须选择一个作为最后群体解决方案, 而很少关注到如何在一个数量巨大的可选择空间中进行优化;其二, 通常假设群体是同类的, 因此可以整合到一个通用的偏好函数。基于以上假设后, 可以应用名义群体技术、DELPHI方法、层次分析法等方法以类似于单决策者的方式进行决策。但是, 决策群体都同意一个公共的偏好函数, 是不太实际的, 特别是对于群体成员较多的情形, 是非常困难或者根本无法得到公共偏好函数的。

本文的目的, 是将多目标粒子群优化方法应用于群体决策, 决策者的偏好也以参考点表示, 但不再直接使用分层排序或距离方式, 而是在支配概念或者距离阈值下, 使用了群体决策中应用最广的投票规则进行求解。我们的重点在于搜索群体关心的一小集合的Pareto最优解, 并且用ZDT问题进行验证。

1基本的MOPSO

多目标优化问题 (MOP) 一般定义如下:

其中X是Rn空间中的决策变量, D是其定义域, fi:Rn→R, i=1, 2, …, k是目标函数;gi, hj:Rn→R;i=1, 2, …, m;j=1, 2, …, q是约束函数。

对于多目标优化问题, 一般没有一个使得所有目标函数均为最优的解, 所以采用的多是Pareto解。

在MOPSO中, 由粒子群到当前为止所发现的非支配解都存储在外部种群档案 (external archive) 中。每个粒子除了向自己所经历的某个非支配历史位置 (pbest) 学习外, 同时从外部种群档案中按照一定规则选择一个解作为引导者 (leader) 。外部种群档案随着计算的进行不断更新, 其所包含的解在运行结束时一般也是最终输出结果。一般MOPSO流程[1]如下:

算法1 一般的MOPSO算法

Begin

Initialize swarm

Initialize leaders in an external archive

Quality (leaders)

Iteration = 0

While (Iteration < max_Iteration)

For each particle

Select leader

Update Position (Flight)

Mutation

Evaluation

Update pBest

End For

Update leaders in the external archive

Quality (leaders)

Iteration++

EndWhile

Report results in the external archive

End

其中“Quality (leaders) ”一般是计算粒子的拥挤距离或适应度或其它粒子密度的评价值, 以便后面有一定规则为每一粒子从外部种群档案中选择leader, 使得粒子在向Pareto前沿飞翔的同时保持较好的分布性。

在MOPSO中, 各种算法不同的地方, 主要在于外部种群档案的设计及剪枝策略、leader的选择方法、pbest的更新方法。

2基于偏好参考点的MOPSO

2.1参考点

在决策者偏好信息方面, 有多种表示方式。决策者不同, 其给出的偏好信息也会不相同。在相关文献中[4,5,6,7], 主要有以下几种方式:目标的重要性优先次序, 目标的重要性权重, 参考点, 参考区域, 参考方向等定义。本文假设群体成员的偏好信息以参考点表示。

偏好参考点表示用户的期望目标, 表现为目标空间中一个点。设群体中有N个决策者, 每个决策者偏好都用一个参考点Rn (Rn1, Rn2, RnNF) , n=1, 2, …, N描述, NF是目标函数个数。任一解x与参考点的距离用欧几里德距离公式定义:

dn (x) =1ΝFi=1ΝF (fi (x) -RnifiΜAX-fiΜΙΝ) 2n=1, 2, , Ν (2)

其中fi是第i个目标函数, fimax (x) 、fimin (x) 是第i目标函数的最大值、最小值, 其作用在于进行规范化。

2.2投票机制

收集好群体成员的偏好后, 进行决策时, 就要根据不同的决策方法对其偏好进行整合, 以期找到群体偏好的解。在群体决策中, 应用最广的是投票方法, 群体成员根据每个人自己的偏好, 对决策方案进行投票, 然后进行汇集, 根据约定的规则, 选择最后方案。应用最多的是多数规则, 即多数决策者同意的解是最终群体解, 但也有其它规则。对于以参考点表示的群体成员偏好, 我们定义如下的投票规则, 以应用多目标优化方法进行求解。

(1) 完全一致解

定义1 (基于支配的解定义) 某个解是群体决策的完全一致解, 当且仅当它是非支配解并且它支配所有群体成员的参考点。

定义1对解的要求非常高, 很容易无解。如果某个参考点不在可行域, 则此方法将找不出任何解。此方法也叫一票否决制。

定义2 (基于距离的解定义) 某个解是群体决策的完全一致解, 当且仅当它是非支配解并且它与所有群体成员的参考点的距离都小于阈值δ

(2) 绝对多数决定解

定义3 (基于支配的解定义) 某个解是群体决策的绝对多数决定解, 当且仅当它是非支配解并且它支配多数群体成员的参考点。

定义4 (基于距离的解定义) 某个解是群体决策的绝对多数决定解, 当且仅当它是非支配解并且它与多数群体成员的参考点的距离都小于阈值δ

这里与完全一致是相近的, 只是现在需要满足多数决策者参考点要求, 而不是全部。按规则, 多数可能是1/2或2/3等。

(3) 相对多数决定解

定义5 (基于支配的解定义) 某个解是群体决策的相对多数决定解, 当且仅当它是非支配解并且它相对于其它解来说, 支配更多的群体成员参考点。

此定义不要求支配超过半数的参考点, 只要求其相对其它解而言支配更多的参考点即可。

定义6 (基于距离的解定义) 某个解是群体决策的相对多数决定解, 当且仅当它是非支配解并且它相对于其它解来说, 与更多的群体成员参考点距离小于阈值δ

此定义不要求与超过半数的参考点距离小于阈值δ, 只要求其相对其它解而言与更多的参考点距离小于阈值δ即可。

根据以上定义, 在搜索群体解时, 即是搜索既靠近Pareto前沿而又满足基于支配概念或距离概念下投票规则的解。

2.3基于参考点的MOPSO群体决策方法

以参考点定义用户偏好后, MOPSO所要找到的解除了满足收敛到Pareto前沿并具有分布均匀特点外, 还要靠近群体的偏好域。以下介绍解决群体决策问题的基于参考点和相对多数决定投票规则的MOPSO算法策略:

(1) 基于投票机制的锦标赛选择leader的方法 首先对外部种群档案按其支配的参考点个数 (或距离阈值δ内的参考点个数) 进行排序, 支配参考点 (或距离阈值δ内的参考点个数) 较多的前50%精英粒子作为候选粒子。然后采用锦标赛方式, 从候选粒子中选择支配参考点个数 (或距离阈值δ内的参考点个数) 较多的解为leader。本文采用的锦标赛规模为2。

(2) 嵌入投票机制的pbest更新规则 从当前粒子和历史最优中选择两者中非支配解为pbest;若相互不支配, 则选择支配参考点个数 (或距离阈值δ内的参考点个数) 较多的解为pbest;若相互不支配, 支配参考点个数 (或距离阈值δ内的参考点个数) 又一样, 则随机选择一个为pbest

(3) 外部种群档案leaders更新规则 若当前粒子相对整个外部种群档案中粒子而言为非支配解, 则加入到外部种群档案中。并删除外部种群档案中被新加入粒子支配的解。

(4) 嵌入投票机制的外部种群档案剪枝规则 档案容量超过预设大小时, 如果其中的粒子支配参考点个数 (或距离阈值δ内的参考点个数) 不一样, 则首先删除支配参考点个数 (或距离阈值δ内的参考点个数) 少的粒子。如果每个粒子支配的参考点个数 (或距离阈值δ内的参考点个数) 都一样, 则去除密度较大的粒子, 以达到均匀分布要求。

基于参考点和投票机制的MOPSO群体决策方法, 主要是在各步骤中嵌入了投票规则, 使得粒子向与群体多数决策者偏好的Pareto前沿收敛。因为只用找出部分的Pareto前沿, 在种群规模、进化代数方面可以大大减少, 使得算法的效率更佳。

3仿真实验

3.1ZDT1[3]问题

ZDT1问题具有凸的、连续的Pareto前沿。以下实验均以ZDT1优化问题为例进行说明。多目标粒子群算法的种群大小是100, 最大进化代数为100, 外部种群档案大小为20, 距离阈值δ=0.3。

(1) 参考点均可行及相对多数投票规则群体决策

假设三位决策成员偏好的参考点分别是 (0.2, 0.9) 、 (0.3, 0.8) 和 (0.8, 0.3) , 它们均位于可行域。为了节省篇幅, 基于支配概念和基于距离阈值下应用相对多数投票规则运行的结果显示在一起, 如图1所示。

从图1可以看出, 对于参考点均是可行点而言, 基于支配概念或距离阈值应用投票规则均可以得到群体决策解, 两者解稍有不同, 但对于决策而言影响不是很大。

(2) 参考点均不可行及相对多数投票规则群体决策

三位决策成员偏好的参考点分别是 (0.1, 0.6) , (0.2, 0.5) 和 (0.8, 0.3) , 它们均位于不可行域。结果如图2所示。

从图2可以看出, 对于参考点都在不可行区域的情况, 基于距离与基于支配概念的群体决策结果非常不一样。基于支配概念的解, 分散于整个Pareto前沿, 实际上其支配的参考点数目都是0, 可以认为此时没有找到群体解。但基于距离的方法可以求出与多数参考点相近的部分Pareto前沿, 与多数规则相符合。

(3) 参考点部分可行和部分不可行及相对多数投票规则群体决策

分两种情况讨论。第一种情况是可行参考点较少, 不可行参考点较多, 结果如图3所示。

可以看出, 基于支配概念与基于距离概念的解相差悬殊, 同样可以看出, 基于距离概念所得到的群体解, 与大部分决策成员的意愿较相近, 而基于支配概念的解只与少数参考点在可行域的决策者意愿相近。

第二种情况是可行参考点较多, 不可行参考点较少, 结果如图4所示。结果与图1是几乎一样的。

从以上仿真结果可以看出, 在决策者给出其偏好参考点情况下, 基于距离和投票规则的多目标粒子群优化方法都可以用较小的种群规模和较少的进化代数就可以找出分布较好、与真实Pareto前沿贴近的, 并较符合群体偏好的部分Pareto解, 这对于加快群体决策是非常有益的。而基于支配概念的方法对参考点的要求较高, 只在部分情况下可以求出相应较符合群体意愿的解。所以后面实验只以基于距离和投票规则进行说明。

3.2ZDT3[3]问题

ZDT3问题的Pareto解是非连续的。实验中设置了四位决策者的参考点, 距离阈值δ=0.4, 结果如图5所示。

从图5可以看出, 对于非连续的多目标优化问题, 基于距离和投票规则的粒子群算法, 也可以找出较好的群体解。

3.3绝对多数决定和完全一致决定

对于绝对多数决定和完全一致决定, 算法主要过程与相对多数决定是一样的, 只在最后一步“外部种群档案中的最终leaders为结果”要进行修改, 不能输出全部的外部种群档案粒子, 而要对外部种群档案中的粒子再进行判断, 支配多数或全部参考点的粒子才输出。

4结论

群体决策的关键, 是要融合不同决策者的偏好, 对此, 在决策者偏好以参考点表示的情况下, 提出了基于支配和基于距离阈值两种不同概念下并以投票规则决定的多目标微粒群优化算法, 用较小的成本, 找到满足群体偏好的部分Pareto最优解。实验结果表明, 在给出参考点情况下, 用基于距离阈值的方法更符合群体成员的意愿, 找到的解更与投票规则相符, 可以大大提高群体成员最后决策的效率。

参考文献

[1] Margarita ReyesSierra, Carlos A.Coello Coello.Multi-Objective Particle Swarm Optimizers:A Survey of the State-of-the-Art[J].International Journal of Computational Intelligence Research 2006, 2 (3) :287308.

[2] Coello C A C, Lechuga M S.MOPSO:A Proposal for Multiple Objective Particle Swarm Optimization.in Congress on Evolutionary Computation[C].IEEE Congress on Evolutionary Computation, IEEE Service Center, Piscataway, New Jersey, 2002 (2) :10511056.

[3]Deb K, Agrawal S, Pratar A, et al.Afast and elitist multi-objective ge-netic algorithm:NSGAⅡ[J].IEEE Transactions on Evolutionary Com-putation, 2002, 6 (2) :182197.

[4] Jella Pfeiffer, Uli Golle, Franz Rothlauf.Reference Point Based Multi-Objective Evolutionary Algorithms for Group Decisions[C].Genetic and Evolutionary Compu tation Conference, ACM Press, Atlanta, USA, 2008:697704.

[5]Kalyanmoy Deb, Sundar J.Reference Point Based Multi-Objective Optimi-zation Using Evolutionary Algorithms[C].Genetic and Evolu-tionaryComputation Confere nce, ACM Press, Seattle, Washington, USA, 2006 (1) :635642.

[6]Kalyanmoy Deb, Abhay Kumar.Light Beam Search Based Multi-Objec-tive Optimization using Evolutionary Algorithms[C].IEEE Congress onEvolutionary Computation, IEEE Press, Singapore, September, 2007:21252132.

多阶段决策优化 第7篇

关键词:分量乘除法,线性加权和法,主要目标法,目标规划法

本文系佛山科学技术学院校级科研课题“多目标优化算法的应用分析”阶段成果.

引言

多目标优化问题也称多目标数学规划问题, 可用如下方式表述:

其中:x是n维向量, F (x) 和G (x) 分别是x的m维和k维向量函数, 即:x= (x1, x2, …xn) T, F (x) =[f1 (x) , f2 (x) , …, fm (x) ]T, G (x) =[g1 (x) , g2 (x) , …, gk (x) ]T (gi (x) ≥0, i=1, 2, …, k) .

由于多目标最优化问题在理论上具有代表性, 在应用上具有广泛性, 因而对多目标最优化算法的研究备受关注.传统求解多目标优化问题的方法是基于权重的方法, 其特点是通过各种方式将多目标优化问题转换为单目标优化问题, 然后利用单目标优化方法来求解.其分类大致包括分量加权和法、构造函数法[1]、分量最优化方法[2]、分量排序方法、淘汰方案法、目的规化法等.

一、提出问题

对于股份制公司或企业而言, 每年都要召开股东大会, 研究确定下一年度的投资方案, 使其利用有限的资金获取最大的投资收益和最小的风险.对于每一个股东, 将会根据自己的利益在可能的投资方案中总是选择对自己有利的方案, 董事会将综合各股东的意见和所持股份作出最后的投资决策方案.这是一类非常有代表性的问题.一般问题如下例:

设某上市公司董事会现有十大股东, 持股比例如表1所示:

公司计划把8000万元资金用于下一年度的项目投资, 初步方案有五个候选项目, 其相应的期望收益率和投资风险率如表2所示:

董事会规定, 如果确定某个投资项目, 则其项目投资额至少100万元.问题是:董事会如何充分考虑公司的利益, 并综合各股东的意见和所持股份作出最后的投资决策方案.

二、问题假设

(1) 每一个投资项目的收益相互独立, 互不影响, 只受到某些不确定因素的影响.

(2) 每个股东都是理性的决策者, 并互相独立, 决策地位与自身的股份有关, 且每个股东对其他股东的决策作用的评价也是独立的.

(3) 收益与风险并存, 收益越高则一般风险越高.

根据题目和假设, 公司要充分考虑公司的利益和每个股东的地位及意见, 使公司的投资方案达到收益最大、风险最小两个目标.

三、建立模型

多目标决策模型:

xi=0或者m/M≤xi≤1 (i=1, 2, …, N)

其中:

N:候选项目数

xi:第i个项目的投资金额占总投资金额的比率

pi, ri:第i个项候选项目的期望收益率和投资风险率m, M:项目的最少投资额和下一年度计划投资的资金

四、模型求解

方法 (1) :分量乘除法

xi=0或者m/M≤xi≤1 (i=1, 2, …, N)

运用LINGO软件编程:

求解结果为:x= (x1, x2, x3, x4, x5) = (0.000000, 1.000000, 0.000000, 0.000000, 0.000000) , 即投资比例.五个项目的投资金额为:MX= (0, 8000, 0, 0, 0) .

即全部用来投资方案2.

方法 (2) :线性加权和法

求的结果为:x= (x1, x2, x3, x4, x5) = (0.000000, 0.000000, 0.000000, 0.000000, 1.000000) , 即投资比例.五个项目的投资金额为:MX= (0, 0, 0, 0, 8000) , 即全部用来投资方案5.

令λ=0.5, 运用lingo软件编程求的结果为:x= (x1, x2, x3, x4, x5) = (0.000000, 1.000000, 0.00000, 0.000000, 0.000000) , 即投资比例.五个项目的投资金额为:MX= (0, 8000, 0, 0, 0) , 即全部用来投资方案2.

方法 (3) :主要目标法

xi=0或者m/M≤xi≤1 (i=1, 2, …, N)

其中r0表示所能承受的风险值, 下面我们通过建立群决策模型的方法来确定这一数值.

假设各股东的期望承受风险率 (r0k) 如下表3所示[4]:

则r0可通过下面公式计算:, 其中为决策权值, 董事会将根据各股东的影响力进行确定.

首先, 每个股东根据其他股东的股份和业绩等因素给出相应的评价, 一个股东评价权值的大小反映了其他股东对自己在决策中所起作用的信任度.不妨设各股东之间的相互评价权值矩阵为[4]:

即各股东之间可以相互给定一个评价权值.

另外, 还要考虑每个股东持有股份的数量, 对股票数量进行标准化, 令.一个合适的决策应该考虑其他股东的地位, 同时每个股东的决策权值应该与其他股东对该股东的评价权值相差不大, 故求加权偏差平方和的最小化问题.我们有

求得:, 即表示各股东在充分考虑持有股份的前提下其他各股东给予的客观评价权值, 而一个股东的决策权值不仅与评价值有关, 还与本身持有股份的比例有关.故决策权值为:

这里, 可计算每个股东的决策权值如表4所示[5]:

由此可计算出, 代入模型, 运用LINGO软件编程.

求的结果为:x= (x1, x2, x3, x4, x5) = (0.000000, 0.000000, 0.000000, 0.1392867, 0.8607143) , 即投资比例.五个项目的投资金额为:MX= (0, 0, 0, 8000*0.1392867, 8000*0.8607143) .

方法 (4) :目标规划法

实际上, 公司对投资方案有一个期望收益目标值p0和所能承受的风险值r0.但由于受不确定因素影响, 实际方案的收益和风险与其目标值可能会有一定的偏差.所以可转化为下面的目标规划模型:

其中λ表示收益和风险之间的转化率, 即二者重要程度的量化.p0, r0, λ为待定常数.利用群决策模型求出p0, r0, λ, 将其代入目标规划模型, 运用LINGO软件编程求的结果为:x= (x1, x2, x3, x4, x5) = (0.8867750, 0.000000, 0.000000, 0.1132250, 0.000000) , 即投资比例.五个项目的投资金额为MX= (8000*0.8867750, 0, 0, 8000*0.1132250, 0) .

五、结果分析

依据上述四种算法可得总收益率和总风险率如表5所示:

以上用四种算法对多目标优化决策模型进行了求解, 决策者可以根据自己的类型来选择合适的模型算法, 从而确定相应的投资方案.

参考文献

[1]胡毓达.多目标最优化[J].上海交通大学学报, 1981 (3) :137-146.

[2]郭玉芳, 陈宝亭, 吴伟.多目标最优化方法浅析[J].河南教育学院学报 (自然科学版) , 1999, 3 (8) :7-8.

[3]解可新, 韩健, 林友联.最优化方法[M].天津:天津大学出版社, 1996.

[4]陈廷, 韩中庚.股份制公司的综合投资方案决策模型[J].数学的实践与认识, 2006, 36 (4) :56-60.

多阶段决策优化 第8篇

为了应对气候变化, 当前中国乃至全球都做出了要减少温室气体排放的决定。中国更是做出了到2020年, 单位国内生产总值的CO2排放量比2005年下降40%~45%的承诺。而发电企业作为CO2排放大户, 面临着减排的巨大压力。尤其是燃煤电厂, 其燃烧1t煤约产生2.62tCO2, 燃煤电厂的CO2排放量约占社会总排放量的40%[1]。针对电厂这种排放量大且集中的情况, 世界各国纷纷采用碳捕集与封存 (carbon capture and storage, CCS) 技术来改进现有电厂, 或建立CCS电厂来实现发电企业的CO2减排[2]。

从目前研究情况来看, 碳捕集设备主要安装在燃煤电厂, 采用的捕集技术大多是燃烧后捕集技术[3]。而从碳捕集电厂的结构特征和运行机理来看, 碳捕集电厂具有灵活运行的潜力。碳捕集电厂的灵活运行将给碳捕集电厂带来更多的运行模式和调控策略[4]。

在国内外, 对CCS的研究已经成为一个热点, 文献[3]分别从电厂和电力系统层面阐述了碳捕集电厂灵活运行方法的研究现状、研究重点和未来发展方向。文献[4]将碳捕集电厂的可行性、运行机制以及灵活运行方式的选择进行分类, 同时还阐述了CO2捕集过程和碳捕集系统与发电系统之间的相互作用。文献[5]结合碳捕集技术的基本原理, 研究了碳捕集电厂内部的能量关系, 同时还揭示了碳捕集电厂的调峰性能。文献[6]引入碳捕集设备的启停次数, 在碳减排日指标约束下, 提出了一种碳捕集调度策略, 以实现厂内减排和厂网协调减排, 但是没有考虑碳捕集设备的灵活运行, 而且没有考虑机组出力间的分配优化, 又没有对减排量进行优化。文献[7]针对碳捕集设备的不同运行方式, 分别分析了相应的电碳特性。文献[8]提出碳捕集设备的启停捕集量及启停时间问题, 并针对燃烧后捕集电厂提出一种混合线性规划模型。

以上文献虽然研究了碳捕集技术不同层面的问题, 但是均没有对碳捕集电厂灵活运行策略进行研究, 因此本文研究碳捕集电厂在灵活运行方式下, 以CO2减排量和发电机组的煤耗量为目标函数, 以相对捕集度为变量, 运用多目标细菌群体趋药性 (bacterial colony chemotaxis, BCC) 算法调节碳捕集电厂24h的运行状态, 调节机组间的出力分配比例, 使碳捕集电厂增大减排量, 同时减小发电机组的煤耗。并且定义减耗率来筛选得出结果中燃料利用率较高的解。

1 基于相对捕集度的减排模型与机组煤耗模型

碳捕集设备灵活运行的含义是碳捕集系统的运行在一定程度上与发电循环是相互解耦的, 即可以灵活控制碳捕集电厂的捕集力度和能量分配关系。灵活运行模式包括分流式灵活运行和储存式灵活运行[3]。

1.1 相对捕集度

将灵活运行模式下, 其相对基准运行模式[3]捕集CO2量的比例定义为“相对捕集度”, 用α表示, 无量纲。

式中:Ef为灵活运行时捕集的CO2的量;Eb为在相同情况下基准运行时捕集的CO2量。

相对捕集度能很好地反映出灵活运行相对于基准运行的差别, 同时依据相对捕集度便于对灵活运行的碳捕集电厂制定更为详细的运行策略。

针对碳捕集设备灵活运行的不同方式, 相对捕集度具有不同的意义:烟气分流形式中, 相对捕集度表现为烟气导入比例;富液分流形式中, 相对捕集度表现为其返回吸收塔的富液比例;溶液储存模式中, 相对捕集度表现为溶液再生速率相对于富液流率的比例。

1.2 碳捕集设备的启动能耗

碳捕集设备从停止状态到设备正常运行的过程称为碳捕集设备的启动过程。在碳捕集设备开启初期, 其不捕集CO2, 捕集效率为0%, 随着启动过程的进行, 捕集率不断增加, 直到达到正常工作状态。假设在启动过程中, 捕集效率的增大曲线是条直线[8], 那么在启动的整个过程中, 碳捕集设备捕集的CO2量就等于相同时间内基准运行工作时, 碳捕集设备捕集CO2量的50%。

设启动时间为tcold, 一般为1~2h, 与启动等时段内正常运行时捕集的CO2量为Esc, 启动能耗为Psc, 具体公式如下:

式中:λ为捕集单位CO2消耗的能耗;β为碳捕集设备的捕集效率, 一般为85%~95%;e为单位电量的碳排放强度;Pm为碳捕集设备的维持能耗, 一般为常数[6];Pi, t为某一时段发电机组总的净输出功率[5]。

由式 (2) 和式 (3) 推导出碳捕集设备的启动能耗为:

1.3 碳捕集设备的运行能耗

碳捕集设备基准运行时的运行能耗公式[5]为:

式中:Δt为运行时段;Pwf为灵活运行能耗。

引入相对捕集度概念, 根据式 (5) 推导了灵活运行时的运行能耗公式。设运行期间捕集的CO2量为Ewf, 则

由式 (6) 和式 (7) 推导出灵活运行模式下碳捕集设备的运行能耗为:

1.4 减排模型

CO2减排量的定义为:未安装碳捕集设备时排放出的CO2量, 减去安装碳捕集设备后排出的CO2量, 根据文献[6-8]中对减排模型的描述, 基准运行模式下减排量的公式为:

式中:EG为灵活运行模式下CO2减排量;Pg为灵活运行模式下某一时段碳捕集电厂总的等效输出能耗。

引入相对捕集度的概念, 根据式 (9) 推导出灵活运行模式下碳捕集电厂的减排模型如下:

式中:S表示碳捕集设备是否处于启动状态, 处于启动状态时, S为1, 否则S为0;H表示碳捕集设备是否处于灵活运行状态, 处于灵活运行状态时, H为1, 否则H为0。在同一个运行时段内S与H只能有一个为1。

1.5 机组煤耗模型

碳捕集电厂内, 碳捕集设备捕集CO2所需能量以及电厂外供电量都是由发电机组燃煤来提供的, 机组煤耗的大小是影响调度决策的重要因素, 其大小直接影响电厂的效益。机组煤耗为[9]:

式中:Fi为第i个机组的煤耗;i=1, 2, …, n;ai, bi, ci分别为机组煤耗系数。

1.6 减耗率

在生产一定电能的情况下, 将24时段总减排量与总煤耗量的比值定义为“减耗率”, 用δ表示。

通过减耗率来体现灵活运行模式运行时, 在一定煤耗的情况下减排CO2量的多少, 用来比较优化的结果中不同灵活运行策略间, 在捕集等量CO2前提下煤耗量减小的多少, 给决策者提供更直接的决策数据。

2 目标函数与约束条件

2.1 目标函数

以电厂的减排量最大和机组煤耗最小为目标函数, 在优化相对捕集度同时, 也要对机组间出力分配进行优化[10,11,12], 最后得出一天内总的减排量最大与机组煤耗最小的解集。

1) 减排量最大的目标函数为:

2) 机组煤耗最小的目标函数为:

3) 机组出力分配优化公式为:

式中:Pg1, Pg2, …, Pgn分别为第1, 2, …, n号机组的等效发电出力;k1, k2, …, kn分别为1, 2, …, n号机组分得出力占总出力的百分比。k1, k2, …, kn的值由优化得到, 每得到一个Pg, 则根据Pg的值优化得到一组最优的k1, k2, …, kn的值。

2.2 约束条件

1) 启停次数约束

碳捕集设备与发电机组类似, 频繁的启停不但影响碳捕集设备的使用寿命, 同时启动的时间较长, 会影响碳捕集设备的灵活性, 不利于对突发事件做出快速的反应。所以限制碳捕集设备一天内的启停次数不大于2次[13]。即

式中:Sc为碳捕集设备的启停次数。

2) 相对捕集度约束

在分流模型下运行, 由于只是将烟气或者富液排放或者储存起来, 以减少其进入碳捕集设备的量, 比例是可以任意的, 因此α≤1;而在溶液储存模式下, 由于相对捕集度的大小取决于再生塔和CO2压缩机的最大处理能力相对于基准值的比例, 一般情况下相对捕集度小于1[14,15,16]。

3) 调峰约束

碳捕集电厂具有比普通电厂更广泛的调峰区间, 因此碳捕集电厂多用于调峰, 这就要求在白天负荷高峰期时, 碳捕集设备耗能少, 甚至没有。对于灵活运行的碳捕集电厂而言, 可以控制相对捕集度, 让相对捕集度处于一个较小值。对于基准运行模式下的碳捕集电厂, 只能选择关闭碳捕集设备来满足电厂的调峰需求。

根据实际负荷曲线, 取8~14时段和18~22时段为调峰期, 设调峰期相对捕集度不大于0.3。即

4) 机组爬坡约束

机组爬坡约束, 即机组相邻两个时段的机组出力之差要小于一定的值, 当差值过大时会使发电机组跟不上发电出力的变化[17]。即

式中:Pi, UR和Pi, DR分别为机组i的有功出力上升量和下降量的限值。

5) 机组出力约束

机组出力约束, 即安装碳捕集设备会使电厂的出力减小, 为了满足负荷要求, 要求碳捕集电厂的机组出力介于机组出力的最小值与最大值之间[18,19,20]。即

式中:Pgmin为机组等效出力最小值;Pgmax为机组等效出力最大值。

3 运行策略

对减排量和机组煤耗同时进行优化属于多目标优化问题, 本文用多目标细菌群体趋药性优化算法进行优化。该方法能够快速、有效地解决多目标优化问题。

3.1 细菌编码

设定细菌个数为N, 每个细菌代表的维数为D, 相对捕集度为x。取N为100, 考虑到一天24时段, 每个时段相对捕集度取值不同, 设x为24维变量, 即D的值为24, 相对捕集度上下限分别为1和0。每个细菌代表一天24时段的x取值, 每一个细菌为一组解。

3.2 初始化种群

初始化生成一个100行24列的随机数组, 每时段x取一个值, 计算该时段相应的减排量和机组煤耗, 24时段循环计算, 累加得一天总的减排量和总的机组煤耗。

3.3 优化流程图

基于相对捕集度的减排量最大和机组煤耗最小的多目标优化流程如图1所示。

4 算例仿真分析

4.1 基本数据

本文针对一个碳捕集电厂进行分析, 假设碳捕集电厂有3台发电机组, 3台发电机组共用一台碳捕集设备[13]。设碳捕集电厂内3台发电机组的机组容量分别为600, 500, 200 MW。根据实际负荷预测结果和发电出力与机组爬坡约束, 给出碳捕集电厂一天24时段机组的净发电出力大小 (每个时段为1h) 。取β=0.9, λ=0.23 (MW·h) /t, Pm=15 MW·h, e=0.76t/ (MW·h) [21], 3台机组的参数如表1所示。

4.2 优化结果分析

1) 两种运行模式下机组耗煤量对比分析

为了对比两种运行模式下机组耗煤量的大小关系, 在灵活运行模式下仅对相对捕集度进行优化。在灵活运行优化策略中选取与基准运行时减排量相近的一组解, 比较两种运行模式下机组煤耗量的大小关系如表2所示。

在表2中, 基准运行模式下, CO2捕集总量为4 600.551t, 其中包括运行时捕集的CO2量4 140.65t和两次启动时捕集的CO2量459.895t, 机组总煤耗为10 128.73t, 其中包括运行时机组耗煤8 119.485t和两次启动时机组煤耗2 009.24t, 减耗率为45.42%。当灵活运行模式下减排量与基准模式下减排量相差不大时, 灵活运行模式下减排量为4 633.562t, 机组煤耗为9 613.941t, 减耗率为48.19%。可见, 减排量相近的情况下, 灵活运行模式下的机组煤耗要比基准运行模式下的机组煤耗少514.784t, 减耗率提高2.78%, 说明灵活运行模式能够减少机组的燃料消耗, 提高机组的燃料利用效率。其对应的运行策略如图2所示。

图2中, 基准运行模式下, 在1~8时段碳捕集设备进行满捕集, 9~14时段关闭碳捕集设备以满足电厂调峰, 从15时段启动碳捕集设备, 启动时间为2h (如图2所示, 基准运行模式下15~16时段、23~24时段捕集率没有达到最大, 仅以0~1之间的值表示其处于启动状态) , 在17时段达到满捕集状态, 18~22时段又是一个调峰期, 碳捕集设备再次关闭, 23~24时段, 碳捕集设备再启动, 启动时间为2h。灵活运行模式下, 碳捕集设备的运行比例是相对捕集度优化得到的最优运行策略, 在1~8时段, 碳捕集电厂不需要调峰, 相对捕集度较大;在9~14时段, 相对捕集度降到0.3以下, 以满足电厂调峰;15~17时段, 相对捕集度再次增大, 增大CO2捕集量;18~22时段, 为了满足调峰, 相对捕集度再次减小;23~24时段, 再次增大相对捕集度。由此可见, 灵活运行模式既能满足电厂减排量的要求, 又不需关闭碳捕集设备, 延长了碳捕集设备使用寿命, 同时减小了机组的煤耗量, 提高了燃料的利用率。此灵活运行模式亦增大了碳捕集设备应对突发事件的机动性。综上所述, 灵活运行模式要优于基准运行模式。

2) 相对捕集度与机组出力分配优化结果分析

在对相对捕集度进行优化的同时还优化机组间出力分配的比例, 其多目标优化得到的Pareto最优解集如图3所示。

图3中, 优化后减排量的变化范围约为[500, 6 000]t, 机组煤耗的变化范围约为[8 900, 9 900]t, 随着减排量的增大, 机组煤耗不断增大, 但是减排量的变化范围要远大于机组煤耗的变化范围。

程序每次运行都有100组解, 在多次的仿真结果中得到的数据量较大, 在此不能一一列出, 所以仅选取部分结果来分析说明。从小到大选取10次优化结果 (包括减排量较小和较大的解) 。如图4至图6所示, 一天内总减排量可以从497.18t调节到5 876.63t, 随着减排量的增大, 机组煤耗会不断增大, 机组煤耗从8 974.03t增长到9 818.52t, 减耗率则由5.54%增大到59.85%, 说明燃料的利用率不断增大。由此可见, 灵活运行模式可以提供更大调控区间来调控减排量的大小和机组煤耗量的大小, 同时还可以根据不同的减耗率来比较不同决策间的燃料减排效率。决策者可以根据实际需求和喜好, 从优化结果中选择一组合适的运行策略。

下面分别以减排量较小和较大的一组解来说明。

1) 减排量较小时优化结果

在优化结果中选取减排量为497.18t的优化结果, 其相应的煤耗量为8 974.03t, 而此时优化的减耗率为5.54%。其具体的相对捕集度的调控策略如表3所示。

当减排量为497.18 t时, 机组煤耗为8 974.03t, 减耗率为5.54%, 说明此时的燃料利用率较低, 而且减排量较小。如表3所示, 优化策略中全天的相对捕集度都较小。说明当减排量较小时, 为了能够快速地应对各种应急情况而不关闭碳捕集设备, 相对捕集度一直处于较小的状态。

2) 减排量较大时优化结果

在优化结果中选取减排量为5 876.63t的优化结果, 其相应的煤耗量为9 818.52t, 而此时优化的减耗率为59.85%。其具体的相对捕集度的调控策略如表4所示。

当减排量为5 876.63 t时, 机组煤耗为9 818.52t, 减耗率为59.85%, 说明此时的燃料利用率较高, 而且减排量较大。1~8时段、15~17时段、23~24时段相对捕集度较大, 此时段的电厂出力较小, 可以多捕集CO2;9~14时段、18~22时段的相对捕集度较小, 为了给碳捕集电厂留出调峰处理空间, 相对捕集度一般都在0.3以下。

从两个优化结果中可以看出, 减排量从497.18t增长到5 876.63t, 增长率为1 082.29%, 煤耗则从8 974t增长9 818t, 增长率为9.4%, 可见通过相对捕集度的优化和机组出力分配的优化, 在机组煤耗增加不大的情况下, 灵活运行的碳捕集电厂具有更大的减排调控区间。同时也延长了碳捕集设备的使用寿命。

5 结语

在定义相对捕集度基础上, 重新推导了灵活运行模式下碳捕集设备的一系列公式。在仅优化相对捕集度的基础上, 将灵活运行模式与基准运行模式进行了对比。说明在相同情况下, 灵活运行模式比基准运行模式更节省燃料, 同时也避免了碳捕集设备的频繁启停, 减小启停损耗的同时也增大了碳捕集电厂的灵活性。

在优化相对捕集度的同时完成发电机组间的出力优化分配, 得到了减排量最大与机组煤耗最小的多目标优化结果。从优化结果可以看出, 其不但可以满足碳捕集电厂的减排量需求和调峰需求, 同时还增大了碳捕集电厂的减排量调控区间和燃料的利用效率, 使决策者能够在更广泛的区间内根据实际需求选择碳捕集设备的运行策略, 真正实现碳捕集电厂的灵活运行。

摘要:碳捕集设备的灵活运行模式给碳捕集电厂带来了更多的运行调控策略, 在灵活运行模式的基础上, 定义了相对捕集度的概念, 根据相对捕集度推导出灵活运行模式下的运行公式。给出了碳捕集设备的启动能耗公式。基于相对捕集度, 以减排量和机组煤耗作为目标函数, 运用多目标细菌群体趋药性算法对目标函数进行优化, 同时完成发电机组间的出力优化分配。最后以单个碳捕集电厂为例, 将基准运行模式和灵活运行模式进行了对比分析, 并通过减耗率的大小来评价灵活运行模式优化的效果, 仿真结果说明了所提方法的有效性。

上一篇:拓扑优化分析下一篇:大型房地产