时间差估计范文

2024-09-10

时间差估计范文(精选8篇)

时间差估计 第1篇

制导工具系统误差分离可以有效提高导弹武器落点精度, 目前, 利用遥测弹道和外测弹道联合处理已经成为制导工具系统误差分离的一种成熟的技术手段[1,2]。制导工具系统误差并不包含外测弹道误差, 联合估计方法是借助外测弹道跟踪测量数据, 将外测系统误差和制导工具系统误差一起分离的一种方法。利用遥外联合处理首先要获得准确的遥外差数据, 而遥测零点与外测零点来源理论机制不同, 因此在求取遥外差的过程中, 必须准确地将时间零点对齐[3], 否则, 在遥外联合的递推估计中, 将产生累积误差, 严重影响制导工具系统误差分离精度, 甚至导致错误的结果。针对这一问题, 提出了一种利用相关估计进行遥外弹道时间差修正的新方法, 相当于对遥外弹道测量数据进行时延估计。近年来, 随着现代信号处理技术的发展, 已经提出了许多时延估计方法, 主要包括:广义相关时延法、高阶统计量时延法、广义相位谱时延法、自适应时延法等, 其中广义相关时延估计法是一类最基本的时延估计方法, 其基本思想就是利用信号的广义相关函数来估计时间延迟, 计算量小, 在实时系统中得到了较多应用。但是, 广义相关时延法在低信噪比情况下, 时延估计性能很差。为此, 在分析遥测弹道和外测弹道测量数据特性的基础上, 将趋势项提取、归一化方法与广义相关法进行结合, 进行时延估计, 实现遥外弹道时间差的修正。

1 最小二乘法提取趋势项

无论是遥测还是外测弹道测量数据, 在数据发送、传递和接收的过程中, 总会产生误码, 其中高位误码体现为野值, 低位误码体现为随机误差。在野值和随机误差的影响下, 利用相关估计遥测和外测弹道测量数据的时间差难以得到理想的估计结果。虽然可以对测量数据进行预处理, 如进行野值剔除与平滑, 但能否达到利用相关法估计时延的需要很难评定。即使在测量数据中偶尔有几个野值点, 也会使得相关估计的谱峰值偏移, 从而得到不准确的时延估计结果。考虑弹道测量的是位置数据, 其变化过程缓慢, 变化的趋势过程足以体现弹道位置变化规律, 因此, 可将遥测弹道和外测弹道测量数据的趋势项提取出来, 并利用趋势项做相关处理, 得到时延估计以实现时间差的修正。

在趋势项提取方法中, 最小二乘法最为常用, 因此这里采用最小二乘法进行遥测弹道和外测弹道测量数据趋势项的提取。最小二乘法提取趋势项是一种针对随机信号和稳态信号极为有效的方法[4], 不仅可以提取呈线性状态基线偏移的简单类型趋势项, 也可以提取具有高阶多项式的复杂趋势项, 是工程上常用的一种趋势项提取方法。最小二乘法提取趋势项的步骤为: (1) 假设一趋势项多项式, 根据最小二乘原理列出求解方程; (2) 用矩阵法求出趋势项系数矩阵, 得出趋势项拟合曲线。

用离散序列x (n) (n=1, 2, 3, …, N) 表示采样序列, 并设采样频率为fs, 现在用K阶多项式y (n) 来提取趋势项, 令

式 (1) 中, bk为多项式的系数。为了提取趋势项, y (n) 应该是离散序列x (n) 中多项式元素的估计, 根据最小二乘原理, 定义中间函数E (h) 为估计值和真实值之间的误差

为使误差E (h) 最小化, 则可根据最小二乘原理, 将E (h) 对bj求偏导数, 并令偏导数为零, 则有

对式 (3) 进行整理可以得到K+1个方程

式 (4) 中, 只要求出拟合趋势项系数bk, 就可以得到趋势项的估计多项式。对拟合趋势项系数bk的求解可以利用矩阵方式求逆方法[5]。

2 相关法估算遥外时间差

无论是遥测弹道测量数据还是外测弹道测量数据, 都可以写成真实弹道与误差 (随机误差和系统误差) 之和的形式。如果以遥测时间零点为基准, 那么遥测弹道测量数据和外测弹道测量数据可以分别写成

其中x1 (t) 和x2 (t) 分别为遥测和外测弹道某测元测量数据, x (t) 为真实弹道, ε1 (t) 和ε2 (t) 分别为遥测和外测弹道测量数据的系统误差, n1 (t) 和n2 (t) 为随机误差。D即为遥测弹道和外测弹道测量数据的时延, 实际上遥测弹道测量数据的系统差即为制导工具系统误差, 遥外联合估计方法就是综合利用遥测和外测弹道测量数据x1 (t) 和x2 (t) 同时估计制导工具系统误差ε1 (t) 和外测系统误差ε2 (t) 。在进行遥外联合处理之前, 首先要求获得准确的遥外差估计, 由于时延D的存在, 直接利用测量数据得到的遥外差将会存在时间对不齐误差, 这一误差随着遥外联合估计递推积分过程, 产生的累积误差将会严重影响制导工具系统误差系数的估计结果, 从而影响制导工具系统误差分离精度。在进行遥外联合处理之前, 必须对时延D进行估计然后对遥测和外测时间差进行修正。

在广义相关时延估计法中, 时延估计方法如下:

其中, D为估计的时延, Υ (f) 为互功率普加权函数, 当Υ (f) 取常数时, 就是相关法求时延, 不失一般性, 现取Υ (f) 为常数1。Sx1x2 (f) 为两信号的互功率谱估计

其中X1 (f) 和X2 (f) 为信号x1 (t) 和x2 (t) 的自谱。

在利用相关法求时延时, 要求在计算自谱和互谱时分割数据的长度至少大于预期最大时延的2倍, 因此提高频谱分辨率需要更多分割数据片。为了得到更为准确的时延估计结果, 可以采用过采样技术, 使数据长度得到满足同时提高频谱的分辨率。由于信号自谱和互谱的估计精度受噪声的影响, 如果信噪比过低, 则会严重影响估计精度, 为了进一步简化计算, 将广义互相关法时延估计中的互谱估计方法修改为互相关估计法, 根据维纳-辛钦定理, 功率谱与自相关函数构成傅立叶变换和傅立叶逆变换的关系, 因此, 相关函数峰值与功率谱峰值具有一致性。利用相关峰值来估计延迟码元数目, 将延迟码元数目乘以采样频率, 同样可以得到对应的时延估计, 而且这一方法计算量要小于广义互相关时延估计法。

对于稳定的随机过程x (n) 和y (n) , 他们的互相关序列定义为

其中-∞<n<+∞, E是数学期望符号[6]。但在实际计算过程中, 仅能得到随机过程的有限部分, 因此常用基于x (n) 和y (n) 的M个采样值的一个估计值, 即

在随机过程x (n) 和y (n) 具有足够相关性的前提下, 所得互相关序列绝对值最大的元素对应的偏差值的相反数与数据采样频率的乘积即为x (n) 相对于y (n) 的滞后时间。

3 仿真计算

为了验证本文方法的可行性与可靠性, 以正弦函数y=sin (x) 为例, 对提出的方法进行仿真验证。取

中fc=0.5, t=N/1 000, 0≤N≤2 000。由于仿真数据不存在随机误差与漂移误差, 所以不需要提取趋势项, 同时数据值域在[-1, 1]内, 不需要进行归一化处理。利用相关性计算得到的x (t) 与y (t) 的互相关序列估计值如图1所示, 绝对值最大的元素对应的偏差值为224, 数据采样频率为0.001, 最后得到的x (t) 相对于y (t) 的滞后时间为0.224。从图2x (t) 与y (t) 图像对比中可知x (t) 比y (t) 滞后0.25, 证明本文采用方法能够得到真实时间差比较精确的估计。

4 实例分析

仿真验证的数据由于没有随机误差与漂移误差的干扰, 可以得到比较精确的估计, 为进一步验证方法在实测数据计算过程中的适应性, 下面以一段未经时间零值修正的遥测与外测数据为例, 估算遥外时间差进行验证。由于惯性导航系统静态误差的存在, 随着时间的推移, 这些误差会在遥测数据累积, 形成漂移误差, 为了抑制漂移误差对计算结果的影响, 同时为了数据计算方便, 在提取趋势项的基础上, 对数据进行归一化处理。归一化采用的公式如下

其中xmin和xmax分别表示遥测数据x (t) 中的最小值和最大值。

采用的数据如图3所示, 其中遥测数据的随机误差比较大, 经过提取趋势项和归一化处理后的数据如图4所示, 从图4可以看出, 遥外测数据存在时间不对齐, 利用相关性得到的互相关序列结果如图5所示, 最终得到遥外时间差为+1.6s。另外, 通过对数据进行100倍过采样, 得到的遥外时间差为+1.596s。

5 结论

遥外测弹道测量数据是从不同角度对同一过程进行测量的结果, 两者具有较强的相关性, 可以通过计算遥外弹道测量数据的互相关序列, 并利用广义互相关方法进行时延估计, 得到遥外时间差。由于存在随机误差和漂移误差, 直接计算难以得到精确的估计结果。利用最小二乘提取趋势项并将趋势项作为时延估计的参考依据, 可以消除随机误差影响;为了压缩漂移误差对结果的影响并规范处理过程, 对数据进行归一化处理。通过计算机仿真与试验数据处理, 证明提出的方法在理论和工程应用上具有较高的精度。

摘要:遥外弹道时间对不齐误差在遥外联合数据处理中对制导工具系统误差分离具有重要影响, 提出一种利用相关估计对遥外弹道时间差修正的新方法。直接利用遥外弹道跟踪数据进行相关估计受到系统偏差和随机误差的影响, 难以得到精确的估计结果。在分析遥外弹道跟踪数据特性的基础上, 利用最小二乘法提取出遥测和外测弹道跟踪数据趋势项, 并将趋势项归一化处理后作相关估计求取时间偏差, 然后对原始弹道跟踪数据进行时间修正。计算机仿真和试验数据处理证明这一方法在遥外弹道跟踪数据时间差修正上具有较高精度。

关键词:遥外联合,相关估计,最小二乘,趋势项

参考文献

[1]王正明.弹道跟踪数据的校准与评估.北京:国防科技大学出版社, 1999

[2]王正明, 周海银.制导工具系统误差估计的新方法.中国科学 (E辑) , 1998;28 (2) :160—167

[3]房鸿瑞.制导工具误差分析中的遥、外测时间对齐问题.遥测遥控, 1996;17 (5) :48—51

[4]蔡山, 张浩, 陈洪辉, 等.基于最小二乘法的分段三次曲线拟合方法研究.科学技术与工程, 2007; (3) :352—355

[5]王广斌, 刘义伦, 金晓宏, 等.基于最小二乘原理的趋势项处理及其Matlab的实现.有色设备, 2005; (5) :4—8

时间差估计 第2篇

跆拳道社的会费不仅贵,而且进去之后还特别忙,因为这个社团在学校里的名气比较大,所以只要有什么活动,就有跆拳道社的身影。为了避免在表演中出现失误等情况,每天都会要求我们去操场上训练打拳,一练就是一小时,简直比上体育课还累。

如果你不是真心喜欢跆拳道社的话,那么最好不要进,等你训练完可能天都黑了,哪还有时间跟恋爱对象一起吃晚饭?

2、校啦啦队

啦啦队不只是助威加油这么简单,她们之所以这么忙,就是因为经常要往校外跑。一有什么啦啦队大赛,就要不停地训练,希望能帮学校拿到一个好名次。除此之外,篮球队或者足球队要去校外比赛的话,这个社团也要跟着去为他们加油,根本没时间谈恋爱!

如果你喜欢跳舞,那完全可以进舞蹈协会或者街舞协会之类的社团,相比于校啦啦队,舞蹈协会会轻松很多。

3、学生会

要说最忙的协会,那么学生会必须排在第一位,无论你进的是哪一个部门,每天可能忙得夜宵都顾不上吃。就拿生活部来说,最忙的工作就是检查宿舍卫生了,一间间宿舍轮着来检查,忙完通常都已经快要到门禁时间了,夜宵都没时间吃,更不用说谈恋爱了。

虽然有很多人想进学生会,但是只有进过的人才知道其中的心酸,如果发现根本提高不了自己的能力,那么最好找个时间给退了,留点时间出来学习。

本文编辑:小杰

基于时间序列的竞技水平估计算法 第3篇

关键词:竞技水平估计,时间序列,概率图模型,True Skill-T

如何用比赛结果正确估计参赛选手的竞技水平, 是一个很有价值也很有挑战的问题。Elo算法作为代表性的评分算法[1,2], 通过使用客观的统计方法, 在一个传统依赖专业人士的主观经验和专业知识的领域, 建立仅依靠数据的客观标准, 确立了本领域的科学性。然而, 近年来随着搜索引擎技术 (Search engine) 以及在线游戏 (Online game) 的快速发展, 新的应用需求不断涌现, 例如: (1) 比赛模式多样化、动态化, 而Elo算法假设参赛为“1对1”模式。 (2) 参赛对象结构多样化、动态化, 而Elo算法假设参赛对象是原子不可分的。 (3) 参赛成员水平随时间变化, 而改进的Elo算法用单个参数表示动态变化的过程, 模型误差较大。

英国微软研究院2006年提出的True Skill模型[3]为问题 (1) 和问题 (2) 提出了解决方案, 并于2007年提出True Skill-T模型为时间建模[4]解决了问题 (3) 。其基本思想是使用图模型 (Graphical Model) 的灵活性, 把所有比赛结果以及所有参赛团队的构成信息转化为一个庞大的因子图 (Factor graph) , 然后用Sum-product算法[5]和EP算法[6]近似估计模型中每一个节点 (Node) 的参数, 从而得到参赛选手竞技水平的边际分布。True Skill系列算法的提出, 极大地扩展了竞技水平估计算法的可用范围。然而, 要想在实际应用中成功地使用它们, 还必须考查算法对数据的适应能力。针对True Skill模型, 已经发表了相关研究[7], 因此本文主要根据围棋比赛的特点, 通过简化和修改True Skill-T实现True Skill GoYear模型, 结合真实比赛数据和仿真数据, 估计围棋棋手在时间序列上的竞技水平, 并力图研究以下几个问题:

(1) True Skill-T对数据缺失的敏感性。在数据收集阶段, 一个很容易出现的问题就是数据缺失。这些缺失的比赛结果会不会影响估计结果, 影响的程度有多大。

(2) True Skill-T算法对数据错误的敏感性。在数据收集阶段, 另一个很容易出现的问题就是录入错误。这些错误的比赛结果会不会影响估计结果, 影响的程度有多大。

(3) True Skill-T算法能否计算出符合领域常识的结果。例如, 九段是关于专业围棋棋手棋力的常识。True Skill-T能否仅仅依靠比赛结果, 计算出哪些棋手的棋力达到了九段水平, 其计算结果在多大程度上符合已授予九段段位的职业棋手名单。

1 方法

1.1 模型实现

为了研究选手竞技水平的起伏变化, 将选手职业生涯按年划分为T个时间段, 假设选手i在t年的竞技水平sit服从均值为μit的高斯分布, 即sit~N (sit;μit, (σit) 2) , 其中σit衡量选手竞技水平的波动。那么, 选手在第t+1年的竞技水平sit+1与第t年的竞技水平sit之间的关系为sit+1:N (sit+1;sit, τ2) , 其中t∈{1, …, Ti}, 参数τ2代表不同时间节点间选手竞技水平变化的平滑程度。对两个选手单场比赛的建模与文献[7]类似, 比赛中选手i的临场发挥pit:N (sit, β2) , 由贝叶斯定理:

其中, rtij为选手在t时刻比赛的结果, 似然P (rtij|sit, sjt) 为:

为方便求解后验概率P (sti, stj|rtij) , 用概率图模型True Skill Go-Year表示以上概率分布, 如图1所示。

根据围棋比赛的特点, 与True Skill和True Skill-T模型相比, True Skill Go-Year存在着以下改动:

(1) 只对单局比赛结果“胜”建模。由于现代围棋3又3/4子的贴子规则, 围棋比赛结果只有胜、负两种, 不出现平局。而对于“棋手A负于B”可转换为“棋手B赢A”的比赛数据。此外, 由于不需要对平局建模, 本文取平局区间 (Draw margin) ε的大小为0。

(2) 只对单个选手建模。由于围棋比赛是“1对1”进行的, 每个棋手作为参赛对象, 并不需要对‘团队’建模, 剔除了团队因素节点 (Team factor node) 和团队节点 (Team node) , 不需要使用团队竞技水平是组成成员竞技水平之和的模型假设。

1.2 参数估计与环路的处理

给定比赛结果和图模型, 本文使用Sum-product算法[5]和EP算法[6]求解选手节点sit的边际分布。在实际比赛数据中, True Skill Go-Year模型存在大量的回路, 图2给出了两种简单的例子。然而Sum-product算法并不能保证在有环路的图模型一定收敛, 因此必须对环路进行处理。本文采取随机更新方法:将参数更新过程分为多轮, 每一轮的第k次更新, 从所有待更新比赛结果中随机选取一场比赛Game k, 用Sum-product算法和EP算法更新两位参赛者的sit和sjt的边际分布, 把Game k从待更新队列移除。用同样的方式进行k+1次, k+2次, …, 直到第N次更新时, 待更新队列为空。此时把所有N场比赛的结果放入待更新队列, 进行新的一轮更新过程。此外在True Skill Go-Year模型的参数估计中, 为了保证sit+1初始值与sit的连续性。参数更新从所有比赛中最早的一年开始, 在同年中随机更新, 只有该年的比赛全部完成后才进入下一年随机更新。理论上该方法并不能保证收敛, 但是实践中所做的所有测试都能收敛。具体结果请参照实验结果与分析部分。

2 实验数据

本文利用职业棋手比赛数据来测试True Skill Go-Year模型在实际应用中的可靠性。数据来源于国家体育总局棋牌运动管理中心官网 (http:∥www.qipai.org.cn) , 利用爬虫程序产生原数据集。

原数据集:共包括837名职业棋手于1976年到2012年间在56项赛事中的9992场比赛信息。

为了检验True Skill Go-Year模型在数据缺失和错误的情况下计算结果的稳定性, 本文针对原数据集又分别仿真得到两种新数据集, 并随机重复生成10次。

数据缺失集:在原数据集中分别按比例RA随机地选取比赛生成新的数据子集。其中, RA∈{1%, 10%, 20%, …, 90%}。

数据错误集:在原数据集中分别按比例RB随机地选取比赛, 将比赛结果取反, 构成新的数据子集。其中, RB∈{1%, 2%, 3%, …, 40%}。

9段棋手:根据各国棋院[8,9]以及Tom棋圣道场[10]的棋手信息, 统计中国、日本、韩国和台湾9段棋手共272名, 其中本文原数据集中包含145人。

3 实验及分析

利用True Skill Go-Year模型在各个数据集上计算棋手的竞技水平, 逐一评估模型的收敛性、μ和σ2的特性、排名的客观性和稳定性。

3.1 收敛性

为了检验模型计算的可行性, 利用原数据集通过迭代计算实验验证模型收敛性。True Skill Go-Year分别迭代更新m轮和n轮后, 模型更新误差为:

其中, μit (k) 和[σit]2 (k) 分别为k轮迭代后棋手i在t年竞技水平的均值和方差。

实验选取k∈{1, 5, 10, 15, 20, 25, 30, 40, 50, 60}, 根据公式 (3) 和 (4) 依次计算迭代k轮与迭代1000轮的dμ和dσ2, 结果如图3和图4所示。棋手竞技水平的计算结果随迭代次数增加趋于稳定。

True Skill Go-Year模型较快的收敛速度能够保证在大数据的应用上具备可行性。

3.2 参数性质

本节分别研究了True Skill Go-Year模型学习到的参数μ和σ2的性质。

3.2.1 μ与胜率

如图5所示, 棋手的竞技水平μ值与胜率有比较强的线性关系。当棋手胜率越高, 棋手水平高的概率越大。在同等胜率下, 棋手水平高低也有不同, 从模型上看原因是对手水平不同。说明棋手的胜率是棋手竞技水平的重要依据, 但并不是决定其竞技水平的唯一因素。

3.2.2 σ2与比赛数

如图6所示, 棋手竞技水平的稳定性参数σ2随棋手比赛数的增加而减小。棋手比赛数量较少时, 其σ2变化很大, 随着比赛次数的增加, σ2减小的幅度越小, 趋于稳定。说明当选手参加一定数量的比赛后, 模型对学习到的竞技水平有较稳定的把握。

3.3 客观性

为了验证排名结果的客观性, 取每年前1名棋手预测为9段棋手并计算其准确率和召回率。实验中l∈{1, 2, …, 50}, 结果如图7所示。当取第1名时, 准确率达到83.8%, 召回率仅16.9%;而当召回率高达98.9%, 准确率高于50%, 其中错误分类中的年轻棋手有潜力晋升9段。因此True Skill计算结果对9段棋手有较好的预测, 排名结果符合领域知识。

3.4 稳定性

实验通过模型对缺失数据的敏感性和错误数据的敏感性两方面验证模型的稳定性。

3.4.1 缺失数据的敏感性

针对数据缺失集计算各排名间的斯皮尔曼相关系数来测试算法对数据缺失的敏感性。第一组实验计算不同规模的数据缺失集上所有棋手排名与原数据集上排名的斯皮尔曼相关系数, 实验重复进行10次, 相关系数的均值和方差如图8所示。第二组实验依次取不同规模的数据缺失集上棋手排名的前100名, 第101~200名, …, 分别计算与原数据集上排名的斯皮尔曼相关系数, 相关系数变化如图9所示。

由图8可知, 数据规模越大, 两个排名的斯皮尔曼相关系数越大, 算法对数据的缺失的敏感性越小, 排名结果越稳定。当数据子集仅为原数据的10%时, 两者排名相关系数依然达到0.5111, 即密切相关。当数据子集超过原来数据的50%时, 相关系数超过0.8, 即高度相关。由此, True Skill在小规模数据集上的计算结果与相关大数据集的结果有较好的一致性, 一方面能在缺失数据的情况下推导可靠结果, 另一方面还可以为大规模数据减少计算而得到近似结果。

如图9所示, (1) 对于顶尖棋手, 两个排名的相关系数最大, 稳定性最好; (2) 数据规模越大, 排名的稳定性越好。第501~600名棋手的排名相关系数较大, 而600~807名之间的棋手由于比赛数很少, 数据缺失对排名结果影响较大。实验说明顶尖棋手的排名有较好的稳定性, 不易受数据缺失影响。

3.4.2 错误数据的敏感性

针对数据错误集计算各排名之间的斯皮尔曼相关系数来测试True Skill算法对数据错误的敏感性。实验同样分为两组, 与缺失数据的敏感性实验类似, 只需将数据错误集替换数据缺失集。

如图10所示, 数据错误比例越小, 排名的稳定性越好。错误数据占总数据比例上升到8%之前, 相关系数的均值缓慢下降, 方差较为稳定。随着错误数据比例的升高, 方差波动越来越大, 方差也明显增大。由此说明, 模型能在错误数据比例相对较小时保持不错的稳定性。

如图11所示, (1) 顶尖棋手排名的相关系数较大, 稳定性较好, 其它选手无较明显区别; (2) 错误数据比例越小, 棋手排名的相关系数越大, 不同排名区间上的相关系数也越稳定, 例如错误数据比例是1%时, 棋手排名与原始数据上棋手排名的相关系数变化范围是[0.8, 1]。

3.5 职业棋手生涯与排名

研究棋手的竞技水平和竞技状态一方面能检验模型对数据的吻合度, 另一方面有助于分析棋手的职业生涯。竞技水平描述了棋手水平的整体变化, 而竞技状态是局部时间内棋手状态在水平附近波动的结果。图12 (a) -12 (d) 分别描述了棋手古力、李昌镐、李世石和周俊勋职业生涯的比赛数量、竞技水平和胜率。棋手的评分综合了比赛胜率和比赛数量, 符合职业生涯初期棋手水平逐渐上升、末期下降的客观规律。相比于胜率的激烈变化, 模型学习到的棋手评分更加平滑, 曲线从整体上看反映了棋手的竞技水平, 局部上反映棋手在某个时间段的竞技状态并与胜率十分吻合。

4 结束语

为研究基于True Skill-T模型排名算法在实际应用中的可行性, 本文实现了True Skill Go-Year模型, 估计围棋棋手在时间序列上的竞技水平, 通过实验验证发现, 模型在数据缺失、数据错误的情况下表现出较好的稳定性, 排名结果能较好地预测了9段棋手。本文研究内容为排名算法在大规模数据上的应用研究提供了参考。

参考文献

[1]Elo A E.The Rating of Chess Players, Past and Present[M].New York:Arco Publishing, 1978.

[2]Clickman M E.Parameter estimation in large dynamic paired comparison experiments[J].Applied Statistics, 1999, 48:377-394.

[3]Herbrich, R, Minka, T, Graepel T TrueskillTM.A Bayesian skill rating system[C]∥In Advances in Neural Information Processing Systems.2007:569-576.

[4]Pierre Dangauthier, Ralf Herbrich, Tom Minka, et al.True Skill through time:revisiting the history of chess[C]∥Advances in Neural Information Processing Systems 21, 2008:337-344.

[5]Kschischang F R, Frey B J, Loeliger H A.Factor graphs and the sum-product algorithm[J].IEEE Transactions on, Information Theory, 2001, 47 (2) :498-519.

[6]Minka, Thomas P.Expectation propagation for approximate Bayesian inference[C].Proceedings of the Seventeenth conference on Uncertainty in artificial intelligence.Morgan Kaufmann Publishers Inc., 2001:362-369.

[7]吴霖, 陈磊, 邓超, 等.基于True Skill模型的围棋棋手排名方法及评估[J].昆明理工大学学报:自然科学版, 2013, 38 (3) :47-55.

[8]Nihon Ki in.棋士[EB/OL].[2014-03-12].http:∥www.nihonkiin.or.jp/player/index.html.

[9]Taiwango.棋士资讯[EB/OL].[2014-03-12].http:∥www.taiwango.org.tw/chesser.asp.

基于探测车数据的路段行程时间估计 第4篇

随着新技术的发展以及对交通网络广域交通流特征愈来愈准确地把握, 以探测车为代表的新型交通信息采集方式受到了广大交通工程师的青睐。这种新型交通信息采集方式具有成本低、覆盖范围广、实时性强以及能够直接采集行程时间和行程速度等优点。

基于探测车数据的路段行程时间估计, 其实质就是利用带有误差的样本 (探测车) 观测值来估计总体的真实值。已经有许多专家和学者对基于GPS探测车数据进行路段行程时间/速度的估计展开了研究。归纳起来, 主要的估计方法有样本均值法[1]、线性回归法[2,3]、神经网络法[3,4]、平滑法[5,6,7]和滤波法[8,9], 各种方法在实际应用中都有各自的优缺点。笔者尝试引入自适应式卡尔曼滤波来估计路段行程时间。

1 自适应式卡尔曼滤波

卡尔曼滤波是从随机过程的观测量中通过线性最小方差估计准则来提取所需估计值 (系统的参数和状态) 的1种滤波算法, 此法的基本思路是根据状态在时间轴上的变化规律由过去状态预测当前状态, 并利用当前观测量对当前状态进行修正。其核心思想有2点:①确定状态变量;②建立状态方程和观测方程。该法的最大特点是能够剔除随机干扰噪声, 从而获得逼近真实的估计值。

卡尔曼滤波不需要过去全部的观测值, 它是根据前1个时段估计值x^ (k-1) 和当前时段观测值y (k) 来形成对当前时段状态量x (k) 的估计x^ (k) , 它是用状态方程和递推方法进行估计的, 因而卡尔曼滤波对信号的平稳性和时不变性不作要求。

通常, 先验的噪声统计特性不能准确得到, 导致常规卡尔曼滤波器性能下降, 甚至发散。为此, 人们提出许多自适应滤波方法, 试图在滤波的同时自适应估计出未知的系统噪声和观测噪声统计特性, 从而不断地改进滤波器的设计, 由此得到的滤波估计比常规卡尔曼估计精度更高。自适应滤波的方法有多种, 包括分布检验法、极大验后法、新息相关法及Sage和Husa自适应滤波等算法[10,11]。其中, Sage和Husa的次优无偏极大后验 (MAP) 噪声统计估值器计算简单, 可同时估计出系统噪声和观测噪声的一阶及二阶矩, 而且对时变系统也适用, 因此被许多学者推荐。

Sage-Husa的次优无偏极大后验 (MAP) 噪声统计估值器计算简单, 可同时估计出系统噪声方差和测量噪声方差, 但是在系统阶次较高时, 容易出现滤波发散, 并发现滤波发散时总伴随着系统噪声的方差矩阵失去半正定性, 观测噪声的方差矩阵失去正定性。鉴于以上时变噪声统计估值器容易发散的情况, 文献[12]给出了改进的估算方法。

2 自适应式卡尔曼滤波在路段行程时间估计中的应用

2.1 状态方程和观测方程的建立

k-1和k个时段2个相邻时间段的行程时间存在着转移关系, 建立状态方程:

t (k) =Φ (k, k-1) t (k-1) +w (k-1) (1)

考虑在第k个时段内, 在通过路段i的车辆中, 有nk辆探测车, 它们的行程时间分别为tj (k) (j=1, 2, …, nk) , 设第k个时段内路段行程时间为t (k) (待估计) , t (k) 服从某种分布, 那么, 探测车的行程时间tj (k) 可以看作是对路段行程时间t (k) 的观测或实现。因此, 可用下式来表示:

tj (k) =t (k) +zj (k) (2)

式中:zj (k) 形成了1个随机过程, 代表了探测车样本行程时间对路段行程时间t (k) 的偏离, 可以看作是高斯白噪声, 均值为0, 方差为σz2

对第k个时段内经过路段i的所有探测车样本行程时间求和并取均值, 得到:

1nkj=1nktj (k) =t (k) +1nkj=1nkzj (k) (3)

v (k) =1nkj=1nkzj (k) , 显然v (k) 是高斯白噪声, 均值为0, 方差为R (k) , 再令y (k) =1nkj=1nkzj (k) , 则有:

y (k) =t (k) +v (k) (4)

上式可解释为:探测车样本行程时间的均值形成了对路段行程时间的观测。将该式作为观测方程。

系统噪声与观测噪声是互不相关的零均值高斯白噪声序列, 与状态向量初值无关。

E{v (k) }=0, E{w (k) }=0, E{v (k) wΤ (j) }=0E{v (k) vΤ (j) }=Q (k) δkj, E{w (k) wΤ (j) }=R (k) δkj, δkj={0, kj1, k=jE{x (0) wΤ (k) }=0, E{x (0) vΤ (k) }=0

显然, 该卡尔曼滤波是1个时变系统, 且为标量卡尔曼滤波。状态转移系数由历史数据来确定, 主要依据相似的时间特征来确定, 相似的时间特征包括2个方面, 一是相同类型的时间, 如工作日、周末;二是相同的时段。这里的转移系数取为上一周的同1天对应的2个相邻时段的路段行程时间之比。

2.2 自适应式卡尔曼滤波方程

滤波方程如下:

t¯ (k) =Φ (k, k-1) t^ (k-1) Ρ¯ (k) =Φ2 (k, k-1) Ρ^ (k-1) +Q^ (k-1) G (k) =Ρ¯ (k) [Ρ¯ (k) +R^ (k-1) ]-1ε (k) =y (k) -t¯ (k) t^ (k) =t¯ (k) +G (k) ε (k) Ρ^ (k) =[1-G (k) ]Ρ¯ (k) d (k) =1-b1-bk+1Q^ (k[1-d (k-1) ]Q^ (k-1) +d (k-1) [G2 (k) ε2 (k) +Ρ^ (k) ]Ρ^ (k) =[1-d (k-1) ]R^ (k-1) +d (k-1) ε2 (k)

式中:t¯ (k) 和t^ (k) 分别为第k时段路段行程时间t (k) 的先验估计和后验估计;Φ (k, k-1) 为第k-1时段到k时段的转移系数;Q (k) 和R (k) 分别为第k时段的系统噪声方差和观测噪声方差;Q^ (k) R^ (k) 分别为第k时段的系统噪声方差Q (k) 和观测噪声方差R (k) 的估计;Ρ¯ (k) 和Ρ^ (k) 分别为第k时段状态向量估计误差协方差P (k) 的先验估计和后验估计;ε (k) 和G (k) 分别为第k时段的新息和滤波增益;b为遗忘因子 (0<b<1) , 取b=0.95。

该滤波需要确定4个初值, 即状态向量初值t^ (0) , 估计误差协方差的后验估计初值Ρ^ (0) , 系统噪声方差初值Q^ (0) 和观测噪声方差初值R^ (0) 。研究表明, 该滤波对状态向量初值t^ (0) 不敏感, 状态向量估计误差协方差的后验估计Ρ^ (0) 可取为略大于估计误差协方差的对角阵。系统噪声方差Q^ (0) 和观测噪声方差R^ (0) 的选取在一定条件下将影响滤波器性能, 房建成等推荐Q^ (0) 取适当大的值, R^ (0) 取适当小的值, 两者均可取为对角阵。

2.3 估计实例

以某城市的出租车GPS数据为例, 选取了某条地面道路路段来验证自适应式卡尔曼滤波的效果, 共测试了153个时段 (时段长度为5 min) , 从07:15~20:00, 其中包括了高峰及非高峰时段。另外, 其中55个时段取得了人工调查的数据 (已排除掉调查数据有问题的时段) , 作为标杆数据来评估估计结果。

1) 性能评价指标。

估计性能评价指标采用相对误差 (APE) 、最大相对误差 (maxAPE) 和平均相对误差 (MAPE) 。

k个时段的相对误差:

AΡE (k) =|t^ (k) -t (k) |t (k) ×100%

最大相对误差:

maxAΡE=max{AΡE (k) }

平均相对误差为:

ΜAΡE=1Κk|t^ (k) -t (k) |t (k) ×100%

式中:t (k) 和t^ (k) 分别为第k时段的调查值和估计值, K为有调查数据的时段集合。

2) 初始值的选取。

x^ (0) =0, Ρ^ (0) =10000Q^ (0) =100000, R^ (0) =10000

3) 估计结果。

(1) 平均相对误差和最大相对误差

ΜAΡE=13.13%, maxAΡE=42.57%

(2) 相对误差的分布见表1。

(3) 真实值与估计值的比较。

从图1可以看出, 估计值能够及时跟踪交通状态发生变化时的行程时间波动情况。

(4) 估计误差的后验估计。

图2表明, 估计误差的后验估计在经过少数几步的迭代后, 迅速收敛至某个常数, 并在其上下波动, 说明滤波的稳定性好。

(5) 系统噪声方差和观测噪声方差。

从图3和4中可以看出, 系统噪声方差和观测噪声方差在经过少数几步的迭代后, 迅速收敛。

(6) 对初始值的敏感性测试。

图5~8给出了估计精度对4个变量初始值的敏感性分析。图5~8的纵坐标是相对误差 (率) , 是相对数, 无单位;其他图的纵坐标是中间指标量, 经查卡尔曼滤波的相关书籍及资料, 可以无单位。

通过图5~8可以看出状态向量初值、误差方差初值、系统噪声方差初值和观测噪声方差初值取不同的值时, 估计精度几乎不受影响。

从图9~图11可以看出, 误差方差、系统噪声方差和观测噪声方差取不同的初值时, 几乎不影响各自的收敛速度, 只经过少数的几步迭代后, 就快速收敛, 最终分别收敛于不同的常数。

由此可见, 论文中的自适应式卡尔曼滤波具有对初始值不敏感的优点。

3 结束语

论文分析了利用探测车数据进行路段行程时间估计的误差来源, 在此基础上提出用自适应式卡尔曼滤波来估计路段行程时间, 取得了较好的效果。此外, 在缺少探测车数据的时段, 论文中的处理方法是采用历史数据来替代当前观测值, 也能取得较高精度的估计值。

显然, 自适应式卡尔曼滤波在路段行程时间估计中还具有以下优点:①能够容忍观测误差和采样偏差;②能够有效利用历史数据;③能够在线估计系统噪声和观测噪声的方差;④对初值不敏感, 能够快速收敛;⑤模型所需参数少, 具有较强的可移植性。

参考文献

[1]Wang Rui.A study on the methodology of express-way travel time estimation utilizing probe vehicletechnologies[D].Nagoya:Nagoya University, 2004

[2]Rohini B.Predicting speeds on urban streets usingreal-time GPS data[D].Arlington:The Universityof Texas at Arlington, 2002

[3]Anthony F D.A framework to transform real-timeGPS data derived from transit vehicles to determinespeed-flow characteristics of arterials[D].Arling-ton:The University of Texas at Arlington, 2003

[4]董均宇.基于GPS浮动车的城市路段平均速度估计技术研究[D].重庆:重庆大学, 2006

[5]王力.移动交通流检测系统信息处理关键问题研究[D].北京:北京航空航天大学, 2006

[6]王力, 张海, 范耀祖.基于探测车技术的路段平均速度估计模型[J].交通运输系统工程与信息, 2006, 6 (4) :29-33

[7]张存保.基于浮动车的交通信息采集与处理理论及方法研究[D].上海:同济大学, 2006

[8]Dailey D J, Cathey F W.Virtual speed sensors u-sing transit vehicles as traffic Probes[C]//IEEE 5thInternational Conference on Intelligent Transporta-tion Systems, Singapore:Center for TransportationResearch, National University of Singapors, 2002

[9]Cathey F W, Dailey D J.Transit vehicles as trafficprobe sensors[C]//Annual meeting of Transporta-tion research board, 2002:560-565

[10]Mehra R K.On the Identification of variances andadaptive Kalman filtering[J].IEEE Transactionson automatic Control, 1970, 15 (2) :175-184

[11]Godbole S S, Babock, Wilcox.Company.Kalmanfiltering with no a-priori information about noise-white noise case:Part I:Identification of covari-ance[C]//IEEE Conference on Decisinon and Con-trol including the 12th symposium on AdaptiveProcesses, USA, SanDiego:1973

时间差估计 第5篇

安全监控系统是煤矿安全避险“六大系统”的重要组成部分[1]。煤矿井下物联网通过各种泛在传感器对煤矿井下人员、设备、环境等进行感知[2,3], 实现各种灾害事故的监测和预警, 为煤矿安全生产提供主动式保障。时间同步是煤矿井下物联网的一个支撑技术, 物联网应用中的数据采集时间标记、时分多址接入技术、节点协同休眠机制、定位技术、监测参数的数据融合等, 都需要网络中节点的时钟保持同步[4], 且能够与外部标准时钟同步。

煤矿井下具有空间狭小、无线通信环境差、信息传输距离短、巷道内分布有大量节点等特点, 节点间极易产生通信干扰和信道竞争, 导致无线传输延迟存在很大的随机性, 无法用某种特定的分布规律来模拟实时变化的传输延迟, 使得成对广播同步 (Pairwise Broadcast Synchronization, PBS) 算法、多跳自适应时间同步 (Multi-hop Adaptive Time Synchronization, MATS) 算法等基于数理统计的时间同步算法无法直接应用于煤矿井下。另外, 煤矿井下巷道面为煤和岩层, 表面粗糙不平, 且巷道中存在液压支架、钢轨、电缆、绞车等设备, 数据传输可靠性差, 极易发生数据包丢失, 在MAC协议允许丢包重传时, 无线传输延迟大为增加且呈现非对称特性, 传感器网络时间同步协议 (Timing-sync Protocol for Sensor Networks, TPSN) 、参考广播同步 (Reference Broadcast Synchronization, RBS) 算法、轻量型时间同步 (Lightweight Time Synchronization, LTS) 算法、洪泛时间同步协议 (Flooding Time Synchronization Protocol, FTSP) 等基于对称延迟或忽略传输延迟的时间同步算法也无法在煤矿井下直接应用。

针对煤矿井下无线通信的特殊性, 本文提出一种基于被动测量的物联网时间同步信息传输延迟估计方法, 在煤矿井下物联网感知层中布置一类评估节点, 获取煤矿井下感知层节点间传输延迟数据并估计传输延迟的分布类型及分布参数, 为煤矿井下物联网感知层时间同步技术的实现提供数据支持。

1 传输延迟数据获取

鉴于煤矿井下多变的通信环境, 在煤矿井下感知层中增加一类评估节点, 得到层次型分级网络[5], 如图1所示。感知节点间经某一无线信道传输时间同步信息包;评估节点通过相同信道被动侦听时间同步信息包, 获取无线传输延迟数据, 并通过另一无线信道将估计参数经其他评估节点传送给汇聚节点, 避免对感知节点间的时间同步信息包传输产生干扰。在布置评估节点时需保证邻级感知节点间至少有1个评估节点侦听到时间同步信息包。

按感知节点与汇聚节点间的跳数进行分级, 汇聚节点为第0级节点, 汇聚节点1跳内的节点属于第1级节点;第i级节点的下一跳节点为第i+1级节点, 网络终端节点记为第K级节点。时间同步信息包传输时携带自身级别号和节点本地时间。

1.1 发送节点为中间节点的情况

设发送节点S为中间节点, 级别号为i, 其中0

由于无线信号具有广播特性, 评估节点E能接收到多个同级节点发送的时间同步信息包。为保证传输延迟数据获取的准确性, 根据时间同步信息包中携带的级别号, 评估节点E只接收最先到达的信息包并标记接收时刻。在N次同步分组侦听后, 评估节点E获取N个传输延迟数据{dki}Nk=1。

1.2 发送节点为汇聚节点的情况

当发送节点S为汇聚节点时, 由于汇聚节点是整个感知层时间同步的发起者, 没有任何时间同步信息包发送给该节点, 无法按照1.1节所述方法获取N个第0级传输延迟数据。现做如下假设: (1) 假设第0级节点和第1级节点双向连通; (2) 第0级节点到第1级节点的传输延迟和第1级节点到第0级节点的传输延迟相等。第0级传输延迟的第k个数据dk0获取如图3所示。图3中, 由于无线信号的广播特性, 接收节点R往第2级节点B发送时间同步信息包P2 (k) 时, 第0级汇聚节点S也接收到该信息包, 且由于邻级节点的距离差相对于电磁波传播速度而言可忽略, 认为信息包P2 (k) 同时到达第0级节点S、第2级节点B和评估节点E, 评估节点E记录的时间差t2-t1为节点R到汇聚节点S的第k个传输延迟dk0。评估节点E侦听N次时间同步信息包后, 得到N个第0级传输延迟数据{dk0}Nk=1。

2 传输延迟分布类型、分布参数估计与突变检测

评估节点每获取一个传输延迟数据都将其作为dNi以更新N个数据{dki}Nk=1。为表述简便, 省略上标i, 将评估节点保存的N个延迟数据记为{dk}Nk=1。由参考文献[6]可知, 无线传输延迟主要服从高斯分布或指数分布规律。本文主要研究评估节点如何在这2种分布规律下选择延迟分布类型、确定分布参数, 并检测分布参数的突变。

2.1 延迟分布类型及分布参数估计

采用极大似然估计法根据N个传输延迟数据{dk}Nk=1确定分布类型和分布参数θ[7]。N个传输延迟数据的联合似然函数为f (d1, d2, …, dN|θ) =∏Nk=1f (dk|θ) , 其中f (·) 为概率密度函数。对f (d1, d2, …, dN|θ) 取自然对数得。由于对数函数为单调递增函数, 所以由lnf (d1, d2, …, dN|θ) 最大值处对应的θ即可得联合似然函数的最大值。

若N个传输延迟数据{dk}Nk=1服从指数分布规律, 则第k个传输延迟数据dk的概率密度函数为, 其中分布参数。若N个传输延迟数据{dk}Nk=1服从高斯分布规律, 则第k个传输延迟数据dk的概率密度函数为, 分布参数为均值

引入累积Kullback-Leibler差异来度量不同分布规律下概率分布间的差异, 以此评价分布模型的拟合优度。定义Kullback-Leibler差异为

若EKL>0, 说明指数分布模型与N个传输延迟数据的相似程度大, 优于高斯分布模型;若EKL<0, 说明高斯分布模型优于指数分布模型;若EKL=0, 说明2种模型的拟合优度相同。在确定分布模型时, 为避免模型在EKL=0附近频繁切换, 借鉴继电特性, 引入一个正常数ε, 当EKL>ε时, 选择指数分布模型;当EKL<-ε时, 选择高斯分布模型;当|EKL|≤ε时, 延迟分布类型不变。

2.2 分布参数突变检测

煤矿井下无线传输环境复杂, 无线传输延迟存在很大的随机性[8], 传输延迟分布会发生突变。这里的突变包括2种:分布规律的突变和同种分布规律下分布参数的突变, 而分布规律的突变可根据EKL确定。下面主要研究同种分布规律下分布参数的突变检测。

设第k个传输延迟数据dk的概率密度函数为f (dk|θ) , N个传输延迟数据{dk}Nk=1更新前的分布参数记为θ0, 更新后的分布参数记为θ1。dk在θ0和θ1下的对数似然比为

sk>0表示dk在分布参数为θ1的分布中出现概率大, 反之在分布参数为θ0的分布中出现概率大。N个传输延迟数据的对数似然比之和。根据S1N可得出{dk}Nk=1更新前后的分布参数是否发生突变, 突变检测结果为

式中:h为突变阈值。

r=1表示分布参数突变, 否则没有发生突变。

评估节点每获得1个新的传输延迟数据, 立即进行分布类型、分布参数的估计以及分布突变检测。若检测到分布突变, 则将本次估计的分布类型和分布参数经其他评估节点传送给汇聚节点, 汇聚节点重新洪泛延迟分布类型及分布参数。

2.3 突变阈值的确定

设N个传输延迟数据{dk}Nk=1更新前后都服从指数分布规律, 记均值分别为λ0和λ1, 则传输延迟数据dk在2组分布参数下的对数似然比为

N个传输延迟数据的对数似然比之和为

从式 (5) 可看出, 在传输延迟数据个数N一定的情况下, S1N取值与λ0和λ1的相对偏差有关, S1N越大, 检测到参数突变的概率越大。本文取指数分布参数的突变阈值为

式中:kt为突变阈值系数, 为大于0的自然数。

设N个传输延迟数据{dk}Nk=1更新前后都服从高斯分布规律, 记均值和方差分别为μ0, σ02和μ1, σ12。则传输延迟数据dk在2组分布参数下的对数似然比为

N个传输延迟数据的对数似然比之和为

由式 (8) 可看出, S1N取值与μ0和μ1以及σ02和σ12的相对偏差有关。本文取高斯分布参数的突变阈值为

式中:kp为突变阈值系数, 为大于0的自然数。

3 仿真及结果分析

3.1 仿真实验设置

基于OMNet++和Matlab仿真平台验证本文提出的延迟分布类型、分布参数估计及分布突变检测方法。

首先, 结合煤矿井下巷道狭长、节点通信距离短等特点, 设评估节点和汇聚节点的通信距离为25m, 感知节点的通信距离为15m, 巷道宽度和高度均为6m, 汇聚节点和评估节点在巷道顶端居中布置, 感知节点分布在巷道两侧、高度约3m处, 考虑一定的通信冗余, 在100 m巷道内布置33个节点, 其中感知节点为27个, 汇聚节点为1个, 评估节点为5个, 在OMNet++仿真平台上按照树状拓扑布置各类节点;其次, 在OMNet++仿真平台上设置节点参数:数据丢包率为0.9, 传输延迟在2~30ms之间随机取值, 节点时钟频率偏移在1±0.005内随机取值, 初始时刻在-2~2s间随机取值;然后, 由汇聚节点开始在感知节点间按级别洪泛时间同步信息包, 评估节点侦听相邻级别的时间同步信息包, 记录接收时间差并保存;最后, 将评估节点保存的传输延迟数据导出, 在Matlab仿真平台上分析传输延迟数据, 进行分布类型、分布参数突变检测。

3.2 仿真结果分析

3.2.1 分布类型突变检测

当2组传输延迟数据在服从指数分布e (10) 和高斯分布N (10, 4) 之间变化时, 根据式 (1) 进行分布类型突变检测, 检测出类型突变的概率如图4所示。可看出虽然2组数据的均值相等, 但由于分布规律不同, 其累积Kullback-Leibler差异很大, 检测出分布类型突变的概率大于99.2%, 近似为100%。

3.2.2 指数分布下的参数突变检测

当2组传输延迟数据都服从指数分布但均值发生突变时, 均值突变100%, 50%, 30%, 10%时的参数突变检测概率曲线如图5所示。可看出根据式 (6) 选择突变阈值能较好地检测出参数突变, 即使均值仅突变30%, 参数突变检测概率也大于50%;当均值突变100%时, kt的取值几乎不影响检测结果, 即使kt取值很大, 参数突变检测概率也能接近100%。

3.2.3 高斯分布下的参数突变检测

当2组传输延迟数据均服从高斯分布但均值和/或方差发生突变时, 参数突变检测概率曲线如图6所示。可看出根据式 (9) 选择突变阈值, 在均值突变50%时, 即使kp取值很大 (如取15) , 参数突变检测概率也能接近50%;方差突变会影响参数突变检测的概率, 原因是式 (9) 中包含了方差相对值;当均值突变100%时, kp的取值几乎不影响检测结果, 即使kp取值很大, 参数突变检测概率也近似为100%。

4 结语

结合煤矿井下运行环境的特殊性, 提出了一种物联网时间同步信息传输延迟估计方法。在网络中增加一类评估节点, 该类节点基于同步信息包被动侦听机制, 获取感知节点间的传输延迟数据, 采用Kullback-Leibler差异确定最优延迟分布类型, 进而确定最优分布下的分布参数, 有利于将现有时间同步算法应用到煤矿井下物联网中。

摘要:针对煤矿井下巷道中无线传输延迟存在很大随机性, 现有时间同步算法因无法确定延迟分布类型和参数而难以直接应用的问题, 提出了一种基于被动测量的物联网时间同步信息传输延迟估计方法。在煤矿井下物联网感知层中增加一类评估节点, 被动侦听感知节点间传输的时间同步信息包, 获取传输延迟数据。评估节点基于极大似然估计法估计不同分布规律下的分布参数, 根据Kullback-Leibler差异值确定最优分布规律;采用对数似然比确定同种分布规律下的参数突变, 检测结果作为评估节点发送延迟分布规律和参数给汇聚节点的触发条件。仿真结果表明, 该方法能够准确检测延迟分布规律的类型及分布参数突变。

关键词:煤矿井下,物联网,时间同步,传输延迟,被动测量,参数估计,突变检测

参考文献

[1]孙继平.安全高效矿井监控关键技术研究[J].工矿自动化, 2012, 38 (12) :1-5.

[2]孙继平.煤矿物联网特点与关键技术研究[J].煤炭学报, 2011, 36 (1) :167-171.

[3]张申, 丁恩杰, 徐钊, 等.物联网与感知矿山专题讲座之三——感知矿山物联网的特征与关键技术[J].工矿自动化, 2010, 36 (12) :117-121.

[4]徐卫东, 王子剑, 丁恩杰.一种应用于煤矿井下线型WSN的时间同步方法[J].工矿自动化, 2013, 39 (4) :51-55.

[5]周公博, 朱真才, 陈光柱, 等.矿井巷道无线传感器网络分层拓扑控制策略[J].煤炭学报, 2010, 35 (2) :333-337.

[6]SERPEDIN E, CHAUDHARI Q M.Synchronization in wireless senseor networks (China Edition) [M].北京:科学出版社, 2011:34.

[7]成海英, 何文平, 何涛, 等.基于概率密度分布型变化的突变检测新途径[J].物理学报, 2012, 61 (3) :1-7.

时间差估计 第6篇

本文对传统的高速公路路段行程时间估计方法进行了介绍和分析, 然后在此基础上, 结合道路交通流动态性特点, 对传统方法进行了一定改进, 最后采用实例对传统方法和改进方法的结果进行了对比分析。

1 路段行程时间估计方法

1.1 高速公路路段行程时间与速度的关系

本文路段指的是高速公路某一方向两个固定检测器之间的部分, 如图1所示, 路段xixi+1即为位于xi处的检测器和位于xi+1处的检测器之间的部分, i=0, 1, 2……。

典型的路段行程时间指的是在时间间隔tj-1tj (j=1, 2, ……) 内经过该路段的所有车辆行程时间的平均值。以xi+1-xi表示路段xixi+1的长度, 则在该路段上, tj-1tj (j=1, 2, ……) 时段从xi出发的车辆, 其行程时间计算如下:

式中:为tj-1tj时段从xi出发的车辆在路段xixi+1上的空间平均车速。

1.2 改进的基于速度的路段行程时间估计方法

从式 (1) 中可以看出, 要求路段行程时间, 需要知道路段长度和空间平均车速, 而对于一个路段来说, 其长度是固定的, 因此推算空间平均车速是基于速度的路段行程时间估计的关键。传统的高速公路路段行程时间估计方法采用分段速度模型[2]、空间线性差值模型[3]以及时空线性差值模型[4], 其计算时涉及到的主要参数有2个:j时段内位于xi处的检测器采集到的地点速度v (i, j) 和j时段内位于xi+1处的检测器采集到的地点速度v (i+1, j) , 可以看出在计算中使用的速度数据都是tj-1tj时段的, 并不涉及时段tj-1tj以外的任何数据。对实际车辆行驶轨迹和平均行程时间的计算进行分析, 假设tj-1tj时段从xi处出发的车辆行驶轨迹示意图如图2所示。

假设在tj-1tj时段内有K辆车从xi处出发, 每辆车的行程时间为Tk (i, j) , k= (1, 2, 3, K, ……) , 则统计的该时段内的平均行程时间为:

从图2中可以看出, 实曲线所代表的车辆行驶轨迹是完全发生在tj-1tj时段内的, 而虚曲线所代表的车辆行驶轨迹一部分发生在tj-1tj时段内, 另一部分发生在tjtj+1时段内。因此, 在式 (2) 中, 有一部分Tk (i, j) 值是与tjtj+1时段内该路段的交通状况有关的。仅考虑tj-1tj时段的速度数据只能推算出实曲线所代表车辆的行程时间, 而忽略了虚曲线所代表车辆的行程时间, 因而得到tj-1tj时段的行程时间估计值不够准确。

如果tjtj+1时段内的交通状况与tj-1tj时段内的交通状况差异较大 (从拥堵变为顺畅, 或从顺畅变为拥堵) , 就会使2个时段内的速度有较大的不同, 从而使图2中虚线所代表的车辆行程时间与实线所代表的车辆行程时间有较大的差异。假设由于交通状况的不同, tjtj+1时段内的车辆速度远远小于tj-1tj时段内的车辆速度, 那么必然导致虚曲线所代表的车辆行程时间远远大于实曲线所代表的车辆行程时间, 这时如果仅仅考虑tj-1tj时段内的速度数据, 就会使得估计得到的行程时间明显小于实际的平均行程时间。

基于以上的分析, 对以往的路段行程时间估计模型进行改进, 在改进模型中综合考虑了xi+1处检测器在tjtj+1时段采集到的时间平均车速v (i+1, j+1) , 其时空位置示意如图3所示。

图3中, 粗虚线表示在计算中所要用到的v (i, j) 的时空位置, 粗实线表示v (i+1, j) 的时空位置, 点划线表示v (i+1, j+1) 的时空位置。从图3中可以看出, tj-1tj时段内从xi处出发的车辆其行程时间估计可以分为2部分, 一部分只与v (i, j) 和v (i+1, j) 有关, 如图3中 (1) 部分;另一部分只与v (i, j) 和v (i+1, j) 有关, 如图3中 (2) 部分。因此在估计路段空间车速时也分2段进行, 第1段记为, 计算公式如下:

第2段记为, 计算公式如下:

式中:Tf为车辆通过路段的大概行程时间, 可根据路段长度和平均车速计算, Tf=L/vf, 其中vf可取自由流速度。

2 案例分析

2.1 数据获取

为了检验改进方法的效果, 采用Vissim仿真软件分别对分段速度模型、空间线性插值模型和改进模型进行仿真分析。选取南京机场高速公路南京—机场方向作为研究对象, 该路的长度为24 573 m, 沿线有3个服务互通:江宁四号互通、禄口互通和机场互通, 在仿真时, 拟在该路线上南京—机场方向布设6组检测器。路线简图、路线上检测器编号、布设位置和间距如图4所示。

将检测器1和检测器2之间的路段称为路段1-2, 其他的以此类推。选取图4中所示的路段1-2、路段3-4和路段4-5三个路段作为3种估计方法评价的试验段。根据机场高速公路收费站在2012-09-05统计的南京机场高速公路中南京—机场方向实际小时交通流量对Vissim仿真软件中的交通流量进行标定。主线和驶入匝道 (1) 、 (2) 、 (3) 在24 h内的交通流量分别如图5、图6所示, 驶出匝道的分流率设为20%。

交通构成为小汽车车与货车;交通流量比例为小汽车:货车=0.66∶0.34;小汽车和货车的车速范围和期望车速分布分别如图7、图8所示。

取仿真步长为5, 随机种子为50, ΔT=10 min, vf=100 km/h。以10 min为单位时段 (统计时间间隔) , 获取各检测器采集的速度数据, 共144组。同时在3条试验段的起始点和终点分别设置1组行程时间检测器, 同样以10 min为单位时段, 统计在每个时段内所有车辆经过每个试验段的行程时间平均值, 以此作为行程时间真实值, 来检验不同的行程时间估计方法的准确性。

2.2 评价指标

为比较各种模型估计结果的优劣, 必须制定相应的性能评价指标。本文用于行程时间估计的性能评价指标包括平均绝对误差 (MAE, Mean Absolute Error) 、平均误差百分比 (MARE, Mean Absolute Percentage Error) 和均方差误差 (RMSE, Root Mean Square Error) 。设仿真后统计的实际行程时间序列为Tr (i, j) , 采用基于速度的行程时间估计方法计算得到的行程时间序列为Tp (i, j) , 各指标的计算公式如下:

式中:Tr (i, j) 为路段xixi+1在tj-1tj时段统计得到的实际行程时间;Tp (i, j) 为采用基于速度的行程时间估计方法计算得到路段xixi+1在tj-1tj时段的估计行程时间。

2.3 结果对比

按照2.1中标定的参数分别对3路段进行仿真试验, 采用分段速度模型、空间线性插值模型和改进模型分别估计行程时间, 3种估计方法得到的结果与实际行程时间的对比分别如图9所示, 3种方法的精度对比如表1所示。

从图9和表1中可以看出: (1) 对于3个路段, 改进模型的效果都优于其他2种模型; (2) 3个路段中, 路段4-5的改进效果最为明显 (如表中所示阴影部分) , 尤其在图7 (c) 中圆圈标注的部分, 分段速度模型和空间线性差值模型估计值有明显的滞后, 而改进模型与实际值的拟合性很好。

3 结论

本文对基于固定检测器速度参数的高速公路路段行程时间估计方法进行了研究, 在分析传统方法的基础上, 考虑了交通流的动态性特点, 构建了一种改进的行程时间估计模型, 并通过实例对其效果进行了分析, 主要得到以下几个结论:

(1) 基于速度的路段行程时间时间估计方法精度较高, 且检测器布设密度越大 (路段越短) , 误差越小, 这是由于固定检测器无法反映路段中间的交通状态, 路段越短, 路段上的交通状态变化越小;

(2) 改进模型由于考虑了交通流的动态性, 因此其估计精度优于传统的分段速度模型和空间线性差值模型, 且当采集周期长度一定时, 采用改进模型, 较长路段的改进效果优于较短路段的改进效果;

参考文献

[1]杨兆升, 于悦, 杨薇.基于固定型检测器和浮动车的路段行程时间获取技术[J].吉林大学学报, 2009, 39 (9) :168-171.

[2]李继伟.城市主次干路的路段行程时间估计与预测方法研究[D].长春:吉林大学, 2012.

[3]Van Lint J W C, van der Zijpp N J.An Improved Travel Time Estimation Algorithm Using Dual Loop Detectors[C/CD].Presented at 82th Annual Meeting of Transportation Research Record, 2000, 1919:45-53.

时间差估计 第7篇

随着社会经济的快速全面发展,交通拥堵已成为一个普遍存在的社会问题。出行时间是评价交通系统运行效率的一个重要指标,出行时间的预测与发布是交通信息系统的主要功能之一,在方便居民日常出行的同时,也能有效地帮助交通拥挤的疏散。

现有文献关于出行时间实时估计的研究已取得一些进展。高速公路[1,2,3,4,5]与主干道[6,7,8,9]出行时间估计的主要区别在于:①主干道上的交通流由于受到交通信号灯控制的影响会出现中断,属于间断流;而高速公路上的交通流是非中断的、连续行驶的状态,属于连续流。②随机的出行需求和随机的路径选择行为导致主干道上的交通流和出行时间具有更强的随机性。③主干道上检测器的分布密度小于高速公路,可用于出行时间估计的数据比较有限。因此,相对于高速公路而言,主干道出行时间估计的难度更大。

最初的主干道出行时间的估计模型有BPR函数、Webster点延误模型[10,11]与HCM中的交叉口延误公式[12]。BPR函数未考虑到信号控制等因素,仅考察了总延误的一部分——流量产生的延误,应用到主干道的行程时间估计不够理想。Webster公式来源于假设固定信号配时的确定性排队理论,并基于车辆到达情况、信号设定和排队情况,计算在交叉口停车线的平均信号延误。交叉口延误公式是基于添加随机因素的固定点延误模型,将平均出行时间看成是零流的行驶时间与交叉口延误之和。这些模型需要标定的参数较多,对于拥堵情况不能进行准确地实时估计。

近年来,一些解析的模型用于主干道出行时间的估计。Lin(2004)将总延误分解为路段延误与交叉口延误,模型基于三个关键参数:交通流条件、进出上下游交叉口的净流量、信号协调水平[13]。Skabardonis和Geroliminis(2005,2008,2011)基于主干道上15~30秒的交通流和占有率数据,模拟信号交叉口处时空排队情况,将行程时间看成是路段的行驶时间与交叉口延误时间之和;并将模型拓展到在排队较长和排队溢出频繁发生的情况下主干道出行时间的估计[6,7,8]。Liu和Ma(2009,2012)通过跟踪虚拟的探测车的行驶轨迹和制动情况,对主干道上的出行时间进行实时估计;并将该问题拓展到拥堵情况下的主干道出行时间的实时估计[14,15]。以上模型虽具有很高的精度,但需要精确的信号相位时间或标定较多的模型参数,使得模型的应用受到限制。

如何利用现有的检测数据,并考察拥堵对出行时间在时空方面的影响,对主干道的出行时间进行实时估计尤为重要。随机过程可以分析和预测系统在时空的状态变化,是解决该问题的一个合适方法[16]。为此,本文利用视频检测器采集的车速数据和信号配时数据作为模型的输入,应用离散时间马尔科夫链的方法,对主干道上的出行时间进行估计。该模型以平均行程速度的阈值界定路段的拥堵与畅通情况,将各路段是否拥堵定义为主干道系统的状态,构造一个无记忆性的马尔科夫随机过程。最后利用江苏省淮安市主干道的车牌识别数据,对模型的有效性和准确性进行验证。

2 马尔科夫链与出行状态转移

马尔科夫模型是一种经典的概率统计模型,目前在交通中的应用比较广泛[5]。本文应用离散时间马尔科夫链的方法,研究主干道上出行时间的估计问题。下面对马尔科夫链和状态转移的相关知识进行简单的介简。

定义1马尔科夫链是一种随机时间序列,具有时间和空间上的随机性。设X={X(t),t∈T}是一随机变量的集合,对于任意的t时刻,系统的状态X(t)为一随机变量。若满足:

其中xt=i表示t时刻系统所处的状态为i,且系统在t+1时刻的状态j只与t时刻的状态i有关,而与t时刻以前的状态无关,则X={X(t),t∈T)即为一马尔科夫链,T为时间集,X为状态集。若T是可数的,则称为离散的马尔科夫链;若是不可数的,则称为连续的马尔科夫链。

定义2-步转移概率矩阵定义为

其中i=1,2,…,m,计算公式为

而在实际的交通网络中,根据交通状态的划分标准,一条路段的交通状态可被划分为若干种。因此,在一定的时间段内,路段的交通状态总是在不同状态之间相互转换,并且路段状态转移规律具有马尔科夫性。

3 基于离散马尔科夫链的出行时间估计模型

3.1 确定系统的状态及其变量

将城市路网中某一主干道视为一个系统,以交叉口作为分界点,将其划分为若干条路段。假设在分析的时间区间内,主干道上交通需求是稳定的,然后将一个时间区间分割为若干时间段。例如,以30分钟为考察区间,再以60秒为时间间隔进行分割,得到30个时间段。下面在每个时间段上定义系统的状态与各路段的状态。

对于有若干条路段的主干道而言,t时段系统的状态可定义为

其中nt表示路段的总数,xi(t)表示路段i在t时段的状态,为二进制变量,定义为

交通拥堵是指交通需求超过某道路的交通容量时,超过部分的交通车辆滞留在道路上的交通现象,是交通供给与出行需求之间不平衡的产物。对于出行者来说,主要是对时间和车速的感觉,即车辆在道路或交叉口上排队或者缓慢移动。单个路段拥堵与畅通的划分标准是根据我国《城市道路交通管理评价指标体系》(2012版)中的规定,以路段上机动车的平均行程速度来评价道路的通畅程度,如表1所示。

表1以平均行程速度作为指标,将路段的交通状况分为5个等级:非常畅通、畅通、轻度拥堵、中度拥堵和严重拥堵。为了简化模型,将路段的状况分为两大类:畅通与拥堵,其中畅通包括非常畅通与畅通,拥堵包括轻度拥堵、中度拥堵和严重拥堵。对于不同类型的城市,以表1中对应的平均行程速度的区间端点值为阈值,当路段的平均行程速度高于该值,并持续至少30秒时,视该路段的状态为畅通;当路段的平均行程速度低于该值时,则视该路段的状态为拥堵。

以一条含有3个路段的主干道为例,若X(t)=[1,1,0],则各路段的状态为:x1(t)=1,x2(t)=1,x3(t)=0,即表示路段1、2在t时段交通拥堵,路段3在t时段交通畅通。若主干道上的路段有k个,而每个路段的状态有拥堵与畅通2种,则此时系统的状态有2k种。图1给出了8:00~8:08,时长为8分钟的时间区间,每60秒确定主干道系统状态的方法。

3.2 路段出行时间估计

主干道出行时间是各路段出行时间之和,而路段分为拥堵与畅通两种状态。表2给出了各路段相应状态下的出行时间的符号。

k:路段总数,i:路段标号,NCTi:路段i畅通时的出行时间,CTi:路段i拥堵时的的出行时间。

3.3 一步转移概率矩阵的计算

主干道系统的状态包含了各个路段的状态变量,在一定的时间段内,各路段的状态将在若干不同状态之间相互转化,相应的主干道系统的状态也将随着路段状态的转化而不断的转化。一步转移概率矩阵刻画的是在一个时间段内系统状态相互转化的概率,即

其中pij=p(xt+1=j|xt=i),i,j=1,2,…,n,t=1,2,···pij表示系统在时刻t位于状态i,经过一个时间段,在t+1时刻到达状态j的概率。计算方法是统计从状态i转向状态j的个数,并除以从状态i转向其它所有状态(包括状态i)的个数之和;亦即从状态i转向状态j的个数除以从状态i转向其它所有状态的总数(当状态i是该时间区间的最后一个状态时,应是总数减1),且该值与时刻t无关。

根据离散时间马尔科夫链的知识,当系统经过n步转移,且当n→∞时将趋于稳定。即无论从何种起始状态出发,系统最终到达状态j的概率趋于常数πj:

其计算为求解方程组:

稳态概率表明系统最终将达到定义的各个状态,据此可以计算系统期望的出行时间。

3.4 主干道行程时间的估计

由3.3节知,系统最终以稳态概率到达各状态,则下面以稳态概率作为权重,在一个时间区间上对系统在各状态的出行时间进行加权,即得主干道上期望的出行时间:

(6)

其中πj是状态j的稳态概率,xi(t)是t时刻路段i的的状态,NCTi是路段i畅通时的出行时间,CTi是路段i拥堵时的出行时间,k是主干道上路段的总数,m是系统状态的总数。

上式表明各状态的稳态概率乘以系统处于在该状态下主干道的出行时间,即是系统期望的出行时间。

4 算例及模型有效性分析

将上述模型应用到江苏省淮安市淮海南路从水门桥到环城路口这一段主干道上。研究的时间是早高峰中一个时间段8:00~8:30,为了获得较高的估计精度,将时间间隔定义为30秒。

4.1 系统状态及变量的定义

根据《城市道路交通管理评价指标体系》(2012版)中的有关规定,江苏省淮安市属于C、D类城市。根据3.1节中路段状态的定义及表1,应以路段的平均行程速度27km/h为阈值,对路段的状态进行划分,进而得到系统的状态。由于考察的路段是3个,系统的状态有23=8种。为了方便计算,利用二进制与十进制之间的转换关系,将系统状态对应的向量转化为十进制标量,如表3。

根据路段平均行程速度、系统状态的定义及表3的转换关系,图2对8:00~8:30共60个时间段的系统状态进行统计。

为了清晰起见,图2中给出了两个时间间隔,每60秒确定系统状态的示意图。

4.2 路段出行时间估计

通过检测器可以直接获取瞬时车速,由文献[17]可得:①,其中是空间平均速度(即平均行程速度),是经过检测点的所有车辆的瞬时速度vi的调和平均值;②,其中是时间平均速度,是空间平均速度的方差。根据上述两个公式可由瞬时速度得到空间平均速度与时间平均速度,又由两者的调和中项可估计平均速度;再结合路段的长度,可进一步对路段的出行时间进行估计。表4给出8:10~8:30各个路段在拥堵和畅通状态下的出行时间。

由于该道路是淮安市最大的一条主干道,路段1与路段2之间的交叉口是该道路上的车流量最大的一个交叉口,路段1在考察的时间段内几乎全部处于拥堵状态,故在该段时间内只能估计出拥堵的出行时间。

4.3 一步转移概率矩阵及稳态概率的计算

根据4.1节中系统状态的定义,每30秒确定各路段是否拥堵,可以确定上午8:00~8:30主干道系统状汰的一步转移概率矩阵。由于该道路是淮安市最大的主干道,路段1长期处于拥堵状态,并非所有的系统状态都出现,因此在该时间区间内,系统的状态只出现了后4种。下表5中给出了系统的一步转移概率矩阵。

从表中可以看出,经过30秒的时间间隔后,大部分状态仍然保持不变(即pii的值大于pij)。根据一步转移概率矩阵,可以计算各个状态的稳态概率,结果见表5的最后一行。

4.4 主干道出行时间估计

根据各状态下路段的出行时间及对应的稳态概率,计算主干道上期望的出行时间:

将4.1节、4.2节、4.3节中的结果代入,则可得8:00~8:30主干道上期望的出行时间是279.45秒。

将该计算方法应用到非高峰段13:00~13:30的区间段内,对同一条主干道的出行时间进行估计。表6给出了一步转移概率矩阵。

将上述结果代入式(6),可得对应的期望出行时间为220.31秒。

4.5 估计结果分析

由4.2节可知,由瞬时速度可得空间平均速度和时间平均速度,再由两者的调和中项可估计平均速度,结合路段的长度,进而估计出路段的出行时间。以上转化公式及最后的估计结果主要基于空间平均速度的计算公式:,那么出行时间的估计精度主要取决于瞬时速度的可靠性,瞬时速度要能体现交通流的变化。而瞬时速度与检测点的位置密切相关,因此,可以通过调整检测器在主干道上的分布来提高出行时间的估计精度。

通过视频检测器可以直接获得流量、瞬时速度和时间点等参数,虽然可以将时间点直接相减获得出行时间,但是时间点数据不是普遍易得的。只有具备特定的检测器才可以获得,有时也是不可得的。尤其是对于欧美等西方国家,注重保护出行者的个人隐私,时间点数据不是普遍可得的。故本文的目的是探讨由普通检测器易得的交通参数——单车的瞬时速度,应用离散时间的马尔科夫链,考虑拥堵在时空上对出行时间的影响,对道路的出行时间进行估计。

为验证估计结果的有效性,可以通过浮动车法对出行时间进行现场直接测量。为了节省直接测量的成本,本文将时间点数据作为主干道出行时间的实测值。并对高峰段8:00~8:30以及非高峰段13:00~13:30的主干道出行时间的估计结果进行误差分析,结果如表7。

从上表中可知模型的绝对相对误差均小于3%,说明该估计方法具有很高的精度。

5 小结

本文针对有若干交叉口的城市主干道,选择两个代表性的时间区间:高峰段与非高峰段,以30秒为间隔,将其划分为若干个时间段。应用离散时间马尔科夫链的方法,以路段的平均行程速度为阈值,界定道路的拥堵与畅通情况,并将各路段拥堵与畅通定义为主干道系统的状态,构造了一个无记忆性的马尔科夫随机过程。在每一个时间区间内,运用马尔科夫决策理论,对该区间段内主干道的出行时间进行估计。最后将该方法应用到江苏省淮安市某主干道上进行验证,结果表明,模型具有较高的精度。

模型的优势在于以易获取的交通流参数——单车的瞬时速度,作为模型的主要输入。该数据通过视频检测器、微波检测器等在高速公路上或主干道上均可获得,因此,该模型的估计方法具有普遍可行性。

时间差估计 第8篇

关键词:产出缺口,小波分析,降噪

产出缺口是指实际产出与潜在产出的差值占实际产出或潜在产出的比率, 它测度的是实际产量与经济中现有资源充分利用所能生产的产量之间的差额, 反映现有资源的利用程度, 其中潜在产出即充分就业时的理想产出水平。如果实际产出大于潜在产出, 就意味着总需求大于总供给, 央行就应当紧缩货币;如果实际产出小于潜在产出, 则意味着总供给大于总需求, 那么央行就应当扩张货币, 以降低有效需求不足引起的通货紧缩风险。在长期, 政策制定者须以潜在产出为基础制定货币政策, 这样才能指向可持续发展的目标, 避免经济起伏不定。

一、产出缺口方法的选择

产出缺口无法直接观测到, 唯有估算得出。近些年来, 国内外这方面讨论逐渐增多, 许多估算方法得到应用。据Konuki (2008) 指出, 目前通用的估计产出缺口方法有三类:生产函数法、单变量法和多变量法。如果把这些估计方法按照时间序列来区分, 上述三类方法可归结为两大类:直接分析数据随时间变化的结构特征, 即时域分析;把时间序列看成不同谐波的叠加, 研究时间序列在频域里的结构特征, 即频域分析。

其中时域分析的方法包括早期的线性趋势分解法、一阶差分分解法、生产函数法、结构式向量自回归 (SVAR) 法。生产函数法与结构向量自回归法对数据的要求比较高, 使用不多, 张建 (2007) 、Chow (2002) 利用该方法估算出我国的产出缺口, 这一方法要求生产函数是稳定的;郭红兵 (2010) 、赵昕东 (2008) 利用SVAR法估计我国产出缺口, 而这种方法有失业率与实际产出之间存在稳定关系为前提的假设。市场是一个日新月异的动态系统, 政策更新、经济转型、技术进步、金融创新等都会使投入产出关系变化, 这样各交叉变量间的关系将不再稳定, 将造成计算结果存在误差 (Wen and Zeng, 2005) 。

通过频域分析估算估计产出缺口的方法中常用的有HP滤波、BK滤波、Kalman滤波等。滤波方法可以将实际产出分解为趋势成分和周期成分, 其中趋势成分即潜在产出, 周期成分就是产出缺口。通过滤波的方法 (许召元 (2005) 、谢太峰 (2008) 、Gerlach&Peng (2004) 等) 计算产出缺口的文献比较多, 这一方法优势在于简单易行, 如果实际产出的分解方程与滤波混合使用将得到理论上强有力的支撑, 而且滤波方法也不要假定协方差不变。实际上, 如果把时间序列看成由不同频率的正弦波或余弦波叠加而成, 在频域上比较不同频率波的方差大小, 通过研究和比较各分量的周期变化, 分析该时间序列的频率结构与波动特征。这一方法需要以傅立叶变换为基础, 这一变换就是将时间序列从时域映射到频域的一种工具, 过程如下:

这里X (t) 表示原始时间序列形式, z表示频率。这一变换的实质是把f (x) 的波动分解成许多不同频率的规则波的叠加, 通过计算f (x) 和复指数函数e-2iπkt间的相关系数, 就可以将对原函数X (t) 的研究转化为对其相关系数F (z) 的研究。通过傅立叶变换可以求得各种滤波算子, 从而将所有频段分解为趋势成分和周期成分。与前面的一阶差分法分解趋势成分和周期成分相比, 滤波不会放大非主流信息, 因此有很强的优越性。但是这并不能掩盖该方法的重要缺陷:由时域转换到频域的过程中丢失了时域信息。如果这是一个平稳的时间序列, 变量之间的关系是稳定的, 那么这个缺陷就不重要, 但是产出缺口的估计确是要计算不稳定变量间的差值, 因此滤波方法会在计算的过程中产生误差。

这就需要寻找一种新的方法, 尽可能少地丢失时域和频域的序列特征, 时间序列小波分析方法很好的解决了上述方法的缺陷, 不仅能够在时频两域的窗口加以改变, 而且在低频部分具有较高的频率分辨率和较低的时间分辨率, 在高频部分具有较高的时间分辨率和较低的频率分辨率, 这让我们能够根据实际需要在时间精度与频率精度之间进行适当的取舍。所以本文在估计产出缺口时采用时间序列小波分析方法, 这一方法在信号降噪领域得到广泛应用, 但是在经济学中的应用尚处于探索阶段 (Crowley, 2007) , Jagric and Ovin (2004) 利用小波分析研究经济周期;国外最早使用小波方法研究产出缺口的是Scacciavillani&Swagel (2002) 和Conway&France (2000) 分别估算出以色列和新西兰的产出缺口, 而国内杨天语和黄淑芬 (2010) 利用这一方法估算出1992~2009的季度产出缺口, 纵观以上研究, 均是对年度数据或季度数据的估算, 而本文将对月度产出缺口进行估算。

时间序列小波分析估算产出缺口的基本原理是:先将实际产出自然对数序列Yt看作原始信号, 将它分离出趋势部分与周期部分, 其中趋势项是潜在产出, 周期项是产出缺口ηt, 公式表示为:

ηt为周期部分, 对产出没有长期影响, 因而可以看作是“噪声”。具体地说, 如果我们将潜在产出序列Yt*看成是一个信号f (t) , 将s (t) 看作是包含原始信号的实际产出序列Yt, e (n) 看作是周期成分或产出缺口ηt, 则上式就可以表示为一个噪声模型:

其中σe (n) 为噪声, σ为噪声强度, 当σ=1时, e (n) 为高斯白噪声。其基本原理为通过小波变换抑制噪声ηt, 以从产出Yt中提取出不可观测的潜在产出Yt*, 再计算出产出缺口Yt-Yt*, 这一过程被称为小波降噪。要实现这一过程, 需先进行小波变换, 这是一种利用小波变换实现降噪的方法, 他主要通过多级小波分解将信号分解为一个近似信号和若干个细节信号, 然后在细节信号上加以处理, 最后再把分解后的信号逐级重构回去, 就得到降噪信号了, 细节信号处理的主要使用门限滤波, 也就是细节信号中过滤掉强度小于门限值的成分。

其中, 原始信号即实际产出Yt, 而重构回的信号即潜在产出, 那么通过上述过程, 就可以计算出公式2中的潜在产出和产出缺口序列。

二、产出缺口估计

本文使用2006~2013年GDP数据, 名义GDP季度数据与同比CPI月度数据来自国家统计局网站, 并由规模以上工业增加值增长率估算出月度名义GDP;2011年及之前GDP平减指数由《2013年中国统计年鉴》中数据计算得出, 2011年之后GDP平减指数根据GDP年增长率及以2005年为基期的GDP数值计算得来, 因为GDP平减指数比CPI更精确地平减现价GDP数据, 所以本文将定基CPI月度数据作为引导序列, 使用Matlab2012a实现三次Hermite插值法把年度GDP平减指数插值为月度GDP平减指数, 然后将现价GDP换算为以2005年为基期的不变价格GDP序列。由于月度数据含有很强的季节特征, 因此先用Eviews6.0对数据进行Census X12调整, 再采用Origin8.0软件实现小波降噪的计算。

对于月度名义GDP的计算, 假设1季度2月相对于1月规模以上增加值增长率为a, 3月相对于2月的增长率为b, 并设1季度名义GDP为100, 则对1月份名义GDP通过如下公式估算:

那么, 2月、3月GDP分别为:

以名义GDP通过GDP平减指数得到实际GDP的计算公式为:

如图1为以2005年为基期的月度实际GDP与通过Census X12调整后的月度GDP, 可以看到调整后的数据更加平稳, 波动远没有调整前剧烈, 但从2008年下半年开始, 调整后的数据依然有小幅波动, 这表明当年实际经济受次贷危机影响较大, 但是依然呈现上升趋势。 (图1)

对于Census X12季节调整后的数据使用小波降噪。在具体操作中:首先, 我们考虑不同的小波基函数, 通过不同的小波基函数的特性观察降噪效果;其次, 在拓展模式中, 本文选择周期性拓展, 对于门限滤波级数的确定, 本文采用3~5级, 这是因为级数越多, 被过滤掉的细节信号就越多, 降噪也就越彻底, 有利于更深层次的信号趋势分析, 时间序列更平稳。但是, 如果级数过多, 也会出现失真的情况, 计算量也成倍增加, 因此本文采用3~5级门限滤波;再次, 对门限值, 其单位是相当于每节细节信号的百分比, 值越大, 降噪越彻底, 但如果门限值太大, 反而会把决定趋势的因素过滤掉, 所以应尽量避免结果失真的情况。

针对以上问题, 本文采用不同的小波基函数, 不同的门限滤波级数和门限值的组合对月度GDP序列降噪。由于小波基函数不是唯一的, 并且本节的研究对象是精确估算实际月度产出缺口, 因此分别试验Haar小波, 2~10阶DB小波, 以及1~3阶具有低通重构滤波的Biror双正交小波等多种小波基函数进行试验。用上述小波基函数做不同门限级数的降噪, 然后重构, 然后放弃那些重构信号明显与原信号存在差别的小波基函数。因为如果重构后信号与原信号差别较大, 那意味着经重构后得到的GDP序列与小波降噪之前的原GDP序列差别较大。

经过试验, Haar小波, bior1.1小波经降噪重构的GDP与经季度调整后的实际GDP序列的差别最小, 上述两种小波基函数计算结果与原序列的标准差值最小的是Bior1.1基函数, 所以本文应用Bior1.1, Periodic, 门限级数:5, 门限值:30%的组合, 估算月度产出缺口如图2。 (图2)

从图3可以看出, 与已有的年度、季度数据估计结果 (赵昕东, 2008;杨天宇、黄淑芬, 2010) 相比, 用月度数据估计的潜在产出波动更加频繁, 因此揭示了很多年度、季度数据估计无法显示的产出缺口, 这表明利用月度数据的产出缺口估计结果更加精细。具体来看, 从2006年1月至2013年12月, 小波降噪的月度数据产出缺口出现了21次正负值转换, 而赵昕东 (2008) 估计的1982~2006年度数据产出缺口只出现了7次正负值转换, 虽然杨天宇、黄淑芬 (2010) 利用从1992年一季度到2009年一季度的季度数据估计产出缺口估计出了22次正负值变化, 但这是超过17年的数据, 而本文只用了8年的数据, 可以看出本文的估计结果更为精确, 可以揭示出更多、更精细的经济波动。 (图3)

三、结论

具体来说, 本文的估计结果有如下特点:周期波动频繁, 时间更为精确。与年度、季度数据相比, 月度数据在同样的时间跨度下估计的产出缺口波动更加频繁, 正负值交替更多。

金融危机后, 波动周期时间更长。2010年之前, 我国产出缺口交替较为平稳, 大概9~10个月完成一次短周期, 周期不足一年;2010年之后, 周期长度变成了15~16个月, 周期超过一年。短期经济周期时间拉长, 意味着产出缺口波动频率降低, 而这一现象也存在于发达国家, 但与发达国家容易出现经济周期稳定化的特点相比, 发展中国家经济周期不稳定更加明显, 原因是发达国家的技术领先优势使得他们的产品有更强的市场支配力量和更低的价格需求弹性, 因此发达国家受需求冲击的影响较小;而发展中国家没有这样的优势, 经济容易收到世界主要大国经济波动的影响, 经济抗压能力弱, 本国没有议价能力, 因此受到冲击的概率明显上升。我国作为发展大国也存在上述问题, 却依然出现了波动周期时间变长的情况, 这就意味着经历经济危机以后, 我国社会主义市场经济更加完善, 市场调节能力上升, 宏观调控手段更加成熟, 时机把握娴熟, 国内需求扩大抵消了国际市场需求量的减少, 从而缓解了产出缺口的波动。

参考文献

[1]姚恩营.基于多尺度小波分解的时间序列预测方法研究[J].计算机时代, 2009.1.

[2]杨天宇.基于小波降噪方法和季度数据的中国产出缺口估计[J].经济研究, 2010.1.

[3]谭屹然, 石柱鲜.小波分析模型在经济领域中的应用[J].工业技术经济, 2010.12.

[4]张健, 何彬.产出缺口的生产函数法估计及经验分析[J].黑龙江社会科学, 2007.2.

上一篇:费用结算下一篇:美国新闻传媒