移动数据网络范文

2024-06-16

移动数据网络范文(精选12篇)

移动数据网络 第1篇

1 策略控制和计费 (Policy Control and Charging, PCC)

策略控制和计费 (Policy Control and Charging, PCC) 架构工作在业务数据流 (Service data flow) 级上, 其目的是将策略控制应用到通信网络资源接入和使用过程中。PCC架构将应用层级会话服务数据流的Qo S要求映射为IP接入传输网络承载级服务的Qo S要求来保障数据传输, 并根据运营商的计费策略实现服务数据流层级的计费功能。PCC架构使得运营商能够合理分配, 并有效控制网络的服务能力, 如图1。

PCC会话由PDP激活流程初始化, 每个PDP上下文映射到一个独立的PCC会话;当SGSN收到一个PDP上下文更新请求时, 并且有一个或几个事件被触发时, GGSN会向PCRF请求新的计费策略;GGSN在遇见事件被触发时, 也会发起PCRF会话请求更新;PCRF本身也会通过对GGSN发出重授权请求时发起会话更新。而PCRF会话结束也可以由SGSN、GGSN、PCRF分别发起。根据3GPP规范, 目前PCC可以支持基于用户等级的控制, 基于业务种类的控制, 基于流量使用情况的控制, 基于网络资源的控制, 结合多种条件的综合控制。

在实际运营中PCRF根据市场策略生成策略和计费控制策略 (PCC RULE) , PCRF连接BOSS制定用户和业务市场计费等策略, 并将该策略下发给分组域核心网中的网关 (GGSN/PCEF) , GGSN/PCEF执行该策略产生针对业务流的策略控制机制, 通过BSC/RNC实现无线资源动态调度管理, 如图2。

2 基于DPI/DFI流量识别技术

3GPP于2011年发布的规范TS23.203R11中, 引入了TDF (Traffic Detection Function, 流量检测功能) 逻辑功能, 支持对网络中业务流的检测和控制。对TDF逻辑实体的功能定义为:执行对业务应用的检测及向PCRF报告的功能实体, 另外也可对被检测的业务应用执行门控、重定向、带宽限制等控制功能, TDF功能的实现可由PCEF增强实现或在网络中独立部署。

DPI (Deep Packet Inspection) 称为“深度包检测”。DPI功能在国际组织3GPP所提出的PCC (策略和计费控制) 框架中有所涉及。业务识别技术是DPI的关键, 普通报文检测仅分析IP包4层以下的内容, 包括源地址、目的地址、源端口、目的端口以及协议类型, 而DPI通过数据包特征提取, 增加了应用层分析, 识别各种应用及其内容, 业务识别率比普通的报文分析要高。信令分析系统集成了DPI业务识别引擎, 可以做到对网络中如网页浏览、即时通讯、微博、P2P下载、流媒体等多种业务的识别。

DFI (Deep/Dynamic Flow Inspection) 称为“深度/动态流检测”, 基于不同的应用类型在会话连接或数据流上的状态各有不同, 可以建立流量特征模型, 通过分析会话连接流的包长、连接速率、传输字节量、包与包之间的间隔等信息来与流量模型对比, 从而实现鉴别应用类型。DFI技术进行流量分析仅需将流量特征与后台流量模型比较, DPI技术由于要逐包进行拆包操作, 并与后台数据库进行匹配对比, 因此DFI较DPI有较高的带宽管理系统的处理能力, 而DPI对业务有较高的识别能力。

3 PCC业务运营与综合管理

P C C在业务管理中可以根据话务特点、P D C H复用度、数据业务占比以及无线利用率等方面划分不同的场景, 在Qo S原有三个THP分级的基础上, 针对指定的业务等级/金银铜用户分级, 将所有业务按需求分为5级 (THP) , 并各自设置不同的资源分配权重比, 从而降低OTO对无线资源的额外空占影响。通过无线侧识别来自Gb口BSSGP消息扩展字段SCI业务分类标志和Qo S参数集中ARP参数以表征用户优先级后, 根据业务规范按照内部功能机制实现综合调度优先级ISP等级映射。表1列出不同用户级别和不同业务级别的THP定义。

通过对PCC的部署, 建立策略控制服务器PCRF SPR, 充分利用GGSN的、DPI能力, 升级GGSN具备策略执行网元PCEF能力可以对网络和业务进行综合管理。

(1) 网络流量深度运营

通过部署DPI流量识别技术, 可以识别出现网流量TOP N用户、TOP N业务流量、TOP N网站、2G/3G整体流量、P2P业务流量等多维度的分析报表, 通过分析网络上业务及流量的分布状况, 建立网络-业务-客户-终端的策略分析体系[2], 并运用DPI等业务内容深度识别手段对进行数据业务的深度运营。

(2) 基于等级管理的VIP用户保障

进行VIP保障方案的应用, 用户终端类型分布上, 同时包含2G和3G用户, 并有TD数据卡用户, 通过对负荷区进行个性化的TBFLIMIT (DL/UL) 设置, 同时结合Active TBF功能开启, 保障VIP用户在重点区域通过手机上网和数据卡或手机在线听歌或者在线观看视频, 下载时间及视频流畅度都得到提高。

(3) 基于流量识别的P2P等业务管控

基于流量识别对网络业务进行可视化分析, 由于当用户同时使用QQ、即时聊天和其他P2P业务时, 频繁的业务变更会造成PDP update消息的乒乓效应, 会使Gn接口和Gb接口的信令负荷急剧增加, 部分P2P业务大量消耗网络流量, 对客户使用正常业务产生影响, 造成网络流量的低值化[3]。因此需要对P2P业务流量占比高的热点区域进行P2P流量管理, 可以通过基于不同小区的业务模型进行精细化的TBFLIMIT设置使P2P流量整体占比降低等技术方案, 优先保障HTTP等高价值业务网速更快, 提升总体的用户网络使用满意度。在实际应用中可以对小区级别的TBFLIMIT设置功能使得每个小区可以根据实际数据业务模型进行设置。

IM业务量多的小区可以设置高的TBFLIMIT, 允许更多用户同时使用。FTP业务量多的小区可以设置较低的TBFLIMIT, 对每个用户提供更大的带宽。实现更多的用户共享, 尤其对IM业务资源共享提高尤为明显, PDCH信道承载效率提升幅度为8%, 上行TBF拥塞次数降低10%。

4 总结语

通过在现有移动分组网络中引入PCC技更加清楚了解分组业务用户的行为特征。通过合适的策略管控手段, 重点保障忙时、热点区域VIP用户的接入带宽和业务质量, 可以减少用户投诉, 提高客户满意度, 更加合理的使用当前的网络资源, 使得移动网络运营商实现网络的精细化管理。

摘要:文章介绍了移动网络PCC的架构和实施的关键技术, 并分析了在现有移动网络架构中部署PPC进行网络流量深度运营, 保障客户网络业务体验的应用。

关键词:策略控制,信令识别,业务保障

参考文献

[1]中国移动, PCRF-SPR设备规范

[2]蔡亚莉.PCC在GSM网络中的应用分析[J].电信工程技术与标准化.2011, (05) :9-12

移动网络在统计数据采集的应用论文 第2篇

进入21世纪以来,信息对人类经济社会发展的影响愈加深刻。信息的产生依赖于一组或者多组数据,它是数据的内容和解释。数据是信息的符号,作为一种社会资源,正在给人类的生活带来深远的影响。数据的收集过程,称为数据采集。大数据时代,人们更加认识到数据的重要性。我们希望更多、更快、更方便地获取跨行业的多种数据,从中提取出有价值的信息,服务于我们的社会经济发展。

1计算机技术及移动网络推动了数据采集工作的进步

上世纪80年代,计算机技术的应用已经取得了很大的发展,这也表现在数据采集方面。企业数据由人工填写在纸介质的报表上,然后通过计算机软件,录入到电脑系统里,进行数据编辑、审核、汇总、分析等一系列的信息生产。计算机技术的发展和推广使用,无疑使数据采集水平提高了一个台阶。但是,在纸介质报表、计算机软硬件和固定互联网这个技术架构下,数据采集仍然有一定的不足。首先,数据从纸介质的报表到电脑系统,有一个相对的时间滞后,从数据使用效率上仍有提升空间;其次,如果数据出现错误,必须物理上回到数据源头,进行排查,这样导致数据纠错不太方便。移动网络技术的发展,又一次推动了数据采集工作的进步。(1)移动通讯网络的建设和发展。一是网络覆盖范围广,到处都可感知到移动信号的存在。二是应用灵活。目前,大家熟知的“4G全网通”技术,使移动用户可以更随意搭配SIM卡,移动、联通与电信卡搭配使用时,任意卡槽都可选择4G网络,全网通可以使用户更随意的选择信号较好的运营商,而不必考虑通讯设备是否与之匹配。(2)手持移动数据终端设备的制造。手持移动数据终端(PDA)具有操作系统、处理器、内存、屏幕,具有硬键盘或者软键盘,可以配置扩展存储,具备数据存储处理能力,通过移动网络进行数据传输,自身有电池,可以移动使用。因为它具备一台电脑主机的基本结构,因此也叫做掌上电脑。(3)手持移动数据终端应用软件开发。各种精彩纷呈的应用软件把移动网络技术的发展成果尽情的`展现给广大用户,用户将他们自己的设备携带到工作场所,下载他们自己需要的应用程序。就数据采集软件而言,应用软件具备了数据扫描、数据录入、数据编辑、数据审核、数据简单汇总、数据存储、数据传输等功能。这样,数据采集工作就可以基于移动通讯网络、手持移动数据终端设备、手持移动数据终端应用软件以及数据处理中心组装的架构来实现。这种模式下数据采集工作不受固定互联网的地理位置限制,可以直接深入到数据调查现场,实时采集数据。

2移动网络在农业普查中的实践应用

针对经济社会的统计调查和普查,是数据采集的典型应用场景。开展的第三次全国农业普查的数据采集工作,就大量使用了移动网络技术。在第三次全国农业普查过程中,大量使用了PDA设备,每台设备配备了4G全网通通讯卡,用于调查《农户普查表》、《规模农业经营户普查表》和《农业经营单位普查表》数据,需要采集的指标共474个。普查员携带PDA入户访问,现场采集数据,现场进行数据逻辑性审核。审核通过的数据,通过安装在PDA上的普查数据采集软件上传数据功能,直接上传到省级和国家级统计机构的数据处理中心。为期3个月的数据采集调查,从使用效果来看,使用移动网络技术采集数据,可以在几个方面取得较好的效果:

2.1可以提高整体工作效率

使用PDA现场采集数据,可以使调查数据立即电子化,传输到数据处理数据库,节省了手工指标填写,再录入到电脑的工作量;

2.2可以提高采集数据的数据质量

在现场采集数据时,PDA数据采集应用程序实时对采集的数据进行现场审核。如果发现数据有逻辑性错误,程序会提示数据审核错误信息,并能很快定位到错误数据所在位置。没有通过审核的数据,是无法进行上报传输的。这样,就可以在数据源头极大的提高了数据的质量。

2.3方便使用在线帮助信息

PDA采集程序提供重要指标的填写帮助信息,审核出错时,也会提示调查人员指标填写的具体要求。

2.4调查工作灵活方便

调查人员携带PDA就可以走访,进行调查采集数据,而不必携带大量纸介质报表。

3移动网络技术架构下的数据采集工作应注意的问题

(1)数据采集人员对电子设备的使用熟练程度。对于年纪稍大、文化水平不高的调查人员来说,操作PDA设备有一定难度,对PDA应用软件的理解也有一定困难。(2)科学设计屏幕界面,提高用户体验度。当使用PDA软键盘时,更需要关注屏幕界面设计。在屏幕布局上,应尽可能多的显示调查指标,指标布局层次要清晰,显示字体要适中。使用标签栏的设计风格,是一种解决办法。(3)充分考虑数据采集终端设备的性能特点。数据采集终端设备是一个终端设备,他不能像电脑主机服务器那样,有很强的性能优势。所以,在做整体工作任务分配时,应尽可能减轻PDA端的功能,如数据分析、汇总这样的数据处理需求,虽然PDA端也可以实现,但最好应分配到主机服务器端来完成。(4)加强数据安全管理,提高数据采集安全性设计,使用科学的移动通讯安全策略。为了加强数据采集系统的安全性,MDM系统应该向应用管理延伸,逐步具备应用层的管理,即构建移动终端应用管理系统。随着移动网络技术的不断进步,使用移动通讯工具进行数据采集工作的范围必然会越来越广,就如同今天的移动互联网一样,渗透到我们生活的每一个角落。大数据时代下,利用移动网络技术,移动终端的数据采集方式,会大有可为。

参考文献

[1]孙友伟.现代移动通信网络技术,工业和信息化普通高等教育“十二五”规划教材,(04).

移动数据网络 第3篇

【摘 要】 本论文针对海量移动学习资源元数据的分散,难以检索的难题,提出基于自组织特征映射网络 ()SOM的移动学习资源元数据聚类萃取算法,该算法将传统的数据库元数据进行合理的量化处理,形成表征移动学习元数据的四元组(资源编号,科目等级,学科等级,资源相似度),并且根据用户需求,通过调整权值四元组后三个个关键字所占比例,实现扩大或者缩小范围。最终利用 Matlab以高中物理的移动学习元数据为例实现该算法的仿真,进行多赋值聚类,其聚类萃取资源的准确度较高,能够满足一般用户对该移动学习资源的需求。

【关键词】移动学习 元数据萃取 神经网络 自组织特征映射网络 ()SOM

【中图分类号】 O453【文献标识码】 A【文章编号】1672-5158(2013)07-0024-02

1 研究背景介绍

移动学习是指依托目前比较成熟的无线移动网络、因特网以及多媒体技术,学生和教师通过利用目前较为普遍使用的无线设备(如手机、PDA、笔记本电脑等)来更为方便灵活地实现交互式碎片式教学活动,以及教育、科技方面的信息交流。 [1]随着移动互联网设施基础逐步完善和移动互联网产品的层出不穷,移动学习的优点越来越被人们关注。目前国内很多家高校和公司都加入了移动学习的研究,并且取得了比较好的成果。[2][3]本论文提出的自组织神经网络算法来对移动学习元数据数据库进行高效的聚类萃取,从而使得资源更加结构化,相关性更强,方便用户检索。

2 基于自组织特征映射网络 ()SOM的元数据挖掘模型

2.1 自组织竞争神经网络的知识介绍

由于移动学习资源的数据量比较大,每个数据量包含的信息较多,并且存在学科交叉问题,故在进行移动学习资源元数据萃取分类时,必须通过对这一客观事件的反复观察、分析和比较,自形查找出其内在的规律,并且对具有内在联系特征的事物进行正确的归类。

2.2 移动学习资源元数据量化

即是建立移动学习资源元数据语义关系(同义)的知识库。移动学习资源元数据语义关系知识库,采用 WordNet的基本思想,利用关系表示词汇语义,使用同义词集代表概念,并且在概念间建立不同的关系指针,表达不同的语义关系。[4]本文提出语义知识库的结构,包含:科目编号,学科等级,<章节号——章节主要内容关键词四个部分。

2.3利用自组织竞争神经网络进行移动学习资源的元数据聚类萃取

⑴数据预处理及网络初始化

1. 数据预处理

由于进行资源聚类时,用户可能会关注与关键字密切的资源,或者更可能像搜索与该关键词相关章节内容的介绍,故该论文又设定一个元数据量化资源组的权值函数:

(0.75,0.15,0.1)1(0.5,0.45,0.15)2(0.45,0.45,0.1)3

式中 ( , )w i j表示输入层的 i神经元和映射层的 j神经元之间的权值

⑷选择和权值向量的距离最小的神经元

计算并选择是输入向量和权值向量的距离最小的神经元,如: ( )d j为最小,称其为胜出神经元,记为 *j,并给出其邻接神经元集合。

⑸权值的学习

胜出神经元和位于其邻接神经元的权值,按下式更新:

⑹是否达到预先设定的要求

如达到要求则算法结束;否则,返回到步骤(2)。进行下一轮的学习。

3 仿真结果及算法评价

由上表可以清晰的看出:组1为 (1, 2,3),组4为 (4),组10为(5),组30为 (6),组36组 (7,8, 9,10),40组 (11)。其分组的正确率高达:85.1%。

由上述的仿真结果,该论文得出结论改进后的自组织竞争神经网络算法能够进行有效的自适应分类,从而高效的进行关键字元数据萃取的功能。但它仍存在一些问题,第一,学习速度的选择使其不得不在学习速度和最终权值向量的稳定性之间进行折中;第二,有,一个神经元的初始值向量离输入向量太远以至于它从未在竞争中获胜,也从未得到学习,这将形成毫无用处的“死”神经元。

4 结束语

目前,很多高校和公司开发出了移动学习(尤其是智能手机)的应用软件,并且提出较好的处理移动学习资源的处理方法[6],为用户的碎片式学习和随时随地学习提供了一个良好的环境。本论文提出的算法,很适合应用在这些碎片资源和微型学习资源的萃取,并且可以为这些应用系统或软件提供大量的聚类资源,从而使得用户能够获得更好的用户体验。

参考文献

[1] http://baike.baidu.com/view/3003454.htm百度百科 移动学习2012-12-7

[2] 叶成林 徐福荫 许骏 移动学习研究综述 电化教育研究 2004 No.3

[3] 陈伟超 国内移动学习研究现状及发展建议[J].中国电力教育,2009 No.9

[4] 词汇语义知识库浅述 刘兴林 福建电脑 2009 No.9

[5] MATLAB神经网络应用设计 张德丰 机械工业出版社 2009-01-01

移动数据网络 第4篇

目前, 世界上关于移动数据通信系统的研究和开发工作正在如火如荼地进行。全球移动数据通信网络运营商已超过50家, 各发达国家和各大电信运营商、制造商都开始致力于移动数据通信业务的发展。未来移动数据通信业务将呈现多样化发展的特点。在第二代GSM和CDMA网络向第三代网络演进的过程中, 目前研发与应用主要集中在使用无线信道进行高速数据传输上, 最引人注目的就是数据技术的引入和发展。如GSM网络通过采用GPRS技术, 数据最高速率可达115kbps, CDMA网络演进到CDMA20001X阶段时数据速率可达144kbps, 而马上开始商用的第三代移动通信系统IMT-2000, 最高速率可达2Mbps, 预计以后可达10~20Mbps, 欧洲正在研发155Mbps的未来移动通信系统。2002年12月9日, 由中国大唐公司自主研发的符合TD-SCDMA标准的第三代移动通信设备和终端一次性通过了第二阶段52项指标的测试 (以数据业务为主) 。2003年1月9日, 中国联通的CDMA20001X网络在上海测试完毕, 现已在多个大中城市正式对用户开通。

当前, 虽然通用的CDMA移动数据通信系统、设备和终端的研究和开发很多, 但针对配电自动化、交通监控与信息发布、银行卡服务、工业数据采集、环境检测等具体应用、独立研发的基于CDMA公用移动通信网络的移动数据通信系统还不多见。

以移动数据通信业务的高速发展和联通CD-MA20001X网络建成为契机, 在广泛了解国内外移动数据通信研发和应用现状、深入研究相关数据通信技术的基础上, 本文提出了一种“基于CDMA网络的移运数据通信系统”。

2 系统特点

2.1 成本低廉、尤其在通信网络的规模比较大时更为明显:

首先是建设投资小, 网络建设中省去了大量的组网投资;其次是维护、运行费用低, 网络运行过程中只需承担少量的终端维护费用;虽然需要支付一些数据通信使用费, 但就目前的资费水平和网络规模估算, 单就运行和维护费用一项的节省就足以对其进行补偿。

2.2 网络组建的灵活性和方便性:

由于网络的基础设施已经十分完善, 通信系统的组建只需要考虑中心站和外围布点的问题。在外程服务 (Multi-Thread Server MTS) 模式下, 由多个会话共享通一个Oracle服务进程。

9i以后, 通过设置PGA_AGGREGATE_TAR-GET参数, 使所有会话的工作区的大小都自动分配。同时, 所有*_AREA_SIZE参数都会失效。任何时候, 实例中可用于工作区的PGA内存总数都是基于参数PGA_AGGREGATE_TARGET的。工作区内存总数等于PGA_AGGREGATE_TARGET的值减去系统其他组件 (如分配给会话的PGA内存) 围布点时可以充分地享受无线网络带来的地点选择上的自由性和移动通信网络的较全面的覆盖范围。在大部分地区, 基本上可以不考虑布点的限制, 甚至支持可移动的站点。对于复杂、易变, 站点位置经常性变化的网络 (城市改造、用户变更等) , 无线网络布点不受限制这一点更表现出它的优越性。

2.3 地域范围和网络密度的适应性:

目前, CDMA移动网的基站在城市中的密度大, 而在乡村中则相对较小, 正好满足在城市通信终端数量大、密度高而在乡村数量少、密度小的要求。因此, 基于CDMA网络的移动数据通信系统在地域范围和网络密度方面没有问题。

2.4 数据业务适应性:

目前的CDMA移动网络能支持多种丰富多彩的数据通信业务, 因此基于CDMA网络的移动数据通信系统完全能满足各种数据应用对通信的要求。

2.5 系统安全性高:

系统采用了多种措施来提高安全性。首先, 终端每一次登录网络之后都要向管理系统发送经过加密的唯一终端标识号, 经终端管理系统确认的终端才可以进入系统;其次, 终端在进行数据传输时采用空中加密和应用层加密进行两次加密;再次, 前置机可以通过IPsec或GRE隧道与CDMA移动网络建立联系。

3 系统构成

用户数据设备、数据采集设备或数据集中设备 (如银行ATM/CDM机、POS机, 电力系统中的TTU、FTU、多功能电能表等) 。无线数据传输终端 (WDT) 。CDMA网络。前置机 (FE) 。前置机的数据中继设备或中继网络, 包括移动专线、有线中继器或Internet等。终端管理系统。用户数据中心的数据处理系统。数据库服务器。

整个系统依托于中国联通的CDMA网络公用移动通信网络。

4 系统体系结构

基于CDMA网络的移动数据通信系统主要采用一对多的树型体系结构, 即一台前置机负责转集和转存分布在一定区域范围内的多台无线数据传输终端传送的来自具体应用数据设备或数据采集设备的数据, 所有前置机和终端都由一个终端管理系统负责管理, 所有终端和前置机收集来的数据都传送到数据中心由同一个数据处理系统进行处理。

的内存消耗。

在专有服务模式下, 推荐使用PGA_AGGRE-GATE_TARGET。

PGA_AGGREGATE_TARGET的取值范围是10M~ (4096G-1) bytes。

对于PGA_AGGREGATE_TARGET大小的设置, Oracle提供了一个以下建议方案:

·对于OLTP系统, PGA_AGGREGATE_TAR-GET= (物理内存大小*80%) *20%

5 系统工作模式

基于CDMA网络的移动数据通信系统支持两种模式的数据传输过程:轮询方式和主动上报方式。轮询方式的可控性较强, 用于实时性要求不高的应用。在轮询方式下, 用户数据中心的数据处理系统发出数据收集指令, 前置机接收并解析数据收集指令, 然后通过查找对应的无线数据传输终端的Socket, 并将数据收集指令转发给相应的终端。终端完成数据收集并将数据通过移动网络发送给前置机, 然后由前置机将数据转发给中心数据处理系统。终端管理信息的收集过程与数据传输过程类似。主动上报方式则主要用于满足用户数据信息和终端管理信息传输的实时性要求。在主动上报方式下, 数据由终端定时或以事件驱动方式收集数据并将数据通过移动网络发送给前置机, 然后由前置机将数据转发给数据处理系统。终端管理信息的收集过程与数据传输过程也类似。

6 系统各部分的功能与特性

6.1 无线数据传输终端 (WDT) :

(1) 基本功能:主动上行呼叫点到点透明数据传输、被动接受呼叫点到点透明数据传输、支持参数配置模式和数据传输模式选择、主动上行短消息数据、短消息广播数据、电路交换数据 (GSM) 、分组包交换数据、无线IP网络数据、一直在线、故障自动重启。 (2) 扩展功能:前置机开放端口自动搜索、自检与告警输出、远程软件升级与维护、配置键盘和LCD显示器方便用户交互。

6.2 前置机 (FE) :

(1) 基本功能:解析中心站数据收集指令以收集所辖区域内的无线终端传送来的数据、分析终端管理系统发送来的终端信息收集指令或终端配置指令、通知终端完成信息的收集或参数配置、接收与终端管理系统相关的终端信息、控制前置机与终端之间、前置机与中心站之间的通信过程、负责将用户数据发送至中心站进行处理、将终端信息发送给终端管理系统以实现相关的终端管理功能。

(2) 扩展功能:

主备用前置机自动切换、终端管理系统功能支持。

6.3 终端管理系统 (TM) 的基本功能:

终端配置管理、终端性能检测与分析、终端故障管理、前置机及终端费用管理由于CDMA公用移动网络终端按照接收和发送数据包的数量来收取费用。

·对于DSS系统, PGA_AGGREGATE_TAR-GET= (物理内存大小*80%) *50%

例如, 你的系统是一个OLTP系统, 物理内存为8G, 那么推荐PGA_AGGREGATE_TARGET设置为 (8*80%) *20%=1.28G。

“实例一”PGA_AGGREGATE_TARGET参数的配置视图 (如图4)

摘要:以移动数据通信业务的高速发展和联通CDMA20001X网络建成为契机, 本文提出了一种“基于CDMA网络的移动数据通信系统”。该系统以中国联通公司CDMA20001X公用移动网络平台为基础, 能广泛地应用于各种领域, 可以为多种实际应用提供高带宽、低收费的数据通道, 实现数据信息的透明传输。

移动数据网络 第5篇

为加强移动综合网管系统和网络优化支撑系统基础数据(配置数据)管理,确保省级和总部移动综合网管系统和网络优化支撑系统基础数据完整、准确,满足对于移动网运行维护管理和指标考核的需要,特制定本管理办法。管理职责

2.1 总部

负责制定移动网络基础数据管理及考核办法;组织检查、监督、指导省分公司移动网络基础数据管理工作的执行情况和考核工作。

2.2 省分公司

贯彻执行网络分公司有关基础数据管理工作的方针、政策,负责制定本省移动网络基础数据管理办法及考核办法;组织检查、监督、指导省内各地市分公司移动网络基础数据管理工作的执行情况和考核工作。

省公司需制定本省基础数据相关管理、考核办法,明确基础数据保障内容、保障措施和工作要求,为地市分公司做好数据保障工作提供有效地指导和帮助,确保数据准确性保障工作落实执行到位。

省分公司需加强对地市分公司对基础数据维护管理的月度考核、日常网络数据核查分析、现场抽查考核。

省公司需安排相关人员或地市分公司进行基础数据自动采集和人工录入、更新、删除等操作,并按照总部相关要求及时完成部省接口数据上报。管理范围

移动综合网管系统和网络优化支撑系统基础数据管理范围为:MSC、MSS、MGW、BSC、BTS、CELL、RNC、NODBE、UTRANCELL、HLR、SGSN、GGSN、GMSC、TMSC、HSTP/LSTP等。

本办法中所指的基础数据指以上网元在移动综合网管系统和网络优化支撑系统中需要分公司自动采集及手工维护的所有网元基础数据。

基础数据属性管理范围包括:

 总部最新下发的《中国联通GSM/WCDMA无线网络持续性优化管理制度》要求管理的内容;

 移动综合网管系统和网络优化支撑系统技术规范、部省接口规范和OMC北向接口规范中所要求管理的内容。基础数据管理

4.1 基础数据基准

基础数据基准:基础数据基准为《中国联通移动网络基础数据管理办法》正式下发之日起现网中的各类网元;移动综合网管系统与网络优化支撑系统的基础数据应与现网中各类网元基础数据一致。

4.2 基础数据变化管理

4.2.1 网元数量变化

4.2.1.1 新入网网元  范围

新入网网元为新割接入网的本管理办法范围要求的所有网元。 数据上报

新入网网元割接入网前,当发生主设备OMC上的预做网元数据,并同步至移动综合网管系统和网络优化支撑系统时,需标识为新增网元工程状态。

新入网网元割接入网,需同时完成省级移动综合网管系统和网络优化支撑系统的接入,基础数据确保完整和准确。网元状态需由新增网元工程状态转换为现网运行状态,未接入移动综合网管系统或网络优化支撑系统视为割接未完成。

省级移动综合网管系统和网络优化支撑系统在接入24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报,基站经纬度信息上报需准确可靠。

新入网网元割接入网一个月内需在省级移动综合网管系统或省级网络优化支撑系统中完成固定资产编码录入,并通过系统间接口同步,在各自系统中完成部省接口上报。

4.2.1.2 退服网元  范围

退服网元包括现网已纳入到移动综合网管系统和网络优化支撑系统管理范围即将退服的所有网元。

 数据上报

网元退服割接完成,省分公司需同时将移动综合网管系统和网络优化支撑系统退服网元状态修改为退服状态。

网元退服割接完成72小时内,省分公司需在主设备OMC内多余的垃圾数据清理完毕。

省级移动综合网管系统和网络优化支撑系统基础数据信息变更24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报。网元退服后在移动综合网管系统和网络优化支撑系统中网元信息至少保留三天,并在部省接口中连续上报三天。

4.2.1.3 网元搬迁及重归属  范围

网元搬迁及重归属包括现网已纳入到综合网管系统和网络优化支撑系统管理范围的所有网元,进行搬迁、重归属操作。

 数据上报

网元搬迁及重归属入网割接完成,省分公司需同时完成省级移动综合网管系统和网络优化支撑系统的接入,基础数据确保完整和准确。

需要重新录入新网元(网元dn变化),对已纳入主设备OMC管理准备搬迁及重归属入网的新录入网元基础数据标识为搬迁工程状态;网元搬迁及重归属割接完成后,省分公司需立即将移动综合网管系统和网络优化支撑系统原网元的状态修改为搬迁退服状态。

不需要重新录入新网元,对已纳入主设备OMC管理准备搬迁及重归属入网的网元基础数据在搬迁过程中标识为搬迁工程状态。

正式割接入网后,立即将搬迁工程状态重新标识为现网运行状态。基站搬迁及重归属操作中如基站经纬度信息发生变更时,需立即在移动综合网管系统和网络优化支撑系统中完成经纬度信息更新,确保经纬度信息准确可靠。

如果主设备OMC产生垃圾数据,网元搬迁及重归属割接完成72小时内,省分公司需将多余的垃圾数据清理完毕。

省级移动综合网管系统和网络优化支撑系统基础数据信息变更24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报。

4.2.1.4 网元替换  范围

网元替换包括替换入网的所有新入网网元,及现网纳入到综合网管系统和网络优化支撑系统管理范围的所有即将被替换掉的网元,进网元替换操作。

 数据上报

网元替换入网割接完成,省分公司需同时完成省级移动综合网管系统和网络优化支撑系统的接入,基础数据确保完整和准确。

已纳入主设备OMC管理准备替换入网的网元基础数据状态标识为替换工程状态。

正式割接入网后,立即将替换工程状态重新标识为现网运行状态。网元替换割接完成后,省分公司需立即将移动综合网管系统和网络优化支撑系统替换退服网元的状态修改为替换退服状态。

基站替换时新入网基站需立即在移动综合网管系统和网络优化支撑系统中完成经纬度信息录入,确保经纬度信息准确可靠。如果主设备OMC产生垃圾数据,网元替换割接完成72小时内,省分公司需将多余的垃圾数据清理完毕。

省级移动综合网管系统和网络优化支撑系统基础数据信息变更24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报。

网元替换割接完成一个月内需在省级移动综合网管系统或省级网络优化支撑系统中完成固定资产编码录入,并通过系统间接口同步,在各自系统中完成部省接口上报。

4.2.1.5 改造扩容及信息变更  范围

网元改造扩容及信息变更包括现网纳入到综合网管系统和网络优化支撑系统管理范围的所有网元,进行网元改造、扩容、版本升级、信息变更操作。

 数据上报

网元改造扩容及信息变更后,省分公司需立即完成省级移动综合网管系统和网络优化支撑系统的接入,基础数据确保完整和准确。

网元改造扩容及信息变更时,移动综合网管系统和网络优化支撑系统中网元状态应调整为维护工程状态,网元改造扩容及信息变更结束后,应在移动综合网管系统和网络优化支撑系统中立即将网元状态调整为现网运行状态。

改造扩容时如基站经纬度信息发生变更,需在移动综合网管系统和网络优化支撑系统中立即完成经纬度信息更新,确保经纬度信息准确可靠。

省级移动综合网管系统和网络优化支撑系统基础数据信息变更24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报。

4.2.2 网元状态管理

4.2.2.1 网元状态

本管理办法范围要求的所有网元在移动综合网管系统和网络优化支撑系统中网元基础的网元状态字段需标识为以下九种情况:

 现网运行状态:网元割接入网后在网正常运行,标记为现网运行状态。

 新增网元工程状态:已纳入主设备OMC管理的首次入网网元,且在未正式割接入网前,标记为新增网元工程状态。 搬迁工程状态:已纳入主设备OMC管理的搬迁及重归属入网网元,且在未正式割接入网前,标记为搬迁网元状态。 替换工程状态:已纳入主设备OMC管理的替换入网网元,且在未正式割接入网前,标记为替换工程状态。 维护工程状态:由于网元版本升级,短期无法承载业务,标记为维护工程状态。

 退服状态:永久退出现网服务,不再承载业务。 搬迁退服状态:由于网元搬迁或重归属,造成需重新录入新网元信息记录,将原网元状态标记为搬迁退服状态。 替换退服状态:由于网元替换,引起退服,不再承载业务,标记为替换退服状态。

 暂时关闭状态:网元由于外界因素,如物业等问题需暂时关闭,短期内无法承载业务,标记为暂时关闭状态。4.2.2.2 网元状态变化

本管理办法范围要求的所有网元在移动综合网管系统和网络优化支撑系统中网元基础的网元状态迁移见下图:

新增网元工程状态割接入网后现网运行状态割接退服后退服状态

图1 入网退服状态变化图

搬迁过程中搬迁工程状态搬迁结束割接后现网运行状态搬迁后的退服网元搬迁退服状态(a)不需要重新录入新网元状态变化图

现网运行状态搬迁结束割接后搬迁工程状态

(b)需要重新录入新网元状态变化图

图2 网元搬迁及重归属状态变化图

替换工程状态替换割接后现网运行状态替换后的退服网元替换退服状态

图3 网元替换状态变化图

搬迁工程状态设备重新运行承载业务后维护工程状态设备问题短时间内无法承载业务现网运行状态外因造成短时间内无法承载业务设备重新运行承载业务后设备搬迁暂时关闭状态退服后退服状态 图4 网元异常变化图

4.2.2.3 网元状态变化要求

网元状态发生变化时,在移动综合网管和网络优化支撑系统中必须有相关详细操作日志。

网元状态发生变化24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报。

4.2.3 网元基础信息字段管理

网元基础信息字段变化包括各类网元基础数据信息发生变更(包括新增、删除、改变)及版本更新等

网元基础信息字段变化需要移动综合网管系统和网络优化支撑系统有相应的变更日志,信息变更日志将作为基础数据核查的依据。

网元基础信息字段变化24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据上报。

4.2.4 部省数据更新及系统间一致性管理 省级移动综合网管系统和网络优化支撑系统中网元基础数据信息变化24小时内,需完成移动综合网管系统和网络优化支撑系统部省接口基础数据的上报。

省级移动综合网管系统和网络优化支撑系统中网元状态变为退服状态、搬迁退服状态、替换退服状态后,网元信息及网元状态需在省级系统中至少保留三天,并上报总部系统。

省级移动综合网管系统和网络优化支撑系统通过部省接口上报的各类网元基础数据的更新(例如增加、删除、变更)需与主设备OMC保持一致。

省级移动综合网管系统和网络优化支撑系统通过部省接口上报的网元基数量需与省级系统保持一致。

省级移动综合网管系统和网络优化支撑系统通过部省接口上报的字段信息需满足部省接口规范要求的字段,保持信息完整、准确。

省级移动综合网管系统与网络优化支撑系统各类网元数量及各类网元相同基础信息字段需要保持一致,并与主设备OMC保持一致。

省级移动综合网管系统与网络优化支撑系统各类网元状态需要保持一致。附则

“移动”中的统计数据 第6篇

统计数字一向被视为国家经济社会发展的“发言人”,是公众了解国家发展整体走向的“第一数据”。一直以来统计数据都是政府和企业关心的焦点,但与公众存在一定的“距离感”,这一方面体现在国家发布的数据一般都较为宏观,另一方面则体现在统计数据较为专业,导致公众对统计数据的理解力不足。近年来,依托于智能终端的“移动统计”逐渐兴起,统计作为国家数据发言人,率先尝试与试水“移动”浪潮。各国统计部门纷纷借助移动互联网提供与统计有关的移动应用程序,统计数据不再高高在上,普通大众可以从智能终端上更便捷地获取统计信息。

统计移动APP应用是基于对统计数据资源的再利用,统计局作为国家数据资源的“发言人”和“所有者”,对其掌握的数据资源进行再利用,开发建设专业性较强的移动APP,将对政府和社会经济发展起到积极的作用。为了进一步了解各国统计部门的移动APP建设和推广情况,笔者对美国、英国、新加坡、加拿大、澳大利亚、印度、中国及中国香港等国家和地区的统计政务APP进行了简单的调查分析。结果显示,截止到2013年9月底,在上述国家或地区中,美国、澳大利亚、中国推出了统计APP应用,英国提供了基于网页的UK data explore测试版本,中国香港推出了统计数字移动门户网站。目前这些移动统计APP全都是免费的,充分体现了政府“以公众为中心”的服务理念。从APP的可用度来看,APP的可用度与统计部门的数据开放程度有关,数据开放度和颗粒度越高,移动统计APP可用性就越高。

美国的移动统计

美国统计工作是由政府各部门和有关业务部门负责的分散型统计管理体制。美国官方统计机构多达70多个,分散在12个部门和其他机构,其中以商务部商务普查局、商务部经济分析局、劳工部劳工统计局、能源部能源信息管理局、农业部农业统计局和卫生部卫生统计中心6个部门工作最为重要。其中,商务普查局和劳工统计局分别推出了America's Economy和Labor Stats两款移动统计应用。

America's Economy

America's Economy由美国商务调查统计局(US Census Bureau)于2012年9月推出,目前相对较为成熟,能提供英语、汉语等多种语言。该应用程序的主要特点是可以利用手机随时获取美国经济指标相关信息,并为每个指标提供了详细的页面说明。为了更好地与公众进行互动,该应用还提供了各指标的预期发布日期,为用户提供通知、评论以及自定义视图等多项功能,并可以在Facebook、Twitter等社交媒体上进行转发与共享。利用该程序,可以及时把握美国经济发展脉搏,实时了解商务统计局、劳工统计局和经济分析局公布的19个主要经济指标,涉及就业、制造业、国际贸易、零售和住宅建设等内容。2013年7月对版本进行了更新,并增加了劳工局消费者价格指数、生产价格指数等新的经济指标。

在系统兼容性方面,America's Economy兼容性较强,提供了iOS和Android操作系统的移动手机与平板电脑下载终端;在获取便捷度方面,该应用的获取渠道较为多样化,可以通过Apple应用商店、Google play应用商店以及美国政府门户网站提供的政府移动应用界面下载“Mobile Apps Gallery”(http://apps.usa.gov/americas-economy.shtml)。其中,在Apple应用商店里,America's Economy位于“商业”分类下,下载量已经达上万次。

Labor Stats

在奥巴马政府“将公共服务搬上手机”口号的号召下,美国联邦政府部门纷纷围绕业务职能推出移动APP,Labor Stats就是在该背景下由美国劳工统计局(Bureau of Labor Statistics)于2012年3月推出的免费移动APP服务。美国劳工统计局作为一个独立的联邦统计机构,负责收集、整理、分析、发布劳动经济方面的重要统计数据,为各级政府部门制定经济和社会政策、为工商界和劳工组织决策提供劳动统计信息。Labor Stats应用提供了美国劳工部就业和培训管理(ETA)以及劳工统计官方发布的最新数据,涉及CPI、失业率、平均每小时收入、PPI、ECI等内容。

在系统兼容性方面,Labor Stats提供了iOS和Android操作系统的移动手机终端应用;在获取渠道方面,Labor Stats同样可以在Apple应用商店、Google play应用商店,以及美国政府门户网站上进行免费下载(http://apps.usa.gov/labor-stats.shtml)。该程序在Apple应用商店中位于“参考”分类,在Google play中位于“商务”分类。由于Labor Stats推出时间较晚,仅提供英语版本,在Google play上的下载量只有上千,评价得分仅为2.6,与America's Economy的上万下载量和3.9评价得分存在较大的差距。

澳大利亚的移动统计

ABS Stats是由澳大利亚统计局于2012年推出的移动应用程序,目的是为公众提供基于手机的“移动”统计,主要提供包括CPI、GDP、失业率等在内的33项关键经济指标,以及最新的人口统计数据。该应用在2012年获得了澳大利亚“2013年电子政务服务提供最卓越奖”。在系统兼容性方面,ABS Stats只提供了基于iOS操作系统的移动手机和平板电脑等下载终端,并不兼容Android操作系统;在获取渠道方面,用户可以在Apple应用商店或者澳大利亚政府门户网站中的App应用(http://www.abs.gov.au/websitedbs/D3310114.nsf/Home/Mobile)中免费下载。在Apple应用商店中位于“参考”分类。

nlc202309030937

中国的移动统计

早在2011年2月,国家统计局就发布了“中国统计”手机客户端,成为国内第一个“尝鲜”政府移动APP的国家部委。2012年,以动态图标方式展示国民经济和社会发展变化的“数据中国”客户端也正式亮相。2013年5月,依托于微信第三方平台的“统计微讯”正式上线。

“中国统计”

“中国统计”依托中国国家统计局庞大的数据和信息资源,向用户提供中国官方统计的即时资讯,包括统计数据动态、统计数据发布,以及统计热点问题和指标解释等栏目,使公众能第一时间获取中国经济发展情况,了解中国政府统计的工作及发展。在Apple应用商店中位于新闻类别,兼容性较强,目前为止已经提供了两个版本,2012年12月进行了改版升级,更加稳定。

“数据中国”

“数据中国”是国家统计局发布的国民经济主要指标数据库应用客户端,采用动态图表方式展示中国国民经济和社会发展变化情况,供媒体、投资者、市场研究机构及个人及时查询了解国家统计数据。数据范围涵盖GDP、CPI、工业、房地产等16个专业270多个指标,包含年度数据和季度、月度等进度数据,并提供了多年的历史数据。在Apple应用商店中位于新闻类别。

“统计微讯”

国家统计局于2013年5月16日推出其官方政务微信平台——“统计微讯”。用户只需在手机微信的公共账号里添加“统计微讯”就能看到最新、最快、最权威的统计数据。“统计微讯”充分利用微信公众平台发布功能,以丰富的多媒体形式、亲切的语言打造“数据速递”、“指标解读”、“统计入门”、“统计观点”等栏目,第一时间发布权威统计信息,及时解答广大微信“好友”的提问。目前已经以群发形式发布了规模以上工业增加值、固定资产投资、房地产开发投资、民间固定资产投资、社会消费品零售总额、50个城市主要食品平均价格变动情况等最新统计数据,并陆续推送了统计基础知识、最新统计资料推介以及统计法释义等内容。

目前来看,国家统计局 “中国统计”、“数据中国”两个APP保持了高频率的更新,前者侧重发布各类文字信息,后者则以动态图表为主。“中国统计”涉及的内容较为丰富,包括“新闻”、“数据”、“解读”、“指标” 、“发布日程”等多个方面,几乎每个工作日都有新的内容发布。相对而言,“数据中国”的数据更新较少。“统计微讯”具有信息主动推送功能。比较“中国统计”、“数据中国”和“统计微讯”,发现三者之间呈现出互补的关系,目的是为用户提供更好的“移动”统计服务。前两者更多的是国家统计局数据发布平台,使用者需要下载该应用程序并主动获取信息,而“统计微讯”则可以根据最新经济动态将经济热点等有关信息主动推送到用户端,交流互动性更强,服务更加人性化和主动化。

编辑:单之卉 / 邮箱:szh@bjstats.gov.cn

移动数据网络 第7篇

GSM作为第2代数字移动蜂窝通信系统, 在全世界范围内已经得到了广泛的应用。为了满足人们对数据业务的需求, GSM系统引进了EDGE (增强型数据速率GSM演进) 技术[1]。为了最大限度地利用现有的GSM网络, EDGE和GSM共用收发信机。为了提高无线传输速率, EDGE调整方式为8PSK (八移相键控) , 其平均发射功率比原有GMSK (高斯最小频移键控) 调制方式低2~5 d B。当小区BCCH频点上启用EDGE功能时, 其平均发射功率降低, 必然对基站的覆盖范围造成影响。本文主要研究BCCH (广播控制信道) 频点开启EDGE功能后对覆盖的影响。

1 EDGE及调制技术

采用EDGE技术的目的是为在现有GSM系统中提供更高的比特率。为了提高比特率, EDGE技术采用了一种新的调制方法, 即最先进的多时隙操作和8PSK调制技术。8PSK调制为多电平调制方式, 将现有GSM网络采用的GMSK调制技术的信号空间从2扩展到8, 从而使每个符号所包含的信息是原来的3倍。

GMSK是恒包络调制, 8PSK是非恒包络调制, 因此8PSK对线性放大器的要求远高于GMSK, 8PSK平均功率低于峰值功率[2]。当EDGE收发信机在发送8PSK调制信号时, 必须降低其平均发射功率, 即比采用GMSK调制方式时的平均功率降低2~5 d B。GMSK调制的平均发射功率与8PSK调制的平均发射功率之间的差叫做APD (平均功率差) 。表1列出了某厂家不同载频在两种调制方式下的功率。

MS (移动台) 空闲状态下一般与驻留的小区同步, MS在测量驻留小区的覆盖电平时仅测量BCCH频点单个时隙的电平, 因此, 此时网络覆盖不受是否启用EDGE功能影响。

MS在连接模式下将根据系统消息获得相邻小区的列表和邻区BCCH的频点, MS根据邻区BCCH频点进行邻区电平的测量。为了使手机能够测量到邻区BTS (基站收发信机) 的信号, GSM系统小区的BCCH频点必须一直保持所有时隙最大功率发射, 其输出功率是恒定不变的。但目前, 在现网中普遍存在BCCH频点承载数据业务信道的情况:BCCH频点不跳频, 主载波 (承载BCCH的载频) 设置PDCH (分组数据信道) 信道;BCCH频点参与跳频, 跳频序列中有载频承载PDCH信道。当BCCH频点承载数据业务并启用8PSK调制时, BCCH频点的发射功率就会下降。当MS在通话中, 需要切换至开启EDGE功能, 并且BCCH频点配置数据业务信道的小区时, 由于邻区BCCH频点总功率的降低, 就会造成MS对邻区电平的测量值变小。切换中目标小区电平如果降低的话, 必然会造成切换滞后, 甚至是切换目标的改变。切换滞后或切换目标的改变, MS无法占到最好的小区, 造成用户感知的网络覆盖下降。

3 验证和结果

为了验证BCCH频点开启EDGE功能后对切换的影响, 我们采用了如下的方法:

1) 选取郊区基站, 市区基站密集程度较高, 不容易体现切换滞后的情况;

2) 调整载频类型, 采用APD功率最大的TRAG载频 (APD的值为4.7 d B) ;

3) 选取切换关系相对较少的小区;

4) 验证切换地点的改变以及切换时目标小区电平变化。

通过宿迁地区的郊区站进行验证, 测试如图1~4所示。主被叫手机占用塘湖玻璃厂2的信号沿路向曹集3小区方向行驶, 主被叫手机均由PBGT (功率预算) 切换切到曹集3小区。图1和图2为曹集3的BCCH频点在GMSK调制方式下的切换位置点。图3和图4为曹集3的BCCH频点启用EDGE功能, PDCH在8PSK调制方式下的切换位置点。通过对比明显切换迟滞, 从电平看覆盖也有所降低。

结论:

1) 当BCCH频点使用8PSK编码时会导致发射功率下降, 因此造成了目标小区电平较未开启EDGE功能时低;

2) 开启EDGE后, 发生切换的地点明显要滞后于未开启EDGE时的切换地点, 且切换时的电平也存在降低的现象。

从上述情况可以看出, 在BCCH频点上启用EDGE功能后作为切换目标的小区, 其切换会较正常情况下滞后, 对于一些切换单一或是无线环境变化较快的情况下, 容易造成切换失败甚至是掉话等网络问题, 造成客户感知网络覆盖的变差。

4 结束语

GSM规范协议要求BCCH载频的APD的值应小于2 d B[3]。现网中BTS中的配置, 有可能发生以下情况:BCCH频点的GMSK和8PSK之间的功率差有可能大于2 d B, 此时可以设置EDGE小区的BS_TXPWR_MAX (基站最大发射功率) , 降低GMSK输出功率, 满足协议的要求。不过, 此时小区覆盖也会受到影响。因此, 在这些情况下, 建议避免在BCCH频点上开启EDGE功能, 即BCCH载频不开启EDGE功能并且不跳频, 或者BCCH频点参与跳频序列的载频不开启EDGE功能。

参考文献

[1]韩斌杰.GSM原理及网络优化[M].北京:机械工业出版社, 2002.88-104.

[2]GSM0 5.08 version 5.3.0, Digital cellular telecommunications system (Phase2+) ;Radio subsystem link control[S].

移动数据网络 第8篇

1 移动通信网络优化与数据挖掘技术

1.1 移动通信网络优化

移动通信主要指的是通信的双方至少有一个处在移动状态的通信。一般而言, 移动通讯系统主要包括移动台机即MS、网络子系统即NSS、基站子系统即BSS以及操作和维护子系即OSS构成。

而移动通信网络优化主要指的是对正在运营的网络进行参数的调整和数据分析, 进而找出影响网络运行的因素并通过某种技术手段使网络达到最佳的运行状态的一种方法。移动通信网络优化主要包括两个方面的内容, 即无线网络优化以及交换网络优化。一般而言, 移动通信网络优化是一个长期的过程, 主要移动网络存在, 便存在网络的优化。

1.2 数据挖掘技术

数据挖掘技术作为一种新型的科学技术是随着网络信息技术的发展而发展起来的。它主要指的是对大量的数据信息进行分析和处理并找到数据之间的内在的联系, 进而得到有价值信息, 为科学的决策提供必要的依据的一种科学技术。在具体的实践当中, 应用不同的数据分析的工具, 可以对现有的数据及数据模型进行有效的分析, 进而从中找到数据之间潜在的联系, 并进行相关的预测。

根据上文对数据挖掘技术的分析, 其关于数据分析的方法主要包括以下几个方面内容:1关联分析法, 利用这种方法可以发现给定数据之间的联系, 即找出其关联性;2序列分析法, 该方法和关联分析法相似, 但是和其相比, 序列分析法更加侧重于对给定数据之间先后关系的分析;3分类分析法。这种方法主要可以将数据的组和集合进行不同的标记记录, 进而实现对网络功能异常情况的检测。

2 移动通信网络优化中数据挖掘技术的基本原则

2.1 分布式处理方法的科学应用

由于在移动通信网络当中的数据资料规模十分庞大, 这种情况无疑增加可移动通信网络优化的难度。所以, 在移动通信网络优化的过程当中绝对不能仅仅依靠一个服务端口的单纯的融合来对网络进行优化, 而且同时也不能依靠一个简单的优化体系来对其他的过程优化。而要进行富有层次性和区域性的方法进行系统的优化, 所以在进行数据和信息的处理分析时, 必须要用分布式处理方法对移动通信网络进行优化。

2.2 移动通信网络阶段性分析的科学应用

由于移动通信网络兼具复杂性和广泛性的特点, 因此在实际的网络优化过程中很难对整个移动通信网络进行非常全面有效的分析。所以, 这就需要人们有针对性的对移动通信网络的每个阶段进行细致而有效的分析。在阶段性的分析完成之后, 还要对其进行系统的总结, 藉此为下一个阶段的分析提供必要的参考。在对每个阶段的分析完成之后, 还需要对各个阶段的分析结果进行研究, 发现各个阶段的内在联系, 进而达到为移动通信网络优化提供参考的目的。

2.3 智能性数据挖掘的基本要求

在移动通信网络优化过程中使用数据挖掘技术必须要遵循一定的要求, 所以在对相关的数据资料进行整理时, 一定要注意工人专业技术和数据挖掘技术的有机结合, 从而实现自动化和智能化的数据信息分析。而对于从事移动通信网络优化的工作人员而言, 必须要有非常扎实的理论功底, 只要这样才能保证移动通信网络优化工作更好的开展。

3 移动通信网络优化中数据挖掘技术的应用

3.1 利用数据挖掘技术对站点的合理选择

站点对于移动通信网络优化而言无疑具有非常重要的意义, 移动站点的对少直接决定了运营商投资规模的多少, 而站点位置的选择则对移动网络质量的好坏也有很重要的影响。

在移动通信网络优化的过程当中应用数据挖掘技术, 可以对站点选择的合理化水平起到提升的作用。其具体的方法是在初始可行解的基础之上, 进行具体的特定方位的搜索, 在一个过程中让相关的目标函数值变化最多的进行移动。这样一来, 不仅能够较为合理、科学的对移动站点进行选择, 而且还可以大幅度的降低移动运营商在这方面的资金费用。与此同时, 用于设备维修的资金也会相应的减少。这样一来, 无疑也会获得更多的利润。

3.2 科学研究掉话现象

对于移动通信网络当中存在的掉话现象的具体的分析, 主要是建立在对数据挖掘技术的基础之上的, 同时在研究的过程中还要注意对相关数据和资料的研究。在此基础上, 还要针对具体研究的类别情况, 才能在最快的时间之内查出在移动通讯当中出现掉话现象的缘由。

因此, 在优化移动通信网络的过程当中有效的应用数据挖掘技术, 不但能够实现实践序列方法的有效的利用, 而且还能够保证对话务出现的特点以及原因进行有效而快速的分析, 从而实现全面系统的分析和研究移动网络中电话现象出现的原因的目的。

3.3 利用数据挖掘技术还可以提升干扰分析的准确程度

数据挖掘技术在优化移动通信网络的过程当中一个非常重要的方面便是对移动通信网络的干扰数据进行分析。例如在对上行干扰进行分析时, 其计算的公式为上行干扰功率= 干扰UE上行发射功率+ 干扰UE到目标基站的路径损耗+ 目标基站对干扰UE的上行智能天线增益。而在对下行干扰进行分析时其计算的公式为下行干扰功率=干扰基站对干扰UE的下行发射功率+ 干扰基站到干扰UE的路径损耗+ 干扰基站对目标UE的下行智能天线增益。

因此, 利用数据挖掘技术对移动通信网络进行干扰分析, 不仅能够以较快的速度找到干扰的物体和干扰的位置, 而且还能够较为及时的对这些问题进行处理, 从而保证移动通信网络的正常平稳运行。

3.4 数据挖掘技术在移动通信优化中话务预测的具体应用

在进行网络规划的过程当中, 需要对移动通信过程当中的话务情况进行预测, 并根据具体的预测情况进行相关硬件设施的投资建设。当话务预测过高时可能会导致硬件设施采购过多, 而造成资源的浪费。当话务预测过低时, 又会造成大量话务的溢出, 进而导致收入情况的损失。

而利用数据挖掘当中时间序列预测的方法可以较好的解决这一问题。该方法主要指的是, 通过对过去相关的历史数据的研究, 来对未来的需求进行有效的预测。具体而言就是在对未来预测的过程中, 分析并发现事物的变化特征以及发展规律, 从而为话务预测提供有效的参考。

4 结语

随着4G网络发展的不断深入, 人们对移动通信技术也提出了更高的要求。在这种情况下, 在移动通讯网络优化的过程中有效的利用数据挖掘技术, 不仅能够更好的提升网络的质量, 而且对于降低移动运营商的投资成本, 提升其利润, 提高市场竞争力都具有非常重要的意义和价值。

摘要:人类进入信息时代以来, 移动通信网络悄然走进了每个人的生活。在社会不断发展的过程当中, 人们对移动通信的依赖程度也变得越来越高, 可以这样说移动通信网络改变了每个人的生活。而数据挖掘作为一种非常典型的智能化应用技术, 它不但可以对大量的数据信息进行分析和处理, 而且还可以找到数据之间的内在联系, 进而得到有价值信息, 为科学决策提供必要的依据。将数据挖掘技术应用到移动通信网络当中不仅能够起到提高网络质量的作用, 而且对于提高企业的竞争力也有非常重要的作用。

关键词:移动通信网络优化,数据挖掘技术,运用

参考文献

[1]胡勇.数据挖掘技术在移动通信网络优化中的应用[J].网络通信, 2012, 24 (1)

移动数据网络 第9篇

关键词:数据挖掘,移动网络,优化,应用

随着用户规模的不断的增加, 以及人们对于业务需求的多元化, 使得移动通信网络处于不断的变化过程当中。由于移动通信用户具有较大的流动性, 这导致移动通信网络需要随时根据用户分布的情况以及话务量进行适当的调整, 对网络进行数据挖掘, 从而使网络资源得到最大限度的利用, 不断的提高移动网络的安全性和稳定性, 为用户提供更好的服务。

1 数据挖掘的概念

所谓的数据挖掘只是一个形象的说法, 其本质上就是从数据库中繁杂的数据中筛选出有价值数据的一个过程。在数据库中存在数量庞大的数据, 对这些数据进行挑选, 找出可信的以及有价值的数据。简单的说, 就是通过专业的工具对数据库中的数据进行发掘, 从而发现有价值的数据。

2 移动通信网络及其优化

2.1 移动通信网络概念

所谓的移动通信是相对于传统的通信方式来说的, 在通信的过程当中, 通信双方往往需要有一方处于移动的过程当中, 可以是步行也可以在各种交通工具当中。对于移动通信来说, 移动通信网络是其存在的基础。

2.2 移动通信网络特点

由于移动通信网络摆脱了线路的束缚, 可以让通信双方随时随地的进行通信, 因此具有传统通信方式所不具备的特点, 主要表现在以下的几个方面:

2.2.1 移动性

移动通信相对于传统的通信方式最为直接和重要的优点就是移动性。也就是说在通信的过程当中通信双方可以不受限制的随意进行移动, 而不必受到传统的线路的影响。

2.2.2 传播条件复杂

由于移动通信的信号传输主要依靠电磁波, 且通信的双方往往处于移动的过程当中, 这就导致电磁波的传播可能受到各种因素的干扰, 从而使通信的质量受到影响。对于移动通信来说, 信号的传输问题一直是一个重点。

2.2.3 受噪声、干扰的影响

移动通信用户往往处于各种复杂的环境之中, 这就使得在通信的过程当中很容易受到周围环境的影响, 如噪音。同时不同的移动用户之间也存在着相互干扰的现象严重的影响通信质量。

2.2.4 网络结构复杂

移动通信网络中存在着数量庞大的用户, 各个用户之间必须保证能够随时的建立联系, 同时还要保证各个用户之间不会产生干扰。除此之外, 移动通信网络不仅在内部实现各个用户之间的联系, 还要打破自身的限制, 与有线网络以及数据网络等互通, 这就使得整个移动通信网络在结构上十分的复杂。

2.2.5 设备性能和频带利率要求高

由于移动通信网络的带宽资源十分有限, 这就要求在保证通信质量的同时要尽可能的节省资源, 提高有效的通信资源的利用率。这就要求移动通信网络保持较高的性能以及频带利用率。

2.3 移动通信网络优化技术

移动通信网络由于长期的使用以及扩容势必存在一些问题, 影响网络的正常运行以及性能的发挥, 这就需要定期对其进行相应的优化, 从而保证移动通信网络能够以较高的性能运作。移动通信网络的优化主要依靠对现有网络进行分析, 找出网络中存在的问题, 然后查明原因, 最后有针对性的对其进行调整, 从而保证网络以优秀的状态运行。移动通信网络优化的最终目的是保证网络运行效益的最大化。

移动通信网络优化是一个十分漫长的过程, 贯穿于整个网络的生命周期。也就是说从网络投入使用之后一直都需要对其进行优化。一般是根据网络性能监控或者是用户的举报、投诉等方式来进行有着针对性的优化。同时各个小区也要定期对网络进行检查优化, 从而保证最佳状态。

3 数据挖掘在移动网络优化中的应用

所谓的数据挖掘就是对数据库中的数据进行相应的分析, 从而掌握网络运行的实际情况, 然后有针对性的采取相应措施。数据挖掘具体包括以下两个部分:第一, 对数据进行统计分析。通过专门的数据处理模块对数据进行预处理, 将经过处理之后的数据及时的存入数据库系统当中, 或者通过在线的方式对数据进行相应的分析。第二, 经过预处理之后的数据进行挖掘分析。在挖掘分析的过程当中对相应的数据进行归类, 形成各种报表, 直接反映网络的实际情况, 优化人员可以根据各种报表数据对网路进行优化, 或者是将报表反馈给上级, 进一步进行数据挖掘分析。统计分析包括很多方面, 通常可把它划分为干扰分析、覆盖分析、接入分析、切换分析以及掉话分析等。按照GSM网络的拓扑结构, GSM网络优化工作可以分为两个方面, 即无线优化与系统优化。其中, 无线优化是指对无线空中接口实行优化操作, 而系统优化则包括BSS系统、数据库、系统参数等多方面的优化。

从上面网络优化的内容不难发现, 网络优化的依据主要由两部分组成:测试数据和移动通信交换系统的内部统计数据。优化测试偏向于根据测试内容, 直接寻找影响网络运行质量因素, 并对其实行优化处理, 不注重问题产生的原因。而统计分析与预测分析刚好相反, 它侧重于分析问题产生的原因, 一方面, 统计分析根据问题产生的原因, 对影响网络运行质量的因素实现优化, 因为只有找到了影响网络运行质量因素, 才能有效准确地解决问题;另一方面, 如果找到了现在影响网络运行质量的原因, 那么, 在今后的优化工作中, 当出现相似问题时, 我们就可以根据经验提前解决, 从而避免了问题的再次发生。数据挖掘运用到网络优化中预测分析功能和统计分析功能相似, 只是它们运用的算法有不同而已, 预测分析是通过对过去的某一时间的系统数据进行分析, 找出现在和未来在某一时间系统有可能出现的情况, 提前对系统做出调整, 从而避免问题的出现。

4 结语

移动通信技术深刻的改变了人们的生产和生活方式, 使人们进入了一个崭新的时代。作为现代最为先进的通信方式, 移动通信技术已经逐渐成为我们日常生产以及生活当中必不可少的技术。但是, 由于它又具有移动性、结构复杂、传播条件复杂、噪声、频带利用率高等特点, 这就要求我们在使用移动通信网络的时候, 需要对其进行优化。另外, 随着市场竞争越来越激烈和用户越来越高的要求, 这都要求移动通信网络时刻保持最佳的运行状态, 为用户提供高质量的通信服务以及多样化的业务种类, 从而满足用户不同的需求, 也可以有效的改善用户的使用感受。随着数据挖掘的不断深入, 网络优化在深度和广度都得到了很大的提高, 在强大的数据分析处理环境下, 移动网络将得到更好的优化和完善

参考文献

[1]岑红虹.数据仓库技术的探讨[J].广东农工商职业技术学院学报, 2005, (04) .

[2]王雁平, 乐春峡.移动网络最差小区数据挖掘分析与实现[J].计算机工程与设计, 2007, (17) .

移动数据网络 第10篇

在当今移动互联网如火如荼发展的大背景下,电信运营商感受到前所未有的网络流量的压力。WiFi有效地缓减了3G网络的移动数据流量压力。一时间,WiFi成为电信运营商的新宠,WiFi建设风起云涌,WiFi的部署从以万计迅速上升到以百万计。WiFi实际上已经成为电信运营商移动通信网络的一部分,运营商已经把移动数据网和WiFi视为一个网络整体对待。

1大背景:移动数据流量激增

随着智能手机、平板电脑等各种移动终端的日渐普及,全球范围的移动互联网流量呈现指数式增长。2011年,全球通用移动通信系统(UMTS)论坛预测,移动网络中的语音和数据流量将在今后的十年中增长30倍以上。

有机构预测认为2016年全球移动互联网通讯的数据流量将扩大至目前的18倍,达到平均每月10.8E字节。到2016年,将有60%的移动用户(30亿人)每月平均产生1G字节以上的移动数据流量,而2011年这一比例仅为0.5%。

进入移动互联网时代之后,数据流量激增,我国已经进入数据爆发的拐点,三大运营商2010年数据流量增速超过150%,其无线网络利用率在2010年中达到了危险的78.32%(警戒线为70%)。如此巨大的移动数据流量压力将是3G网络难以承载的。如今,只有WiFi能担当起来承载巨大移动数据流量的重任。

2骨架网络——第三代移动通信网络

相对第一代模拟制式手机(1G)和第二代GSM、TDMA等数字手机(2G),第三代移动通信网络,是指将无线通信与国际互联网等多媒体通信结合的新一代移动通信系统,在国内有WCDMA、CDMA2000和TD-CDMA。

3G是定位于移动数据和移动多媒体业务的,它能够处理图像、音乐、视频流等多种媒体形式,提供包括网页浏览、电话会议、电子商务等多种信息服务。为了提供这种服务,无线网络必须能够支持不同的数据传输速度,也就是说在室内、室外和行车的环境中能够分别支持至少2 Mbps(兆字节/每秒)、384 kbps(千字节/每秒)以及144 kbps的传输速度。3G网络最显著的特性:高速的移动数据传输技术,其数据速率为2G的200倍!据专家介绍,由于3G技术在数据业务上的频谱利用率比2G提高了3倍以上,再加上频谱带宽的成倍增长,3G的数据传输能力大幅提高。在理想环境下,其数据速率可以达到2G的200倍。也就是说通过手机,使用者能像用电脑连接宽带上网一样,轻松实现高速网络游戏、视频在线观看、高压缩率音频在线收听等功能,这些业务在现有的2G网络上是根本无法想象的。

3G在技术上不仅兼顾了2G成熟的应用技术,但它不是完全抛弃了2G,而是充分借鉴了2G的网络运营经验,再根据IMT-2000确立目标,蜂窝移动通信技术主要包括多址/双工等寻址手段、射频信息参数、小区复用及复用模式、纠错技术,帧结构和物理信道等诸多方面。3G系统网络具有灵活性和全覆盖能力,无线技术试用多业务坏境,高频谱利用率和高业务质量,现行的无线技术在诸多方面进行了大量创新,其主要有以下5个方面内容。

(1)应用了高频段的频谱资源。

为了创造更加宽广的频谱空间以实现通信网络的全球漫游等诸多业务,更加好满足人民对宽带业务,达到3G网络容量发展,依据ITU的最新规定,IMT-2000会全部统一使用2G频段,其可用宽带空间多达230 MHz,而其中,无线卫星网络拥有60 MHz空间,陆地网络拥有170 MHz空间。

(2)采用宽带射频信道,支持高速率业务。

3G射频载波信道应该根据业务要求,更好提高码片速率的同时,让系统抗多径衰弱能力大大的提高之外,也能承受多媒体的业务需要。

(3)实现多业务、多速率传送。

在现今的宽带信道上,通信技术应该体现出宽带的多速率、可以采用QOS将具有不同速率的业务通过不同的扩频因子,保证宽带的速度传送。

(4)快速功率控制。

3G技术在总体上应用了改善系统,性能是非常好的,通过普及应用闭环功率的快速控制技术实现了下行信道换代升级,其应用目标在于改善和提升下行信道的传输性能,尽管该技术的应用有效地提升了通信系统规避多径衰退的水平,但由于现行多径信道的干扰造成码分多址的扩频用户通信质量的降低,进而强化了通信系统自干扰的误差度。

(5)采用自适应天线及软件无线电技术。

3G无线电技术软件在基站及终端产品中,应该做到降低成本、提高系统灵活性,起到非常重要的作用,可以应用携带电子编程相位的新型天线阵列,加大通信系统容量,还能够实施波束赋行,提高接受灵敏度,做到自适调整功率,从而减小系统的自干扰。

但3G技术与用户的大数据流量的业务要求有一定的矛盾,一是网络能力上无法支撑;二是经济上费用昂贵,普通消费者不可能像有线网络那样无限制的使用数据业务。由此便捷便宜的WiFi技术成为用户接入层面的有效补充。

3 WiFi技术概述

WiFi是一种可以将个人电脑、手持设备(如PDA、手机)等终端以无线方式互相连接的技术。简单来说其实就是IEEE802.11b的别称,是由一个名为“无线以太网相容联盟”(WirelessEthernetCompatibilityAlliance,WECA)的组织所发布的业界术语,它是一种短程无线传输技术,能够在数百英尺范围内支持互联网接入的无线电信号。随着技术的发展,以及IEEE802.11a及IEEE802.11g等标准的出现,现在IEEE802.11这个标准已被统称作WiFi。它可以帮助用户访问电子邮件、Web和流式媒体。它为用户提供了无线的宽带互联网访问。同时,它也是在家里、办公室或在旅途中上网的快速、便捷的途径。WiFi无线网络是由AP(AccessPoint)和无线网卡组成的无线网络。在开放性区域,通讯距离可达305m;在封闭性区域,通讯距离为76~122m,方便与现有的有线以太网络整合,组网的成本更低。WiFi以其自身诸多优点,受到人们推崇。

4 WiFi技术特点

4.1无线电波的覆盖范围广

WiFi的半径则可达100m,适合办公室及单位楼层内部使用。而蓝牙技术只能覆盖15m内。

4.2速度快,可靠性高

802.11b无线网络规范是IEEE802.11网络规范的变种,最高带宽为11Mbps,在信号较弱或有干扰的情况下,带宽可调整为5.5Mbps、2Mbps和1Mbps,带宽的自动调整,有效地保障了网络的稳定性和可靠性。

4.3无需布线

WiFi最主要的优势在于不需要布线,可以不受布线条件的限制,因此非常适合移动办公用户的需要,具有广阔市场前景。目前它已经从传统的医疗保健、库存控制和管理服务等特殊行业向更多行业拓展开去,甚至开始进入家庭以及教育机构等领域。

4.4健康安全

IEEE802.1 1规定的发射功率不可超过100mW,实际发射功率约60~70mW,手机的发射功率约200mW~1W间,手持式对讲机高达5 W,而且无线网络使用方式并非像手机直接接触人体,是绝对安全的。

当然WiFi技术也有其一定的局限,如带宽不高、覆盖半径小、切换时间长等,使得其不能很好地支持移动VoIP等实时性要求高的应用;并且无线网络系统对上层业务开发不开放,使得适合IP移动环境的业务难以开发。此前定位于家庭用户的WLAN产品在很多地方不能满足运营商在网络运营、维护上的要求。但由于运营商的网络是以3G网络为骨架的电信级通信网络,这些短板正好骨干网络互补。

5 WiFi与3G的融合

3G网络与WiFi具有天然的融合优势,两者具有明显的互补性,WiFi技术数据高速传输的特点可以弥补3G网络数据传输速率受限的不足之处,而WiFi技术所欠缺的签权和计费机制又是3G技术的强项,另外3G网络运营商级的广阔覆盖为WiFi提供了多点接入切换的条件。总之,3G网络和WiFi的融合,在技术上水到渠成。

5.1终端的融合

终端是直接面向用户的设备,在整个产业链条中至关重要,目前大多数手机及支持WiFi也支持3G,唯一不足之处是在3G网络和WiFi网络切换时,需要手动进行,尤其是在进入新的WiFi网络时,不支持自动切入,但随着用户需求的增加,人们期盼的WLAN/3G双模芯片或终端的研究也在进行。

5.2网络的融合

无线局域网可以通过两种方式和3G移动网络相结合:松散和紧凑模式。

(1)紧凑模式。

所谓紧凑模式就是WiFi网络和3G网络共用核心网设备,即通过WiFi网络和3G网络共用Iu接口。这种方式的优点是,WiFi网络能够利用3G网络成熟的安全和服务机制,能够为用户提供两网间的无缝切换。但这种模式也有显而易见的缺点,第一,WiFi网络产生的数据流量和信令与3G网络完全不同,其移动模式和业务流量的差异使得现有3G网络需要做出很大的改造。第二,为了直接与3G核心网络相连,WiFi网络也需要重新修改和定制已有的产品。也就是说紧凑模式虽有融合优势,但投资很大。

(2)松散模式。

企业数据移动与同步的完胜“法宝” 第11篇

以往,企业数据基础架构面临的问题并不十分复杂,比如企业信息通常保存在一个数据中心、数据一般以KB字节计量仅最大和最复杂的数据以MB字节计量、报表以批处理方式运行但统计结果经常延迟,企业内普遍为单一供应商环境等等。但是,随着全球经济一体化程度的逐渐加深,企业组织面临的状况极尽复杂——大部分企业的消费者已经遍布全球,致使与企业业务相关的数据信息零散地存储于全球各地的服务器中,频繁交易使得数据分布的速率日益加快,数据量的激增及数据分散状况的加剧给数据管理带来更大的难度,同时企业还要面对应对激烈的竞争压力而削减预算、降低成本的压力……

事实上,企业IT面临的典型问题远不止此。

企业IT系统困境重重——无法同步更新的数据、成本压力、难以容忍的停机时间……

首先,企业的全球化业务要求企业IT系统必须能够提供24 x 7 x 365永不间断的信息访问,因为那些陈旧的或静态的、无法同步更新的数据已经无法满足管理层“即时了解各分支机构运营情况”的需求。

其次,提供准确的信息至关重要。这是企业为了遵守监管线所制定的繁杂的规定,否则企业将受到严厉处罚。

再次,成本压力和运营效率压力。近年来,市场竞争更加激烈、竞争对手层出不穷、全球化的运营和监管愈发严格,这些都给企业带来了巨大的生存压力。面临这种状况,企业需要在提高盈利能力的同时降低成本,这时,IT部门往往首当其冲,于是,提高运营效率就成为最好的解决方式。

与此同时,微博时代(Generation Twitter)的到来也使得用户对信息的即时访问和即时响应提出了更苛刻的要求——他们无法容忍应用程序或基础设施升级所带来的片刻的系统中断甚至是简短的等待,停机对他们来说更是无法容忍。

显而易见,企业IT的压力与日俱增。

困境中的曙光——数据库复制

面对以上困境及多重挑战,管理人员只好采用日益复杂的商业智能软件,以寻求最佳方式来处理数据并帮助他们做出实时的业务决策。其中,“在网络间和目标服务器上移动大量数据”、以成本优势见长的数据库复制技术已经被越来越多的企业IT所采用。

数据库复制的核心是指在某地创建或更新的数据分发到其他目的地的过程,它被应用在一系列数据库服务器之间,通过对位于相同或不同的物理位置的分布信息进行交换,实现网络间的信息复制,从而无需用户的干预即可保持数据的同步。目前,其解决方案已广泛地应用于各个领域。常见的的数据库复制的主流方法有很多种,比如转储和加载、快照、两阶段提交驱动的分发、数据库触发器(无事务支持/事务支持)、基于日志的复制等等。但这些主流方法也存在着一定的弊端——

“转储和加载”其机制是从一个地方提取数据并加载到一个或多个目的地,所以在数据产生与其传播之间存在一定的时间差;

“快照”的机制是在给定时间点捕捉数据库的映像,然后将此映像加载到一个或多个目的地,所以这种方法不适用于需要实时信息的场合,以上这两种数据库复制方式都不能允许远程更新;

“两阶段提交驱动的分发”则不能适用于对响应时间有较高要求的应用;

“数据库触发器(无事务支持)”则因其是通过触发器将数据拷贝到一个或多个目的地,所以虽然降低了成本,但信息的完整性上存在问题;

“数据库触发器(事务支持)”虽增加了完整性,却由于事务开销又带来了应用性能的降低。

与以上这些复制方法的优劣形成鲜明对比的是,基于“日志”的复制方法因其采用了直接读取在线日志记录的方式,而被业界公认为是在提高性能、降低成本方面最有效的复制方式。Sybase Replication Server所采用的就是这样的数据库复制方法。

企业数据移动与同步的完胜“法宝”——Sybase Replication Server®复制服务器

Sybase Replication Server®复制服务器突破了传统中式数据库的限制,采用分布式架构及一系列功能来保证对变化数据的交付,它支持变化数据采集、数据分配和异构数据库环境之间的数据同步,以实现实时分析、报表、分布式操作和灾难恢复。并能够支持多平台、多字符集以及多语言,除了支持Sybase自身的数据库产品Adaptive Server® Enterprise (即ASE)之外,还可与各种数据源一同工作,包括Oracle、IBM DB2、Microsoft SQL Server,这种灵活性使得数据库管理员能够将信息从任何数据源复制到任何目的地。

当然,仅仅简单地启用数据复制方案仍然不够。为了帮助企业管理这些复杂的复制配置,Sybase还提供了功能强大的图形化管理工具——复制服务管理器(Replication Server Manager)。通过这个三层架构的管理器,系统管理员可以从单一的桌面创建复制环境,监控各服务器的状态,从而管理复制的数据流。另外,Sybase的建模和元数据管理工具Sybase PowerDesigner®还引入了全新的图形化模型图,即信息流模型(ILM),它不仅可以图形化方式展示复制环境,也能够从模型中产生Sybase复制服务器实现代码,从而助复制服务管理器一臂之力。

毋庸置疑,数据库复制是一个对性能有较高要求的应用,为了保持信息尽可能快速、高效地流动,Sybase复制服务器提供了一系列与吞吐量相关的特性,这些特性包括:

Ÿ专用的数据库复制功能。为避免由于数据库复制所带来的额外加载而可能导致的数据库服务器停滞,Sybase复制服务器采用了专门设计的附加解决方案,相比那些“栓死”到数据库服务器上的复制方法,这种架构对源数据库的侵入最小。

Ÿ连续实时的基于日志的事务数据捕捉。这种直接从在线重做日志读取的技术比基于触发器的数据库复制方法在速度上要快得多。

ŸSQL语句复制。为了使网络上传输的信息最小化,Sybase复制服务器仅仅将SQL语句本身发送到目的服务器,这是对Sybase基于日志的复制策略的完美补充。

Ÿ在目标数据库中增强事务性能。为了能够实现与其它来自不同供应商的产品协同工作,Sybase复制服务器支持包括与供应商相关的各个平台的性能优化和调整。

具有上述特性的Sybase复制服务器尤其适用于金融服务和资本市场等对吞吐量和延迟有极为苛刻要求的高挑战性行业,无论企业的信息架构的模式和规模如何,它都能有效地分发和保护用户的重要数据。这一点,已经得到了全球用户的广泛认可。

嘉吉粮食部门数据库管理员组经理多恩•尼尔森这样评价Sybase复制服务器:“我们的系统管理着每年大约一亿蒲式耳的存货,以及每日多达16000单的装运量,每天在企业内部来回移动的数据多达1GB,每小时要运行大约8500张报表,没有Sybase,我们根本做不到这点。”

Sybase复制服务器三大特性——灾难恢复和高可用、实时报表、数据整合和同步

那么,为企业提供强大支持的Sybase数据库复制解决方案到底有何高招呢?

特性之一:灾难恢复和高可用

对于那些业务遍及全球、全天候运营、对信息高度敏感的企业来说,任何因为停机所带来的影响都是灾难性的,比如收入损失、品牌破坏、客户关系矛盾、供应链问题等等,停机的时机和停机时间的长短时刻牵动着企业的神经——有管理的、有计划的停机经常发生在硬件、软件以及网络等升级的时候,尽管如此,这样的停机仍然有可能妨碍企业的正常运营。相较而言,非计划的停机基本上是由软件bug、系统故障、网络中断以及其它问题所导致的时间,这种停机不仅给用户信心带来沉重的打击,还会带来巨大的经济损失。灾难性的停机时间虽然鲜有发生,但仍会给企业带来严重的、长期的损害。

面对各种不可预知的、有可能随时而至的停机可能,Sybase数据库复制解决方案可以极大降低主系统或数据中断的可能性,提升信息系统架构可靠性,从而帮助企业降低甚至消除停机所造成的影响。“灾难恢复设计极大地简化了我们的恢复过程,也让我们得以安心。除了Sybase复制服务器外及其热备复制技术外,我们没有使用任何第三方工具。” 沙特阿拉伯最大的超市以及ACE五金授权的经销商SACO IT经理 Read Ayyous说。

特性之二:实时报表

随着用户对信息的更高需求,创建、浏览和修改实时报表成为越来越流行的处理数据的方式。而高速CPU、大容量磁盘存储、快速网络以及强有力的商业智能软件等等这些现代信息技术也使得这些方式得以实现,并为用户创建模型和管理数据开辟了崭新的天地。

然而,所有这些功能都可能给企业的生产应用带来重大风险——让普通的信息消费者使用实时分析和报表工具来操作生产服务器将不仅会带来应用性能降低的问题,随之而来的还有种种负面影响。Sybase数据库复制解决方案可以通过“生产数据库的完整副本”及“数据仓库”两种报表方法解决以上难题¬——企业可以使用Sybase数据库复制服务器来生成一份在线生产数据的完整副本,在复制点上,所有在线生产数据都以近乎实时的方式可用,用户可以用最少的IT投资即可实现实时查询和报表功能;企业也可以选择将大量数据合并集中到一个或多个的数据仓库中,通过向用户提供商业智能软件,鼓励他们新建或使用已有的查询和报表,分析企业的信息子集,这些数据可以被用户更新,并反馈在线生产系统。无论选择哪种报表方法,Sybase数据库复制解决方案都可以大大降低生产应用及其相关服务器的工作负荷。

特性之三:数据整合和同步

通常,一提及复制二字,IT专家首先想到的肯定是数据同步和数据整合,但事实上,复制的分类还涉及数据集成和数据移植,这四种数据复制的原理也截然不同。

首先,数据同步是指数据分布在多台计算机中,每台计算机保存一份最新信息的副本,一般说来,每台服务器都允许对其信息进行修改,随后这些修改被透明地传播到其它服务器上;

第二种,数据整合是指抽取来自异地的不同数据,合并到一台或多台复制服务器上。在许多情况下,这种做法是用于数据仓库或其他商业智能应用。

第三种,数据集成是指组合来自多个源的信息,然后发布到目标计算机上;

第四种,数据移植是指数据库复制将遗留应用的信息转移到新的目标服务器。在这种情况下的复制方法是从源服务器中卸载数据,然后加载到目标服务器。

值得注意的是,在同步或整合信息时,必须考虑两种主要类型的数据库同步——一种是一个主点,多个目标点;另一种是没有明确的主点,而是分发到平等的节点上,所有这些节点都可以自由地修改数据。以上情况就要求所选择的数据库复制技术必须能管理任何来源的数据变化,即使不是一开始就计划对这些类型的数据进行修改,这个功能必不可少。

通过Sybase数据库复制解决方案,不仅可以同时组合运用以上多种类型的复制,比如可以用数据集成来联结不同的应用,再用数据同步将数据分发到其它的复制目标上去。另外,它还能够支持不同的数据库发行商所提供的数据库产品,并能利用低成本的通用硬件完成数据整合和同步,大大降低基于数据库复制可用性的一些新应用的价格门槛。

Sybase数据库复制解决方案应用实例解读——Evergreen Motors公司应用

企业用户的应用实例及高度评价成为Sybase数据库复制解决方案最佳实践的有力证言。

Evergreen Motors公司(以下简称为Evergreen)是为全球主要机场的消费者提供混合动力交通工具租赁服务的企业。随着业务的发展和企业规模的壮大,企业IT系统却未能与时俱进,导致系统速度明显变慢,系统中断以及IT方面的一系列问题时有发生,从而引发了客户的不满以及媒体的负面报道。为了改变困境,Evergreen采用了数据库复制技术。

最初,Evergreen的生产数据库还是由管理员每晚进行备份,但当得知竞争对手因遭受了火灾而损失了数据中心(包括备份磁带)的信息后,Evergreen实施了一个完全的复制环境,包括重复的应用服务器和数据库服务器,使用数据库复制来执行实时信息拷贝,将数据复制到位于其它州的另一个数据中心的备份服务器上。

Evergreen的报表方法

随着业务的持续增长,Evergreen的营销和财务分析师需要通过使用电子表格和商业智能工具来运行一些“假设”的场景,从而达到帮助企业优化收入和利润的目的,这些模拟场景对企业管理有一定正面的价值,但它也带来了一定的负面影响,那就是在生产数据库服务器上运行这些查询将导致代理点(及其客户)的(访问性能)明显放缓。

由于数据库服务器性能缓慢已经开始影响企业的收入,Evergreen为营销和财务分析配置了专用的服务器——Sybase数据库复制服务保证了报表服务器始终保持最新数据,从而使分析师们在模拟企业运营场景的同时还能够运行所有查询模拟场景,而不会影响生产环境的用户。

Evergreen的整合数据

在业务持续成长之时,Evergreen收购了面向欧洲市场开展业务的竞争友商 Recycled Wheels,但非常遗憾的是,Recycled Wheels所采用的却是一系列与之完全不同的系统和数据库产品,于是,如何在不中断彼此业务的同时集成两个完全不同的环境从而完成两个主数据库之间双向数据复制的问题就成为Evergreen所面临的巨大挑战,Sybase的数据库复制解决方案恰好帮助Evergreen Motors解决了这一问题。

通过应用Sybase数据库复制解决方案,Evergreen公司在数据的灾难恢复及有效备份、实时报表的更新速度以及收购竞对后不同的数据库产品的数据整合方面都发挥了明显的效果,同时使得企业的整体运营得到了显著改善。

企业数据库复制成功部署的有力保证——复制能力、可管理性、规划性

目前,与Evergreen面临同样甚至更复杂状况的公司还有很多,怎样才能“对症下药”、药到病除呢?成功部署数据库复制解决方案是必不可少的前提,Sybase认为,数据库复制平台的复制能力、可管理性、规划性是企业数据库复制成功部署的有力保证。

任何情况下,对于数据库复制技术的提供者来说,复制能力都是首要的,而且必须满足以下方面才能真正地发挥该技术的效用——必须满足在不影响数据源服务器的前提下支持海量数据的处理;必须能够对异构数据源访问并可进行出色地处理;高可用性及高性能,使数据库复制技术对生产系统的负荷最小;具备保证事务完整性的能力,保持所有复制节点之间信息的一致传递;能够满足地方自治并适应主从模式或点对点模式的要求等等。

如果难以配置或管理,那么即使是最先进的数据库复制解决方案也会被市场淘汰,在可管理性方面,出色的数据库复制解决方案必须具备支持选择中央位置简化管理、支持多种数据源和多个目的地以及选择性复制的能力(包括选择行、列或其它过滤条件、选择复制什么数据以及如何复制等等)。

面对与日俱变的竞争形势,数据库复制解决方案还需要具备高可扩展性和升级能力,首先必须支持消息总线,无论选择何种数据库复制技术,它与ESB中的实时消息特性的整合能力是相当重要的;另外,还要具有镜像互操作性,应用基于硬件的替代方案,如备用服务器、冗余网络和磁盘镜像,有助于确保宝贵信息的高可用性。

以上三个方面涵盖了数据库复制技术实施的各个环节,可被看成是企业选择数据库复制解决方案的重要参考指标。

总结

有了诸如Sybase复制服务器的数据库复制解决方案,企业得以从全球化、二十四小时不间断运营、日益增强的监管要求、更激烈的竞争压力等等压力中完全解脱出来,并可以轻松地将来自多个源的数据分发到多个目的地,保证随时能够满足用户名需求的灵活性。

移动数据网络 第12篇

随着移动电话的普及以及3G网络的部署,移动网络中基于位置信息的服务(LBS)越来越成为热点。如日本的NTT Do Co Mo推出个人用户定位和导航服务,美国的Verizon主推Family Locator服务以及欧洲的Vodafone等推出了团队位置跟踪服务等;还如MIT的Mobile Landscapes项目使用移动通话数据得到静态城市人群时空分布,Real Time Rome项目的实时监测人群密度动态分布等。基于移动位置信息的研究和应用正成为全球学术界和产业界共同关注的焦点问题。

当前,与移动位置相关的行为研究的热点问题之一是对移动用户未来的位置信息进行实时、准确的预测[1,2,3,4,5,6]。然而,当前对用户未来位置的预测研究主要集中在对连续轨迹(典型代表是GPS轨迹)建模的基础上,如文献[1-3]。然而,此类研究难以预测移动通信场景下的用户轨迹。因为在该场景下,用户轨迹十分离散,一天平均只能获得十几个用户轨迹点,现有模型难以根据如此离散的轨迹反演得到用户的历史行为,并建立起有效的预测模型。所以,移动通信场景下的移动轨迹预测成为一个尚未解决的难题。

本文提出了一个新的对离散轨迹进行建模预测的方法。首先,将话单数据所反映的离散轨迹转换为连续轨迹得到用户行为模式,基于该行为模式提出了轨迹预测算法Match,实验证明,使用该算法有85%的人类行为可以预测。通过对历史相似轨迹进行合并,更加准确地刻画了用户的真实轨迹,进一步提高了预测准确率。并得出结论:在以天为单位的尺度上,人类的行为有30%是自相似的。

1 相关工作

由于使用的定位手段不同,对人类轨迹的建模方式以及预测方法也有不同。GPS定位精度最高,通过内置的客户端,可以获得用户的连续轨迹,基于此种数据的研究也最多。从预测方式上,主要有两种方式:基于Dynamic Bayesian Network等网络学习模型对轨迹建模并预测,如文献[1-3]等;另外,基于历史轨迹频繁项的轨迹预测研究也比较多,其中以文献[4]为代表。作者假设,由于城市中公共交通发达,多数人的出行方式应该相同。将多数人运动的轨迹重合部分,作为对轨迹预测的依据。但是,个人GPS轨迹数据难以得到,一般由志愿者提供,样本数量很少,难以大规模开展实验以验证算法可靠性以及研究人类的行为规律。

利用Wi Fi可将用户定位到Wi Fi基站,基站覆盖范围较小,使得定位精度较高。由于Wi Fi网络并不普及,研究大多局限在一个校园或一个社区之内[5,6],代表性并不强,这里不再赘述。

利用移动基站定位用户精度最低,城市中基站的覆盖范围为0.5km~5km不等,其定位精度也在这个范围。然而,由于手机的普及特性,因此研究基于该数据特性的轨迹预测将为大量基于位置信息的应用提供支持。实际中得到的用户话单数据,记录了一个用户在一段时间的通话行为,用户位置通过话单数据中通讯时所联络的基站反映出来。但用户通话行为极其离散,形成了离散的轨迹,如何对其建模成为难题。另外,由于涉及用户隐私,此种研究往往难以开展。所以在这个领域,开展的研究还较少。文献[8]通过在手机安装客户端,记录下用户附近的基站信息,得到连续的轨迹。利用DBN,对用户的轨迹进行预测。该研究使用了志愿者提供的信息,实际上是低精度类似GPS定位数据的连续轨迹预测,有着与GPS定位进行轨迹预测相同的缺陷。

Barabasi等在Nature[9]上报到了他们开创性的研究工作。通过与移动公司合作,作者得到了三个月10,000,000用户的话单数据。通过系统的分析论证,得到了任何对于人类行为进行预测的准确率不会超过93%的结论,但准确率也不会低于70%(在后文中称该算法为Most Frequent算法)。但是,作者并未在文中提出其他具体的轨迹预测方法,仅仅对在移动通信环境下人类行为的可预测性做出上下界的定义。本文是在该文的基础上开展工作的。

2 问题定义

假设Set Ti,j表示移动用户i在第j天所有开始通话时刻的集合。Set Toweri是用户i历史通话中出现的全体基站。用户i的一次通话记作<tp,Towerp(xp,yp)>,其中tp是通话开始时刻,tp∈Set Ti,j,(xp,yp)是通话时通信基站经纬度,Towerp∈Set Toweri。

用户i在第j天的通话行为记为话单数据集Calli,j,表示为:Calli,j={<t1,Tower1>,<t2,Tower2>,…,<tn,Towern>}。Calli,j是一个有序集,t1<t2<…<tn。

定义1轨迹设r是集合Ti的一个划分,rk={Towerk1,Towerk2,…},那么Calli,j可重写为Trajectoryi,j={<t1,r1>,<t2,r2>,…<tn,rm>},称作用户i在第j天的轨迹。

定义2行为模式定义点对<tk,tk+1,rk>表示用户i在时间段[tk,tk+1]处于ri区域,有序集Patterni,j={<t1,t2,r1>,<t3,t4,r2>,…,<t2n-1,t2n,rn>}称作用户i在第j天的行为模式。

定义3轨迹预测已知序列{<t1,r1>,<t2,r2>,…,<tn-1,rn-1>}(t1<t2<…<tn-1),待预测时刻tn(tn-1<tn)以及用户在tn时刻的真实位置rn。使用某种预测算法得到用户在tn所处区域为r’,若r’=rn,则称预测正确;若r’≠rn,则称预测错误。

定义4轨迹预测策略已知序列{<t1,r1>,<t2,r2>,…,<tnrn>}(t1<t2<…<tn)以及待预测时刻t',满足t'-ti≤k(t'-tk),tiSet Ti,那么预测序列{<t1,r1>,<t2,r2>,…,<ti-1ri-1>}在ti的位置,若使用某种预测算法得到的r'=ri,则称预测正确;若r'≠ri,则称预测错误。

3 轨迹预测方法

手机在进行通讯时,有一定概率发生基站转换,使得话单记录的基站位置并不能很好地反映用户的真实位置。首先对话单数据进行修正,去除通话中发生的基站转换。然后在区域划分的基础上得到用户行为模式,将用户离散的轨迹转换为连续的行为模式。基于该模式,使用Match算法对用户轨迹进行预测。在3.5节还提出了轨迹合并算法,轨迹合并集较之行为模式更加准确地反映了用户历史真实轨迹,利用轨迹合并集,进一步提高轨迹预测的准确率。

3.1 基站转换

手机在进行通信时,由于信号、基站容量等客观问题,并不总是选择距离最近的基站,使得话单记录的基站位置并不能精确地反映用户的位置,因而有必要去除通话时发生的基站转换。

用户两次通话为<ti,Toweri(xi,yi)>,<tj,Towerj(xj,yj)>(Towerj≠Towerj,ti<tj),在这两个基站间最小的移动速度为:

设人类移动速度的上限是vth=120km/h,任何基站间最小移动速度高过该上限的都视作发生了基站转换,找出话单数据中发生基站转换的记录进行修正。

3.2 区域划分

用户的一个活动区域往往包括几个基站,将该活动区域中的基站合并就可以得到用户的一个区域。

由于基站的特殊性,我们并没有选择常规的聚类方法。当两个活动基站的信号范围发生重叠时(这里使用基站距离小于1.5km作为标准),这两个基站属于同一个区域(算法1)。

算法1 Region Division

3.3 用户行为模式

由话单数据得到的用户历史轨迹十分离散,难以通过其对轨迹进行预测。本文假设,如果用户连续的两个通话区域相同,那么用户在这个时间段内并未移动。根据此假设,离散的用户轨迹可以转换成连续的行为模式。

给定轨迹Trajectoryi,j,用户i在第j天的行为模式按照算法2得到。

算法2 Pattern Extraction

3.4 轨迹预测算法

Barabasi在文献[9]中指出,人类的行为有其潜在的规律性。这个规律体现在人类的后一时刻的行为常常取决于前一时刻或前几个时刻的行为。可以结合用户历史通过前几次行为来预测用户的下一次行为。

例1已知t3时刻之前的轨迹序列为{<t1,r1>,<t2,r2>}。用户历史轨迹Trajectoryi中包含该序列的最频繁子序列为{<t1,r1>,<t2,r2>,<t3,r3>},那么用<t3,r3>作为预测结果,即预测用户在t3时刻位于r3。

人类行为的规律性还体现在人类的作息以天为单位进行。在一天中的某时刻或时段,人的行为总是相似的。比如,一个人在夜晚常常在家中睡觉,白天在单位上班。多数人的时间还分为工作日和周末,在工作日,人们主要从事劳动;在周末,人们主要休息娱乐。

例2对于Patterni,j,k∈{工作日},p∈{周末},使得(Patterni,j∩Patterni,p)(Patterni,j∩Patterni,k)

根据上述规律和假设,提出算法3(称之为Match算法)来对用户轨迹进行预测。

算法3 Match

3.5 轨迹合并

用户一天的通话行为十分离散,使得话单数据很难准确反映他的真实轨迹。选取用户历史轨迹中最为相似的两条记录进行合并,则有可能更加真实地反映用户的轨迹。

例3用户i在j,k两天的真实轨迹均为{<t1,r1>,<t2,r2>,<t3,r3>,<t4,r4>},表示为:Trajectoryi,j={<t1,r1>,<t2,r2>,<t3,r3>},Trajectoryi,k={<t1,r1>,<t3,r3>,<t4,r4>},则合并j,k这两天的轨迹得到了真实的轨迹:Trajectoryi,j∪Trajectoryi,k={<t1,r1>,<t2,r2>,<t3,r3>,<,t4,r4>}。

用户两天轨迹的相似程度由轨迹差来度量。

定理1三维空间(x,y,t)中,由Trajectoryi,j中序列点对依次连结形成的连续曲线记作(Linejx(t),Linejy(t),t)。d1、d2两天的轨迹差为:

其中(tstart,tend)是曲线(Linexd1(t),Lineyd1(t),t)与曲线(Linexd2(t),Lineyd2(t),t)定义域的交集。

证明:对于用户i,在同一时刻t,第m天的位置为(xm,ym),第n天的位置为(xn,yn),这两天在时刻t的距离为:

两天平均意义上的距离为:

其中m、n所对应轨迹曲线为(fmx(t),fmy(t),t)、(fnx(t),fny(t),t)。则上式可写成:

如果f取由Trajectoryi,j中序列点对依次连结形成的连续曲线(Linejx(t),Linejy(t),t),那么上式可以写成:

在确定两天轨迹的相似程度度量方法后,计算Disi(p,q),选取轨迹差最小的前th%的用户轨迹进行合并,得到用户轨迹合并集,称之为Mergei。具体轨迹合并算法见算法4。利用Mergei代替Patterni进行轨迹预测,实验证明,能够提高预测准确率。

算法4 Combination

4 实验

4.1 实验数据

本文选用中国某地级市2007年9月14天1240000用户的话单数据。选择f≥0.5的用户数据进行实验,满足该条件的用户有15000。

4.2 轨迹预测评估

为了计算预测准确率,我们使用前13天的数据作为话单数据集Call,应用3.2节区域划分算法对用户的活动范围Ti进行划分,最后使用轨迹预测策略对最后一天每一个整点时刻进行预测,并计算准确率。结果如图1所示。

具体解释如下:

1)Case1:使用Most Frequent算法。将最常访问的区域作为轨迹预测结果,对数据不做额外处理。平均预测准确率为68.5%。

2)Case2:使用Most Frequent算法。使用3.1节所述算法对话单数据集Call进行修正。平均预测准确率为75.4%。

3)Case3:使用本文提出的Match算法。使用3.1节所述算法对话单数据集Call进行修正。平均预测准确率为85.4%。

由图1可以得到以下结论:

1)对数据进行去基站转换处理很有必要。Case1实验重复了文献[9]中所述算法Most Frequent,验证了其预测准确率在70%左右的结论。Case2实验对Case1实验数据额外进行了去基站转换处理,比较Case1与Case2,平均预测准确率提高了6.9%。在具体实验中,发现检测出发生基站转换的通话记录只占总记录数的1.9%。说明虽然发生基站转换的比例并不高,但基站转换错误地暴露了用户位置,去除基站转换,能够很大程度上提高预测准确率。

2)比较Case2与Case3,发现本文提出的Match方法较之前Most Frequent的方法预测准确率提高了10%。本文提出的方法不仅考虑了用户前几个时刻表现出来的行为对之后的影响,还考虑了以天为单位,用户行为的规律性。使得在轨迹预测时,能够找到最为相似的历史中一天,给出合理的预测结果。

3)人类在休息时间(一天的较早时间和较晚时间)的规律性要大于工作时间的规律性。对于休息时间的轨迹预测准确率要高于工作时间的轨迹预测准确率。尤其是在正午时间,三条预测曲线都达到了最小值,说明在正午时间人类行为的规律性最差,最为难以预测。

对Match算法错误预测用户轨迹的来源进行分析,发现主要有三个因素影响了预测的结果:

1)人类行为不可知性。在文献[9]中,作者详细论述了该问题,人类的行为虽然有着很强的规律性,但大约有7%的人类行为是突发的、不可预知的。

2)基站转换。每次通话时都会有一定概率发生基站转换,而不是与最近的基站进行通讯,使得部分验证数据错误反映用户位置,影响预测准确率。

3)行为模式并不能完整的反映用户的历史行为。用户的通话极为离散,即使是选择通话行为较频繁的用户,其一个小时内所打出的电话也不过1、2个,也就是说,一个小时中,只能够得到1、2次用户的位置。用户的轨迹很可能并未完全暴露,得到的行为模式只反映了用户部分历史行为。

4.3 轨迹合并预测评估

针对4.2提出的第3个影响预测结果的因素,我们进行了轨迹合并实验,希望使用用户轨迹合并集提高预测的准确率。

首先,使用前13天的数据作为话单数据集Call,并对数据做去基站转换修正,应用3.2节区域划分算法对用户的活动范围进行划分。

接下来的步骤与3.2节轨迹预测实验方法略有不同。使用算法3产生用户轨迹合并集Merge,用Mergei代替Trajectoryi产生行为模式Patterni,并计算预测准确率。结果见图2。

由图2可知,随着轨迹合并比例th的增大,平均预测准确率不断上升,在th=30%左右时,预测准确率达到峰值,th继续增大,预测准确率开始下降。

这是因为当th很小时,只合并轨迹差异最小、最相关的记录,合并后的轨迹能够正确反映用户的真实轨迹,能够增大正确预测轨迹的比率。当th过大时,一些不相关的轨迹记录也被合并,合并后的轨迹不能反映用户的真实轨迹,减小了正确预测轨迹的比率。

图2还可以得出结论:人类在以天为单位的时间尺度上,有30%的行为是自相似的。

5 结语

已有研究大多针对于GPS等连续轨迹数据,无法预测离散轨迹。本文对离散轨迹(话单数据)建模得到用户行为模式,使用本文提出的Match算法,约有85%的人类轨迹可以预测,接着使用轨迹合并算法,预测准确率得到进一步地提高。另外,在对轨迹合并进行研究的基础上,我们得到了人类在以天为单位的时间尺度上,有30%的行为是自相似的结论。

基于移动数据的轨迹预测,还应有提高预测准确率的空间,结合社会网络的轨迹预测将是我们进一步研究的方向。

摘要:随着无线移动通信设备的发展,获取用户位置的手段更加多样,如何对轨迹进行建模并预测人类行为成为研究热点。现有方法主要针对GPS轨迹等连续轨迹进行建模预测,而对移动通信场景中人行为轨迹预测方法尚未研究。针对移动话单数据这种离散程度极大的轨迹数据建模,提出Match算法对人类轨迹进行预测。实验证明,85%的人类轨迹可以利用该算法正确预测。在此基础上,提出轨迹合并的方法,进一步提高了预测的准确率,并发现人类在以天为单位的尺度上,有30%的行为是自相似的。

关键词:移动数据,轨迹预测,行为分析

参考文献

[1]Han Sangjun,Cho Sungbae.Predicting user's movement with a combi-nation of self-organizing map and markov model[C]//ICANN2006,883-893.

[2]Daniel Ashbrook,Thad Starner.Using GPS to learn significant loca-tions and predict movement across multiple users[J].Personal and U-biquitous Computing,2003,7:275-286.

[3]Jan Petzold,Faruk Bagci,Wolfgang Trumler,et al.Global and local state context prediction[C]//Artificial Intelligence in Mobile Systems 2003(AIMS2003)in Conjunction with the Fifth International Confer-ence on Ubiquitous Computing,2003.

[4]Anna Monreale,Fabio Pinelli,Roberto Trasarti,et al.WhereNext:a location predictor on trajectory pattern mining[C]//KDD'09,2009:637-645.

[5]Hsu Weijen,Ahmed Helmy.IMPACT:investigation of mobile-user patterns across university campus using WLAN trace analysis[R].Technical report,University of Souch California,2005.

[6]Faruk Bagci,Florian Kluge,Theo Ungerer,et al.Optimisations for LocSens–an indoor location tracking system using wireless sensors[J].International Jounal of Sensor Network,2009,6:157-166.

[7]http://www.miit.gov.cn/.

[8]Nathan Eagle,Aaron Clauset,John A Quinn.Location segmentation,inference and prediction for anticipatory computing[C]//AAAI2009.

上一篇:《伏羲伏羲》下一篇:大学招生制度