信息数据范文

2024-06-15

信息数据范文(精选12篇)

信息数据 第1篇

在大数据浪潮的引领下,政府开放数据应该牢牢抓住这一机遇,利用大数据带来的先进技术和理论,为政府开放数据的信息增值服务作贡献。在大数据时代,打造一个民主、透明、公开的政府相对更容易。

1 大数据的基本概念与理论

1.1 基本概念

大数据是相对于不同的群体、利益相关者使用的方式不同而定义也不一样,并且随着时间的推移和应用的重点转移,其定义存在较大争议。一般认为大数据是不可能用常规软件和分析工具的数据集。

1.2 大数据的特点

(1)数据种类丰富多彩,包括各种可变格式和结构化数据;(2)数据源高度分散;(3)数据的实时共享;(4)数据的扩展和延伸性好;(5)开发专门的分析工具;(6)跟踪验证数据,很好地进行反馈。

1.3 政府开放数据存在问题

(1)政府开放数据量少,大多数数据都为保密数据,不对公众开放;政府开放数据的价值低,开放的都是一些含金量不高的数据;数据可机读比例低,大多数地方政府开放的数据集,大都是PDF格式。

(2)数据多为静态数据,不如丰富多彩的动态数据能够带给数据使用者们更好的直观感受和便捷分析。

(3)公开互动交流不及时,不太注重公众对开放数据的反馈意见。

(4)政府开放数据的配套应用软件较少,没有相应配套软件进行分析,或者此软件只供应已经接受审核的企业的应用,不能为大众所利用,受众面比较狭窄。

(5)数据获取渠道不便捷,政府开放数据只在政府特定网站上推出,只有当公众有需要时才会去浏览,不能像一些社交网络微博等具有推送功能,能够及时为公众提供最需要的数据。

2 政府开放数据的信息增值服务

2.1 政府信息增值服务的理论依据

大数据是一个多维的概念,它包括技术,决策和公共政策。在公共政策方面,国家政府能够通过大数据技术挖掘出一些社会弊病,从而提出相应的政策方案去解决这些社会弊病,在大数据为国家民生治理带来帮助的同时也可能侵犯公民的隐私权,加强了国家对公众的控制度。但整体还是利大于弊。

2.2 政府信息增值服务的模式

政府信息资源能够根据其服务主体的不同分为5种,第一种服务的主体是政府机构;第二种主体是私营企业,即由政府机构向部分私营企业提供各种支持。第三种是一些非盈利组织和机构;第四是服务外包,例如政府机构把我国全国公民的身份证信息外包给支付宝,使得支付宝可以实名注册,从而为支付宝提供的蚂蚁花呗和蚂蚁借呗等借贷性服务提供保障,从而加大了国内经济的内耗;第五是特许经营,即政府在一段时间内给予企业去生产政府信息增值产生的产品,从而获得利益并从中获取回扣。依据政府数据的种类、结构、数量以及作用的不同,选择的信息增值服务模式也不一样,也有可能是在多种服务模式齐头并进。

3 大数据带来的崭新的信息增值服务模式

3.1 政府的智能化

政府不再单单地收集信息然后发布到门户网站上,而是对收集到的信息进行智能分析。国外政府开放数据网站以需求驱动的方式来促进数据集的发布,主要目的是公众的需求能够通过政府开放的数据得到满足。为了满足这些社会团体,政府可以根据某些特定团体的需求去发布信息,这样方便了那些特殊兴趣团体的检索过程,同时政府应该及时地将网站上的实时互动发送到数据库中,数据库进行分析,然后将结果反馈到开放的数据中,做到及时、准确、快捷。相比之下,大数据带来的智能化可以减轻数据分析工作的压力,提高公众参与决策的积极性。

3.2 政府数据的实时共享与反馈

大数据给政府开放数据带来的革新是公众不仅仅是数据的浏览者也是数据的制造者。政府在针对某一问题发布数据的时候,用户不仅仅可以浏览数据,也可以对数据进行评价互动,然后这些评价互动又将被录入到政府信息资源的数据库中进行分析,更好地实现了数据的实时更新。用户可以了解到最新的信息。而且政府数据的实时共享减少数据收集和数据处理的重复,改善决策过程和数据的可持续性。不同的政府机构需要相同的数据来执行公共服务,政府数据的实时共享会使公共服务变得更有效。而且能够减少政府职能部门之间出现的“信息孤岛”现象,加强各职能部门之间的合作,同时能够使得政府的职层变得扁平化,促进各部门之间信息的快速交流。

3.3 政府数据集的规范性

在质量上,政府公布的数据经常是不被机读的PDF的格式,这是由于缺乏标准化的数据规范。大数据技术很好地应用于生产这样有用的数据集。这项政策的颁布将有助于推出更多的初创公司和企业,促进创新和创造力,将改变很多事情的完成方式。

3.4 政府数据的安全性

政府开放数据可能导致数据集中的用户匿名数据被识引起的混乱,并造成隐私泄露。大数据技术在这些个人隐私数据集上都设有密码口令,只有政府方面才拥有口令密码,其他组织机构不能够破解密码,也就不能够窥视个人隐私信息。政府部门也得加强此方面的职能监管,不得任何人以何种名义泄露公民隐私信息。只有在个人隐私信息被保护的情况下,公民才愿意将更多的信息交给政府部门管理或者创造更多的信息。

4 建议

大数据理论和美国等发达国家的政府开放数据的政策研究都为我国的信息增值服务提供了理论支撑,这是发展中国家应该注意和学习的地方,政府如何才能够更好地进行信息增值服务。

(1)多借鉴国外研究的先进成果,例如在数据开放之前就提前利用先进分类技术对搜集来的数据进行分类划分,例如mapreduce和hadoop等,并挖掘出其潜在的信息内容,再公布出去。

(2)调整政策倾向。随着理论研究成果不断运用到实践中,政府未来将会更加倾向于中小企业,以大企业带动小企业,让国内的大中小型企业都能够享受政府开放数据带来的巨大利益。

(3)政府加大对政府开放数据领域研究的资金投入。谁能更好地利用政府信息资源的数据,谁就是赢家。只有重视这领域的研究,走在世界同等研究领域的前端,大数据带给我们的利益将远远超过投入。

(4)在政府强调政府信息资源的公开、公正、透明的情况下,同时还得预防一些不法分子窃取国家情报。必须严格立法,对于那些破坏了信息法的不法分子必须做到执法必严,违法必究。

摘要:大数据的出现蕴含着巨大的价值,为社会发展提供了更多可能,也为政府信息资源的增值利用提供了指引方向。如何在大数据时代挖掘政府信息资源的最大价值,政府如何开放数据,提高政府的工作效率,如何在这个藏有万千机遇的平台之上进行社会化信息增值服务是文章的研究重点。

关键词:大数据,开放数据,政府信息资源,信息增值

参考文献

[1]何宝宏.大数据的四次历史变迁[J].电信网技术,2012(7):45-46.

[2]刘恒.政府信息公开制度[M].北京:中国社会科学出版社,2004.

[3]李绪容,徐焕良.政府信息资源开发与管理[M].北京:北京大学出版社,2005.

[4]游斌.信息增值原理探索[J].情报杂志,2006(2):88-90.

[5]吴钢华.信息增值的特点及其原理概述[J].情报理论与实践,1998(2):80-82.

[6]联合国经济和社会事务部.开放政府数据:全球与区域动态[EB/OL].[2014-08-12](2016-09-29).http://www.egovernment.gov.cn/art/2014/8/7/art_579_1588.html.

信息数据 第2篇

一、企业信息

(一)基本信息

1.单位全称、法人姓名、企业法人营业执照号码、企业组织机构代码、注册资本金、企业性质、企业专业类型、经营范围、成立时间、执照发证时间、有效期限、执照审验记录、企业联系人姓名、联系电话和传真、电子邮箱、企业网址、企业注册地址和实际住址;

2.建筑业企业资质证书编号、资质类别和资质等级(有增资质的,包括每项增资时间)、资质证书规定的经营范围、发证时间、有效期限、审验记录、各项变更记录;

3.安全生产许可证编号、发证时间、有效期限、审验记录;

4.企业主要经济、技术和管理人员信息库及其相关信息。

(二)企业良好信息

1.近5年内承接的各类工程情况

a.工程名称、建设地点、建设单位、规模、面积、造价、层次、跨度、结构形式、使用功能或特殊施工工艺、特殊施工技术、合同工期、实际开工和竣工验收时间;

b.是否在部、省、市获得工程质量、文明施工、安全生产方面奖励及获奖时间(发文和发证时间)。

2.是否被部、省、市建设行政主管部门评定为“安全质量标准化达标示范企业”及评定时间(发文和发证时间)。

3.企业良好信誉信息

a.通过ISO9000系列质量管理体系认证及通过认证时间;

b.通过GB/T24001环境卫生管理体系认证及通过认证时间;

c.通过GB/T28001职业健康安全管理体系认证及通过认证时间;

d.获得国家、本省、本市工商行政主管部门授予的“重合同、守信用企业”称号(授予部门、授予时间);

e.近5年内参加社会突发重大灾害的抢险救灾、承担过政府部门下达的突击性重大建设任务等有突出贡献,并受到市或区人民政府表彰的信息(事件名称、事件发生时间、表彰单位或部门、表彰时间);

f.近5年内在本市开展扶贫、助学募捐的信息(募捐名称或事由、历次募捐时间、每次募捐金额)。

(三)企业发生的不良状况和被限制投标的信息

1.处于被责令停业、投标资格被取消或者财产被接管、冻结和破产状态(暂停期限、解除暂停期的时间);

2.因拖欠工人工资或分包工程款,被有关部门暂停投标资格和承接新的工程(暂停期限、解除暂停期的时间);

3.因骗取中标或者严重违约以及发生重大工程质量、安全生产事故等问题,被有关部门暂停投标和承接新的工程(暂停期限、解除暂停期的时间);

4.因安全生产许可证过期或被暂扣、吊销或连续两年在安全质量标准化评定中安全生产条件不合格,被暂停投标和承接新的工程(暂停期限、解除暂停期的时间);

5.因其他方面原因发生不良行为记录,并处于被公示或暂停投标和承接新的工程的期限内(公示或暂停期限、公示期截止或解除暂停期的时间)。

二、建造师(项目经理)信息

(一)基本信息

1.姓名、性别、出生年月、身份证号码、户口所在地址、学历、所学专业、职称证书编号、职称专业名称和等级、发证时间、联系电话、电子邮箱、工作状态;

2.注册建造师(项目经理)证书编号、注册执业资格专业名称和等级、发证时间、证书有效期(起止时间)、执业期的审验信息(审验部门、审验时间)、注册登记信息(包括历次注册的单位全称、注册时间等);

3.受聘信息(包括历次聘用的单位全称、聘文或聘书编号、聘任职务、聘用起止日期、制发聘文或聘书时间等)。

(二)建造师(项目经理)良好信息

1.近5年内担任施工单位项目负责人(即项目经理)承建的各类工程情况 a.工程名称、建设地点、建设单位、规模、面积、造价、层次、跨度、结构形式、使用功能或特殊施工工艺、特殊施工技术、合同工期、实际开工和竣工验

收时间;

b.是否在部、省、市获得工程质量、文明施工、安全生产方面奖励及获奖时间(发文和发证时间);

c.是否被部、省、市建设行政主管部门评定为“安全质量标准化达标示范工地”及评定时间(发文和发证时间)。

2.建造师(项目经理)良好信誉信息

获得过国家、本省、本市建设行政主管部门授予的“优秀建造师(项目经理)”称号(授予部门、授予时间);

(三)建造师(项目经理)发生的不良状况和被限制投标的信息

1.正在其它在建工程项目上担任施工单位项目负责人(计划开工和竣工时间);

2.因骗取中标或者严重违约以及发生重大工程质量、安全生产事故等问题,被有关部门暂停投标和承接新的工程(暂停期限、解除暂停期的时间);

3.因其他方面原因发生不良行为记录,并处于被公示或暂停投标和承接新的工程的期限内(公示或暂停期限、公示期截止或解除暂停期的时间)

数据走向信息是王道 第3篇

事实上,对于感兴趣的事实、事物乃至系统,如果获取的信息多,对其在认识上的不确定性或模糊性就会少。不难理解,人们对系统的关注和兴趣,根本的目的是要认识它、适应它、溶入它、“控制”它,乃至最终利用它并与其和谐相处。这其中当然需要智慧。差不多可以这样认为,历史发展到今天,人类获取智能所遵循的就是一条从数据(data)到信息(information)到常识(knowledge)到认识(insight)到智慧(wisdom)的演变路径。而人工智能的终极发展,这个路径也极具价值。

处在信息时代、信息技术高度发展而且还在快速发展的历史节点上,已经容不得不从大数据、云计算和物联网这三个维度和角度来审视信息社会的发展进程和状态了。根据全球最具权威的IT研究与咨询公司高德纳(Gartner)建立的IT概念及潜在项目演变的成熟度变化曲线模型,即便到今天,大数据、云计算和物联网也还没有进入到成熟、稳固、全面发展的状态。这从另一个方面也预示着,信息社会的发展不久将会进入更加激动人心的阶段。

正是因为数据与信息的紧密关联,大数据才在社会的各个层面受到特别的关注和更大的重视。数往知来,获取数据不是目的,提取信息才是所求,甚至这也仅仅是个过渡性的追求,更大的期盼是获得更多的知识以提升具有更高智能的智慧。

数据的大量产出是信息技术和信息社会快速发展的必然结果。笔者在1990年代早期赴美国的大学从事研究期间就领略到美国教授和IT工程师的一种察觉:“计算机磁盘空间永远也不够大。”根据全球著名的管理咨询公司麦肯锡(McKinsey)2011发布的关于大数据的报告,到2007年的时候,全球一年所生成的全部数据第一次超过了全世界全部存储器所能容纳的程度。这意味着一些数据如过眼烟云般随生随灭了。如今,存储器集成度在提升价格在下降,以GB和TB为单位的数据盘和存储器已经非常普遍,尽管全球的数据存储能力得到明显加强,但却要“水涨船高”地面对全球每天生成的高达2.5EB字节之巨量的数据,这大体上相当于1万个美国国会图书馆全部藏书的数字化之规模。显然,数据价值评估与数据冗余去除及数据噪音去除已经成为一个首当其冲的问题,因为数据越多,从中提取出有用的信息就越困难。撇开抽样而利用全数据空间是一个诱人而没有技术和方法支撑的想法。“啤酒和尿布”的关联故事很难在更大范围更宽领域重现,而且即使这个关联关系本身的发现也需要数据之外的工具和技术。

数据价值挖掘的好,首先数据要存放的好,数据的干净程度要高。不论是大数据还是小数据,从数据走向信息才是王道。在纪念信息论奠基人香农诞辰100年的今天,我们更应从信息的角度来审视数据及相关的概念延展:0级信息是数据,1级信息是信息本身,2级信息是常识,3级信息是认识,4级信息是智慧。本质上,数据总是产生自一个系统,系统的日益复杂性自然导致了数据呈现出的复杂性,而攻克复杂性问题将是科学、技术、工程领域必须长期面对的挑战。为了实现大数据的健康发展,需要从数据采集和存储的一开始就要尤其关注数据和信息的融合。只有这样,大数据才能发挥出更大的价值!

注:2016年4月30日是信息论奠基人香农诞辰100周年的纪念日。

浅谈大数据时代数据信息现状及发展 第4篇

一、大数据时代的必然出现

大数据的概念最早由麦肯锡咨询公司提出, 顾名思义即数量规模庞大的数据, 体现数据的规模性、多样性、高速性和价值性四大特点。大数据是信息处理与计算技术的延伸, 也是社会进步和发展的必然趋势。

在信息和网络技术飞速发展的情况下, 社会生活中越来越多的活动实现了数字化。随着数据生成的自动化、数据生成速度的快速化, 数据量随之迅猛增长。存储设备、内存、处理器等电脑元件成本的不断下降, 使之前昂贵的大数据存储和大数据处理更加便宜, 为数据量飞速增长提供了有效的保证, 从而使得大数据的存在成为可能。信息技术的飞速发展, 为数据的生产、存储提供有力的基础, 并且允许数据形式的多样化, 从而促进了大数据时代的产生和发展。随时随地通过各种方式和手段, 上传和下载、发布或共享文字、图片、音频和视频等各种形式的数据, 越来越多各种形式的数据提供给人们使用。数字化已经成为经济社会发展的必然趋势。与生产过程必须依赖硬件设备和人力资本一样, 企业的业务活动、创新、成长也越来越离不开大量数据的支持。也就是说, 社会生活中的任何一项业务活动都与大量的数据紧密相联, 每一个人都是数据的产生者, 同时又是数据的使用者。数据量与日俱增, 数据结构繁杂多变, 数据产生速度越来越快, 数据带给我们的价值远远超过以前, 我们已经进入了大数据的时代。

在大数据时代, 有计算机技术的支持可以分析处理更多的数据, 甚至可以处理某个特定范围的所有数据。随着数据数量的不断增加, 使我们的思维有所改变不再只关注数据的准确性, 不再关注数据的之间的因果关系。大数据为工作、生活和思维带来了改变, 所以需要对数据和信息的重新界定。

二、大数据时代带来大规模的数据

数据的一般定义为, 科学实验、检验、统计等获得的和用于科学研究、技术设计、查证、决策等的数值。随着数据定义的发展, 不同研究领域数据已不再单纯局限于数字本身, 它是载荷或记录信息的符号, 并且是按照一定规则排列组合的符号, 除数字以外, 数据表达方式也可以是文字或图像, 甚至是任何代码。数据无所不在, 充斥于社会生活中的每一个角落、每一个人、每一个组织都在使用数据。数据的海量生产、共享和应用已经成为必然。在大数据时代背景下, 数据具有传统数据所不具备的独特特点。

首先, 数据产生数量庞大。数据量非常大是大数据的首要特点之一, 大数据时代的数据量不再用TB为存储单位, 而是以PB、EB、ZB为存储单位。社会生活中每天产生的数据量已经远远超过过去每7年所产生的数据量。企业的磁盘存储量及个人电脑和笔记本的存储量超过了7EB字节。经济社会被如此庞大的数据量所包围, 这也正是大数据时代下重大变化之一, 即用数据来表示社会生活中的各种活动。

第二, 数据增长、变化速度飞快。这既是大数据时代所具有的独特之处, 也给大数据的处理带来机会与挑战。大数据环境下, 数据产生、存储和处理、并不断更新的速率十分惊人。因特网上每秒钟产生的数据量超过了20年前整个因特网所存储的数据量, 可见大数据产生速度之快, 数据处理变化之快。数据生产量飞速增长的同时, 要求创新出更快更好的数据处理技术。才能满足这个用数据说话、竞争异常激烈的大数据时代对数据的要求。通过快速地有效地处理不断更新不断变化的大规模的数据量, 才能获得竞争优势, 才能在大数据时代发展和进步。

第三, 数据表示方式越来越多。多样性也是大数据的重要特点之一。大数据以多种多样的形式涌现, 文字、语音、图像、视频等形式。随着大数据时代的发展, 新的数据来源与数据形式会不断出现。如此多样化的数据对数据非结构的存储要求更高, 从而要求改变传统的数据库。另一个方面, 大量、繁杂的数据中却保存着更多的有价值的信息, 这也是数据多样性带来的数据价值的体现。

第四, 数据具有较高的价值。数据数量巨大并且价值总量也很高, 但价值密度却很低。连续不断的视频数据中, 有用的数据可能仅仅只有几分钟甚至是几秒钟。大数据的价值体现在数据的数量多, 进而带来更多的价值, 但是从繁杂的大数据中找到有用、有价值的准确数据也是大数据时代带来的挑战。

三、有意义的数据才是信息

在很多情况下, 数据和信息两个词常被赋予同样的定义。严格意义上讲, 二者间是不同的。数据是对信息数字化的记录, 是一种表示的符号, 其本身没有实际意义。信息则是指把数据放到一定的背景下, 对于数字进行解释并赋予意义, 也就是说信息是有意义的数据。但在进入信息时代后, 人们趋向于把所有存储于计算机上的信息, 无论是数字还是音乐, 甚至连视频都统称为数据。

信息具有价值性, 有意义有价值的数据才是信息, 信息是使用者可以利用的数据。信息是真实的, 可以客观地反应现实世界的, 相反不符合客观事实的信息是没有价值的。反应客观事实并且不虚假的数据才是信息。信息比数据更有时效性, 过期的数据对现实没有用处不是信息。如果反应客观事物的所有数据都可以找到那么这样的信息就是完整的。不同的载体可以承载相同的信息, 与数据相同信息具有多样性和变换性。信息可以被共享, 共享后的信息价值相对会下降, 因此为了获得更多的利益, 必须寻找新鲜的信息。

迅猛增长的数据数量, 快速涌现的新数据, 千变万化的数据表现形式, 不断增加的数据价值, 以及不断创新的计算机技术给大数据时代打下了夯实的基础, 标志着数据化的必然趋势, 也标志着经济社会已经迈入大数据时代。在大数据时代对数据和信息的理解要有所变化, 需要我们重新审视, 重新区分数据和信息, 这样有助于我们在大数据时代获得更多更好更有价值的信息, 从而在竞争激烈的大数据时代获得竞争优势。

摘要:大数据开启了一个时代的转型, 给人们带来一场生活、工作与思维的大变革。时代的变革需要以大数据为视角理解数据与信息。本文介绍了大数据时代出现的必然性, 分析大数据时代数据的特点, 从而阐述大数据时代背景下信息的特点。

关键词:大数据时代,数据,信息

参考文献

信息数据 第5篇

教学过程:

一、引入

利用网络是获取信息的一个主要途径,网络信息的获取分常规信息获取和网络数据库信息的获取。我们先复习常规网络文件信息的获取,再学习和体验网络数据库信息的获取。

二、复习

集体复习一下怎样利用google搜索引擎和flashget下载工具来通过网络完成我们需要的文件。

三、新课堂知识点讲解

1、什么是网络数据库

2、网络数据库:数据和资源共享这两种技术结合在一起即成为在今天广泛应用的网络数据库(也叫WEB数据库)。它以后台数据库为基础,加上一定的前台程序,通过浏览器完成数据存储、查询等操作的系统。

2、网络数据库信息检索的一般过程

以检索义务教育法为例http://

重点突出:明确目标——提炼关键字——输入执行——评价调整 这个过程

3、体验多样的网络数据库(演示)a、教育资源库:

中国基础教育网

http:// c、在线图书馆

中国国家图书馆 http:// e、数字城市

数字北京:http://

4、网络数据库的评价

从我们目前的实际出发,一般我们建议考虑以下几个因素:

1、内容准确无误

2、范围广深适度

3、来源权威可信

4、更新及时规律

5、检索方便高效

6、系统稳定可靠

四、课堂小结

从知识点、课堂秩序、学生反应进行小结 实践:

1.参考书P34页的网站,查找学习资料,如:三角函数的内容;

2.利用在线图书馆,查找某本书的情况,将书名,作者,出版社,出版年份,开本,页数,定价,内容简介等保存。

3.利用数字城市网站,查找从苏州火车站到苏州乐园的公交路线。

让数据说话 传递有用信息 第6篇

一问起2008年暑假里最令人激动的事情,相信你会说:我国成功举办了北京奥运会.是啊!奥运会上,我们国家体育健儿表现可棒了,取得的金牌总数是51,位居世界第一;取得的奖牌总数是100,位居世界第二.详细数据见表1.

你看!以上数据够详细了吧,看了这样的数据,谁都会对中国竖起大拇指!你看,有了数据,就有了最后的结论.数据说了话,谁都会认可.

这就是我们今天将要一起讨论的课题:让数据说话,传递有用的信息.

生活中这样的例子可太多了.

你还记得你们班的班干部是如何产生的吗?可能刚进校时,班主任会依据小学里的表现情况,暂时指定一些临时负责人,一段时间以后,一般还是要通过大家的选举,这时谁能否当选,就看得票的多少.谁得的票多,就说明大家对他更信任,他就可以为大家服务.

你在观看一些电视娱乐性比赛节目时,一定也注意到选手最后的名次,是和评委的打分多少、短信的支持数量密不可分的.

相信你一定还可以举出其他很多例子,这说明:有了数据,就有了说话的依据.现在让我们一起投入到收集数据,表示数据的过程中去,更好地体验一下其中的乐趣吧.

假设你们七年级一共有4个班级,进行大循环的足球比赛,成绩情况如表2所示.

按照通常比赛的规则“赢一场得3分,平一场得1分,输一场得0分”,请你算算各班的总成绩,相信你一定会得出这个结论:你们一班取得了第一名!

现在让我们关注一个抛掷硬币的问题.足球比赛开始前,裁判通常会抛掷一枚硬币,硬币落地以后,以出现的正面或者反面为依据,让比赛的某一方首先挑选半场场地.那么裁判在抛掷一枚硬币时,硬币落地以后,应该有两种可能:出现“正面”或出现“反面”.这两种情况出现的可能性是一样还是不一样呢?如果不一样,那么哪种可能性会大些?你可能会猜想:可能性差不多大吧,否则裁判使用硬币就变成不公平了.可以告诉你,的确是完全一样的,你猜得真准!那么能否让数据说话呢?

某一位同学抛掷一枚硬币,所得到的数据如表3、表4所示.

这里的频数就是出现的次数,频率就是出现的次数与总次数的比值.从表中可以看出,出现正面的频率都是50%左右.

若你再画出折线统计图,那就更清楚了.在折线统计图中,你可以看到:随着抛掷次数的增加,出现正面的频率会稳定在50%附近.因此我们可以说,出现正面的可能性是二分之一.

历史上众多的科学家对于抛掷硬币的问题都做了许多实验,实验情况如表5所示.

不过这个统计表中,还有一些数据没有填上,请你帮忙把这些数据填上.填完后,相信你,一定会有这样的感受:这些科学家为了解决在你现在看来好像是一个十分简单的问题,花了很多工夫,他们的执著精神真值得我们好好学习.

除了抛硬币,如果你有时间,不妨换一个东西试一试.如果换为一个矿泉水瓶盖,结果还会一样吗?要想得到真正的结论,那就可以实际抛抛看,一边抛,一边记录抛得的结果,看看瓶盖朝上、朝下的可能性各有多大.抛的次数越多,记录的数据就越多,你得到的结论可能就越准确.或许你还会发现其他一些有用的结论.

以上这些例子给我们揭示了一个数据收集与表示的过程:

统计图有条形统计图、扇形统计图和折线统计图等,它们都可以用来表示数据,传递真实的信息,让人们获取有用的信息,了解某一问题的发展变化情况,从而作出正确的判断与决策.

用数学的语言表达你的观点,让数据说出真实的、有意义的话!

(责任编辑:田心红)

谁更满足

老师问比尔:“一个有六个孩子的人和一个有600万美元的人,谁会感到更满足?为什么?”

信息数据 第7篇

关键词:机动作战,信息服务,大数据,决策

机动作战是以本部建制内的步兵、坦克兵、炮兵等力量为主体,并得到跨建制、超常规加强和支援的诸军兵种联合进行的战斗行动,主要表现为以精锐作战力量在较短的时间内,以中、小规模作战达成战役战略目的,战斗样式将随着作战对象、地形、任务及作战进程的变化而变化。在机动环境下,机动用户的信息服务和固定环境下的信息服务不同,必须考虑位置相关因素、时效性相关因素和用户行为特征等,才能符合机动作战瞬息万变的战场形态。整个机动作战战场的信息,将通过一体化的机动信息服务保障手段,形成全天候、立体化、多种手段并举的综合一体化战场信息网,为机动作战中的各机动用户提供信息服务。

信息化作战条件下,战场数据具有明显的大数据特征,因此机动信息服务系统中的指挥信息系统模块不仅应具有数据汇聚整编的能力,更需要具备生成决策支持数据的能力,为作战决策注入新的活力。战略信息与战役信息、战术信息密切相连,难以明确区分其层次,许多战术行动直接决定战略、战役行动的成败,这就要求将战略、战役和战术信息结合在一起,实现一体化的信息服务保障体系,形成战场信息资源共享。如何把握大数据的特点规律,对海量多元基础属性数据和动态目标数据进行深度挖掘,综合生成高价值、集约化的决策支持数据,从而有效辅助作战决策,是我军机动信息服务系统中信息内容模式研究需要解决的一个重要课题。

1 大数据环境下机动信息服务系统指挥信息决策支持数据需求分析

信息化条件下的作战体系是一个开放的复杂巨系统,由于信息技术的飞速发展和广泛应用,作战体系运转将涉及越来越多的各种信息资源,因此,与大型企业的经营管理类似,大数据已成为信息化条件下联合作战不可回避的问题,换言之,大数据环境是基于信息系统体系作战必须适应的环境。大数据环境下,依托机动信息服务系统这一主要指挥手段进行作战筹划时,首先需要解决面向指挥者尤其面向指挥员提供什么样数据的问题,也就是决策支持数据的需求问题。

首先,决策支持数据应该符合知识管理的DIKW模型,即数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)。数据D在本文中探讨了一个单独立作战目标的事实、信息、知识;信息I则是有意义的数据,或者是有序的数据,信息是通过对数据的“关联、分类、计算、纠正、提炼”等获得的;知识K是有用的信息,通常是通过对信息采取“比较、推理、关联、交谈”等方式获得的;智慧W是集体或个体,运用知识解决问题的经验,表现为概念、经验和洞察力,在对知识理解的基础上对知识进行运用。这也是知识的产生、评估和使用的基本框架。可见,决策支持数据的获取,应该是从数据D中获得信息I,并基于智慧W获取知识K的过程。因此,决策支持数据是基于底层数据所获取的高层“知识”。

其次,决策支持数据应该具备以下3个特点。

1.1 集约化程度高

决策的关键是要达成及时性和科学性。决策支持数据的目的性应该高度聚焦,信息量应该十分丰富,并且还能蕴含高价值的知识和认知,这样才能为指挥者直接、快速、集中和有效地利用。反之,如果提供的决策支持数据是粗放的、离散的,有明显的冗余甚至有偏差,将会使指挥者陷入迷惑从而迟滞决策,甚至严重干扰正确决策。大数据方法能够以新的方式处理各部门各系统分散存在的海量数据,更多的是依赖于数据的相关性分析而不是数据间特性的因果分析实现集约化处理,因此,指挥者借助大数据方法和手段得到的决策支持数据,可直接、集中、准确地发现“威胁有哪些”“最高程度威胁是什么”“我方优势是什么”等信息和知识,从而快速作出正确决策。

1.2 精确性高

信息化条件下作战,要求实施精确的作战运筹,在最短的时间内以最低的代价达成最佳的战场控制效果。这需要准确而详细地掌握各作战目标信息,掌握我参战兵力的空间信息和兵器使用的空间要求,从而精确把握作战时机,运用相应的作战力量,对选定目标实施精确打击。通过大数据的特征知识挖掘技术,包括基于云计算的大数据挖掘技术、高扩展的数据分析技术、大数据并行计算框架技术等,可以高效准确地处理各种数据,从中得到精确的决策支持数据,缩短决策周期,提高指挥速度,加快作战进程。

1.3 时效性强

信息化条件作战,战场实现了网络化、一体化,信息可实时获取、传输、处理和利用,战场态势瞬息万变。数据处理越及时,其价值就越大,发挥的效能就越好,就能在快速变化的战场态势中赢得先机。如何从种类繁多、价值密度低的基础属性数据和动态情况数据中实时地提炼出系统所需的决策支持数据,是制约整个作战辅助决策系统效率的瓶颈。

2 运用大数据技术,生成智能决策支持数据

2.1 基于数据仓库、联机分析处理与数据挖掘的决策支持数据生成模式

联机分析处理、数据仓库、数据挖掘都是大数据模式下的决策支持数据生成技术,他们有各自的辅助决策方式。在线分析处理,决策支持数据仓库,以提供、存储大量数据和决策支持,适用于各种不同的用户趋势分析,它可以提供一种多维数据分析,随机的数据挖掘查询和其他信息被用来进行活化,是要找到的信息和知识的决策给用户的隐式数据。一个大型数据环境在线分析处理,需要整合数据挖掘技术与数据仓库,能够形成一种新的决策支持数据生成模式,其结构如图1所示。

2.2 基于大数据融合技术,生成精准的目标属性数据

目标属性数据是决策支持数据的重要组成。目标属性包括目标的当前位置、状态、威胁程度等。基于大数据融合技术,可以生成决策所需的目标属性数据。

2.2.1 目标状态属性数据的生成

由于复杂的外部环境和传感器自身的局限性,对于目标信息的处理过程面临着多种不确定性,如信息监测传感器的不确定性引起的随机误差;虚警或者其他目标测量不确定度等客观来源造成的误差;不确定性移动目标;不确定性造成通信延迟等。只有解决这些不确定性问题,才能进行目标状态的融合估计,选择相应的解决方案,包括数据关联,滤波算法和机动目标建模。

(1)相关数据是根据与其他测量单个传感器之间的关系的数据的度量来确定是否与所述其他数据处理相同的源(或目标事件)。发现了目标跟踪处理,数据关联过程将已知目标航迹预测与候选回波进行比较,并进行跟踪观察。

(2)过滤和预测的目的、目标位置、速度、当前状态和未来的目标周期,如对加速度进行评价。维纳滤波、最小二乘滤波器、α-β滤波器、α-β-γ滤波器和用于过滤卡尔曼滤波器基本方法。据此以确定过滤算法预先掌握初步信息的多少。目前的做法通常是用卡尔曼滤波器工程直角坐标系来确定。

(3)目标模型描述了在数学模型的运动目标状态的变化。跟踪机动目标的主要问题是要建立一个未知的目标加速度模型。此问题由两部分组成:第一,随机过程机动的目标特征的特点,该过程为白色;第二,机动加速度的特定概率密度函数。

2.2.2 目标身份属性数据的生成

多传感器目标基于融合的目标身份识别是对于来自多传感器的身份说明或者与身份相关的参数将为了得到联合估计身份稠合。目标是地理位置分散、辐射到目标或者可以肯定的武器平台(如作战单位等)。数据参数数据或传感器相关判定识别的属性,如红外或可见光谱中,属性的数据身份是指同一性之间的敌我识别的直接输出被测量和突发成像数据、数据雷达反射截面(Radar Cross Section,RCS)等。目标融合的身份属性可以使用以下3种算法:基于认识的模型、基于特征的推理技术、基于物理模型。基于特征的推理技术,包括经典的推理、贝叶斯和DS证据推理方法。基于认识的模型包括逻辑模板、基于知识的(专家)系统、模糊集理论等。

2.3 基于大数据挖掘的舰艇编队对空防御决策支持数据生成模型示例

决策支持数据的生成可以采用各种不同的大数据实现技术,其中,基于神经网络专家系统的智能决策支持既充分发挥了以模型计算为核心的定量分析问题的特点,又发挥了专家系统以知识推理形式解决定性分析问题的特点,充分做到定性分析和定量分析的有机结合。运用该结构可生成舰艇编队对空防御的决策支持数据。

例如,某舰艇编队对空防御决策支持系统可以采用以专家系统知识库、推理机、数据库、模型库为主体的智能决策数据生成模型。具体如下:

(1)知识库中的知识表示采用产生式系统的规则表示,事实库中的每一个事实均以对象、属性、价值、重量来表示,表达了他的信心。事实上,即在每个节点(推理树)的树知识的所有节点可以分为叶节点(节点证明),它实际上是基于以下事实得出结论库中间节点(中间假设)的事实和神经元之间的知识嵌入在神经网络(重量)中的黏结强度。

(2)推理引擎是基本的信息处理的神经元。这是基于多重链路点对点协议(Multi-Link ppp,MP)中数值方法的模型。神经网络有成熟的学习算法。有关使用的算法和模型的详细信息,基本上都是基于使用delta规则感知器和Hebb规则。

(3)该数据库是由来自基础数据库动态和静态数据组成。预先输入的,由主库和该库参数制备武器固定数据库来存储数据,也被称为基本数据库配置;动态数据库用于存储战场实时数据。

(4)舰艇编队防空模型库模型主要分为3类:第一类是知识模型结叶树,如大量的图表图形模型;第二类是决策模型,如方向形成机理模型分析模型、资源分配和对空作战模型等;第三类是优化模型。

3 依托大数据环境,构建机动信息服务系统中指挥信息决策支持的“数据云”服务平台

机动信息服务系统辅助决策单元的数据源是海量、复杂的,而决策支持所需的数据具有高价值、精简、高效等特性,因此,必须采用一种与之相适应的高效计算平台。

云计算是分析和处理大数据的强力平台,是成本最低、效率最高、利用率最大的大数据处理方式。可以通过云平台统一管理作战过程中的源数据,并采取大规模的分布式处理方式来提高计算效率。因此,在大数据环境下,以云服务的方式搭建平台是快速有效获取机动信息服务系统决策支持所需数据、提高决策效率的关键。

3.1 机动信息服务系统云服务平台的特点

安全、高效、可靠的导航信息服务体系是建立一个平台、云服务和运行的基本要求。在云服务平台建设之初,首先,应根据“云机动信息服务系统”的客户群体数量、资源需求、云计算资源利用率,峰值云资源和服务,传统的云安全威胁和安全需求评估的系统,选择合适的对象和云服务的比例,从而保证云服务平台具有最优的资源配置与响应速度。其次,应当准确地预测云服务模型的未来发展和对扩充和系统接口保留用于未来的资源需求,云服务基础设施,平台和应用软件单元的云的膨胀方向。第三,加强对机动信息服务系统云服务平台可用性和业务数据流的安全防护功能的评估,为传统的决策支持系统与数据安全、高效地迁移至云计算环境提供理论依据。第四,保护好机动信息服务系统的云数据管理系统、业务和用户信息、领导和机密数据等基本数据,以确定云服务的安全浏览用户信息,保密性和可靠性的服务体系并没有中断。因此,在不降低云系统的效率前提下,提高操作应用水平、系统服务、数据服务和用户加密认证的水平,以确保声音管理易于控制和使用,是提高平台、云服务的安全性的重点。

3.2 高性能机动信息服务系统和云服务平台系统的构建策略

该云服务平台使用活动以确定科学的设计平台的效率和可靠性。首先,必须操纵信息服务系统,其特征是制定了详细而完整的设计平台服务。硬件和软件应用云计算、安全系统和功能、调整结构覆盖等操作符合技术标准的云计算和云系统架构规范,且易于实现。其次,增加了硬件来提高在云服务平台系统的应用程序和服务的前提下云平台的密度,增强云应用软件的兼容性、可靠性、可扩展性、工作能力以及云应用的建设,减少维护和升级平台的成本。第三,在云服务运营平台的设计中,应加强资源平台的云基础架构、系统资源、存储管理和云应用,以数据管理和服务交付资源的云业务的统一实施和管理流程为导向,提高云平台效率和服务质量。第四,云服务平台在建设和功能实现过程中,应加强平台云服务功能可控性和云应用程序设计的灵活性,不断增加云系统底层结构的透明度。

总之,云服务平台消除了多系统的应用存在的分散数据存储、浪费存储资源、管理不善、对交叉数据分析困难的问题。通过提供标准统一的数据收集接口,机动信息服务系统云服务平台能够收集各机动信息服务系统中的结构化和非结构化的数据,并且将数据进行统一存储和管理,不需要自己搭建复杂的计算集群即可获取高价值的机动信息服务系统决策支持数据。

4 结语

信息数据 第8篇

1 企业信息数据防泄密现状及分析

1.1 企业信息数据的泄密隐患

当前, 企业的信息数据泄密隐患主要来自于两个方面, 即外部的信息窃取和内部的信息泄密。数据泄密的主要途径有七种:黑客和间谍窃取, 外部竞争对手窃取, 内部人员离职拷贝带走数据泄密, 内部人员无意泄密和恶意泄密, 内部文档权限失控泄密, 存储设备丢失和维修泄密, 对外信息发布失控泄密。

1.2 企业信息数据安全保密现状

企业在信息化规划及建设规划过程中都已或多或少考虑了信息安全, 并已经建立了一些信息安全系统, 企业信息安全系统主要由防火墙、VPN、IPS、IDS、防病毒、存储备份、容灾和安全管理制度等组成。通过信息安全系统的建设, 对企业信息安全管理、网络安全、数据安全有一定的防护能力。但是, 企业还存在信息安全的投入不断增加、维护与管理越来越复杂、信息系统的使用效率不断降低、企业内部缺乏信息数据泄密防范、对新型攻击入侵无防御能力等一系列问题。

1.3 企业信息数据防泄密存在的突出问题分析

企业内部需要进行数据保密, 同时也面临着更多的数据交换方式和业务应用方式的结合问题, 如何在安全和便捷之间寻找合适的平衡点, 是企业数据保密建设的难点, 从企业信息安全管理的实际情况来看, 主要存在以下矛盾:

1.3.1 如何保证信息数据处于开放状态下的保密

由于企业的规模较庞大, 人员的流动和信息的交互也非常频繁, 企业很难从管理上确保处于开放状态下的信息数据的安全。另外, 早期建设信息化系统时考虑更多的是使用的便利性, 比如OA、ERP在公网的应用, 原本是方便驻外人员和移动办公的需要, 但是由于外部的管理措施无法和企业内部进行有效的联动, 开放的应用系统成了数据保密建设的障碍之一;

1.3.2 如何解决在对外频繁交流和沟通中的数据安全性问题

任何的信息数据都不是孤立的, 一旦孤立对企业的生产和运营的工作效率将产生严重的影响, 因此, 各种途径的数据交换都给数据在传输使用过程中的安全性带来了严峻的挑战, 企业要保证数据对外交换的过程中提高数据的安全管理, 是安全和便捷间寻求平衡最头疼的问题;

1.3.3 如何同现有的管理体系和人员组织相结合

数据保密不仅是一项功能性产品, 更多的是需要跟不同的职能部门进行有机的结合, 跟相关的管理措施和制度相结合, 不同的使用角色和不同的工作职能对数据的使用方式和应用方式, 如何有效地进行联动取得最佳的效果是数据保密项目成功实施的关键要素。

从以上问题中可以发现, 很多企业对于建立数据保密系统处于两难境地, 既要考虑到企业实际的需求又要考虑到现在的企业制度和企业文化。目前企业急需系统化架构和实施信息数据防泄密体系, 为企业提供有效的信息数据安全保障。

2 企业数据加密系统建设

2.1 数据加密系统规划思路

数据加密系统规划思路是围绕数据文档加密为控制点, 在企业网络内对数据文档进行自动透明加密, 通过解密流程控制审核数据文档解密, 防止企业数据文档被非法窃取、泄密。在不影响企业用户正常使用的前提下, 做到企业数据文档加密:盗走了、拿走了、没法用。

2.2 数据加密系统关键功能

(1) 全面安全防护。采用高强度加密算法, 内核透明加密保证文件全程处于加密状态, 进程自身保护防止恶意修改、终止、卸载等。

(2) 内置解密流程。程序内置解密流程, 集成域帐户解密审核审批权限控制, 点击鼠标即可完成授权解密, 解密记录可审计。

(3) 灵活策略定义。根据企业实际情况, 对重点部门的个人终端, 可实施强制性加密措施, 使终端里的机密数据自动加密保护。

(4) 精细权限控制。对CAD图纸文档等可以实现细粒度的权限控制, 如:打印、传输、拷贝、编辑修改、使用时间、次数等细致权限控制。

(5) 无缝安全对接。本系统能够与企业已有的应用业务系统 (比如说:PDM、ERP等) 集成, 顺畅对接, 方便使用。

(6) 完善的审计跟踪。提供详细的操作审计日志, 记录使用者的所有行为。可以利用查询记录功能来检查这些记录。

2.3 加密系统的加密原理及应用思路

2.3.1 加密系统实现原理

通过在服务器和客户端计算机上安装加密系统软件, 加载到Windows操作系统的内核, 可以监控Windows操作系统的所有应用程序的文件读写、输入、输出及数据通讯等相关的执行过程, 对非法访问进行控制 (如拷贝、粘贴、截屏操作) , 根据加密策略对指定的应用程序产生的数据文档进行实时加密。

2.3.2 文件解密实现原理

申请人直接右键点击文件和文件夹, 选择“申请解密文件”, 通过计算机分组管理, 解密申请会自动发送到相应主管领导计算机上, 主管领导确认是否同意即可实现文件解密, 主管领导确认后会自动发通知到申请人计算机, 申请人下载解密后的文件即可。解密文件操作过程不会影响到原来存储的文件, 系统会复制一份到后台解密, 只有申请人可以下载解密后的文件, 并且解密后的文件经下载后, 即自动删除了。解密流程如图1所示。

2.3.3 加密系统运行的安全性

加密系统是加载在Windows内核中的软件监控系统, 当安装了加密系统后, 用户感觉不到加密系统在运行, 但用户的操作动作, 如保存文件、读/写文件等都在加密系统的监控之下。用户试图卸载加密系统是不可能的, 就像Windows操作系统运行时您不可能关闭Windows内核一样, 除非您关闭计算机。

2.3.4 加密系统的稳定性

加密系统在Windows操作系统内核执行文件读写前实现监控并触发必要的加密动作, 加密系统在运行时, 并不损耗系统资源, 且能“安静而忠诚”的工作着。只有当指定的应用软件 (如UG) 访问数据文件 (如PRT后缀的文件) 时才触发加解密动作。安装完加密系统后, 对系统的影响就像多加装了一个USB接口的硬件设备及其驱动程序。

2.3.5 加密系统应用的条件

在公司内整体部署加密系统, 就形成了一个特定的公司网络工作环境;只要是公司网络内计算机上产生的指定类型文件都处于实时加密状态;在公司网络内计算机上读写加密的文件对用户来说是透明的, 不产生任何影响;加密的文件可以在公司内部进行交流, 当离开公司网络的加密文件立即不可用;

需要对外交流的加密文件, 可通过部门领导的审核并解密后发出;加密系统的加密密钥和解密密钥对我们公司来说是唯一性的;加密系统支持离线使用, 即离开公司网络的公司计算机可继续使用, 像在公司网络内一样;加密文件的内容复制、粘贴、截屏有严格的管理规定。

2.3.6 加密系统的影响

实施加密系统对用户使用操作计算机不产生任何影响、也不需要任何额外操作, 不会对公司的日常运转、计算机使用带来其他的影响。加密系统采用的加密方式为实时加密, 即用户在安装了加密系统客户端的电脑上操作时, 无论是打开、修改和保存文档时, 加密系统将实时对文件进行加密, 对用户并没有增加其他的额外工作, 加密于无形之中。

对于已经加密的文件, 在公司网络内安装了加密系统客户端的电脑上可以直接打开、修改和保存, 保存后的文件仍然是实时加密的, 即对用户来说是透明的、感觉不到的。

在打开加密文档后, 对文档内容的拷贝、粘贴以及截屏, 加密系统有严格的管理控制。加密文件内容拷贝以及截屏仅仅可以粘贴到实时加密的应用程序中, 即实时加密的应用程序间可以进行拷贝和粘贴;非实时加密的应用程序间也可以拷贝和粘贴;非实时加密的应用程序内容拷贝可以粘贴到实时加密的应用程序中, 反之则不行;截屏只能粘贴到实时加密的应用程序中。

实施加密系统后, 现有的大量文件仍处于未加密的状态, 需要进行批量手动加密以确保公司内部的所有文件都处于加密状态中。对于以上的情况, 加密系统提供了手动批量加密方式, 可以一次加密整个目录或者整个磁盘的指定类型文件。今后从外部导入的数据也可以实现手动批量加密。

2.4 数据加密系统实施部署

按照以下五个阶段的方法对加密系统进行实施部署:

阶段一:软件安装

加密系统供应商将与IT管理人员共同建立加密系统项目实施小组;确定并分配各自在项目中担任的角色和职责;确定软件安装硬件环境, 组织软件的服务器和客户端安装。

阶段二:配置加密策略

加密系统供应商指导项目实施小组根据企业的具体要求, 确定需要加密的程序类型, 并根据需求对不同的客户端应用不同的加密策略。

阶段三:对已有的数据进行加密

软件安装完毕并确定加密策略以后, 对服务器和客户端上已有的文件进行加密。以达到所有文件都处于加密的状态。

阶段四:系统管理培训

供应商对加密系统的管理和维护进行培训, 包括如何安装、策略配置、加密和解密、常见问题处理。

阶段五:运行支持

软件供应商提供系统实施后的技术支持, 协助系统维护人员处理运行过程中遇到的技术问题, 以确保系统能够正确地运行, 并逐步移交工作。

总结

通过建立企业信息数据防泄密体系, 保护企业的信息资产和核心机密数据, 已成为当前众多企业的普遍共识。本文讨论了数据加密系统在企业构建和应用思路, 通过实施部署数据加密系统, 切实管控了企业核心机密数据, 有效防止了企业信息数据泄密, 为企业提供有效的信息安全保障。

参考文献

[1]李硕.电子文档防泄密软件的设计与实现.上海交通大学, 2008

信息数据 第9篇

与一般的地理信息系统不同的是, 我们开发的电信线路网络GIS系统采用的就是关系型数据库 (Oracle) 和GIS软件相结合的方式。

由于最常用的系统功能是显示当前电信设备, 因此有效的组织电信要素数据数据库是比较重要的。由于GIS的数据是海量的, 系统在图形处理速度上的快慢是一个GIS系统成功与否的重要标志。因此, 我们采用了背景图和电信设备、线路分开组织、统一管理的方式。背景图存储地形图的空间和属性数据;而关系数据库存储电信设备及线路的空间和属性数据。

由于地理信息库数据结构是地理信息处理技术的基础, 地理信息数据库结构设计是整个系统设计成败的关键所在。合理的数据结构能提高整个系统信息处理的效率, 简化系统编程, 增强地理信息库对异常情况的容错能力, 从而达到提高整个系统实时性、可靠性的目的。

1 地理信息系统空间数据模型与数据结构

根据所采用的数据结构的不同, GIS数据模型可分为矢量型、栅格型以及栅格与矢量混合型。一般来说, 栅格型GIS的数据结构简单, 易于实现面域数据的处理, 如求面域的面积、周长, 作面域的扩张、收缩、叠加, 以及求弧段的交点等。但它不便于作面向实体的处理, 不便于记录特征之间的相互关系, 且数据存储需占较大空间;而矢量型GIS的数据结构则较为复杂, 但它擅于表达特征之间的相互关系, 如面域的相邻关系, 弧段的相交关系, 以及点对线的归属关系, 线对面的归属关系等, 并且易于以实体为单位对数据进行处理, 它的数据存储也只需较小的空间。只是对于栅格型GIS所擅长的面域方面的处理, 用矢量数据结构来实现时, 则需要较复杂的处理过程和较多的处理时间。随着计算机的发展, 处理速度的飞速提高, 数据的处理时间问题变得不再那么突出, 而人们对数据所能表达的内容的要求却越来越高, 因而更多的地理信息系统采用了矢量数据结构作为其主要数据结构。

矢量数据易于实现面向实体的操作, 这里的实体是现实世界中的个体在数据世界中的映射。在二维数据世界里, 面状实体用来表达平面投影为面状的物体, 如居民地、林地、水域等;线状实体则表达平面投影长宽相差非常显著, 并且对其面积不作为重点考察的物体, 如各种管线、道路, 以及小比例尺地图上的河流、通路等;点状实体用来表达投影面积可忽略不计的物体或示意点, 如小比例尺地图上的居民点、港口、机场等。

1.1 栅格数据结构

在栅格数据结构中, 空间被规则地划分为栅格 (通常为正方形) 。实体的空间位置就是用其在栅格中的行号、列号来表示;实体的属性就用单元的取值来表示, 这样输入、输出、储存、处理都比较方便。在靠近事物边界的位置, 按四舍五入原则决定单元取值。基本单元的大小代表了栅格型地图 (空间) 数据库的分辨率。一般地图是用点、线, 面来表达空间事物, 点在网格中占据一个基本单元, 线由一系列单元连接成锯齿状折线, 面的边界也是锯齿状的。

网格基本单元的大小, 对地图分辨率和计算精度其关键作用, 一张1000×1000的地图, 基本单元为100×100时, 需要像素100个;当单元的长度改为10米时, 需像素10000个。数据量的增加和分辨率的提高成平方指数关系, 因此计算机的存储量和空间信息的分辨率之间就有很大矛盾。

用栅格结构表示的地表特征是不连续的, 在栅格结构中, 地表被分成相互邻接、规则排列的矩形方块 (有时也可以是三角形或菱形、六边形等) , 每个地块与一个栅格单元相对应, 栅格数据的比例尺就是栅。

1.2 矢量数据结构

1.2.1 简单的矢量数据

空间数据一般由点、线、面组成, 在矢量数据结构中, 所有这些空间要素都是以点的形式表示的, 最常用的是二维笛卡尔平面直角坐标系, 折合平面解析几何对物体的描述十分相似。一个点有一对坐标 (x, y) 表示, 没有形状也没有大小。简单的线用一串有次序的坐标表示, 对精度要求高的曲线可用多条很短的直线来拟合, 也可用圆弧或更复杂的数学函数和直线混合起来表示。面是用线围起来的封闭的不规则多边形。虽然矢量坐标点的分辨率比栅格模型中的最小基本单元的分辨率要高得多, 但实际使用时也要受存储量的限制。如小比例尺地图数据库中的河流不能表现出实际的宽度变化;大比例尺地图数据库中的房屋边界, 也往往略去一些小的转折。另外坐标点用什么做基本单位, 保留小数点后几位, 也是有限制的。

1.2.2 拓扑型矢量数据

目前在GIS领域中, 拓扑结构是得到最广泛应用的空间数据结构。这种数据结构借助了数学中拓扑学的原理来描述空间事物。GIS尽可能采用拓扑矢量数据结构。因为在进行空间分析时, 可基于空间关系, 而不必使用坐标数据, 许多空间分析, 如综合分析或连通性分析都是很费时的运算, 只有使用拓扑数据, 才能提高计算速度。拓扑结构明确反映区城定义、连通性、邻接性、方向性和包含性。

2 地理信息系统数据的组织与管理

2.1 空间数据的组织

目前, 通常的方法是用“层”的概念来分别存储不同专题的空间信息。即每一层存放一种专题或一类信息, 并有一组对应的数据文件。在具体的数据库设计时, 分得粗好, 还是分得细好, 必须根据应用上的要求、计算机硬件的存储量, 处理速度以及软件的限制来决定。一般来说, 分得过细不便于操作人员记忆, 处理上比较麻烦;分得过粗不利于某些特殊要求的分析、查询。例如, 把不同性质的地下管线合在同一层上, 当需要单独查询、显示其中一种管线时, 只能根据管线的属性来区分, 这比单独用一层存放一种管线要花费更多的处理时间, 数据更新也是分开方便。但是, 若经常要同时显示几种管线时, 若用分开存放的方式, 需要同时对几个层操作, 这时又可能是合起来方便。

2.2 空间数据的管理

一般的事物管理用的D B M S不适合直接管理空间数据, 常见的原因有以下几点。

(1) 不提供有关空间位置的查询功能。如要查询某幢房子有哪些公共设施管线通道它附近, 这幢房子在土地使用规划图上允许做什么用等等, 一般的O B M S很难做到, 再复杂的分析更难。 (2) 没有复杂的图形显示功能。空间查询、分析的结果不只是文字报告图形显示更重要, 一般的DBMS不具备这一能力。 (3) 存储、处理空间数据不够经济。空间数据模型的内部结构比较特殊, 而一般的事物管理用的OBMS大都是表状的关系型数据结构。 (4) 没有某些特殊的管理功能。如连续地图管理等, 难以用一般的D B M S实现。

参考文献

[1]高瑞娟, 王勇.地理信息系统及其应用软件研究[J].西安邮电学院学报, 1998, 3 (2) :25~30.

浅谈大数据信息化及数据库建设 第10篇

一、数据信息化以及数据库建设的时代背景

知彼知己, 方能百战百胜, 这句古语充分体现了信息的指导性作用。随着信息技术的发展, 如今已进入一个全新的信息化时代, 人们可以通过各种科学手段收集信息, 将大量信息归纳分类, 整合分析, 为人们提供有效的信息资源, 作为决策和未来规划的参考, 确保决策的科学性。数据是信息的载体, 与传统数据处理系统不同, 大数据是一个全新的数据名词, 是随着计算机科学技术的发展和互联网的普遍使用而产生的新型信息资产。物如其名, 大数据有着海量的数据资源, 在数据获取、存储、管理以及分析等环节都能承受住海量数据的考验, 其数据量更为丰富多样, 数据量更大, 同时也代表着大数据系统具有更强的数据捕获能力, 更广的数据容纳能力, 更快的数据处理能力, 具有可变性、真实性、复杂性的特点[1]。人们的日常生活、社交活动以及经济活动, 都透露出你个人的信息, 这些数据信息在积累起来之后, 都具有一定的价值, 随着数据处理技术的发展, 海量的信息资源被收集存储, 归纳整合, 经数据处理系统的分析后, 成为信息资产。在大数据的时代背景下, 人们越来越重视数据信息化以及建立数据库的价值。早在2015年, 《国务院引发关于促进大数据发展行动纲要的通知》一文的颁布, 就已经标志着我国大数据工作的全面开展, 说明大数据已成为国家发展的重要战略性资源[2]。大量数据信息的积累, 使得传统的数据管理系统已不具备竞争力和实用性, 而大数据时代的到来, 为社会数据信息管理与处理提出了新要求。

二、大数据信息化及数据库的建设

计算机技术的飞速发展与普遍应用, 使得大量信息资源得以被收集储存, 而互联网的出现, 使得大量数据信息能够被共享。数据是一种虚拟性的资源, 但是却能创造出实际价值, 如何让将收集到的海量数据转化为有效信息, 就要依靠数据处理系统, 随着信息技术的发展, 大量数据平台的建立、数据处理软件的开发, 大大提升了数据转化为信息资产的效率与质量, 为社会经济活动提供有效参考指标。

数据信息的广泛积累, 给数据存储以及处理技术带来了全新的挑战, 而且随着信息化时代的到来, 更多种类的数据被采集到数据处理系统中, 如何提高信息采集效率与分析速度, 快速从大量数据中提取各行各业所需的有效信息, 是大数据时代背景下数据处理的新课题。目前, 在数据信息转化体系中, 包括大数据技术、存储技术、分析技术、计算技术以及大数据与云计算融合技术, 在各个技术体系中, 依据社会发展的要求, 其应用技术在不断更新, 技术种类不断增加, 为大数据的信息化提供扎实的技术基础。大数据信息化, 将所有的信息采集整合, 归纳分析, 剔除无效数据, 整合有用的信息, 存储管理, 造福社会, 同时获取信息价值。除了同类数据分析, 还需要能够实现不同数据种类的交叉分析, 才能确保信息的全面性, 提高其参考价值。

大数据的收集、存储、处理、分析, 将海量数据转化为信息资产, 而如何将这些信息资产保存下来, 分享给有需求的人, 创造实际价值, 则是大数据信息化战略的关键性步骤。信息数据库的建立, 能够提高数据信息资源的丰富度及质量, 通过互联网实现不同地域数据信息的联合处理, 避免信息重复采集处理的问题[3]。数据库的建立, 需要遵循统一的信息采集标准, 确保信息质量, 同时依靠科学的数据处理系统对数据进行整理分类, 储存在各自的数据子库中, 在公共平台上发布供人查询, 同时需要依靠管理人员进行定期维护, 确保数据库的正常运行。目前我国高校正兴起建立图书馆特色数据库的活动项目, 旨在整合各个高校的文化资源, 让大家能随时随地查阅自己想要的资料, 方便大家的学习与研究, 这一举措解决了传统纸质书籍图书馆中文化资源积累造成的管理难题, 打破了文化交流的壁垒与信息资产积累的上限, 对于推进高校文化发展具有积极意义。

结语:信息技术的发展, 使得大量的信息能够被采集, 存储到数据库, 经过整理分析, 化为信息资源。尤其是在当今大数据时代背景下的知识经济型社会, 海量的数据资源在科学技术的支持下转化为信息资产, 为社会经济活动的战略决策提供参考指标, 确保了经济发展战略的正确方向。

摘要:计算机技术的发展, 互联网的普遍使用, 使得人们在信息泛滥的时代具有了处理海量数据转化为有效信息的能力, 如今大数据议程为国家发展的基础性战略资源, 信息行业在不断发展, 从数据的采集, 到数据库的建立, 都意味着大数据时代的到来, 而信息资产的价值也在不断提升。

关键词:大数据,信息化,数据库建设

参考文献

[1]赵付玲, 安锋, 张晓锋.大数据时代商业银行信息化问题浅析[J].金融理论与实践, 2013, 10:56-60.

[2]刘国斌, 尹航.大数据时代县域信息化建设推动新型城镇化发展研究[J].情报科学, 2016, 02:100-103.

信息数据 第11篇

【关键词】征信系统  数据质量  评价机制

一、建立征信系统数据质量评价机制的必要性和重要性

(一)有利于促进征信业的发展

目前,金融信用信息基础数据库(简称征信系统)是我国重要的金融基础设施之一,采集近10亿企业和个人的信用信息,已经成为世界上规模最大的数据库。它由中国人民银行征信中心运营和维护,接入金融机构、小额贷款公司、融资性担保公司、汽车金融公司等多种类型的机构。通过开展征信系统数据质量工作评价,有利于全面、系统、客观公正地反映和评价接入机构征信系统数据质量工作的成效,塑造金融业良好形象,促进征信业发展。

(二)有利于提高征信系统数据质量

通过开展征信系统数据质量工作评价,对接入机构及其工作人员进行激励约束,从而督促接入机构重视征信系统数据质量工作,建立提升征信系统数据质量的长效机制,提高接入机构报送征信系统数据的及时性、准确性、完整性,从而促进征信系统数据质量不断提升。

(三)有助于提升征信工作人员的积极性

在我国征信系统数据质量工作激励约束机制中,除了制度法规约束外,运用金融经济学中的“补偿原则”,引入利益分配和补偿机制,使征信系统数据质量卓有成效的机构有一定程度的获益,提高数据质量工作的主动性和创造性,为做好数据质量工作提供内在的、强大的、持久的动力。

(四)有利于减少异议或诉讼的发生

随着信用信息主体维权意识的逐步增强,信用信息主体申请征信异议或投诉的数量呈现出增长的势头。据调查,接入机构数据报送错误是引起异议或诉讼的主要原因。因此,提高信用信息的完整性、及时性和准确性,有利于减少征信异议或诉讼的发生。

二、征信系统数据质量工作现状和存在的主要问题

(一)征信系统数据质量工作重视程度不高

征信系统防范信用风险、促进信贷市场发展有着重要的意义。然后,存在一些接入机构对征信工作重视程度不高、相关制度落实不到位的情况,影响了征信系统的数据质量。

(二)对征信系统数据质量的认可度不高

根据信用信息基础数据库运行情况问卷调查显示,接入机构对数据质量的认可度较低,主要由于一些接入机构上报信用信息不真实,录入不够准确,更新不够及时等原因,导致征信系统中不能真实、全面反映个人和企业的信用情况。

(三)征信系统数据质量专业人才缺乏

由于我国征信体系建设起步较晚,高等教育也就这几年才有征信人才的培养,在全国看来,建设征信体系人才缺乏已是不争的事实。尤其是一些小额贷款公司、融资性担保公司等小型机构,征信工作的专业人才缺乏,缺少对数据质量工作的责任心,对从而影响了征信信息准确性、完整性、及时性。

(四)征信系统数据质量评价机制有待健全

目前,主要针对征信系统量化考评等个别专项工作进行激励约束,缺少对征信数据质量工作全面的评价机制。同时,征信系统数据质量的相关规章制度总体重处罚轻激励,对数据质量工作积极配合、努力尽职的机构或个人缺乏激励机制和成本补偿机制,不利于征信数据质量工作的开展。

三、征信系统数据质量评价方案设计

(一)评价原则

1.科学性。设计征信系统数据质量工作评价指标体系时,以征信系统数据质量相关制度要求、征信系统数据质量应达到的目标、开展征信系统数据质量工作等方面为指导。设计评价指标体系力求在基本概念和逻辑结构上严谨、合理,抓住征信系统数据质量工作的实质,并具有针对性。另外,采用定性、定量的相结合方法,将征信系统数据质量抽象的内容具体化。

2.可操作性。可操作性,也就是可行性和实用性,指征信系统数据质量评价指标内容客观明确,指标简化、方法简便,信息及数据易于采集且准确可靠。

3.引导性。评价指标要能引导被评价对象的行为。合理、可行的征信系统数据质量工作评价指标体系必须能对接入机构及其工作人员的行为起到一定的引导作用,接入机构及其工作人员不仅仅为了评价而评价,评价只是手段,它的最终目的应该是保证目标的实现,因此,评价指标应具有灵活、动态和全方位的特点,以此引导被评价者与组织目标保持一致。

(二)评价指标及内容

征信系统数据质量评价工作分为对接入机构征信系统数据质量评价和对接入机构征信系统数据质量工作人员评价。本文中指标体系设计的思路是根据征信系统数据质量工作内容、性质、目标要求以及完成这些工作所具备的条件等进行研究和分析,确定评价的各项要素。本文在认真分析研究影响征信系统数据质量的各种因素的基础上,建立评价指标体系。

1.接入机构征信系统数据质量工作评价内容包括三个方面:征信系统数据质量考评情况、数据质量日常监测情况和对征信中心数据质量工作配合支持情况。其中,征信系统数据质量考评情况包括评价接入机构征信系统数据的完整性、及时性、准确性。数据质量日常监测情况主要评价接入机构征信系统数据上报和加载、补报和纠改情况。对征信中心征信系统数据质量工作机制具体包括接入机构征信工作牵头部门及人员配备情况,内控制度情况,会议培训情况,工作创新情况和投诉、诉讼情况等方面。若接入机构发生征信系统数据丢失、向未经信贷征信主管部门批准建立或变相建立的信用数据库提供信用信息等对征信系统有较大负面影响的事件,则实行一票否决。

2.对于接入机构征信系统数据质量工作人员的评价以其所属接入机构质量评价结果和接入机构工作人员数据质量工作情况两方面进行考评。根据接入机构数据质量评价情况的评价得分,作为接入机构征信系统工作人员评价得分的一部分。接入机构工作人员数据质量工作情况主要评价工作人员征信系统数据日常工作、数据质量提升工作以及征信制度业务学习情况、征信系统数据质量理论研究情况工作创新情况等。若工作人员所在部门或本岗位发生数据丢失、泄密、违规查询信用报告等对征信系统有较大负面影响的事件,则实行一票否决。

(三)评价的结果划分

根据评价结果将接入机构征信系统数据质量划分为A、B、C、D四个等级。其中A级指该机构征信系统数据的完整性、准确性和及时性好,能很好的开展数据质量工作,并对征信中心数据质量工作配合力度高。B级指该机构征信系统数据的完整性、准确性和及时性较好,能较好的开展数据质量工作,并对征信中心数据质量工作配合力度较高。C级指该机构征信系统数据的完整性、准确性和及时性不高,能开展数据质量工作,但效果不明显,并对征信中心数据质量工作配合力度较低。D级指该机构征信系统数据的完整性、准确性和及时性差,数据质量工作开展较差,并对征信中心数据质量工作配合力度。同上,根据评价结果将接入机构数据质量工作人员评价成绩划分为优秀、良好、一般、较差四个等级。

(四)评价的程序

1.评价数据的采集。定量指标数据来源于征信数据量化评分、两端数据核对、征信数据日常上报、更新、纠改。定性指标根据各接入机构数据质量工作开展情况等。

2.计算各指标得分。定量分析跟据专家打分法确定权重,按照层次分析法计算出分值;定性分析按照事先制定好的接入机构评价内容及指标表进行打分。

3.综合指标得分。将定量指标与对应的权重相乘,并与定性指标得分进行加总,即得到接入机构征信数据质量工作最终得分。

4.在接入机构征信数据质量工作评价结束后,将评价结果作为对征信数据质量工作人员评价的一项重要指标。对征信数据质量工作人员评价比照接入机构征信数据质量工作评价进行。

5.评价的流程。(1)成立征信中心征信系统数据质量评价办公室(以下称评价办公室),并在各分中心成立评价小组(以下称评价小组)。全国性接入机构由评价办公室负责评价,地方性接入机构由评价办公室委托评价小组评价。

(2)评价工作开始前,由评价办公室启动评价工作,如图1所示。评价办公室制定评价计划,下发数据质量工作评价标准。接入机构报送评价对象的征信系统数据质量工作情况自查报告和自查表,并说明理由。其中全国性接入机构将材料报评价办公室,地方性接入机构将材料报当地评价小组。评价办公室和评价小组根据接入机构报送资料及掌握的相关资料进行打分。

(3)评价小组汇总各类得分,计算最终得分,并进行初步等级判定,将本地区评价结果报评价办公室审批。

(4)评价办公室汇总评价结果,将初评结果发送至各接入机构。

(5)被评价对象收到评价结果后,如有异议,可以在5个工作日内将申诉意见反馈至评价办公室或当地评价小组。评价办公室或当地评价小组收到申诉意见后5个工作日内,应给予答复。

(6)评价办公室以正式文件形式下发被评价对象的征信系统数据质量工作的评价结果。

四、建立健全征信系统数据质量评价机制的措施

(一)提高对征信系统数据质量工作重要性的认识

“征信系统数据质量是征信系统的生命线。”做好征信系统数据质量工作是落实科学发展观,坚持以人为本的根本要求;保障征信业健康发展,维护金融稳定的客观需要;塑造金融业良好形象,维护正常金融秩序的有效举措;促进社会公平正义,建设和谐社会的重要内容。因此,接入机构提高对征信系统数据质量工作重要性的认识,积极主动做好征信系统数据质量工作。

(二)加强对征信系统数据质量评价机制的宣传

目前执行的征信系统数据质量方面的文件都强调了接入机构征信系统数据质量工作的职责义务,却没有涉及激励机制问题。因此,在推行征信系统数据质量评价机制中,应加强宣传,使接入机构及其工作人员了解征信系统数据质量激励及约束机制的目的、内容等,促使接入机构认真履行征信系统数据质量工作义务,并使征信系统数据质量卓有成效的机构有一定程度的获益,提高数据质量工作的积极性。

(三)明确征信系统数据质量评价工作的程序

建议征信中心制定征信系统数据质量评价工作的方案,并明确征信系统数据质量评价工作的程序。围绕个征信系统数据质量评价的制度规范、工作流程、方式方法等内容,组织对分中心及接入机构工作人员开展培训。为了确保评价工作顺利,可以根据量化考评掌握接入机构的数据质量情况,在全国部分分中心选择不同机构类型、数据质量在不同层次的接入机构开展征信系统数据质量评价试点工作,对发现的问题进行研究分析和解决,总结试点地区进行征信系统数据质量评价的工作做法和先进经验,并在全国推广。

参考文献

[1]胡燕.商业银行征信监管影响因素探析——基于《征信业管理条例》的视角[J].征信,2013,(12):23-27.

[2]刘霏.完善商业银行员工激励的对策研究[M].企业导报,2011,(7):206-207.

[3]孙艳丽.完善我国国有商业银行绩效考核机制的思考[J].科学之友,2011,(1).111-112.

探索信息整合,促进数据共享 第12篇

一、人行长沙中支信息化管理现状

(一) 业务系统概况

从系统建设现状来看, 现有应用系统与央行业务存在较明确的对应关系, 按业务特征分为13类, 即支付类、征信类、反洗钱类、国库类、中央银行会计核算类、货币金银管理信息系统、人民币结算账户管理系统、办公类、综合业务类、综合管理类、统计分析类、基础技术服务类及其他类系统。使用单位涉及省、市、县三级人民银行和相关外联单位。人行应用系统具体分类如图1所示。

(二) 存在的主要问题

1. 数据共享层次较低

目前各业务系统均各成体系, 数据分散在总行、省分行以及地市中支, 数据之间未形成统一标准, 系统数据之间的交互以及数据跨系统共享利用还处于初级阶段。

2. 大多数系统未实现软硬件平台统一

总行推广的系统目前基本上采取每套系统配置独立的软硬件环境, 各系统之间缺乏统一、规范的技术标准, 软硬件环境差异较大, 操作系统、数据库、中间件基本涵盖了目前主流的各种产品。

3. 大多数系统未实现统一的安全访问控制

总行推广的核心系统基本上采用独立认证的方式, 人行长沙中支仅自建系统在同一技术路线下实现了统一的身份认证、授权。

4. 缺乏集中的接入平台

目前由于部署以及技术门类的原因, 各系统缺乏统一、集中的接入途径。

技术的快速更新换代以及金融业务发展对信息化水平的高要求, 对管理信息整合、数据共享提出了新的课题。

二、信息整合框架思路

(一) 总体框架

信息整合和数据共享解决方案的总体目标是:制定信息资源共享的规定和技术标准;建设信息资源共享平台 (人行长沙中支门户系统) , 整合各类信息资源, 保证信息的充分共享和及时获取;建立内部信息门户, 实现“单点登录, 全网通行”;规范管理模式, 实现管理标准化、流程化。

信息整合及数据共享的总体框架可以描述为:一个平台, 一个体系, 一种语言, 一项协议, 四层架构。信息整合及数据共享将以人行长沙中支门户系统为唯一的基础平台, 采用最先进的Web服务技术体系, 信息交换统一使用XML和SOAP。按照信息生命周期, 形成由基础数据层、信息管理层、门户服务层和客户应用层组成的4层功能架构。

(二) 技术解决方案

信息整合及数据共享的工作内容包括以下几点。

1. 完善和扩展人行长沙中支门户系统

通过人行长沙中支门户系统对原有应用系统进行集成, 一方面保证了系统的延续性和前期投资效益, 另一方面采用相对简单的方式实现新的业务需求, 符合信息整合及数据共享的总体规划。

2. 建立信息资源交换和业务流程控制系统

按照定义好的业务流程规则, 从现有业务系统中提取共享信息, 上传到交换和流程控制系统;本地系统接收经过控制系统处理的共享信息, 将其和本地现有系统整合;向控制系统发送数据抽取指令, 从其他部门的业务系统中提取共享信息。

3. 制定信息交换标准

共享信息分布在不同业务部门的信息系统中, 制定一套公共的信息标准, 各部门在本地交换系统中, 对照该公共信息标准, 形成本部门信息系统和标准的映射关系。采用XML语言作为信息描述的载体。另外, 信息描述标准定义的不仅是数据结构的标准, 而且定义了一套信息交互流程的标准及其底层的支撑框架。

4. 数据获取和清洗

在信息交换标准没有制定完成、业务系统没有进行相应改造之前, 必须采用其他半自动或者手动的方式获取数据, 并对数据进行整理清洗入库, 建立本地数据仓库。

5. 信息安全设计

数据的可靠性对于系统是至关重要的, 采取各种技术手段, 从网络层安全、应用层安全、数据安全等方面采取安全防范措施。

信息整合及数据共享的解决方案是信息管理集成工作的重中之重, 必须总体规划分步实施, 最终达到整合业务数据。

三、信息整合的策略方法

根据信息整合和数据共享的基本思路, 结合人行长沙中支的实际情况, 提出如下整合共享策略和实施步骤。

(一) 信息整合策略

信息集成和数据共享是为了将业务系统和业务数据有机地结合在一起, 形成一个完整、高效、易于扩充的信息系统。从信息数据资源整合和共享的角度出发, 制定整合策略, 进行展现集成、应用集成和数据集成。

展现层是整个系统的门户, 最主要的功能是提供用户交互的界面, 同时针对不同用户的不同需求提供个性化的服务。人行长沙中支门户系统从展现层实现信息的整合, 基于Web应用, 提供个性化服务, 单点登录, 统一认证和授权, 整合不同资源, 实现应用和信息的集中访问。

应用层包括具体的业务应用和信息系统的辅助应用, 它们将完成相应的业务处理。应用系统之间交互的问题以及业务流程集成的问题, 目前主要是总行在进行相关整合工作, 人行长沙中支考虑建立统一业务流程平台。

数据层主要是数据库与数据仓库。数据层存储的数据被各个应用系统以及数据分析与决策系统所使用。数据层从纯数据层面, 解决数据存储和共享的问题, 通过多种方式实现对多种数据源进行数据转换, 采用集中存储备份等物理手段, 达到数据共享和分析利用。

(二) 建设全省信息化基础平台

1. 统一认证和授权的标准化

目前人行长沙中支门户系统已经实现了统一的认证管理, 通过统一认证管理系统中的配置, 可以完成跳到其他异构系统的统一用户管理、单点登录。这种方式要求对各系统进行一定程度的改造, 按照统一认证系统提供的接口实现本系统的登录。对于新建系统, 可以按照统一的用户和组织结构进行设计和管理;对于已有系统, 必须使已存在的系统用户与统一用户系统中的用户进行关联, 使得在登录统一用户系统后, 能够自动使用该系统的用户进行访问。

下一步, 将统一认证扩展到统一授权, 即在统一认证管理系统中实现对各个应用系统的授权, 包括功能权限和数据权限的双重授权。用户在合法登录以后, 由应用系统通过用户令牌到统一授权系统中获得授权信息, 然后根据自身对授权信息的判断进行权限操作。

2. 可重用的流程模块

目前各应用系统在涉及流程操作时, 往往需要重新设计。这些流程往往不可重用, 缺乏通用性和可移植性, 造成自主开发的应用系统在开发过程中耗费时间, 甚至由于后期需求变化而导致流程的推倒重来。设计一个标准化、可重用的流程模块, 减少与应用系统其他模块的耦合度, 提供可实现的标准接口。在新的应用系统开发过程中, 经过简单的实现即可完成对流程模块的引入。在使用时, 可以方便地定义每个流程的节点、角色、流转方向、节点是否可以跳过等。

(三) 扩大数据共享层次和范围

要实现数据共享, 首先必须有数据源。共享数据源从高到低的层次为:数据仓库、直连生产数据库、备份数据库、根据生产数据导出文件创建的统计查询库、非结构化数据。

数据共享的方式有如下几种:通过调用原生产系统页面或者服务实现数据共享;通过二次开发实现对共享数据的查询统计分析;通过文件下载等方式实现对非结构化数据提供共享;提供人行长沙中支门户系统Webservice服务提供数据共享;通过流程工具实现跨系统数据流转和共享。

对于总行部署的全国集中的系统数据。可以采用两种方法提供数据共享:如果总行提供了开放式服务接口, 可以直接在人行长沙中支门户系统中调用该服务实现数据共享, 如果有文件接口, 可以通过文件下载实现有限数据共享;如果没有服务接口, 但是数据有下发到省会中支, 可以通过对下发数据进行整理, 导入到本地数据库中, 再结合业务部门需求进行二次开发, 实现数据共享。

对于总行部署的省会集中的系统数据, 采用数据同步复制, 或者通过备份数据库然后再恢复, 形成备份库。通过分析备份库结构, 结合业务需求, 通过开发形成数据共享。

对于省级集中的自建系统, 由于对数据比较熟悉, 可以考虑在不影响业务的基础上, 直接在数据库上进行共享开发。

目前在人行长沙中支门户系统上, 已经实现了部分自建系统数据共享。下一步将结合业务部门需求, 通过制定对外数据采集、交换的数据标准及技术规范, 充分利用总行开放的数据接口抽取数据, 实现数据的二次加工, 逐步扩大数据共享范围;建立统一流程工具, 实现各业务系统数据之间的有序流转。

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【信息数据】相关文章:

数据信息共享05-15

数据信息素养06-09

数据信息传输08-22

信息系统数据09-12

大数据信息时代05-22

共享信息与数据05-25

标注信息数据模型08-18

数据信息知识策略09-09

信息数据传输09-10

数据信息论文提纲09-18

上一篇:医疗自助服务系统研究下一篇:唯心主义哲学观