新数据环境范文

2024-08-24

新数据环境范文(精选10篇)

新数据环境 第1篇

关键词:新媒介,数据新闻,报道,研究

数据新闻的报道大体是指, 新闻报道在新媒介环境下, 利用数据方面的各项技术, 对新闻报道进行一系列创新和改革, 将新闻报道的方法推上一个新的历程。其在新媒体环境下出现, 是一种新的新闻报道方式。在数据技术的帮助下, 新闻报道的内容和速度都发生了巨大的变化和进步, 在内容上更具有深度和广度, 在报道速度上, 更加快速和频繁。

1新媒介环境下数据新闻的相关内容

1.1数据新闻的有关概念

数据新闻又被称为数据驱动的新闻, 这个现象被公认为是计算传播学的一个实际的具体的应用。在现在社会中, 可从两个角度解释数据新闻的相关概念。

首先, 从新闻呈现的形态等相关角度加以解释和理解, 数据新闻的呈现形态与传统的新闻报道呈现方式大相径庭。 数据新闻的报道, 能使新闻内容更具深度和广度, 因为传统的新闻报道只侧重于问题是什么, 只宣传表面的现象和信息。然而, 数据新闻的报道则更加注重于问题或者现象产生的根源。这有助于观众了解更加真实的新闻内容, 在数据技术的帮助下, 加大新闻的深度和广度。

其次, 数据新闻内容获取的流程与传统新闻的获取方式有所不同。数据新闻的内容是通过大量工作而得出的结论, 经过不断搜集, 反复筛选和分析, 进行大胆重组, 在海量的信息中发现最有价值的内容, 发现最有传播意义的信息, 将新闻的逻辑顺序安排妥当, 为观众带来条理清晰的新闻。

1.2新媒介环境下数据新闻的特征

首先, 数据新闻最大的特点是服务于公众利益, 为广大社会观众提供精彩的新闻内容是数据新闻和传统新闻共同的目标, 保持点击率或者收视率也是它们存在的动力。但是, 在数据新闻看来, 更为重要的是为公众利益服务, 这是数据新闻报道的基本特征, 这种现状有利于观众了解数据的作用, 明白数据在我们生活中的作用, 增长观众的知识, 提高观众的能力。

其次, 数据新闻报道的基础是公开的数据。数据新闻就是从公开的数据中寻找有效信息, 对新闻进行多次分析、 了解和推理, 为观众整理出一份合理而全面的新闻报道。为了保证新闻报道的质量, 数据新闻搜集的对象主要是政府或者其他社会公共组织。

再次, 拥有着先进的技术手段, 应用特别的软件程序。数据新闻的产生, 主要由于数字技术也得到了相应发展, 在数字技术高速发展的背景下, 媒介行业也发生了彼此相互融合的局面。媒介融合、数字技术应用, 导致信息处理、 传播等技术和形式, 也发生了翻天覆地的变化。所以, 数据新闻报道的一个巨大的优势就是拥有科学的技术和特殊的软件。

最后, 数据新闻报道可视化, 新闻报道的内容更加生动化、具体化和形象化, 提高了人民大众的兴趣。数据新闻的报道应用了特殊的软件, 利用高超的科学技术, 将一些难懂的、抽象的新闻信息变得可观、可想, 减小了人们消化新闻内容的难度, 为人们观看新闻提供了一个良好方式。

2新媒介背景下数据新闻报道的基本流程

2.1利用多种渠道和方式搜集大量新闻数据

为了得到全面的或者充足的新闻数据, 数据新闻进行了大量的搜集新闻数据的工作, 从众多的机构、部门或者组织中获取相应的信息, 例如, 从政府部门或相关企业的官方微博中, 获取比较官方和正规的数据, 或者通过搜素引擎中的高级搜索, 亦或者通过登录网络公关资源平台等, 在科学技术的帮助, 从各个渠道获取数据。有了大量的、充足的新闻数据, 能为观众提供全面的新闻报道, 提高新闻内容真实性, 同时, 也再一次推动了科学技术的发展。

2.2全面而严谨地处理数据

通过多种渠道搜集数据, 可以保证数据的数量, 但是, 也为新闻内容的重组带来了难度, 这就要求工作人员在完成数据搜集工作之后, 严谨全面地处理数据内容。工作者们必须具有高超的分析数据的能力、严谨的工作态度、良好的逻辑思维能力及勇于质疑的心态。因为数据的混乱可能会带来几种不同的新闻内容, 这就要求对新闻数据处理一定要谨慎、合理、有效。在处理完搜集来的信息后, 要再一次合理推测数据的逻辑关系, 不要遗漏掉相关数据, 以免影响新闻内容, 进而影响数据新闻的报道。

2.3利用多种呈现方式有效传播

新闻搜集的最终目的是传播, 服务于广大民众。所以, 在新闻整理完毕之后, 利用传播工具传播新闻, 但是, 新闻呈现方式也会直接影响新闻传播广度, 进而影响新闻的收视率或者点击率。这就要求在新媒介背景下, 充分利用新媒介的特点, 对新闻报道方式进行有效创新, 对新闻进行可视化改变, 这有利于提高观众观看新闻的兴趣。有利于改善人们接受新闻的方式, 使人们更加容易获取自己所需要的新闻内容, 加深对新闻内容的理解, 加深印象。

3促进数据新闻发展的策略研究

3.1大力培养和提高新闻工作者与时俱进的思维方式和能力

面对社会的快速发展, 社会中的一些观念和思想在悄然发生变化, 无论是一个人还是一个单位, 要想在快速发展的今天依然傲立群雄, 就必须顺应时代步伐, 进行合理改变或者是改革。数据新闻的发展, 其实就是工作人员的工作方式和思维方式的改变, 个人或者数据新闻行业必须进行大胆创新。首先, 要求新闻采集者拥有与时俱进的数据思维方式和能力。所以, 在以后的发展中, 数据新闻行业要注意培养和提高新闻数据采集者的数据思维, 提高他们在数据利用方面的能力和素质, 还要注意改变以往的工作方式, 对工作人员进行相应的技能组合, 提高工作效率, 改善工作质量。

3.2健全相应法律法规, 提高隐私保护

数据新闻是搜集所有有效的新闻数据, 这要求在搜集过程中, 避免搜集别人的隐私, 以免为他人带来不必要的麻烦。 在法制社会, 为了能更好地保护自己或者他人隐私, 我们倡导建立健全相应的法律条文, 给社会带来一份安定, 合理保护他人隐私。让我们在科学技术迅猛发展的今天, 保护自己的隐私, 仍然可以做到有法可依, 起到违法必究的作用。

3.3扩大新闻教育范围, 强化相关专业教育现象

为了保证新闻工作者拥有更高的教育水平, 或者为了迎合数据新闻行业中各种不同的工作要求, 可以改变以往的教学要求, 在学生的文理分科的背景下, 仍然保持文理都接受数据新闻教育的权利和义务, 这样有助于为数据新闻的工作提供充足的人员, 提高数据新闻工作者的素质。

4结语

社会的发展, 带动了其他行业的发展, 各个媒介在时代背景快速发展的情况下, 为了能适应社会的发展, 所以进行了相互融合, 同时, 又促进了新闻行业的发展, 推出了数据新闻这一新产物, 为了能保证数据新闻的健康发展, 对数据新闻进行详细了解, 有着非常大的意义。

参考文献

[1]张茹.新媒介环境下数据新闻报道研究[D].沈阳市:辽宁大学, 2014.

[2]杨保军.新媒介环境下新闻真实论视野中的几个新问题[J].新闻记者, 2014 (10) .

[3]姚争.新兴媒体竞合下中国广播现状与发展策略研究[D].上海:上海戏剧学院, 2013.

大数据环境下的数据安全研究论文 第2篇

自然灾害这里主要是指台风、龙卷风、飓风、地震、洪水、火灾等。随着信息技术的发展,网络已经成为世界人民生活中不可或缺的一部分。人们在使用计算机网络的过程中,有很多数据存储在服务器之中,并且经常与它们实时交互。在运营过程中,因为各种灾害例如火灾、停电、地震以及数据传送时线路的突然中断,将造成各种数据的丢失。

3.2 网络硬件

在信息化快速发展的今天,硬件虽然更新换代很快,但数据量的增长速度却是爆炸性的增长,进而造成以前的存蓄环境不能满足当前海量数据的需要,因此,应该对存储环境进行优化升级,使其能满足现今对数据存储的需要。在传输数据的过程中如果数据量过于庞大,而硬件设备由于老化导致传输速率的降低,那么网络的延迟可能会导致系统崩溃造成数据丢失,影响数据存储过程的安全。

3.3 操作失误

数据管理人员不管是面对怎样的应用软件,都有可能出现操作不当的情况。任何一个人在开展工作时都有可能会误删除系统的重要文件,或者修改影响系统运行的参数,以及没有按照规定要求或操作不当导致的系统宕机,尤其是进行数据库管理的工作人员,面对的数据量比较大,系统的运作也极为复杂,这都将导致操作不当或失误情况的发生,进而威胁到系统数据的完整性与安全性。

3.4 管理不善

构建大数据产业环境 第3篇

李国杰表示,大数据对经济社会发展和科学研究具有革命性的意义,其兴起有着内在的需求和利益驱动,因为数据里蕴藏着巨大的价值。未来将形成数据服务、数据探矿、数据化学、数据材料、数据制药等一系列战略性新兴产业。

他认为,数据安全主要不是技术问题,因为数据放在哪里都有泄露的风险,它与商业模式有很大关系。中国当务之急是建立上下游相互协作、相互支撑的大数据产业环境,特别是构建有技术自主权的大数据产业链。

商业价值驱动

《新经济导刊》:继物联网、云计算、3D打印等新技术之后,大数据已成为投资者、IT人士以及政府部门、科研人员关注的热点,请问大数据是在什么背景下发展起来的?

李国杰:今年三月份,奥巴马宣布美国政府投资2亿美元启动“大数据研究和发展计划”,这个计划可以同美国上世纪90年代初的“信息高速公路”相比拟。美国政府认为,大数据是“未来的新石油”,并将大数据的研究上升为国家意志。

表面上看“大数据热”受到美国计划的影响,但不完全是这样。过去美国副总统戈尔呼吁的数字地球,中国也在跟进,但经济上并未成气候;有些是美国不太热,中国反而进行得有声有色,比如物联网,这可能与中国政府对物联网的大力扶持有关。所以层出不穷的新技术,有时候是真热,有时候是虚热。

我认为,大数据不是因为奥巴马的宣布而热起来的,它的兴起有着内在的原因。现在的大数据与互联网、物联网的蓬勃发展有很大关系,特别是美国几家大型企业的大力推动,像IBM、Amazon、Google、Facebook等。

科研人员研究大数据,习惯于从数据到信息到知识再到智慧,若按照这个链条,时间太漫长,产生的经济效益也有限,大数据不会形成这么大势头。现在企业走了一条捷径,直接从数据里开发出商业价值,而不管数据中的科学规律和知识,这可以大大激发企业的兴趣。比如电子商务eBay,它用大数据分析网络广告,发现广告里的每一个单词都与经济效益有关联,通过优化,使广告收益提高80%以上。所以,大数据兴起的根本原因是里面蕴藏着巨大的价值,有实实在在的经济利益驱动。

《新经济导刊》:人们对大数据的理解,见仁见智,如何界定大数据?大数据有哪些基本特征?

李国杰:一般意义上,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理和服务的数据集合。大数据的特点主要表现为四个“V”:一是体量浩大(Volume),数据集合的规模已从GB到TB再到PB级,甚至已经开始以EB和ZB来计算。著名咨询公司IDC的研究报告称,未来10年全球大数据将增加50倍,管理数据仓库的服务器的数量将增加10倍。二是类型复杂(Variety),大数据类型包括结构化数据、半结构化数据和非结构化数据。现代互联网应用呈现出非结构化数据大幅增长的特点,到2012年末非结构化数据将达到整个数据量的75%以上。三是生成迅速(Velocity),大数据通常以数据流的形式动态、快速地产生,具有很强的时效性。数据自身的状态与价值也随时空变化而发生演变,数据的涌现特征明显。四是价值巨大但利用密度低(Value),基于传统思维与技术让人们在实际环境中面临信息泛滥而知识匮乏的窘态。

开启数据革命

《新经济导刊》:大数据对经济社会发展和科学研究有哪些重要作用?

李国杰:根据数据的来源,大数据可以分为两类:一类来自与人类社会有关的数据,特别是互联网和经济活动产生的数据,企业最感兴趣。这一块增长也最快,互联网实际上反映的是人的活动。另一类来自物理世界,通过传感器、科学观测获取。比如生物数据、脑科学数据、气象数据、野外环境保护数据、卫星遥感数据等,这类数据首先推动科学的进步,继而推动经济的发展。

大数据具有革命性的意义,作为一种重要的战略资源,不仅事关国家的数字主权和战略安全,而且可以促进我国的经济结构调整和产业升级。大数据时代,企业关注的重点转向数据,计算机行业正在转变为真正的信息行业,从追求计算速度转变为大数据处理能力,软件也将从编程为主转变为以数据为中心。大数据处理的兴起也改变了云计算的发展方向,使其进入以分析即服务(AaaS)为主要标志的Cloud2.0时代。采用大数据处理方法,生物制药、新材料研制生产的流程会发生革命性的变化,大大提高科研和生产效率,使整个行业迈入数字化与信息化的新阶段。未来将形成数据服务、数据探矿、数据化学、数据材料、数据制药等一系列战略性新兴产业。数据服务是许多企业瞄准的重要领域,华为本来是一家通信企业,现在也开拓数字医疗市场,打通社区医院和三甲医院,这是一个潜在的巨大市场。

此外,大数据正在引发科学研究思维与方法的一场革命。最早的科学研究只有实验科学,随后出现了以研究各种定律和定理为特征的理论科学。由于理论分析方法在许多问题上太过复杂,难以解决实际问题,人们开始寻求模拟的方法,导致计算科学的兴起。海量数据的出现催生了一种新的科研模式,科研人员只需从数据中直接查找或挖掘所需要的信息、知识和智慧,甚至无需直接接触所研究的对象。2007年,已故图灵奖得主吉姆·格雷在他最后一次演讲中描绘了数据密集型科学研究的“第四范式”,把数据密集型科学从计算科学中单独区分开来。第四范式不仅是科研方式的转变,也是人们思维方式的大变化。现实中,许多复杂的经济社会问题无法用传统的方法进行研究。比如股市,没有大量的数据无法找到其中的规律,仅靠模型是不行的。

《新经济导刊》:大数据对地理信息和位置服务有何影响?

李国杰:地理信息和位置信息是人在物理世界的活动,是社会活动和物理世界两类数据的融合。这种数据的规模是相当大的,是未来一个新的经济增长点,而且能带动物理空间和社会网络领域的数据产业的飞速发展。

地理信息是国家信息基础设施的一部分,电子政务、电子商务、智能交通、智能物流等行业应用,都离不开地理信息。政府对地理信息这种公共资源应该分层管理,除了涉及国防和国家安全的信息需要保密外,其他基础信息都要免费或以较低成本提供给企业和民众,防止信息采集单位据为己有。基于基础信息上的各种应用服务,应该大量放开,让企业去做。我国的地理信息产业之所以发展不快,就是没有解决好信息的分层管理,收集地理信息的单位,理所当然地认为这些信息就是本部门的,而且互相之间也不交流和共享,导致重复建设和资源浪费。

颠覆IOE模式

《新经济导刊》:大数据时代,传统的数据库软件将难以满足处理海量数据的需要。您认为大数据对信息技术提出哪些新的要求?

李国杰:过去,中国对信息系统有所谓“金三角”的说法,即“IOE”,I指IBM的服务器,O指Oracle的数据库,E指EMC的存储。这三家公司基本垄断了国内银行、证券等对计算机处理数据要求很高的行业。现在业内认为,如果某家技术公司还沿用“IOE”,那这家公司就不是大数据公司。因为你的技术建立在IOE基础上,决定了你无法处理大量数据,因为你的基础设施就不适合做大数据处理。

数据在基础设施层面有三类技术:存储、管理和计算。IOE模式从上世纪70年代就逐步成型了,即关系数据,当时对数据的认识是线性维度。到了大数据时代,数据的巨大规模和快速变化超过了硬件能力的增长,而且数据之间的复杂关联使得线性思维无能为力。另外还有社会因素,数据与人在不断地互动,甚至人就是动态的数据集。在这种情况下,采用原有的IOE模式来处理大数据就难以应对了,数据中的价值也无法有效挖掘出来。现在大数据有许多应用,例如通过查询Google,可以知道流行病在某区域的分布;通过舆情的分析,可以预测选举的结果。

大数据存储不同于传统的EMC,它是一种高效率、低成本、多层次柔性的存储架构,不是集中到一起存储,而是把数据放在云和端。实际上,数据存储的分布很关键,哪些在主服务器,哪些在客户端,这要比提高单个存储的性能更重要。虽然许多企业都在做,但还处于探索中。目前,Hadoop开源分布式系统,已成为大数据处理的主流技术,包括资源调度、存储管理等各种数据工具。这是一种发展趋势,但也存在不少问题。

在大数据管理方面,过去的关系数据管理在冗余、一致性、复杂查询优化上解决得非常好。在Hadoop体系下,数据规模、增量速度和灵活性上远远超过Oracle,但在数据价值挖掘和分析方面还不能提供较好的技术支持。所以大数据管理是打碎了旧的模式,新的模式还没有规范化和体系化。

《新经济导刊》:中国与国外大数据产业相比,有哪些优势和劣势?国外互联网企业在大数据处理方面有哪些经验可供我们借鉴?

李国杰:不管是Google、Amazon还是Facebook、Twitter,肯定不是用IOE这种模式,都是重新设计和建立新的系统。比较领先的应该是Google,但Google把自己的技术包裹起来,不告诉别人,所以,后来形成了以Hadoop为代表的一系列开源技术。虽然Hadoop借鉴了Google的一套大数据处理思路:GFS存储、MapReduce计算、BigTable管理,但由于是全球人的贡献,所以全球60%~70%的大型互联网企业都在使用Hadoop开源技术。

国内的大数据代表性企业是百度、腾讯、阿里巴巴。由于大数据原创体系和基础技术的话语权在国外(开源组织和大企业),所以国内企业在这方面有一定差距,但应用上不比国外企业差。需要注意,国内大型互联网企业是自己确实有需求和价值驱动才改进原来的技术架构,而不是一味地跟风。比如淘宝网,每天的日志按照传统方法只能存储一周,数据量太大,不可能为了存储数据再盖大楼和机房,这就逼迫它必须优化存储、提高效率和节约成本。

由于中国人口多、市场大、数据量大,所以中国大数据发展的动力非常强劲,大数据的应用需求丝毫不亚于国外。同时,我们也要看到,中国发展新兴产业是一个后来者,以前经常讲,我们有后发优势,能够避免走弯路。实际上,前面所走过的二十年,更多暴露出后发的劣势和壁垒。比如桌面计算机(PC),技术掌握在英特尔和微软手里,这就形成了它们的事实标准,必须用它们的平台来做,而我们创新的空间很小,联想在奋起直追,毛利率也是15%以下,净利率只有2%。通信也是这样,2G和3G的无线通信专利掌握在高通公司手里,虽然我们可以做4G等新技术,但必须与2G和3G兼容,只要兼容就无法摆脱高通的控制。这两个大产业,虽然我国花了很大力气,但在平台上受制于人,创新空间一直很小。

大数据也不是没有限制,但大数据是在比较开放的环境下发展的,尽管Google不很开放,但相比PC和无线通信领域还是有利的。中国科研机构和企业研发的大数据开源软件,也可以加入到国际标准中去,成为世界开源组织大家庭的一部分。比如中科院计算所牵头的Hadoop in China大会,现在转移给中国计算机学会大数据专家委员会承办,就一直得到世界开源组织的支持。大数据时代,不是国际大数据企业愿意主动贡献Hadoop等数据处理技术,而是大数据产业特征决定了必须协作共享。大数据无所不在,不是几个大企业就能垄断得了的。

《新经济导刊》:在IT领域,包括大数据在内,为什么新的技术都是国外先有,然后再引入到国内?什么时候“中国创新”能引领世界呢?

李国杰:总体来讲,中国的信息技术水平处于世界第二军团的前沿,与美国、日本等发达国家相比还有一定差距。如果中国的信息技术水平已经与发达国家并驾齐驱,那中国还是一个发展中国家吗?信息技术是当代的一个特征技术,一个国家是不是经济强国,不能仅拿制造业来衡量,关键看信息技术和生物技术。中国到2020年才能全面建成小康社会,到2050年才能实现现代化。科技不可能在国家综合实力还落后的情况下一枝独秀,当然不排除个别技术脱颖而出,但整体上还是受制于经济和社会发展。

我国在发表论文方面,个别领域已经位居前列,国外的引用也较多,最典型的是材料科学。世界前十位材料科学论文引用率最高的作者,60%~70%都来自于中国大陆。按说中国应该是一个材料强国了,但实际情况并非如此,80%~90%的尖端材料全部是进口。所以我们不能对中国的科技水平期望太高,毕竟中国还是一个发展中国家,科技与经济是相辅相成的,必须有市场需求,才有科技创新,信息技术同样如此。

建立数据市场

《新经济导刊》:面对纷繁复杂、无处不在的数据,中国在大数据管理和应用过程中如何确保数据安全呢?

李国杰:大数据时代,安全是一个基础保障,但如果建立一个竞争有序的大数据交易市场,将大数据打包成产品依法进行交易,那所谓的数据隐私问题就可以规范化了。现在数据市场还未成型的情况下,那从顶层设计上要注意保障数据安全,包括隐私权、执行权、防范数据篡改和崩溃、可信度等一系列问题。

但数据安全主要不是技术问题,因为数据放在哪里都有泄露的风险,它与商业模式有很大关系。中国迫切需要把数据市场、数据产业、数据产品的形态和交易模式清晰化。这些问题解决了,数据安全也就迎刃而解。现在最大的问题是,拥有原始数据的机构和企业,不知道如何把这些数据变成产品。

中国数据市场的建立可以借鉴金融衍生品市场的模式,一是政府出台优惠措施加以扶持;二是建立透明公开的交易平台;三是加强创新,突破关键技术;四是发挥资本市场的作用。这样就可以把各个载体的数据开发出一系列数据产品。目前产业界和投资界走在前面,科技界紧跟其后,政府还没有认识清楚。

实际上,大数据现在仅仅是冰山一角,它的巨大价值还远远没有挖掘出来,人们也确实不知道它的价值到底有多大。国家要创造一个支持新兴业态的环境,让新产品和新服务能够喷薄而出。有些东西应该冒出来而未能冒出来的原因就是,被负面的东西和可能产生的负作用吓怕了,比如安全和隐私。任何事物都是一把双刃剑,关键看你的着眼点和出发点,如果只是除弊而不兴利,那就越除越小,最终抑制它的成长。所以要正确看待新兴事物,并在发展中解决存在的问题,而不是一棒子打死。例如,互联网和手机,十年前谁也无法预料到能发展成现在这样,都是在市场竞争中不断优胜劣汰发展起来的。当然,新技术和新兴产业刚开始都有一个炒作过程,然后逐渐挤掉泡沫,沉淀下来,从而步入正常发展轨道。

《新经济导刊》:请介绍一下中国的大数据产业链建设情况?

李国杰:IT产业在发展过程中已经形成了一些层次分布,有做服务器和底层系统的,有做软件的,有做应用的,大数据也需要在原有的架构上加以发展。原来做基础设施的企业,如联想、华为,也要向大数据转型,提供低成本、低能耗的大型存储器,这是大数据产业的基础。中间层是类似Hadoop、MapReduce的数据分析软件,原有的软件产业也要转型,由卖软件转为以数据为中心。再往上就是百度、腾讯、阿里巴巴等大数据应用服务公司。

中国大数据产业的整体实力与国外相比有很大差距。应用企业由于服务中国市场,具有民族和语言等方面的优势,所以市场占有率较高,但需要走向国外,提高国际竞争力。软件实力较弱,基础设施更弱,芯片和操作系统还在成长中。所以,国家要针对大数据的需求,尽快出台政策措施,全面提高大数据产业的竞争实力。企业要抓住机遇,加大自主创新力度,实现转型发展,扭转国际竞争中的不利地位。科研机构要瞄准国际前沿,大胆尝试,积极探索。中科院计算所已经在研发五年以后的服务器和计算机了,我们如果研发成功,将会缩小国际差距。

《新经济导刊》:您认为中国大数据产业的难点和瓶颈是什么?

李国杰:当务之急是建立上下游相互协作、相互支撑的大数据产业环境,特别是构建有技术自主权的大数据产业链,避免核心技术受制于人,重蹈PC和通信产业的老路。发展大数据产业,还需要突破一个瓶颈,那就是宽带网络的滞后。没有高速的宽带网络做支撑,大数据将成为“空中楼阁”,所以,信息产业的“短腿”要赶紧补上。

大数据环境下农业经济发展新趋势 第4篇

1 农业经济现状

目前我国的农业经济, 有两个较为显著的特点。首先是农业经济发展的地区差异明显。从2014年各省农业生产总值的数据来看, 农业生产总值排名前三的分别是山东、河南和江苏。这三个省份全部位于黄淮海平原上, 不仅农业资源优越, 而且地理位置良好。在看农业产值排在倒数前三名的, 分别是西藏、青海和宁夏。这三个省份地处高原荒漠地带, 农业结构单一, 而且技术也相对落后。如表一, 表二:

表一, 表二2104年农业生产总值位居前三的省份和倒数前三的省份。

2 大数据对农业经济的影响

大数据对农业经济发展的影响非常显著, 就2014年农业发展大数据显示, 全年粮食产量60 710万t, 比上年增加516万t, 增产0.9%, 全年肉类总产量8 707万t, 比上年增长2.0%, 全年水产品产量6 450万t, 比上年增长4.5%, 全年木材产量8 178万m3, 比上年下降3.1%, 全年新增耕地灌溉面积132万hm2, 新增节水灌溉面积223万hm2。从这些数据中我们可以看出, 肉产品增产和水产品增产的速度要远远高于粮食产量的增速。木材产量的下降说明一个问题, 即生态可持续林业发展有所成效。

3 农业经济发展新趋势

3.1 商品化程度进一步加强

随着改革开放的不断深入, 市场经济的作用愈发明显。在市场需求的调节作用下, 我国农业开始走向商品化。就大数据分析得出, 从实行土地承包责任制以来, 我国农业中粮食作物占比一直处于绝对优势, 但是近年来的数据显示, 在我国农业经济中, 经济作物的占比已经远超粮食作物, 而且即便是粮食作物, 目前也在向商品粮方向发展。在商品化程度进一步加强的趋势下, 我国东北、华北、西北、华中、华东和华南地区相继建立起了具有重要影响力的商品谷物农业基地。

3.2 机械化程度显著提高

据数据显示, 山东省的农业总产值之所以位居全国第一, 是因为山东省农业生产的机械化达到了97.3%, 在高机械化程度的帮助下, 山东的农业经济走上了快速的发展道路。不仅是山东, 河南、辽宁、黑龙江等农业经济发展比较迅速的几个身份, 其机械化程度也都占有较大比重, 而且其机械化程度在呈逐年上涨趋势[3]。

3.3 生态农业比重增加

随着农业发展生态问题的逐步显现, 国家对于生态农业的建设更为重视。近年来, 在国家的大力支持下, 我国的生态农业比重逐年增加。由于目前我国生态农田、生态园林、生态牧场等生态农业建设正在如火如荼的进行, 生态农业基地的建设使得生态农业经济比重在农业经济中稳步上升。

3.4 农业综合化发展方向显著

我国未来的农业要走向世界, 就必须发展综合立体农业, 使得农业资源得到充分的利用。目前, 各个省份不仅在利用自身的优势资源进行农业经济的发展, 与此同时还在积极进行综合农业的建设和发展, 珠三角地区的桑基塘农业模式、西北传统牧区进行的耕种与畜牧结合的农业模式, 都是农业往综合化方向发展的实例。

结束语

大数据为环境保护服务 第5篇

“由于大气本身的流动性,雾霾天气具有跨区域污染的特点。”曾参与中国环境监测总站相关中间件平台建设的东方通高级咨询顾问认为,新形势下,一个区域“单兵作战”的方式,难以有效掌握空气污染状况,需要建立多个区域联防联控的工作机制,通过跨区域的污染信息数据共享交换,为后续的污染预警、应急等工作提供决策依据。并且,造成雾霾天气的污染源是多样性的,涉及燃煤排放物、建筑工地扬尘、道路渣运车等方方面面,也需要多个区域、部门联合治理。

该咨询顾问进一步指出,大气污染防治还要与水资源保护、土壤污染治理等其他工作联动运作,实现对各类污染物、地理、人口、企业等环保相关数据的集中管控,以“大数据”为手段持续完善环保工作体系。

现代信息社会,环保工作已经离不开各类信息技术的支持,这其中,中间件在环保信息数据共享和业务系统协同运行中扮演着非常关键的角色。例如在中国环境监测总站环境监测数据平台中,东方通部署了几十套消息中间件TongLINK/Q,可同时为纵向和横向的“信息流”搭建基础数据传输网络:纵向方面,通过部署在部级、省级等各级单位上的中间件产品,实现各类监控数据的“上传下达”;横向方面,基于TongLINK/Q构建的数据传输通道,连接了环境监测信息空间表征分系统、突发性水污染事件预警分系统、酸雨监测分系统等多个业务系统,未来还可以把新建的业务系统快速集成到统一的数据平台上,通过各系统间数据的共享交换,提高各类数据资源对环保工作的实际利用价值。

“作为专业中间件厂商,东方通在环保信息化建设上拥有丰富的实践经验,并在此基础上结合物联网、云计算等前沿技术,推出了环保协同感知系统解决方案,满足新时期环保工作对信息系统的高标准要求。”东方通相关负责人指出,环保协同感知系统以大气、河流、湖泊等管理对象为核心,搭建出环保物联数字神经可视化平台,将环保涉及的所有组织机构、应用系统、传感设备及其实时监测数据集中到统一平台上,并根据业务需求整合物联网感知信息、人口、法人、地理空间等数据,可以分别为领导决策、相关部门业务协同、社会公众等提供更具针对性的信息服务,开创环保工作新局面。

生态文明建设关乎人民生活和民族未来,环境保护工作势在必行。“两会”期间发布的《2014年政府工作报告》就明确提出,我国将出重拳强化污染防治,健全政府、企业、公众共同参与新机制,实行区域联防联控,深入实施大气污染防治行动计划。由此可见,“联防联控”已成为新时期环境治理和生态文明建设的关键词,“大数据”理念及相关技术将会在环保领域获得更多的用武之地。而东方通凭借在数据资源共享交换方面积累的丰富实践经验,将通过大数据等先进技术为环境保护工作提供更多的专业支持。

新数据环境 第6篇

关键词:大数据,图书馆,读者服务

信息科技、网络技术及大数据技术的迅猛发展,云计算、物联网的广泛应用,数据储量和运算速率的几何级增长,为智慧图书馆的建设发展及读者服务方式的变革提供了契机。深层次挖掘读者多层次的信息需求并及时提供个性化服务,最大限度地满足读者的服务效益,是图书馆工作的核心和关键。依托大数据环境的构建,门户网站、一站式检索、微信公众号、智能网络等应用平台不断被推出,致使图书馆之间的竞争,已然超越了传统的资源藏量、空间功能、排架齐整等服务项目,更多地体现在读者服务深度、资源获取效率及便捷性等服务质量的变革方面。面对新的现代技术环境,图书馆势必创新性地提出新的读者服务模式,深度挖掘读者需求、广泛寻求服务渠道、大力拓展服务内容、全面创新服务方式,真正推动图书馆读者服务向知识型、智慧型的方向发展。

1大数据知识服务的概念和特点

1.1大数据知识服务的概念

大数据知识服务是依托移动互联网、物联网、传感网、云计算及海量数据资源的泛在化发展趋势和复杂处理需求,用以解决结构化、半结构化及非结构化数据多维度处理的嵌入式协作化知识服务模式(见图1),是图书馆服务思想理念化、服务方式现代化、服务内容知识化、服务重心特色化的具体体现。大数据知识服务体系是大数据生态运行系统中最关键和核心内容之一。知识服务不是简单地信息数据库的整合与构建,而是强调知识、能力、资源和过程通过服务形式进行彼此之间的有机融合,并基于移动互联的网络通信技术,对虚拟环境下大数据无障碍自由获取、存储、分析、整合、决策和显示等依据“将计算推向数据,而不是移动数据”的策略,实现大数据知识服务体系中的知识动态协调构建、能力智慧管理、资源按需使用、过程智能控制。借助主题标引技术,深入调研读者多层次信息需求,实现面向研究问题及对象的查全查准;借助XML与知识挖掘技术,析出知识单元并构建为直接支持读者需求知识直接检索的概念库、观点库、专家库等,实现面向知识的一站式检索;面向读者服务管理与创新需求,提供新颖、权威、可定制且不同维度、不同粒度、不同功能、不同类型的大数据知识服务组合,最大限度地满足广大读者的大数据知识服务处理需求。

1.2大数据知识服务的特点

大数据知识服务是一种提供智慧服务以及面向数字图书馆发展的知识服务模式,智慧图书馆是未来图书馆的新模式,是一种以信息化、网络化、数据化、智能化为基础,突出互联、共享、高效、快捷的运行特征,支持用户应用和创新知识的特殊服务,建立于搜寻、分析、重组知识的服务基础上。可见,在提供智慧服务模式上,大数据知识服务的主要特点有:(1)互联、融合和共享图书馆基础设施。(2)提供智慧服务。(3)智能管理体系构建高效化。(4)全新的资源建设策略。(5)构建全新知识服务平台。(6)提供“融入环境、嵌入过程”的预见性服务。

2图书馆读者服务工作的现状

为广大读者提供全方位深层次服务是图书馆可持续发展的原动力,当代大数据技术已经渗透到生活的各个方面,使图书馆读者服务方式、服务途径、服务需求、服务手段等方面都有了新的变革,致使现代图书馆读者服务工作呈现出新的特点。

2.1网络服务与阵地服务并重

随着信息技术的发展,图书馆服务也发生了大的技术性变革,信息资源读者获取手段多样化、需求内容广泛、需求时效紧迫,对图书馆传统服务模式提出了新的挑战。传统的图书馆依托大量工作人员局限于一定的时空限制来提供相应的服务,具体涉及文献资源建设、书刊借阅管理、馆舍设备维护、读者咨询服务等工作。但是大数据技术在图书馆的启用使读者在网上获取信息资源变得更加快捷、便利,例如CNKI知网、RFID系统、IC空间等。但是,必须辩证地看到网络技术与大数据服务的局限性。传统服务在读者需求的某些领域仍有着不可替代的价值,当前势必出现现代图书馆网络服务与传统图书馆阵地服务并驾齐驱的互补局面。

2.2突破时间和空间的限制

传统图书馆管理与服务主要是由工作人员操控的,受到严格的时间和空间限制,广大读者只能在规定的时间和空间内享受到图书馆相应的服务,影响了图书馆资源利用最大化和服务效益最优化。随着网络技术的互联互通及大数据技术的发展,读者享受服务打破了时空的限制,可以随时随地检索利用各类文献信息资源,比如掌上图书馆、微图、图书自助借还系统、超星电子图书等。读者只需要通过身份认证登录相应的系统平台就可以无障碍地检索和利用图书、期刊等文献信息资源。

2.3资源无限带来服务无限

大数据技术推动信息资源展现形式和资源总量实现质的飞跃,读者不仅可以阅读到传统的纸质图书、期刊资源,还能够下载并看到各种各样的电子资源,让读者在最短的时间内便捷地掌握最前沿的信息,使图书馆读者服务趋于多样化、极量化。

2.4个性化服务的需求越来越突出

当前,读者服务呈现出个性化、多样化、高效化特征,对传统图书馆满足大众多样化需求的服务模式形成明显冲击,随着现代科技的发展,网络资源不断丰富,图书馆能够根据个性需求设立个人图书馆,进行资源定制与推送;设立研讨/自修室等个人学习空间,让读者沉浸于自我的思维间中,有全新的体验,享受自主性、个性化的特色服务体验,带给读者视觉的震撼的同时,也为读者提供了一种精神层面的超越。

3大数据环境下图书馆读者服务工作新模式

大数据时代,信息资源获取渠道越来越广,个性服务越来越突出,图书馆已经从以馆藏资源为中心转变为以读者服务为中心,为图书馆的个性化服务提供了全新的技术支撑。3.1特色服务个性化

特色服务是根据图书馆根据用户的不同需求,依据各种渠道对资源进行收集、整理和分类,向读者提供和推荐差别性的针对性服务,以满足读者的个性化需求。特色服务打破了传统的被动服务模式,主动开展以满足用户个性化需求为目的的全方位服务。通过利用大数据加强与读者需求之间的互动沟通,从数字图书馆海量文献资源中筛选出符合读者需求的针对性信息,提供高质量的特色服务、针对性的导读服务和多样化的定题服务等。并建立读者个人图书馆,依托大数据系统,分析读者的浏览借阅行为,预判读者的后续动态需求,为读者提供主动的跟踪推送服务,从而极大地提高读者服务效益。

3.2知识服务常态化

知识服务主要是按照读者的需要从各种显性和隐性知识资源中有针对性地提炼总结各种知识,并用来解决用户问题的高级阶段的信息服务过程,诸如新闻摘要、科技查新、信息检索、论坛服务、博客搜索、网站排名、倾向性分析、热点发现、聚类搜索、信息分类等服务内容。当前由于各种因素的制约,国内图书馆界知识服务存在很多不足,很大程度上浪费了读者的阅读时间,影响读者的阅读价值。大数据时代图书馆知识服务的影响力将会日益显现,通过信息采集、信息过滤、信息分类、信息摘要、精华萃取等处理过程,运用交互式方法为用户提供服务,使图书馆的知识服务能够常态化。

3.3咨询服务深度化

参考咨询服务是图书馆服务工作的重要体现形式,是发挥图书馆情报职能、开发文献资源、提高文献利用率的重要手段。它通过具有专业知识的图书馆工作人员运用检索工作通过协助检索、解答咨询和专题文献报道等方式向读者提供事实、数据和文献线索等咨询服务。如今大数据技术广泛应用,要求图书馆要提供更快捷便利、更有深度的参考咨询服务,这就对参考咨询馆员的综合能力和素质提出了更高的要求,馆员可以借助大数据分析系统,为读者提供翔实的、更符合读者要求、含金量更高的参考咨询服务,从而提高了图书馆的服务质量和服务效率。

综上所述,大数据时代的来临,图书馆的读者服务工作机遇与挑战并存,图书馆要敢于冲破传统思维定式的局限,大胆开拓创新,转变服务意识,紧紧抓住网络信息时代大数据的技术优势,不断加强馆员队伍素质建设,全力改进读者服务模式,积极拓宽读者服务渠道,促使读者服务更加系统化、体系化,切实为读者提供全方位、深层次、个性化的信息资源服务,真正发挥图书馆文献资源中心的作用,推进图书馆事业更快更好地发展。

参考文献

[1]秦晓珠,李晨晖,麦范金.大数据知识服务的内涵、典型特征及概念模型[J].情报资料工作,2013(2):18-22.

[2]王新筠,王海欣.大数据背景下图书馆知识服务的思考[J].图书馆工作与研究,2014(11):75-78.

[3]胡莲香.走向大数据知识服务:大数据时代图书馆服务模式的创新[J].农业图书情报学刊,2014(3):173-177.

新数据环境 第7篇

1 数据新闻的优势

1.1 数据新闻能够梳理出人物、事件之间的关系,方便阅读

我国城市电视台传统的新闻报道是以文字性叙述为主要的表现方式,在文字状态之下需读者先进行阅读之后再来对整个事件、人物进行梳理,但是很难将新闻事件内部之间的联系察觉出来。而数据新闻中新闻画像师则可以将一个事件的发生、发展以及变化过程中的人物、利益、结构关系等用信息图表的方式进行梳理并揭示出来,从而方便读者阅读。

1.2 数据新闻能够揭示新闻重点,加深认识与理解

数据新闻将抽象、枯燥的新闻内容数字形象化,从而加深读者对数字的认识。用信息图表的方式将一条新闻中包含的重点内容揭示出来,使读者能够更加容易理解、记忆其中的要点[1]。比如,2014年全国两会期间,搜狐新闻网在两会专题中,以数据新闻的形式将习近平主席与李克强总理一年的工作历程呈现出来,并以《领导人的时间都去哪儿了?》为标题。通过数字、图表、漫画等形式向读者形象生动地展示了习近平主席与李克强总理一年来都去了什么地方,做了什么,都见了哪些人。数据新闻中和蔼可亲的习主席漫画形象以及归纳好的数据,让读者对习主席一年以来的工作情况,调研、学习、访问、会议、活动等一目了然。

2 城市电视台在新媒体环境下发展数据新闻的措施

2.1 完善搜集的数据

数据新闻的核心部分就是数据,城市电视台发展数据新闻的前提与基础就是要建立完善的数据管理体系,包括了对数据的搜集、过滤与分析。其中数据搜集是生产数据新闻的第一个环节,数据搜集的可靠性直接对数据新闻的可信度造成影响。就当前的情况而言,数据新闻中的数据主要来源于新闻中的数据、网络用户的数据、政府机构以及企业发布的公开数据3个方面[2]。比如曾经的《两会大数据》就为数据的来源提供了一个崭新的思路,就是从大数据公司中来获取数据资料。大数据的出现为新闻行业带来了大量的新鲜信息,但是信息的质量参差不齐,需要新闻工作中对其进行去伪存真的处理,从而使得真正有价值的数据呈现在读者的面前,而不是一味地简单罗列与堆砌。

2.2 构建专业的数据新闻团队

对于我国的电视新闻媒体而言,如果还是以传统的依靠个人力量来制作可视化的数据新闻,是很难满足高速发展的电视行业的需要。澳大利亚全国广播公司的数据新闻团队是由网页开发设计人员,主编记者,擅长于搜集、分析、整理数据的兼职研究员,兼职初级记者,制作顾问;提供ABC跨平台支付的项目经理7类人组成,其中构成每一个数据项目的核心重要部分是由研发技术人员、建议以及设计师的可视化处理3个部分组成。与国外相比,我国的媒体团队在视觉生产方面的建设可谓是左支右绌,具体表现为视觉团队的人员配备不完善,分工细化程度不够,严重缺乏数据编辑以及电脑制作编辑的人才。绝大多数情况下记者既要承担外出采访、编辑的日程工作,还要担任负责制作可视化数据新闻的美工编辑工作,记者犹如一个无所不能的战士一样,但是在这样的情况下生产出来的新闻作品的质量很难得到保证。

2.3 贴近老百姓生活做数据分析

在数据的搜集方面,为给大众提供通俗、直观的可视化服务,则可以通过腾讯、搜索引擎、百度等大数据平台网络,来对全球范围内的实时数据进行挖掘,进行多维度的数据对比,深入分析大众的思想来实现。其中数据新闻中的数据可以是来源于、腾讯、移动数据、百度搜索制度、百度检点预测、疾病预测、百度风云榜等渠道。城市的电视台的记者则可以通过本地化的处理,重点在大数据中查找与本地有关的数据,查找其中的不同之处。比如在春运的出行图中,过年前,我国范围内的大中小城市的人群都在回流向中小城市,从地域上分析就是从东部城市向西部城市流动,而对于城市电视台则可以将数据细化到本地,通过数据分析来本地的外地务工人员主要分布在哪些地区。对于这样的分析,更加贴近于老百姓的生活,也为老百姓的出行提供了有效的参考。在过年期间,通过数据的分析可以发现主要外来务工人员地区的各种交通方式十分拥挤,提醒市民可以错开高峰期。

2.4 要形成良好的数据意识

数据新闻就是要从数据之中来寻找新闻,利用数据来对事实进行解读,这是城市电视台在面对大数据所必须要作出的改革与创新,也即是要发展数据新闻。从整个社会的数据化来看,城市电视台中的每一个新闻工作者都需要逐步形成良好的数据意识,只有具备了良好的数据意识才能够做好数据新闻发展[3]。为此,需要对数据乃至数据新闻本身所拥有的优势:数据本身并不仅仅只是解读新闻的一种依据,同时还是新闻报道的重要资料来源与新闻内容;数据新闻则是新闻工作者对于新闻事实所作出的一种精确的分析、一种深刻的解读以及清晰的呈现,数据新闻的生产方式是对传统新闻的那种简单堆砌与罗列的改进,可以帮助读者对新闻事实产生出清晰直观的感受。为此,作为城市电视台的新闻工作者必须要清晰认识到数据新闻是对新闻事实进行深刻解析的一种重要的途径,还可以让新闻事实具有更强的可读性与趣味性。为此,作为城市电视台的新闻工作者需要在日常的工作之中不断进行数据新闻的尝试,养成良好的数据意识。

3 结论

如今,我们已经进入了大数据时代,城市电视台本身的发展依赖于社会大环境,但是还必须要做到审时度势、未雨绸缪。在新时期,城市电视台要把握住新的机遇,就需要对数据新闻进行大力发展,不断地提升数据新闻产业的地位,实现华丽的转型。

参考文献

[1]蒋玉林.接“地气”才能聚“人气”——城市电视台新闻节目本土化的思考[J].宿州学院学报,2012(7):32-33,71.

[2]方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(6):73-83.

新数据环境 第8篇

1 大数据环境的特点

大数据作为信息全球化的产物, 它有四大特点:大量的数据、多样的数据类型、高速的运算能力、价值密度低。

1.1 大量数据

大数据, 顾名思义, 数据量大是大数据的基本特点。大数据时代, 数据一直在不断的生产, 其数量的级别从Trillion byte级别, 跃升到Pet byte级别, 甚至是Zetta byte, 并一直处于增长趋势之中。

1.2 多样的数据类型

数据量的巨大也会使数据类型呈现多样化的特点。大数环境下, 数据类型众多, 并且不断产生新的种类。网络日志、图片、电子邮件等都得到了快速发展, 且日益成为信息数据的主体部分。

1.3 高速的运算能力

根据一秒定律, 大数据环境下可以十分快速的从不同种类的数据中获取价值高的信息。其运行系统是一个分布式结构。它是以海杜普大数据框架为基础, 通过集群的威力, 具有高速的运算能力。为适应大数据的应用程序, 其访问数据是通过流的形式, 提高传输率来实现的。由于许多搜索引擎、数据发掘等技术的不断发展, 数据的运算能力将变得更加高效。

1.4 价值密度低大

大数据有价值密度低的问题。一方面大数据环境下处理分析数据需要非常高的成本, 存储和计算PB级的数据是非常消耗成本的。另一方面大量的数据, 多样的数据类型, 导致信息资源复杂, 对其进行数据统计中, 很难进行细化分析, 很难形成有效的价值, 其价值密度比较低。综上可知, 除存在价值密度低的问题, 大数据具有数据量大、种类繁多、运算高效等优点。大数据通过这些优势, 使自己成为数据分析的前沿技术。

2 大数据环境下数据结构

大数据环境下数据结构是以非结构化和半结构化数据为主, 结构化数据为辅, 但结构化数据始终处于核心地位。数据结构一般可以分为结构化数据、非结构化数据、半结构化数据。结构化数据一般是指普通出文本之类的数据, 详细地说来, 是指那些方便于计算机处理的数据。它通常被存储在数据库中, 有着明确的语义标签, 可以被分割, 单独使用, 又可以在特殊情况下成为一个独立的单元被使用。而非结构化数据则是指网页、视频之类的信息数据。它是以自由文本的形式, 存在于数据库之外, 在计算机内并没有固定的数据模式, 因而计算机很难处理分析。半结构化数据则是出于结构化数据和非结构化数据之间的数据结构形式。正如上文所述, 大数据环境下数据具有数据体量大、数据类型繁多等特点。而在这大量的数据中, 非结构化数据占大多数。通过相关的调查统计可知, 大中型企业中, 非结构化和半结构化数据占有76%, 结构化数据只占24%。此外当今世界非结构化数据正以十分巨大的速度增长, 大约70%左右。由于非结构化数据在计算机内没有固定的数据模式, 其结构并不固定, 因此处理起来很困难, 很难实现信息的价值最大化, 从而造成了大数据价值密度低。因而在数据环境下, 合理有效地处理非结构化数据是每个企业必须解决的问题, 也是企业实现价值最大化的潜力所在。

3 数据安全

由于大数据环境下非结构化数据的暴增, 以及大数据自身的缺陷, 也为数据的安全买下了隐患。其存在的问题以及解决方法如下。

3.1 存在的问题

3.1.1 信息处理设备的安全

数据需要设备处理, 而设备的管理与数据安全有着重要关系。一旦设备出故障, 数据很有可能消失或泄露。因而对设备的管理维护, 是做好数据安全工作的第一步。机房环境、线路距离、电磁干扰、电压电源以及计算机的软硬件设备等都是需要仔细考虑的。如果出了问题, 后果不堪设想。例如夏天温度过高, 计算机的温度也会升高, 如果不及时散热, 计算机就会出现短路, 导致数据丧失。

3.1.2 信息内容的安全

危害信息内容安全主要体现在信息的泄露和破坏上。其他用户通过非法途径窃取他人信息, 造成原用户的信息泄露。系统故障、病毒侵害, 导致数据内容删减破坏, 这些都是危害信息内容安全的行为。如索尼公司遭黑客侵入事件, 就是信息内容安全受到侵害的具体表现。

3.1.3 信息传播的安全

我们平时传输数据, 一般是通过各种网络通信协议进行传播的, 如TCP/IP, HTTP地址等。但是这些协议本身就有很大的安全漏洞, 它没有完善的数据保护机制。许多网络攻击、病毒的传播都是通过这些网络协议的漏洞, 对用户数据进行攻击、破坏, 严重甚至导致网络系统瘫痪。

3.1.4 信息管理的安全

管理作为数据安全的重要组成部分, 管理的好坏, 与数据安全与否有重要关系。不健全的安全管理制度必然会造成数据安全问题。这主要体现在无法提前预防、实时控制网络攻击、破坏行为, 此外也表现在数据受到攻击后的数据恢复、修补上。这种不健全的管理制度, 必将为日后数据安全管理埋下隐患, 不利于数据安全的维护。

3.2 解决的措施

3.2.1 做好设备的更新维护

设备的更新换代及维护对于数据安全的维护具有重要作用。及时更换设备, 检查设备线路, 控制电源、电压, 注重设备的防潮防尘等, 这都是做好设备的更新维护的重要举措。

3.2.2 采用先进的安全防御技术

这主要是针对信息内容和传播安全问题所提出的措施。网络保护中, 我们既然无法阻止非法用户的破坏, 也不能去反击对方, 那么能做到的就只有做好防御工作。采用先进的安全防御技术, 对于信息内容保护能够起到重要作用, 其具体表现在加强网络访问控制、给数据加密、数据隔离、病毒治理等方面。如杀毒软件、安全卫士等防治病毒修补漏洞的安全防御性软件, 就能有效地保护自己信息不受非法人士入侵和篡改。

3.2.3 完善保护网络安全制度

网络由于其本身隐秘性特点, 导致有些用户在网上十分肆无忌惮, 任意公开他人隐私, 人肉他人信息等。这些受害人的隐私权受到了侵害。政府部门应加强网络监督机制和维权机制, 保护受害人的合法权益。

3.2.4 加强保护数据安全的意识

以上从外在客观条件上提出解决方法, 但任何危险都是受人的主观意识影响的。如果每个人都有保护信息安全的意识, 那么就不会有人会去侵害他人的信息安全, 如果每个人都能注重信息安全, 那么非法人士也不会有机会侵害他人的信息安全。加强数据安全的法律意识和道德意识, 使人们自觉遵守网络运营制度, 营造良好的网络学习、交流环境。由此可见, 信息安全的保护不仅仅需要外在的硬件、软件支持, 也需要人的责任心、使命感的维护。

4 结 语

大数据的生成发展从根本上来说是经济全球化的结果, 从直接原因上来看则是信息化的必然结果。数据量大、种类繁多、运算高效迅速、但其价值密度低, 是大数据环境下数据的四大特点。由于网路信息数据的飞速发展, 网路安全问题也变得越来越棘手。信息内容、传播、管理及设备的安全, 在大数据环境下都受到了不同程度的威胁, 因而必须针对这些问题加强防护意识, 真正做到信息数据的安全。当今世界的信息化程度不断加深, 数据结构和数据安全等问题将会不断加深、演变、发展, 因此不管是企业还是个人, 应紧跟信息技术的前沿, 不断开发应用新型技术, 以此适应大数据环境的发展。

摘要:大数据又称巨量资料。它是当前信息全球化过程中的必然产物。庞大的数据、多样的种类及高效的运算等特点造成了大数据环境下的特殊的数据结构, 也带来了一系列的数据安全问题。笔者简述大数据环境的一般特点, 分析大数据环境下的数据结构和数据安全问题, 以此展望大数据环境下的发展前景。

关键词:大数据,数据结构,数据安全

参考文献

[1]常景.关于大数据环境下的数据安全分析[J].信息通信, 2014 (6) .

[2]李洪洋.大数据环境下的数据安全研究[J].电子技术与软件工程, 2013 (7) .

大数据环境下税收数据深度利用探索 第9篇

关键词:大数据,数据挖掘,数据利用,税收信息化

一、深度利用税收数据是“大集中”之后税务信息化建设的必然要求

税收数据是指税务机关在税收征管过程中记录和保存下来的各种工作记录和档案资料,包括纳税行为人基础数据、计会统计数据、电子纳税信息、调查记录、工作底稿等各类相关文字、图片、报表。范围涵盖纳税人从登记到注销整个纳税活动生命周期内所有生产活动记录。在税收管理中税收数据通常发挥基础性作用,常见的利用方式以报表生成、搜索查询、数据比对、税负分析、风险监控等为主,通常借助分类、汇总等通用统计指标根据历史数据对税收情况进行“陈述式”展示。数据利用较多地侧重于对基层业务具体征管行为的指导和监督,而对税收与宏观经济关系的展现、政策效果的评价、管理决策参考等方面的作用相对不足。

近年来,税制改革与纳税服务工作的推进对税收数据深度分析提出了更高的要求。金税三期规划所倡导的在统一平台框架下,建立总局、省局两级数据处理中心和以省局为主、总局为辅的数据处理机制,实现涉税电子数据在总局、省局两级的集中存储、集中处理和集中管理的机制意味着从国家战略层面上税收数据大集中将在不远的将来变为现实。而这一规划的重要目标之一就是通过集中管理税收数据资源,将原先分散于各种独立系统中的数据统一整合到一套平台当中,为深度利用税收数据完成重要的前期准备。可以预见的是,未来税收数据的深度利用研究将主要围绕以下三个目标展开:第一,围绕税收与经济协调发展为目标;第二,围绕如何加强征管效率为目标;第三,围绕如何提升纳税服务水平为目标。税收数据的深入分析将成为优化重构纳税服务流程、提升纳税人满意度、降低纳税成本的重要途径。

二、税收数据应用现状及问题

近些年来,国家税务总局对税收数据利用非常重视。各地方税务局也在加强基础数据管理、提升数据分析利用水平等方面开展了大量的工作并取得了局部的成果,主要包括:重点税源动态监控应用已基本建立、税收执法防范措施应用已初具规模、税务稽查选案已初见成效等。但总体而言,数据的利用率和应用范围还很局限,特别是与社会和纳税人对税务部门的要求相比,仍然存在不小的差距,缺乏有效的数据质量控制机制和专业性数据利用支持机制。具体分析有以下几个方面原因:

1. 数据质量难以保证。

数据分析得出的结论优劣,很大程度上依赖于数据本身的数量和质量。一方面,从纳税人那里返回数据采集表,由于填表人员常常忽视非关键项内容的填写,造成数据缺漏现象普遍存在。另一方面,纳税人报送的财务会计报表和纳税申报表反映的税源不真实,隐匿收入、少报、漏报、假账的现象屡屡发生,税务机关如果不加以区别而按照虚假税源信息征税必然会导致税收遭受损失。因此,数据的数量和质量在很大程度上限制了数据利用的效果。

2. 数据利用不够充分。

主要原因:一是目前信息系统数量较多,信息共享性差,信息孤岛现象严重,跨系统数据联合应用性不高,不能从行业、区域等角度进行横向动态对比、分析。二是缺乏专业的数据分析和数据挖掘专业技术人员,税务系统内部人员对于数据挖掘的理论研究不足,工具软件的使用不够熟练。

3. 数据分析方法有限。

对于大部分税收数据分析人员来说,当前最为常见的数据分析方法还是以简单的统计分析和票表比对为主,运用数量经济模型进行分析预测的还是相对有限。至于运用数据挖掘等智能化的大数据分析方法进行税收分析和预测,还基本处于理论及实践的探索阶段,鲜有成熟的、完整的、系统的分析案例。

4. 数据安全隐患较大。

大数据在税收中应用的环境对数据安全的要求相应大幅提高。数据安全性的危害除了硬件设备故障的损坏、备份介质的损坏、自然灾害等不可抗力危害之外,其所处的网络化环境对安全性造成了更为严峻的考验,由于纳税数据量庞大而且关联性强,在大数据逐步走向开放的过程中,网络黑客可以较为容易地利用挖掘工具和程序破译诸如客户银行账户之类的重要的信息,给国家和纳税人造成损失。

三、大数据环境下税收数据未来深度利用的探讨

1. 树立大数据理念,培养大数据文化。

“大数据”是数据、技术和思维的高度融合。数据本身是静止的,要深度挖掘其内在价值,不仅要依赖先进的数据处理技术,而且更需具有善于使用数据的创新思维,“大数据”是三者的统一体。思想是行动的先导,加强数据分析,首先必须解决思想观念问题。为此,要在税务系统深入开展普及“大数据”相关知识,引导每名税务干部正确理解“大数据”的核心理念,培养“大数据”的思维方式,力争在全税务系统营造一个“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的“大数据”文化氛围,为税收“大数据”建设奠定坚实的思想基础。

2. 构建税收最小数据集,推动政府部门间信息共享。

借鉴美国等发达国家先进做法,积极推进政府部门最小数据集建设,加快政府部门间数据共享步伐。作为税务部门,一是严格涉税信息报送管理。贯彻执行征管法有关规定,由纳税人按照统一口径、统一时限、统一格式报送生产经营和财务管理数据,提高基础信息质量。二是扩大与相关部门数据交换范围。将发改、商务、建交、工商、统计、金融和国土房管等部门掌握的宏观经济指标与涉及企业、个人的相关信息纳入数据仓库。三是定期与经济管理部门交换数据。加强与相关部门沟通联系,努力提高数据交换的制度化和标准化水平,逐步实现数据的实时交换。

3. 加强数据来源质量的管理,确保数据的完整性和准确性。

首先,对现有的系统内数据的准确性、完整性、合法性进行筛查,对所发现的“问题”数据,按来源反馈到相关责任部门加以处理,或征询责任部门的意见后进行技术化处理;其次,要通过宣传强化纳税人自觉申报意识,努力纠正目前存在的纳税人纳税申报不及时、申报数据质量不高、申报行为不规范、申报内容不真实等行为;再次,规范外部数据来源,对从外部相关单位取得的税收相关数据给予检验,规范取数口径,最大程度地保证数据的真实和可靠。

4. 强化数据的归集和整理,方便数据深入利用。

主要工作是对系统内、外的各类业务数据和第三方数据进行归集并分类备案。第一,对核心业务系统中的历史数据按行业、税种等进行归集、整理;第二,对各部门从第三方取得的外部数据进行归集、整理和分类备案,包括:国税数据、工商登记数据、统计局相关数据、银行数据等。在国家法律规定的框架下,建议成立专门机构来确保信息共享机制长期稳定运行,统一数据交换平台的开发和核心网络的组建,制定跨部门间统一的规范技术和业务标准和第三方数据采集标准,提升数据的匹配成功率,最大程度地提升第三方数据对于税务部门内部数据的补充作用。数据归集与整理在初期需要耗费较大的时间与精力,但优质的数据管理是最终实现数据高效利用的必要前提。

5. 打造专业的技术分析团队,提升数据深度利用的水平。

为更好地开展数据深度利用工作,应在税务系统内部挑选既熟悉税收业务又掌握数据挖掘技术和统计理论的复合型人才组建专门的数据分析团队。采取“请进来、走出去”的方式对分析团队成员进行有针对性的系统培训。既要加强数据仓库、数据挖掘、联机分析系统等计算机方面的知识培训,也要通过实际的风险应对、税务检查,加强征管实务、财务会计等方面的知识培训;既要积极紧跟大数据的前沿研究热点,将新理念、新技术与税务数据的深度利用紧密结合,也要借鉴其他领域的数据分析方法,努力创新工作思路,在实践中摸索出一套适合税务数据利用的分析体系。

6. 健全收入质量评价指标体系,提高税收分析预测能力。

一是税收与经济发展相关指标,主要包括宏观税负变动率、税收弹性系数,以及主要行业的税收弹性系数等。二是税种间关联分析的评价指标,主要包括城建税与流转税的比对、契税与房地产企业各种税收比对、企业所得税与营业税及个人所得税税基比对等。三是反映征管与税收关系的评价指标,包括申报率、入库率、清欠率、企业所得税汇算清缴比重等。在此基础上,利用数学方法和实际经验确定主要税种指标的上限值和下限值,分析数据所处状态并计算综合预警指数,建立起反映宏观税收经济运行轨迹的监测预警系统,结合经济运行情况,开展税负分析和税源分析,判断税收与经济的协调性。

税收数据深度分析利用工作是一项涵盖税务系统各级、各部门的综合性系统工作,税收数据的采集、管理、分析挖掘需要专门机构负责和各级税务机关的配合支持,指标体系和数学模型的形成需要众多科研人员的参与,只有充分调动各方工作积极性和创造性,在系统内树立“数据为王”的理念,将税收数据深度分析利用工作努力推向全新的高度。

参考文献

[1]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,(6).

[2]姚琴.电子税务:以大数据推动智能化管理[J].世界电信,2014,(Z1).

[3]谭荣华,焦瑞进.关于大数据在税收工作中应用的几点认识[J].税务研究,2014,(9).

新数据环境 第10篇

1 动态数据仓库的概念及特点

动态数据仓库是一个集中的、全面的、集成的、逻辑一致的、易访问的企业级的数据的集合, 它不仅能像传统数据仓库那样支持OLAP和数据挖掘等应用分析技术, 还增加了能实时监测、实时进行数据分析帮助企业决策的功能。动态数据仓库战术性的决策支持与企业事件的自动检测、处理功能, 是异于传统数据仓库之处, 更明确的说, 是对传统数据仓库的补充与扩展。动态数据仓库不同于一项技术, 它是一个处理过程, 数据仓库中的加载方式也有多种, 常见的为传统ETL批量加载、实时加载技术等。

动态数据仓库与传统数据仓库相比, 具有数据实时加载、混合工作量、事件检测和处理的特点。

动态数据仓库的信息并不是在企业用户发出请求后才能使用。动态数据仓库可以在事件发生同时, 根据最新的数据, 同步及时的检测到事务, 对数据进行企业战术性的分析与事件的检测处理, 将结果自动反馈于用户系统。为了确保决策的有效性与及时性, 要求数据必须实时或接近于实时的加载到动态数据仓库中。在满足业务需要的前提下, 对“实时”的要求也就应具体情况而定了, 所以, 此处的“实时”, 也并非绝对的“实时”。

混合的工作量数据仓库, 与传统数据仓库工作量相比, 除了能进行复杂的查询和批量的数据加载外, 快速并且高效的, 满足企业要求的战术性查询、事件检测、处理以及实时加载也是混合工作量数据仓库数据处理的特点。

事件的处理可以分作同步事件处理与异步事件处理。从字面上可以理解, 同步处理则为按一定的顺序, 依次完成数据处理的任务, 其中必须等待上一步完成后, 之后的事件才可以被提出处理, 强调按顺序执行。异步处理则不一样, 其处理过程中每一步都是独立的, 不依赖于其他步的调用, 所以其基于事件的各应用程序在设计上是松耦合的。

2 动态数据仓库的体系架构

动态数据仓库的数据集成方式有多种, 周期性的ETL方式、直接点滴导入、点滴翻转导入、导入实时数据缓存为常见的数据集成方式。所有数据集成方式都需满足不影响业务系统的事务处理, 实时查询, 接近零延时的基本准则。

若通过EAI, 还可以将企业内的其他系统与动态数据仓库集成一体使用, 不仅可以优化企业的业务流程, 在实时传递战术性决策时, 还能帮助企业的决策与业务流程完整结合, 以实现并提高企业的运营自动化。

3 动态数据仓库的应用

动态数据仓库已用于多种工作领域, 在帮助企业全面快速的掌握重要信息, 提高竞争环境下企业的分析能力方面, 动态数据仓库从中发挥着重要作用。

3.1 物流调度

动态数据仓库系统, 可以将配送货车的最新请求在最短时间内呈现于车辆调度人员, 调度人员根据货车行驶终点站、货物数量等等配送或安排货车送货。这就要求动态数据仓库将最新的数据于几秒内反映给总站, 以用于驱动业务决策。同时, 为保证货运的正常运行, 动态数据仓库系统必须365天, 每天24小时实时运作, 该动态数据仓库必须100%可用。

3.2 商品库存管理

商品库存决定商家是否需要进存货物。商家可以从前端得到销售的详细数据, 根据商品的销售趋势, 库存情况, 结合同比销售情况, 判断是否需要进存货物, 货物需要保证在销售完毕前库存得到补充的同时, 不能多进货以造成库存积压, 达到销售完毕时正好有货物进库的最佳零界状态, 保证了资金的灵活性, 实现销售商的利益最大化。因此, 动态数据仓库必须实时获取最新销售情况的数据并做出及时的处理决策。

3.3 信息通信安全

越来越多的信息欺诈的出现, 是目前信息通信安全面临的最大危机。不法分子通过电信行业中的后付费业务, 实施欺诈。为了减少此类欺诈行为给用户带来的损失, 建立反欺诈安全机制便成了重要任务。动态数据仓库可以根据用户的通话数据, 通过实时查看用户产生话费是否大幅增涨, 若有该情况发生, 通信运营商将对比该用户平均通信时长、信用度、历史话费情况, 综合判断是否有欺诈行为发生, 以采取对应措施, 减少用户损失。

3.4 银行客户管理

在银行业中可以根据用户的存款行为制定个性化的客户关系管理。客户关系管理部门可以寻找有规律的大量存款的客户, 基于这些客户的存款级别和近期消费行为, 为客户提供免费或打折的服务, 来加深、扩展与客户的关系。通过客户的近期的消费行为来拓展同客户的关系, 有利于保留客户, 扩大市场份额。

参考文献

[1]Inmon WH, 王志海译.数据仓库 (译2版) [M].北京:机械工业出版社, 2000.

[2]姜智远.动态数据仓库的研究与应用[J].科技情报开发与经济, 2008 (09) :130-132.

[3]谭光玮, 武彤.基于生产线质量控制系统的动态数据仓库解决方案[J].微型机与应用, 2014 (07) :7-8.

[4]Jiawei Han, Micheline Kamber, 范明, 孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版社, 2001.

[5]陈京民.数据仓库与数据挖掘技术[M].北京:电子工业出版社, 2002.

上一篇:物理学科优势下一篇:家庭类节目