空间数据标准范文

2024-07-23

空间数据标准范文(精选9篇)

空间数据标准 第1篇

近年来,随着地理空间信息化技术的发展,测绘地理信息资源在行业中的应用价值不断提升,其在各行业中的需求量不断增加,但由于各行业建设地理空间数据管理系统及空间数据标准不统一,地理信息资源无法整合,地理信息资源的应用价值得不到发挥。因此,国家和省级高度重视地理空间数据的共享应用,2015年6月,国务院关于《全国基础测绘中长期规划纲要(2015年—2030年)》中明确了地理信息资源共建共享的任务和目标,湖南省人民政府出台《湖南省人民政府办公厅关于促进地理信息产业发展的实施意见》,明确了湖南省地理信息数据共建共享的任务及目标。

因此,本文在国家测绘地理信息产业发展的新形势下,针对目前湖南省地理空间信息开发利用的情况,开展针对湖南省地理空间数据交换与共享标准及共享机制研究,为湖南省建设地理空间数据交换共享平台提供依据,对提升地理空间数据应用价值,服务政府、企业、公众起到一定的推动作用。

1 湖南省交换共享平台目标及数据类型

1.1 湖南省交换共享平台目标

湖南省交换共享平台以计算机软硬件环境、地理空间数据集成管理与网络通信技术、分布式计算技术(Distributed Computing)、并行计算技术(Parallel Computing)和虚拟化技术(Virtualization)为依托,以数据交换共享标准体系为集成依据,基于云GIS平台构建地理空间数据共享交换规则、数据处理、数据管理工具集,整合基础测绘类、影像类、4D产品类、元数据类、文档类、地名地址类、行业专题类数据等各类核心数据,建设基于地理空间框架数据库、高清影像数据库、电子地图数据库、三维景观数据库、元数据目录库、实体编码库、POI空间数据库、专题空间数据库,构建地理空间数据中心管理层,集成管理湖南省省域范围内地理信息相关的数据,依托交换共享中心为各行各业提供地理空间信息数据。

1.2 湖南省交换共享平台数据类型

湖南省地理空间数据具有数据量大、数据类型丰富、多尺度、多来源等特点,主要基础测绘4D产品、1∶2 000不动产统一登记基础数据(高分辨率DOM、高精度DEM、大比例尺DLG)、地理国情普查与监测数据、国土资源专题数据、数字城市地理空间框架数据,各类数据覆盖全省范围,现势性在2010年—2016年范围内,精度较高。

本文将各类地理空间数据划分为7类:基础地理信息数据、遥感影像数据、地名地址与POI数据、三维数据、专题空间数据、数据元数据、其他数据等。

2 交换共享平台标准体系

本文在国家测绘标准体系框架和地理信息标准体系框架下,基于理论、技术、过程方法、分类方法、模块化方法、层次法、系统法,结合湖南省地理空间数据实际情况,构建地理空间数据共享和交换标准体系,标准体系按性质划分为通用类、数据标准、数据处理、数据更新、数据接口、服务、质量与标准管理等7类,见图1。

2.1 通用类

通用类是涵盖地理空间数据共享和交换标准体系建设中使用范围广,适用于交换共享平台概念设计的标准规范。

通过对地理空间数据模型与数据库管理系统的研究,制定用于湖南省交换共享平台概念设计的标准《湖南省地理空间数据交换与共享平台概念设计》。

2.2 数据标准

数据标准涉及的内容比较多,从数据的分类编码、数据格式、数据字典、元数据到数据目录等,贯穿数据形成、更新的整个生命周期。具体如下:

1)数据内容及分类代码。数据内容及分类代码标准主要有GB/T 7027—2002信息分类与编码的基本原则与方法、GB/T 25529—2010地理信息分类与编码规则、GDPJ 01—2013地理国情普查内容与指标等,本次主要采用基础地理信息数据库为母库,其他地理空间数据作为补充,因此,采用GB/T 13923—2006基础地理信息要素分类与代码,对湖南省各类地理空间数据进行分类与编码。

2)数据格式。湖南省地理信息数据资源主要包括空间数据与非空间数据,空间数据主要为地理信息数据,常见的数据类型有卫星影像,DOM,DEM,DLG,空间属性数据等,一般为Geo Tiff,image,JPG,TIF+xls,MAT,GRID,BIL,COV+XLS,E00,MAPGIS,DWG,MDB,COV,CAD,SHP等格式;非空间数据主要为业务办理过程中产生的业务数据,其类型有业务表、文档、图片等类型,常见数据格式为WORD,PDF,EXCEL,TAB,TXT等。湖南省地理空间数据交换共享平台的空间数据与非空间数据格式以基础测绘成果数据格式为标准,统一录入交换共享平台数据中心管理。

3)数据字典。数据字典是数据管理的核心,数据字典标准主要用于指导数据建库过程中的表结构的规范,湖南省交换共享平台数据字典设置要符合GB/T 20258—2007基础地理信息要素数据字典要求。

4)元数据。元数据是湖南省地理空间数据交换共享平台重要的基础数据,用于快速检索和查询。湖南省地理空间数据交换共享平台元数据制作依据《全国地理信息资源目录服务系统元数据规定》,制作空间化元数据。

5)目录。目录的设置与划分依据《湖南省地理空间数据交换与共享管理办法》附件进行设置,并结合国家政务信息资源目录体系,规定交换共享平台中地理空间数据的分类、编目、标识语言等。

2.3 数据处理

数据处理主要规定各类地理空间数据统一到一个平台中时需要用到的方法、流程等,湖南省地理空间数据交换共享平台数据处理主要参考《基础地理信息数据库建设设计书》《基础地理信息数据库标准》《湖南省地理空间框架数据建库技术规范》《湖南省POI分类分级与代码规范》等。

2.4 数据更新

数据更新规范规定交换共享平台中地理空间数据更新的原则、要求、技术流程等。主要包括《湖南省基础地理信息数据库更新技术规程》《湖南省测绘地理信息项目管理办法》等。

2.5 服务接口

服务接口是为了实现不同地理空间信息模型中空间数据在不同空间参考系统中的交换和共享。交换共享平台遵行统一的共享交换接口和技术规范,建立对外服务提供、数据表处理、空间叠加分析、空间坐标转换、地图实时渲染等接口,湖南省交换共享平台依据《湖南省地理信息共建共享数据交换和服务接口技术规范》(征求意见稿)、《国家信息网络分发服务元数据服务接口规范》《地理信息元数据服务接口规范》,确定接口名称,明确接口类型,接口参数。

2.6 数据表达

湖南省地理空间数据交换共享平台地理空间数据可视化依据国家相关的图式进行表达,并参考地理国情普查要素数据可视化相关标准进行制作符号化地图,主要用于指定电子地图。

2.7 质量与标准管理

依据国家的相关规定,用于湖南省地理空间数据交换与共享的数据成果在应用之前需要进行质量检查,湖南省地理空间数据由湖南省质量监督检查授权站依据质量标准进行检查,合格后再统一用于湖南省交换共享。

3 运行机制研究

为了保障湖南省地理空间数据交换与共享正常运行,湖南省国土资源厅编写了《湖南省地理空间数据交换与共享管理办法》,该办法从法律、机制、管理、保密等方面进行了相关规定,如图2所示。

3.1 法律法规保障

法律法规保障方面,2002年国土资源部发布了《重要地理信息数据审核公布管理规定》;2012年我省国土资源厅制定了《湖南省测绘资质管理实施细则》;2014年湖南省地方标准《湖南省地理信息共建共享数据交换和服务接口技术规范》已经通过了专家初审;2015年我省国土资源厅正式下发了《地理信息数据交换共享办理流程》;2016年组织了《湖南省地理空间数据交换与共享管理办法》(草案)的讨论会。这些政策条例和管理办法的推出,将统筹规范全省地理信息数据的管理,推动全省地理信息数据资源的交换共享和整合利用。

3.2 机制保障

1)沟通机制。湖南省地理空间数据交换与共享主要为了提升测绘地理信息数据的应用价值,避免重复投入,减少资源浪费,加强行业间的交流。因此,在建设该平台初期,应对各行业进行需求调研,充分了解各行业对测绘地理信息数据的需求,保障交换共享平台实用性。

2)管理机制。湖南省形成了一套地理空间数据管理机制,全省测绘地理信息成果统一归属湖南省国土资源厅管理,测绘地理信息数据质量由湖南省测绘产品质量监督检查授权站进行检查,检查后的成果统一汇交至湖南省国土资源信息中心进行保管,测绘成果的提供利用统一从国土资源信息中心出口。

3)支撑环境保障。湖南省测绘地理信息数据量达到上百TB,再通过交换共享后形成大量专题数据,所以交换和共享平台需要高效的软硬件支撑。另外,针对数据管理相关的管理、应急响应等需要制定相关管理办法,以保障数据安全、保密。

3.3 人员保障

1)建立专业的应用服务队伍。湖南省地理空间数据交换与共享平台主要用于服务各行业对测绘地理信息数据的需求,服务范围广、对象多,因此,需要建立专业的应用服务队伍。首先,在建设平台前,需要调配相关专业技术人员调研各行业对数据的需求,并且针对需求整理、落实到交换共享平台上。另外,配备相关专业技术人员针对平台的技术、处理等进行介绍、培训,保障交换共享平台的广泛性与实用性。

2)建立测绘地理信息资源采集队伍。为了保障湖南省地理空间数据交换共享平台数据的高精度、高时效性,需要配备数据采集队伍,采集测绘地理信息数据,并对平台数据进行更新。

3.4 安全与保密管理

湖南省国土资源厅领导高度重视测绘地理信息数据成果的安全与保密。每年,针对数据的安全与保密管理开展培训,提升专业技术人员的保密意识。依据国家的规定,湖南省地理空间信息数据交换与共享平台只共享公开共享的数据成果,限制公开的测绘成果根据社会发展需求进行确定。同时,结合国家要求与数据的实际需求,湖南省制定了数据交换共享管理办法、机房的管理条例、内外网数据交换管理办法、计算机使用安全条例等地理空间数据安全与保密的规定,但还不够满足全省地理空间数据交换与共享,因此,还需要加强安全与保密管理相关制度的制定。

4 结语

本文主要围绕湖南省地理空间数据交换共享平台的总体目标与用于交换共享的数据基础,分析现有各类地理空间数据标准及交换共享平台的需求,研究交换共享平台标准体系与运行机制,取得了一定的成果。目前,湖南省地理空间数据交换共享平台在建设中,参考了本研究的成果,例如,交换共享平台的元数据主要采用了基于《全国地理信息资源目录服务系统元数据规定》生产的元数据,交换共享平台数据中心数据库的建设,数据分类与编码等参考了本文研究的数据分类编码,交换共享平台中地理空间数据依据该研究成果进行数据组织等等。这些实际的应用表明,本文的研究成果贴合实际需要,为湖南省地理空间数据交换共享平台的建设起到了指导性作用,具有一定的合理性。

摘要:围绕湖南省地理空间数据交换共享平台的总体目标及数据基础,研究了用于湖南省交换共享相关的标准规范及湖南省地理空间数据交换共享机制,旨在为湖南省交换共享平台建设提供建设性意见及依据。

关键词:交换共享平台,地理空间数据,标准体系,运行机制

参考文献

[1]姚国章.大数据背景下的政府信息资源整合与利用[J].南京邮电大学学报(社会科学版),2015,4(17):20-25.

[2]王艳敏.基于本体和Web Services的数据交换平台的研究与应用[D].南京:南京航空航天大学,2010.

[3]王野,汪艳霞,沈怡然.数字城市地理空间数据共享和交换标准体系构建的探讨[J].测绘与地理空间,2013(36):80-81.

[4]孙枢,马宗晋,周秀骥,等.对我国地球科学数据共享问题[M].北京:科学出版社,1998.

[5]何建邦,胡志勇,李新通.国家地理信息共享政策框架意见[J].资源科学,2001(1):40-43.

[6]李静,罗灵军.省级地理信息公共服务平台保障体系建设[J].地理空间信息,2013(3):60-63.

[7]胡建伟,许岩岩.美国信息共享模式对我国地理信息共享机制的启示[J].地域研究与开发,2009(2):30-31.

[8]毛卫华.浙江省地理空间数据交换和共享平台标准体系构建[J].计算机与信息技术,2011,4(9):1-3.

空间与图形教学论文空间数据库论文 第2篇

浅谈初一数学空间与图形的入门教学

摘要:初中阶段要求学生探索基本图形的基本性质及其相互关系,以进一步丰富学生对空间图形的认识和感受,欣赏、体验几何图形在现实中的广泛应用,在探索图形与他人合作过程中发展学生的合情推理。然而很多学生都感觉不适应,觉得几何难学,具体体现为:一是由数到形、由计算到推理的转变,学生一时难以适应;二是入门概念多,学生不能正确理解、掌握;三是思维方式的变化,学生困惑几何到底是什么;四是学生对教师的教学方法不适应或者教师驾驭教材的能力有限。

关键词:培养兴趣;结构整理

初中平面几何入门难历来是初二两极分化的重要原因之一,现在几何提前到初一,同样的问题依然存在。平面几何入门难难在图形复杂、语言抽象、推理深奥等方面。一是由数到形、由计算到推理的转变,学生一时难以适应;二是入门概念多,学生不能正确理解、掌握;三是思维方式的变化,学生困惑几何到底学什么;四是学生对教师的教学方法不适应或者教师驾驭教材的能力有限。新的课程标准将以往“几何”拓展为“空间与图形”,初中三年螺旋式上升,相应的教学要求也呈现出新的特征。如新的教材大量展现图案的欣赏与设计,很

多教学内容需要教师组织学生进行观察、操作等活动,学生的学习方式发生了很大变化,因此,几何入门教学要从以下几方面入手:

一、培养学生学习几何的兴趣

学生学习过程有两类心理因素:一类是直接与智力活动相关的智力因素,如感知、记忆、思维、想象等;另一类是与激发学生学习积极性有关的非智力因素,如动机、兴趣、情感、意志等。在后一类因素中,兴趣是最活跃的,所谓“兴趣是最好的老师”,“兴趣可能成为动机”,因此培养学生学习几何的兴趣,是保证学生几何入门的前提之一。那么,如何在教学中培养学生的学习兴趣呢?

1.重视引言课。

(1)由动手操作引入。比如折纸、拼图或运用学具、教具操作等。

(2)运用多媒体技术展示引入。

(3)创设问题情景引入。比如,学习“两点之间线段最短”这一公理时,笔者就用多媒体展示了一幅图,一个长方形草坪四周都有路,草坪的斜对角被人踩出了一条小路,要求学生观察想象,为什么会出现这条路,从而引出公理,同时又给出了另一个用此公理解决的实际问题,自然引起了学生探索的兴致。

(4)做实验探索引入。

(5)趣味式提问引入。

(6)讲数学家的故事或数学发展史引入,等等。

总之,要让引言课有趣味性,要能引起学生参与学习、研究的愿望与兴趣。

2.重视知识的发生、发展过程。传统的数学教学一直以传授知识为主要目的,强调学生的基本知识、基本技能的训练与获得,过分强调知识的重要性,认为掌握知识就是具备了能力,而忽视学生的个性发展,忽视学生的情感、态度、价值观等的体验,导致部分学生厌学,甚至丧失对数学学习的兴趣。《新数学课程标准》的实施,为数学教学开辟了一片新天地,它要求教师充分挖掘几何教材实质,联系生活原型,设置具体形象的数学问题,引导学生主动参与,同学之间相互合作交流,去探求知识的发生、发展过程,强调学习过程比结果更重要,强调学生数学思维过程的合理性与灵活性,而不是大搞题海战术,以达到切实提高教学效率的目的。

3.重视学生的好奇及疑问。在数学教学中要多鼓励学生质疑,一定要保护学生的好奇心,把提问的权利交给学生。学生的每一个疑问都是思维的火花,教师都要给予充分的肯定。笔者尝试过多次,如有的学生喜欢提问题,就大加赞扬一番:哎!你怎么想得出这么好的问

题!只有肯动脑筋的学生才会提出如此精彩的问题!这对他是一种鼓励,对其他同学也是一种鼓舞,因此,更多的学生会积极动脑,渴望得到教师的赞许。其实,提问题是思考的一种表现,“学而不思则罔,思而不学则殆”,提问题后还要鼓励学生解决它。在平时的教学过程中,往往只有成绩好的学生才敢站起来讲,大部分学生都只是“陪客”,因此,笔者从不批评讲错的或回答不出的学生,而是引导、鼓励中等及以下同学积极发言,并给予肯定、表扬,以营造良好的学习氛围,切实提升学生的学习兴趣。

二、帮助学生克服学习概念、图形、语言、推理等方面的困难

概念是反映各种对象、现象共同的、本质属性的一种思维形式,只有正确理解和运用概念,才能进行正确的判断和推理。几何概念与图形、语言是紧密相连的,正确理解几何概念,不仅要会叙述概念的定义,而且还要能正确画出表示概念的图形,掌握图形的标注法和读法,并运用概念进行正确的判断。

1.在初一几何入门阶段,“图形的初步认识”这一章中概念多而集中,学生因一时不能形成概念的系统,就容易感到枯燥乏味。此外,由于学生学习几何概念的方法多是机械记忆,以为背得出就是学会了,弄懂了,结果不仅不能很好地掌握几何概念,还会给以后的推理教学带来障碍。因此,在概念教学中,教师应根据各个概念对后续教学影响的大小,突出重要概念的教学,而不必求全。比如,对于一些

描述性的概念或术语,如平面图形、点、直线等名称,以及连结、截取、延长、相交等画图术语,还有相邻、同旁、重合等表示图形位置关系的词语,教学中就可结合实例或图形让学生多“意会”,而不必过多描述。此外,端点、边、顶点等术语也不必过多强调,但对于基本、常用的重要概念,如线段的中点、角平分线、互余(补)、对顶角、垂线、点到直线的距离、两点间距离等,都是教学中的重点概念,则必须使学生理解、掌握并会应用。因此,教学时教师要做到以下几点:一是联系实际,丰富学生的直观感知,可以利用实物、模型、媒体甚至动手或者进行户外数学活动等,让学生眼、耳、口、手等多种感官共同参与;二是强化概念的理解,多进行图形的变式辨认,多进行阅读,多进行概念内涵与外延的语言辨析,这样有助于概念的准确理解;三是加强概念的语言叙述与图形的互译训练,把概念具体化,在运用中实现牢固掌握;四是适时对概念进行分类、比较,使之系统化。

比如角的教学,在学生小学已掌握了角的部分知识的基础上,教师可以先给出几个图形,让学生判断哪些是角,哪些不是角,以巩固角的形象,然后对这些感性认识进行加工,抽象概括出角的实质,形成角的概念;其次,可以给出几个变式图,介绍角的表示方法,给出复杂图形让学生寻找角并学会表示角;再次,把角与角度建立联系,介绍平角、周角、直角、锐角、钝角等。角的内容学完之后,就可以帮助学生总结:按角的大小分类;按两个角和为直角、平角分类;按

角的位置分类,等等,让学生在头脑中对角形成一个整体结构的认识,以便于记忆与运用,从而将这些概念融会贯通。

2.几何推理是数学思维的一种形式,也是初一学生感到最陌生的一块地方,因此,教师要及早重视基本的推理思维训练,开始时进行一步推理训练,放慢进度,分散难点,逐渐进行到多步推理的训练。比如:∵点C是线段AB的中点,∴AC=BC;∵∠AOB=90°,∴AC⊥BD,等等,让学生知道每个推理都必须有书上定义、公理、定理等作依据,多步推理也是由一步一步的推理构成的,学生刚接触多步几何推理时,可以以填空的形式让学生多练习,使之逐步了解几何的证题模式,并且能够模仿,形成推理思维。比如,∠B=60°,∠C=120°(已知),∴∠B+∠C

=180°,∴AB∥CD(同旁内角互补,两直线平行)∴∠1=

∠2(两直线平行,内错角相等)。到初一下学期学习三角形,特别是等腰三角形这块内容时,几何推理过程要求规范了,而学生头脑里还没有形成逻辑推理思维,为此,教师应多进行简单的几何说理训练,使学生形成一定的逻辑思维能力,之后再进行逻辑思维的培养,证题时必须对照图形,加强分析,弄清题目的已知条件,根据什么定义、定理或公理可以推导出什么样的结论,开始时,教师一定要板书详细证明过程,让学生模仿,逐渐形成逻辑思维能力。总之,几何推

理思维能力的培养不是一蹴而就的,最重要的是掌握分析、证明的方法。

三、指导学生及时进行知识结构的整理

根据认知心理学的“同化理论”,教学中应及时把各单元所包含的知识排成一个有层次的相互关联的结构系统,即单元知识结构图,使学生的知识系统化和概括化,形成良好的认知结构,提高认知能力,即观察注意力、理解能力、归纳概括能力等。这不是一个简单的再加工,而是一个复杂的再创造过程,有位荷兰数学家说过:学习数学的唯一方法是实现“再创造”。而教师的任务就是引导和帮助学生掌握再创造所要学的知识,而不是把现有的知识灌输给学生。

为什么有的学生学不好几何呢?他们很用功啊!原因就在于他们常把数学知识理解为一些零散的定义、性质、定理、法则、方法,认为结果记住了,反复练习会做了就行,但是一旦遇到新问题他又不会了,这就是因为头脑中还没有形成知识系统,不能融会贯通,不能灵活运用,没有形成数学能力。因此,形成知识系统结构与发展思维能力是密切相关的,教师要帮助学生建构每一节、每一单元、每一章直至整个学科的知识系统大树。

参考文献:

大数据下的空间数据挖掘分析 第3篇

关键词:分布,空间数据挖掘,大数据

随着经济水平的不断提高, 人们的生活水平得到了较好的改善。工业、农业以及第三产业的快速发展促使了科学技术不断创新。社会主义市场经济的快速发展, 为满足我国经济发展的需要, 不断扩展发展的空间成为当前国家发展经济、政治、文化的重要内容。科学技术的发展迫使人们对地球的研究上升到空间的研究, 随着大数据时代的到来, 挖掘空间数据是历史发展的必然结果, 是发展经济、政治以及文化的动力所在。

1 大数据下空间数据的特点

空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据, 它可以用来描述来自现实世界的目标, 它具有定位、定性、时间和空间关系等特性。空间数据是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据。随着科学技术的不断发展, 经济的快速发展, 对地球的研究已经不能满足于大数据背景下经济快速发展的需求了, 人们把研究的方向逐渐投向宇宙空间, 精确的空间数据有助于为经济的发展做出更好的发展战略和策略。

1.1 集成的数据

空间数据仓库的数据是从原有的空间数据库中将数据抽取来的。因此在数据进入空间数据仓库之前, 必然要经过统一与综合的过程, 这一过程是空间数据仓库建设中关键所在, 所要完成的工作包括消除数据中的不一致性和进行数据综合计算。

1.2 数据的持久性

对空间数据仓库中的数据进行挖掘主要为经济、政治、文化发展做出最好的决策, 所涉及的数据操作主要是数据查询, 一般情况下并不进行修改操作。空间数据仓库的数据反映的是一段时间内的数据内容, 是不同时间的空间数据库快照的集合。对这些集合快照进行统计、综合和重组导出的数据, 而不是联机处理的数据。空间数据库中进行联机处理的数据经过集成输入到空间数据仓库中, 一旦空间数据仓库存放的数据已经超过空间数据仓库的数据存储期限, 这些数据将从空间数据仓库中删除。

2 空间数据挖掘的常用方法

2.1 空间分析法

随着科学技术的不断创新, 为适应经济科学技术的不断发展, 利用先进的GIS技术对空数据库的数据进行建模分析, 从而获得更新颖的数据, 让人们对空间数据的认识更深。利用空间分析的方法可以发现目标在空间上的关联, 从而找出最佳的决策方式为数据做出正确的判断。

2.2 统计分析法

空间数据的挖掘促使人们对地理空间信息的探索越来越看重。为了是的得到的数据更加的准确和精密, 统计分析方法是人们管用的一种, 通过对空间物体以及空间各种现象的特性进行分析。在对空间数据进行统计分析的时候, 数据的空间特性对统计分析方法的作用不大, 在进行分析的时候能清楚的将数据以图形的形式展现出来, 但是统计分析方法在字符型数据上很难做到将空间数据进行关联。

2.3 遗传算法

遗传算法是对生物进化的过程进行模拟计算, 这种方法计算的结果精确, 它能在搜索过程中自动获取和积累有关搜索空间的知识, 并自适应地控制搜索过程以求得最优解。利用这种方法在空间数据的挖掘方面, 能有有效的对空间数据的变化进行详细的定位分析, 全方面的进行搜索, 从而搜索出更加精确的数据结果。

2.4 数据可视化的方法

人类的可视化能力, 允许人类对大量抽象的数据进行分析。人的创造性不仅取决于人的逻辑思维, 而且取决于人的形象思维。人脑的空间认知分析能力目前尚无法全部用计算机代替, 因此可视化技术为知识发现提供了有力的帮助。为了了解数据之间的相互关系及发展趋势, 人们可以求助于可视化技术。海量的数据只有通过可视化技术变成图形或图像, 才能激发人的形象思维——从表面上看来是杂乱无章的海量数据中找出其中隐藏的规律。数据可视化技术将大量数据以多种形式表示出来, 帮助人们寻找数据中的结构、特征、模式、趋势、异常现象或相关关系等。从这个角度讲, 数据可视化技术不仅仅是一种计算方法, 更是看见不可见事物或现象的一种重要手段和方。

3 空间数据挖掘存在的问题

3.1 空间数据库类型多样性

随着科学技术的不断发展, 空间数据的挖掘也逐渐成型, 空间数据的数据类型复杂多样, 数据间的联系优势紧密相接的, 空间数据库之间的数据源分布不集中, 种类繁多, 这对空间数据进行挖掘所有类型的空间数据带来了困扰。

3.2 空间数据的不断变化

整个宇宙是处于不断运动的状态的, 空间数据库里的数据也是处于不断变化的, 这种运动变化会使得在空间数据挖掘的过程中对数据的把握度难以拿捏, 对一组数据进行挖掘的时候, 由于数据不断化, 下一秒就会产生新的数据。

3.3 空间数据挖掘的智能化问题

随着人们对空间的探究不断加深, 空间数据的挖掘也在不断成熟起来, 但是由于空间数据库的数据是不断变化的, 受到科学技术水平的限制, 空间数据智能化程度偏低, 对空间数据的挖掘程度难以深入。

4 结语

经济的快速发展推动了科学技术的不断发展, 随着大数据时代的到来, 人们对空间数据的挖掘正在逐渐深入。在经济快速发展的社会, 为了满足经济快速发展的需要, 不断加深对空间数据的挖掘有利于给经济发展提供更好的决策。在今后的发展道路上, 空间数据的挖掘要不断创新, 利用科学的技术水平, 不断完善和发展自己的理论和方法, 为经济快速发展提供科学的依据。

参考文献

[1]冯弟飞, 胡圣武.空间数据挖掘的方法进展及其问题分析[J].测绘科学, 2011.09 (11) :36—37.

[2]胡圣武, 李鲲鹏.空间数据挖掘的方法进展及其问题分析[J].地球科学与环境学报, 2012, 0903) :226—227.

[3]王新华, 米飞, 冯英春, 赵玮.空间数据挖掘技术的研究现状与发展趋势[J].计算机应用研究, 2011, 08 (07) :111—113.

[4]徐胜华, 刘纪平, 胡明远.空间数据挖掘与发展趋势探讨[J].地理与地理信息科学, 2011, 07 (03) :158—159.

城市基础空间数据更新研究 第4篇

城市基础空间数据更新研究

城市基础建设的加快对空间数据的更新提出了更高的要求,本文基于笔者多年从事空间数据库建设的相关工作经验,以空间数据更新为研究对象,研究探讨了空间数据据更新的原则,方式和内容.全文既是笔者长期工作实践得到的技术经验总结,同时笔者也进行了一定的.理论升华,相信对从事相关工作的同行有着重要的参考价值和借鉴意义.

作 者:毛海亚 作者单位:广州城网信息发展有限公司,广东广州,510070刊 名:科技资讯英文刊名:SCIENCE & TECHNOLOGY INFORMATION年,卷(期):“”(9)分类号:P2关键词:空间数据库 更新 方法

空间数据标准 第5篇

关键词:Excel,GIS,数据转换,数据接口

一、引言

在进行震害预测专题研究工作的过程中, 对Excel数据文件的充分利用可以降低项目成本, 避免数据的重复采集, 缩短项目周期, 提高现有数据的利用率。在数据更新过程中有Excel数据文件数百个, 其全部转换到GIS空间数据库, 数据处理全部人工去处理难度较大, 并且数据的准确性以及完整性难以保证。通过对数据转换方式与地震行业数据格式的分析, 在C#.NET中, 利用文件流、VBA和OLE技术实现Excel数据与GIS空间数据格式之间的转换接口, 减少人工数据转换带来的错误和误差。

二、地震行业数据转换方式分析

震害预测专题数据汇总完成后大部分是以Excel格式数据文件形式整理成册, 通过Ftp服务器或者网络工作站的形式上传至服务器。传统的数据处理方式采用人工编辑导入相应的GIS文件数据库中, 此种方式无疑增加了数据导入过程中产生误差的几率, 增加数据录入的麻烦。为避免误差几率的增加和数据录入的麻烦, 借鉴ADO技术在Excel与Access之间的数据转换和VB.NET在AutoCAD与GIS数据转换接口中的方式, 最终通过C#.NET平台运用自定义Txt文件数据流结合Office办公软件提供的VBA接口和OLE技术实现Excel文件与GIS数据库数据转换。

三、两种数据分析与技术路线

3.1 两种数据分析

以GIS空间数据的格式中的Shapefile为例进行说明, Shapefile是ArcView GIS 3.x的原生数据格式, 属于简单要素类, 用点、线、多边形存储要素的形状, 具有简单、快速显示的优点。Shapefile是空间信息和属性信息分离存储, 所以称之为“基于文件”, 其由*.shp、*.shx、*.dbf三个主要文件组成。*.shp:存储的是几何要素的空间信息, 即XY坐标;*.shx:存储的是有关*.shp存储的索引信息;*.dbf:存储地理数据的属性信息的dBase表。

以地震行业统计的点数据Excel文件为例, Excel工作表中包括若干属性列, 其对应Shapefile中的*.dbf文件, 即存储地理数据的属性信息;最后两列为X、Y经纬度坐标, 其对应的Shapefile中的*.shp和*.shx文件, 即存储地理数据的是空间信息。

通过对两种数据分析不难发现只要做到Excel每条记录与Shapefile文件每个点的属性信息与空间信息的一一对应, 即可完成两种数据的无缝转换。

3.2 技术路线

Excel数据与GIS空间数据转换技术的研究方法是采用MVC设计模式, 即“模型建立—算法研究—系统实现”的思路来组织的。首先按照城市震害系统需求规范建立的GIS空间数据模型搜集廊坊地区的各种属性和空间数据, 例如医院、学校、小区、4S店、公园、立交桥、公司等企事业单位的Excel数据文件, 其次通过C#.NET结合VBA接口与OLE技术编程实现对廊坊地区空间、属性数据“剥离—重组” (图1所示) ———即利用C#.NET与Office办公软件提供的VBA接口将Excel文件中的属性数据与空间信息进行剥离生成自定义Txt文件;然后将生成的自定义Txt文件通过OLE技术形成由*.shp、*.shx、*.dbf三个主要文件组成的GIS空间数据Shapefile文件。转换分两个阶段, 依次为Excel-Txt转换和Txt-Shapefile转换。转换过程的关键是Excel每条记录到Shapefile文件每个点的空间信息与属性信息的一一对应, 最后完成廊坊增量式空间数据信息更新, 提高城市震害预系统的数据处理和更新速度。

3.2.1 数据准备

由于地震行业数据汇总的Excel文件较多, 提交的数据比较乱, 为保证Excel数据与GIS空间数据Shapefile文件的无损转换, 需要对Excel数据在坐标属性字段上重点检查。由于空间信息数据是依赖坐标信息进行转换的, 坐标信息关系到转换后Shapefile数据对应的具体位置, 因此转换前的Excel数据必须都要有坐标属性字段, 且坐标信息正确无误。

3.2.2 Excel-Txt转换

此阶段的目的是实现对Excel数据的空间信息与属性信息剥离, 按照空间信息属性字段的值提取“Point”信息, 逐行存储到临时文件Point.Coo中, 按照其他属性信息字段的值提取“Property”信息, 逐行存储到临时文件Property.Att中, 即可建立Excel数据到GIS空间数据Shapefile文件两者关系。

3.2.3 Txt-Shapefile转换

此阶段的目的是实现Point.Coo和Property.Att文件中的空间信息与属性信息存储到GIS空间数据Shapefile文件中。首先创建一个新的Shapfile工作空间, 其次将Point.Coo和Property.Att中的信息通过数据流对象转化并存储到Shapfile工作空间中进行保存。通过上述两个阶段的转换, 数据即完成了Excel数据到GIS空间数据平台的转换。

四、小结

当然, 通过几个项目的实践, 对这两种数据转换过程中的一些实际问题也有了更深层次的了解与把握, 为便于其他项目借鉴, 主要总结了如下几点。 (1) Excel-Txt转换模版中, 对Excel文件数据格式要求较为严格, 在以后的数据汇总中需要形成一套比较完整的数据模板, 这样就能避免转换前的大量数据检查工作, 确保转换后的空间信息正确, 有利于各个地区间数据整合。 (2) 在基于Excel的点空间信息文件与GIS空间数据Shapfile的数据转换过程中以IO数据流文件作为桥梁, 小数据量的数据转换对系统的影响不大, 若遇到海量数据转换需改进中间介质。 (3) 现在仅完成了基于Excel的点空间信息文件与GIS空间数据Shapfile的数据转换, 基于其他几何信息的Excel的空间信息文件模板有待确定, 最终可借鉴点信息的转换思路进行转换。

参考文献

[1]殷志杰.一种基于VB的Excel与Access间的数据转换技术[J].科学论坛

[2]伍云, 张东.XML与关系数据库的数据转换接口的实现[J].电脑开发与应用, 2007

[3]陈立, 罗传文, 余向勇, 赵庆丹, 孙海洪.基于AE和C_的帽儿山CAD用图到GIS数据转换[J].森林工程, 2010

[4]马永昌, 李建民.基于VB.NET的AutoCAD数据转换技术研究及应用[J].测绘与空间地理信息, 2010

空间数据仓库技术的应用 第6篇

1 空间数据仓库的简述

空间数据仓库是今年来数据仓库思想在空间信息科学领域延伸的产物。数据仓库是一个面向主题的、集成、稳定的、包含历史数据的数据集合,用于支持经营管理中的决策制定过程。传统的数据库是联机事务处理系统,处理和存储日常业务数据,无法实现更高层次的分析处理各种类型信息的任务。而数据仓库从各数据库中按专题和内容等提取数据,并对所提取的数据进行预处理,可以支持在线分析处理,利用存储在数据仓库中的数据完成各种分析操作,以直观易懂的形式将分析结果返回给决策分析分员。目前,数据仓库在许多需要大型数据库管理海量数据和对数据进行分析的行业如通信、金融等领域得到了成功的应用。

空间数据仓库的特点:与传统空间数据库面向应用进行数据组织的特点相对应,空间数据仓库的数据是面向主题进行数据组织的。它在较高层次上将企业信息系统中的数据进行综合、归类,并加以抽象地分析利用。空间数据仓库的数据是从原有的空间数据库数据中抽取来的。因此在数据进入空间数据仓库之前,必然要经过统一与综合,这一步是空间数据仓库建设中最关键、最复杂的一步,所要完成的工作包括消除源数据中的不一致性和进行数据综合计算。空间数据仓库中的数据主要供决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作。空间数据仓库的数据反映的是一段相当长的时间内的数据内容,是不同时间的空间数据库快照的集合和基于这些快照进行统计、综合和重组导出的数据,而不是联机处理的数据。空间数据库中进行联机处理的数据经过集成输入到空间数据仓库中,一旦空间数据仓库存放的数据已经超过空间数据仓库的数据存储期限,这些数据将从空间数据库中删去。空间数据仓库的数据是随时间的变化不断变化的,它会不断增加新的数据内容,不断删去旧的数据内容,不断对数据按时间段进行综合。

2 空间数据仓库的应用

2.1 空间数据仓库的功能

空间数据仓库在数据仓库基础上引入空间维,根据主题从不同的GIS应用系统中截取从瞬态到区段直到全球系统的不同规模时空尺度上的信息。空间数据仓库主要实现三个功能:1)从分布式空间数据库中获取空间数据;2)对数据进行动态综合、集成、管理和分析;3)提供空间信息访问。通过空间数据仓库技术,可以将来自不同专业领域的相关数据,按照选定的主题转换成统一的格式,集成、存储在一起,实现空间和非空间的分析操作,然后借助各种专业模型通过数据挖掘技术从数据中发现知识,为辅助决策提供支持。

2.2 空间数据仓库的作用

空间数据仓库是分析型数据库,根据主题通过专业模型中不同空间数据库中的原始业务数据进行抽取和聚集,为用户提供一个多视角、综合、全面的分析决策支持环境。空间数据仓库是一种基于空间数据管理和利用的综合性技术,它使得现有的传统空间数据系统由操作型向分析型转变。在竞争日益激烈的市场中,能否迅速做出更好的决策关系到银行是苟且偷生还是繁荣兴旺。银行需要对各种压力迅速做出反应,包括不断加剧的竞争、行业的无规律发展、企业并购、产品和市场革新、传统系统的重组等。如今大多数企业并不缺少决策的数据,这些数据包括:联机交易的历史数据、研究分析结果、Internet提供的数据……数据几乎无处不在。因此,关键不在于数量,而在于质量———是否一致、准确、具有时效性和复杂度。在过去几年中,许多企业认识到了这一问题,并开发了各种系统,如决策支持系统、管理信息系统、运作信息系统。这些系统从各种源系统中下载数据,通过运行一些相应的程序进行查询等操作。但由于这些系统基本上都是基于主机的,功能有限,比如:联机无法进行数据分析;数据是离散的、冗余的;用户访问过于复杂;用户访问降低了业务操作的效率。联机系统一般的设计原则是以最快速度更改一条记录,而不是用于数据分析,也不是按照某一标准浏览数据和对数据进行排序,以及对数据进行计算。与之相比,数据仓库却能够实现快速数据查询,帮助银行挖掘其传统系统中潜在的无法被直接利用的信息。

3 结束语

空间数据仓库的构建是一个处理过程,空间数据仓库是—个从多个数据源收集的信息存储库,存放在一个一致的模式下并且通常驻留在单个站点。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新过程来构造。数据仓库系统由数据仓库、数据仓库管理系统、数据仓库工具三个部分组成。在整个系统中,DW居于核心地位,是信息挖掘的基础;数据仓库管理系统负责管理整个系统的运作;数据仓库工具则是整个系统发挥作用的关键,包含用于完成实际决策问题所需的各种查询检索工具、多维数据的OLAP分析工具、数据挖掘DM工具等,以实现决策支持的各种要求。

参考文献

[1]邹逸江.空间数据仓库研究综述[J].测绘学院学报,2002(3).

[2]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大学出版社,2006.

[3]陈书琳,方兆宝.浅谈空间数据仓库[J].海洋测绘,2002(1).

空间数据库构建研究 第7篇

(Faculty of Ecotourism,Southwest Forestry University,Yunan Kunming 650224)

0 引言

近年来,伴随着IT技术的迅猛发展,特别是随着计算机处理速度的不断提升和硬件价格的不断下调,以GIS、RS、GPS(简称3S技术)为代表的空间信息技术在各领域中得到广泛应用。现代社会对基于空间信息的服务、分析、决策等的需要日益迫切,因而深入分析和研究空间信息的组织、存储、管理、应用———空间数据库技术的重要性也就突显出来。

1 空间数据及空间数据库

1.1 空间数据

空间数据是指与空间位置和空间关系相关的数据[1]。与一般数据的区别在于其中包含了大量的几何属性,所以具有以下几个基本特征:

(1)数据量特别大。地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往很大。

(2)结构复杂多样。空间数据不仅要描述地理要素的属性特征(与传统数据库中的数据性质相似),而且还具有空间特征———即描述地理要素的空间分布位置,并且二者之间具有不可分割的内在联系。

(3)具有自相关性。根据地理学第一定律,空间分布的每个地理要素都与其他要素相关,并且领近要素间的相关性比距离较远的要素间要大得多。

1.2 空间数据库

数据库技术产生于60年代末期,是计算机领域中最重要的技术之一,是一种较理想的数据管理技术。计算机对数据的管理经历了三个阶段———最早的程序管理阶段、后来的文件管理阶段以及现在的数据库管理阶段。数据库是数据管理的高级阶段,数据库可以看作是与现实世界有一定相似性的模型,是集中、统一存储和管理某一领域内信息的系统。它根据数据间的自然联系而构成,减少了数据冗余,且具有较高的数据独立性,能为多种应用服务。

空间数据库是某一区域内关于一定地理要素特征的数据集合[2],它是一种与现实的地理世界保持一定相似性的实体模型,目的是为了使用户能够方便灵活地查询出所需的空间数据,同时能够进行有关空间数据的插入、删除、更新等操作。由于空间数据具有复杂的空间几何特征,以空间数据存储和操作为对象的空间数据库,把被管理的数据从一维推向了二维、三维甚至更高维。

2 空间数据库的构建

2.1 传统数据库的构建

传统数据库的构建主要服务于商务、管理等领域,其重点往往放在了高效且安全地处理大量相对简单的事务上。数据库中关于数据和联系的逻辑组织形式的表示被称为数据模型,每一个具体的数据库都是由一个相应的数据模型来定义。每一种数据模型都以不同的数据抽象与表示能力来反映客观事物,有其不同的处理数据联系的方式。传统数据库采用的数据模型有层次模型、网状模型和关系模型,其中应用最广泛的是关系模型。

关系数据模型是根据数学概念建立的,逻辑结构表现为满足一定条件的二维表,具有固定的列数和任意的行数,在数学上被称为关系(Relation)。二维表是同类实体的各种属性的集合:每个实体对应于表中的一行,在关系中称为元组(Tuple),相当于一条记录;表中的列表示属性,称为域(Domain),相当于记录中的一个数据项。

关系数据模型不是人为地设置指针,而是由数据本身自然地建立相互之间的联系,使用简单,维护也方便,并且关系模型具有严密的数学基础和操作代数基础———关系代数,通过关系运算可以将关系分开或合并,使数据的操作具有高度的灵活性。

2.2 传统数据模型用于空间数据库构建的局限

关系数据模型用于构建传统数据库已十分成熟,但面对空间数据还存在种种局限:

(1)关系模型存储的数据通常为等长记录的数据,而空间数据通常由于不同空间目标的坐标串长度不定而具有变长记录,并且数据项也可能很复杂。

(2)关系模型模拟的实体类型较少,实体类型之间关系简单且固定化,只支持不可再分的简单数据(如:整数、实数和字符串等),不支持抽象数据类型(Abstract Data Type,ADT),因而在面对空间数据实体类型繁多,并且实体类型之间存在复杂空间关系(拓扑、方位、度量)时显得无能为力。

(3)关系模型模拟主要针对简单对象,模拟和操纵复杂对象(如图形、影像等)的能力较弱。关系模型不支持概念、分类和聚合的模拟,无法用递归和嵌套的形式来描述复杂关系的层次和网状结构,只能借助于关系的规范化分解来实现,必然导致在存储模式、查询途径及操作模拟等方面困难和复杂化。

2.3 空间数据模型

为了较好地模拟和操纵现实世界中的复杂对象,克服传统数据库模型的局限,人们从更高的层次上提出了空间数据模型的概念。如:以数据库设计为背景而产生的实体-联系(E-R)模型、从操作角度模拟客观世界且具有严密代数基础的函数数据模型、基于图论多层次数据抽象的超图数据模型[3]、基于二阶谓语逻辑的演绎数据模型以及以面向对象程序设计为基础的面向对象数据模型,等等。其中以面向对象模型构建空间数据库最具代表性,成为业界发展的趋势和方向。

在面向对象数据模型中,将现实世界中的所有实体都模拟为对象(Object),对象与记录的概念相似,但更为复杂,它由属性成员(Attribute)和方法成员(Method)构成。对象具有封装性(Encapsulation),即把对象的属性和方法结合成一个独立的相同单位,并尽可能隐蔽对象的内部细节。具有共同属性成员和方法成员的对象的集合就是类(Class),类间具有继承性(Inheritance),使类构成层次结构。面向对象数据模型利用类描述复杂对象,利用对象中封装的方法模拟对象的复杂行为,利用继承性实现对象结构和方法的重用。

根据面向对象的概念,地理系统中无论怎样复杂的地物要素都可以准确地由一个对象表示,这个对象是一个包含了数据集和操作集的封装性实体,且具有分类、概括、聚集和联合的抽象技术以及继承和传播的抽象工具。因而,面向对象模型最适宜于空间数据的表达和管理,它不仅支持对象的嵌套、信息的继承,而且允许用户定义对象和对象的数据结构以及它的操作。可以将地理系统中的各种地物抽象为点状地物、线状地物、面状地物以及由它们混合组成的复杂地物四种超类。点状地物为点,具有(x,y,z)坐标;线状地物即为弧段,由若干个结点组成;面状地物由弧段和面域组成;复杂地物可以包含多个同类或不同类的简单地物(点、线、面),也可以再嵌套复杂地物。

2.4 空间数据库的构建

目前,采用面向对象的数据模型建立面向对象数据库系统,主要有以下三种方式[4]:

(1)扩充面向对象程序设计语言(OOPL),在00PL中增加DBMS的特性。

在OODBMS中,通过扩充OOPL增加处理和管理空间数据的功能。在这种系统中,对象标示符是指向各种对象的指针,具有计算完整性。可以利用OOPL强大的功能,相对地减少开发工作量。

(2)扩充RDBMS,在RDBMS中增加面向对象的特性。

RDBMS是目前应用最广泛的数据库管理系统,可以用常规程序设计语言(如C)扩充RDBMS,也可用OOPL(如C++)扩充RDBMS,这样可以充分利用RDBMS的功能,同时结合OOPL的特性,大大减少开发的工作量。

(3)建立全新的支持面向对象数据模型的OODBMS。

从重视计算完整性的立场出发,以记述消息的语言作为基础,各有全新的数据库程序设计语言(DBPL)或永久性程序设计语言(PPL),此外还提供了非过程型的查询语言。这种数据库可扩充性较强,操作效率高,重视计算完整性和非过程查询。

3 结束语

空间、属性和时间是空间数据的三个基本特征,采用面向对象数据模型构建的空间数据库在处理空间数据时已经可以有效地体现出前两个特征。随着空间信息技术应用领域的不断扩大,对空间数据的处理也提出了更高的要求,要能够保存并有效地管理历史变化数据,以方便将来重建历史状态、跟踪变化、预测未来。空间数据库的构建要求能够支持信息的时态性,即对时空数据进行统一的模拟和管理,从而在时间、空间和属性语义方面更加完整地模拟客观地理世界。因此,面向对象技术结合时空数据模型构建新型空间数据库将成为未来空间数据库技术领域的主要研究方向之一[5]。

参考文献

[1]龚健雅。空间数据库管理系统的概念与发展趋势[J].测绘科学,2001,26(3):4-10.

[2]邬伦,刘瑜,张晶等.地理信息系统:原理方法和应用[M].北京:北京大学出版社,2002.

[3]BOUILL E F.Methodology of Building a Class:Based Integrated Platform for GIS Design and Develop-ment[C].Proceedings of European GIS Conference.1994.

[4]张东明.地理信息系统原理[M].郑州:黄河水利出版社,2007.

空间数据插值方法研究 第8篇

通常采用各种方法测量的空间数据是离散的, 为了获取区域内其他未知点的数据, 需要应用空间数据插值的方法。空间数据插值是用已知点的数值来估算其他点的数值的过程, 是将点数据转换成面数据的一种方法[1], 其任务是基于可使用的观测结果来为新的点计算最可能的值[2]。

空间数据插值的理论假设是空间位置上越靠近的点, 越可能具有相似的特征值;而距离越远的点, 其特征值相似的可能性越小。通常, 在以下几种情况下要做空间数据插值: (1) 现有的离散曲面的分辨率, 像元大小或方向与所要求的不符, 需要重新插值; (2) 现有的连续曲面的数据模型与所需的数据模型不符, 需要重新插值; (3) 现有的数据不能完全覆盖所要求的区域范围, 需要插值[3]。

2、插值方法

空间插值方法可以分为整体插值和局部插值方法两类。整体插值方法用研究区所有采样点的数据进行全区特征拟合;局部插值方法是仅仅用邻近的数据点来估计未知点的值[4]。

2.1 整体插值方法

整体插值的方法主要是趋势面分析, 它是用多项式方程拟合已知值的点, 并用于估算其他点的值。它的理论假设是地理坐标 (x, y) 是独立变量, 属性值Z也是独立变量且是正态分布的, 同样回归误差也是与位置无关的独立变量。趋势面分析的优点是非常容易理解, 至少是在计算方面。另外大多数情况下可用低次多项式进行拟合, 但给复杂的多项式赋与明确的物理意义比较困难。

趋势面分析的主要用途是, 在使用某种局部插值方法之前, 可通过趋势面分析从数据中去掉一些宏观特征, 不直接用它进行空间插值。趋势面分析法是针对大量离散点信息, 从整体插值角度出发, 进行趋势渐变特征分析的最简单的方法。

2.2 局部插值方法

局部插值法是用一组控制点的样本来估算未知值, 主要包括以下几个步骤: (1) 定义一个邻域或搜索范围; (2) 搜索落在邻域范围的数据点; (3) 选择表达数据点空间变化的数学函数; (4) 为网格单元上的数据点赋值。局部插值的方法较多, 主要有泰森多边形、反距离权重插值、样条函数插值和克里金法等。

2.2.1 泰森多边形

泰森多边形是荷兰气候学家Thiessen提出的一种根据离散分布气象站的降雨量来计算平均降雨量的方法。地理信息系统 (GIS) 和地理分析中经常采用泰森多边形进行快速的赋值, 实际上泰森多边形的一个隐含的假设是任何地点的气象数据均使用距它最近的气象站的数据。泰森多边形按数据点位置将区域分割成子区域, 每个子区域包含一个数据点, 各子区域到其内数据点的距离小于任何到其它数据点的距离, 并用其内数据点进行赋值。

2.2.2 反距离权重插值

反距离权重插值 (Inverse Distance Weighting, IDW) 是一种应用广泛的空间插值方法, 经常被用在各种GIS分析中, 该方法综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处, 它假设未知点处属性值是在局部邻域内中所有数据点的距离加权平均值。

反距离权重插值法的通用方程式为:

式中Z0为点0的估计值, Zi是控制点i的Z值, di是控制点i点与0点间的距离, S是在估算中用到的控制点的数目;K是指定的幂, 幂越高, 内插结果越具有平滑的效果。

在使用反距离权重插值方法时, 要注意搜索半径的确定。因为有些点太远, 对插值点的结果没有影响, 或影响很小。通过确定搜索半径以及形状, 可以将使用的样点限制在一定的范围之内, 从而提高计算效率。其中, 大小可以选择为一个固定值, 形状可以为圆形或椭圆形。实际处理中, 为了达到简化的目的, 搜索区域形状一般选取为圆形, 由此可考虑两个基本准则:一是距离准则, 即用来计算内插点的观测点位于内插点某个半径范围之内;二是点数准则, 即采用点数为离待插点最近的n个点。联合考虑两个准则就可以避免各自的不足[5]。

IDW通过创建一个光滑的表面来达到插值的目的, 表面上各个点的值, 与其相邻点的值更相似。距离为零处的点, 权值为无穷大, 因此, 如果用IDW计算某一个观测点的值时, 会得到该点的实际观测值。由于能准确地保证观测值并进行插值, IDW被称为精确插值方法。反距离权重插值法简单易行, 直观并且效率高, 在已知点分布均匀的情况下插值效果好, 插值结果在用于插值数据的最大值和最小值之间, 但缺点是易受极值的影响。

2.2.3 样条函数插值

样条函数插值法是通过所有的采样点建立一个数学函数, 从而产生一个曲率最小的表面。样条插值是一种比较精确的插值技术, 假设变化是平滑的, 它有两个特点: (1) 表面必须精确通过所有样本点; (2) 表面必须具有最小曲率。样条插值在创建有视觉要求的曲线和等高线方面有优势。样条插值法适用于对大量样点进行插值计算, 同时要求获得平滑表面的情况。在表面变化平缓的情况下, 会得到比较理想的结果。而如果在较短的水平距离内表面值发生急剧变化时, 或者当获取的样点数据不够准确时, 此方法不适用。

样条函数插值操作简单, 计算量不大, 因此插值速度快, 但难以对插值的误差进行估算。样条函数的种类很多, 最常用的有B样条、张力样条和薄板样条等。

2.2.4 克里金法

克里金法是地统计学的重要内容之一, 它是建立在变异函数理论及区域结构

分析的基础上, 是一种无偏最优估计的插值方法, 由法国著名统计学家Matheron和南非矿山工程师Krige提出的, 用于矿山勘探。克里金法假定采样点之间的距离或方向表现出一定的空间相关性, 这种相关性将有助于描述表面。克里金法通过一定数量或一定半径内的所有点满足一个数学函数来确定某个输出点的值, 在插值过程中根据某种优化准则函数来动态地决定变量的数值, 也考虑各观测点之间的相对位置关系, 从而使内插函数处于最佳状态。在点稀少时插值效果比反距离权重等方法要好, 所以利用克里金方法进行空间数据插值往往可以取得理想的效果。

克里金法和普通的插值方法不同, 它最大限度的利用了空间取样所提供的各种信息和已知观测值空间分布的结构特征, 使其结果更符合实际, 还可以判断插值的精度。克里金法有多种表现形式, 主要有普通克里金法、泛克里金法、简单克里金法、指示克里金法和协同克里金法等方法。

3、结论

对于相同的数据集, 不同的插值方法将生成不同的插值结果。对空间数据

插值而言, 各种方法均有其优点和不足, 没有绝对最佳的方法。在运用空间插值方法时, 要得到理想的空间插值效果, 必须针对不同研究区的实际情况, 对实测数据样本点进行充分分析, 反复试验比较, 以选择最佳的方法。最重要的是在运用一般插值方法的基础上, 依据自身需要, 对插值方法进行改进, 进而提出最优的空间数据插值方法。

参考文献

[1]Kang-tsung Chang著, 陈健飞, 等译.地理信息系统导论 (第3版) [M].北京:清华大学出版社, 2009:310.

[2]Tor Bernhardsen著, 王浒, 李浩川译.地理信息系统导论[M].机械工业出版社, 2006:204.

[3]张景雄.地理信息系统与科学[M].武汉大学出版社, 2010:255.

[4]邬伦, 刘瑜, 张晶, 等.地理信息系统-原理、方法和应用[M].科学出版社, 2001:180.

高维数据空间索引方法的研究 第9篇

目前高维数据库在计算机图形处理,医学图像处理,多媒体数据库中有着广泛的应用。随着高维空间数据库的发展,空间数据库对相似性查询产生了广泛的需求,而在目前来说,高维数据空间索引技术则是解决该需求,提高高维数据库上检索效率的一项关键技术。近些年来,高维数据空间索引技术在图像、视频、时间序列等基于内容的相似性查询(content-based search)中扮演着十分重要的角色,是数据管理及数据库相似性查询领域一个广受关注的研究热点。

本文就高维数据空间索引的结构特点进行介绍,并分析几种具有代表性的索引结构,最后对高维数据空间索引技术进行总结。

2 高维索引的结构特点及分类

相对于一般的维数比较低的数据而言,高维数据量巨大,结构复杂,动态性比较强,并且不能排序。在对高维数据进行操作的时候并没有标准的操作,操作由实际需要而定。因此,对高维数据空间建立起来的索引一般要满足以下特点:

1)动态性::由于高维数据结构复杂,在对数据操作过程中,往往伴随着数据本身的修改变化。由于数据动态性较强,所以高维数据空间的索引结构也应该具有动态性,支持动态的插入和删除。

2)操作多样性:高维数据在操作时没有标准操作,其操作往往是由需要决定的,所以高维数据空间的索引结构也应该支持多样性的操作。

3)时间和空间的有效性:索引是为了提高查询效率,由于高维数据一般数据量巨大,所以在建立高维索引的时候,一定要考虑到查询的时间效率。同时,也要考虑索引结构要保持一定的空间利用率。

一般来说,目前的高维索引技术大致分为两类:向量空间索引和度量空间索引。向量空间索引中比较具有代表性的技术是Kdtree,R-tree,X-tree等。度量空间索引中比较具有代表性的技术有M-tree,VP-tree,MVP-tree,MB+-tree,Slim-tree,M+-tree,VA-file等。

向量空间索引和度量空间索引只是侧重点不同,在相似查询方面,各有优劣。向量空间比度量空间多出了数据坐标信息,因此,度量空间可以看作是没有坐标信息的向量空间。度量空间一般是定义好距离函数,然后计算物体之间的距离信息。所用到得信息也主要是数据间的距离信息,因此,相对于向量空间索引来说,度量空间索引所用的信息较少,但是计算量较大。而向量空间更主要的是利用物体的坐标信息,因此这种索引方法在查询的时候读取磁盘的代价要高于向量空间。但是由于向量空间比度量空间多出了可利用的坐标信息,它在索引结构设计查询算法的时候更为灵活。

3 具有代表性的高维索引结构

在此节中我们分别从向量空间索引和度量空间索引两个方面来介绍一些具有代表性的高维索引结构。

3.1 X-tree[1]

X-tree引入了超节点的概念,当节点发生溢出的时候,对节点选择合适的分裂算法,使得节点在分裂以后重叠区域小到一定程度,假如无法避免分裂后出现较严重的区域重叠,则不分裂节点,而是扩大节点大小以放入更多的项,形成超节点,但是随着维数的增加,会形成越来越多的超节点,使得该索引方法的效率急剧降低。

3.2 R-tree[2]及R*-tree[3]

R-tree是一种平衡树,R-tree的查找算法是从根节点出发,对内部节点,检查其每一个项是否与要查找的区域重叠,如果重叠的话,则查找该项所指向的字节点,直至查找叶子节点。后来提出的R*-tree则对R-tree的插入算法和分裂算法进行了一些改进。R*-tree在插入算法的改进主要是引入了强制重新插入的概念。即当第一个节点在插入过程中发生溢出,并不立刻进行分裂,而是查看该层节点在此次插入过程中有没有进行过重新插入,如果没有的话,则选择一定比例的项从该节点中删除,并重新插入到树中。如果该层已经有过节点进行过重新插入,那么对该节点进行分裂。在分裂算法的改进体现在,节点分裂时增加了对分裂后节点周长以及该层节点重叠面积等因素的考虑。但是与X-tree相类似,随着数据维数的增加,R-tree的查询性能会迅速下降。

在高维向量空间中进行距离计算要增加相当大的计算开支,并且随着维数的增加,计算量成指数级增加,查询性能会迅速降低。于是,一些研究人员引入了度量空间索引。通过选取一点的距离参考点来将大多数距离预计算好并存储在索引当中,通过这种方法来避免很多距离的动态计算。

3.3 M-tree

Ciaccia等人根据数据对象间的距离分布建立了M-tree的查询模型,该模型采用最优查询候选队列实现KNN查询,对与查询覆盖区域相交的数据区域进行搜索。但是M-tree的兄弟节点索引空间的重叠对查询处理性能有着非常大的影响,子空间重叠较多会降低该索引查询效率。因此M-tree索引结构出现了几种改进索引技术例如Slim-tree和MB+-tree。

Slim-tree通过一个后处理过程减少子空间的重叠区域和索引节点的数目。MB+-tree采用B+-tree作为一个辅助索引结构,通过聚类分解,对数据进行更细致的划分来减少子空间的重叠区域。MB+-tree的空间划分是不相交的。

3.4 VP-tree[4]和MVP-tree

VP-tree是第一种支持相似性查询的层次索引结构,它使用数据对象到代表点之间的相对距离和三角不等式来进行数据空间的过滤。因为VP-tree索引结构较小的扇出(因而索引的高度很高)引起了大量的距离计算,增加了计算开支,从而极大地降低它的查询性能。后来提出的MVP-tree,则对此进行了改进。MVP-tree索引结构通过使用了多个代表点来增加索引的扇出,降低索引的高度。

值得注意的是VP-tree和MVP-tree都是静态的基于度量空间的索引结构,它们采用一种自上而下的方法来构建。这就意味着,这些索引无法支持数据的更新和删除。

4 国内高维数据空间索引的一些成果

近年来在国内研究高维数据空间索引的人很多,也取得了一些积极进展。目前较为突出研究成果有以下几种。

4.1 利用分区和距离实现高维空间快速KNN查询[5]

该算法通过使用分区和距离来实现高维空间上的快速KNN查询,算法通过近似向量和一维转换表示法有效克服了维数灾难,通过结合近似向量和一维转换这两种思想,从而提出了一种基于区位码和距离的索引结构(BD),从而可以实现快速KNN的查询。该算法根据高维空间向量分布特点,通过合理分区,使得大量分布在空间表面的点尽可能地划分到不同的分区中,这样提高了检索剪枝效率,通过引入区位码概念和转换函数,从而将高维向量近似表示并转换为一维数值形式,组织成B+-Tree索引。利用这样的快速KNN查询算法,实现了两层过滤,缩小了搜索范围,降低了树的搜索代价。

4.2 基于聚类分解的高维度量空间索引B+-Tree[6]

为了提高高维数据索引的性能,高维度量空间索引通常采用K-Means等聚类技术来获取数据的分布信息。但是,这种方法缺乏对聚类与查询性能之间关系的理论分析,因为已知的工作需要根据经验来确定聚类参数。因此该算法提出了一种基于聚类分解的高维度量空间B+-tree索引,通过使用聚类分解,对数据进行更细致的划分,从而减少了查询时需要的数据访问。在该算法中,还对聚类与查询代价的关系进行了讨论,通过使用查询代价模型,给出了最小查询代价条件下的聚类分解数目等理论的计算方法。通过实验证明了该索引方法明显优于iDistance等度量空间索引方法,而最优聚类分解数的估计接近实际最优查询时所需的聚类参数。

4.3 高维数据空间分割策略[7]

该策略是由周项敏提出。她提出一种高维数据空间分割策略——在距离分割基础上基于关键维的二次分割,以及相应的索引技术。基于关键维的二次分割保证孪生兄弟节点的无重叠性,而在索引中根据选定的关键维进行孪生兄弟节点间的二次过滤,从而增强过滤效率。这种数据分片策略和索引技术使得索引的过滤效率成倍提高.其关键维能够很好地提高索引的相似性检索性能。

5 结论

上述文章是对近些年来国内外在高位数据空间索引的各种方法进行了分析。尽管上述文章中索引方法在低维空间中取得了较好的检索效果,但随着维数的增加,搜索的空间呈指数增长,检索性能显著下降[8],这种现象被称之为维数灾难(dimensional curse)。目前又有降维索引方法提出,但是无论是局部降维还是整体降维,虽然能在一定程度上克服维数灾难,但是在降维过程中不可避免的丢失检索精度,降维后的数据维度越少,检索精度越差。因此非常需要研究新的索引结构和算法,克服维数灾难,实现对空间任意分布方式的数据的快速检索,并能够应用到生活和工作的实践中去。

摘要:讨论了高维数据空间索引的基本结构、建树算法,重点对几种有代表性的索引方法,如R-Tree,X-Tree,M-tree,VP-tree在重叠、插入原则、分裂原则、再插入等方面进行了比较研究。该文中主要介绍了一些索引结构的特点和一些具有代表性的索引结构。

关键词:高维数据空间,索引,查询

参考文献

[1]Berchtold S,Keim D,Kriegel H P.The X-Tree:An Index Structure for High-Dimensional Data[A].22nd Conf.on Very Large Databas-es[C].Bombay,India,1996:28-39.

[2]Guttman A.R-Trees:A Dynamic Index Structure for Spatial Searching[A].Proc.ACM SIGMOD Int.Conf.on Management of Data[C].Boston,MA,1984.47-57.

[3]Beckmann N,Kriegel H P,Schneider R,et al.The R*-Tree:An Efficient Robust Access Method for Points and Rectangles[C].Proc.ACM SIGMOD Int.Conf.on Management of Data.Atlantic City,NJ,1990.322-331.

[4]Yianilos P.Data structures and algorithms for nearest neighbor Searching general metric spaees[J].In:Pro.4th ACM一SIAM Symposium on Discrete Altgorithms(SODA93),1993.311-321.

[5]梁俊杰,王长磊.利用分区和距离实现高维空间快速KNN查询[J].计算机研究与发展,2007,44(11):1980-1985.

[6]张军旗,周向东.基于聚类分解的高维度量空间索引B+-Tree[J].软件学报,2008,19(6):1401-1412.

[7]周项敏,王国仁.基于关键维的高维空间划分策略[J].软件学报,2004,15(9):1361-1374.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【空间数据标准】相关文章:

空间数据转换05-06

空间数据集07-23

空间数据集成07-30

数据空间的数据项研究05-08

空间数据结构06-06

三维空间数据06-25

空间数据生产体系06-26

水利普查空间数据07-30

空间数据挖掘论文05-05

空间数据结构范文06-02

上一篇:玻璃上的爱情下一篇:教学感触