地理信息系统的数据模型与数据分析
摘 要
本文主要研究了地理信息系统中的数据的获取,矢量数据模型和栅格数据的模型的建立和数据分析的各种算法,并讨论了属性数据的管理,以此来对地理信息系统的数据有透彻的了解。
【关键词】数据转换 矢量数据模型 栅格数据模型 数据分析 属性数据
在土地规划利用,野生动物栖息地的分析,森林海域的管理,以及自然灾害的防控上,地理信息系统都有其不可替代的作用,主要对地球及其表面的数据采集,存储,管理,以及处理和分析,并达到描述和三维可视化的效果,而数据是地理信息系统分析应用的基础,因此必须格外重视。
1 地理信息数据的获取
通过GPS RTK技术,掌上电脑或者全站仪等在野外可以直接采集到空间数据,同时摄影测量,合成孔径雷达干涉测量和机载激光雷达测量技术也可以通过不同方式获得地形信息。其中在数字摄影测量中,主要的产品包括数字高程模型(DEM),数字正摄影像(DOM)和数字栅格图(DRG)等。
虽然通过野外数据,卫星图像和街道地址等可以获得数据源,但必须运用数据转换方法得到符合要求的数据来分析和建模。对于特定的数据格式,必须用专业的译码软件进行转换,而中性或公共数据格式,在GIS软件包中就有相应的软件。
2 矢量数据模型
矢量数据模型的数据,计算机在处理数据时,在空间中用x,y坐标和点将离散的空间表示为点,线,面,然后再将空间关系和几何对象处理成为数字化的数据文件,使计算机可以编译处理和访问。
矢量数据模型用点,线,面等几何对象来表达空间要素,它可以非拓扑或者拓扑的。在拓扑统一地理编码格式数据库中,点是0像元,面是1像元,线是2像元。该数据库不仅包括点线面,也包括它们之间的空间关系。基于这种空间关系,在数据库中可以将街区道路联系起来。
地理关系数据模型是矢量数据模型中的重要概念,是指以独立的两个系统来分别存储属性数据和空间数据,用要素标识码ID号来对二者衔接。以ESRI公司的coverage产品为例,coverage是拓扑的,它支持连接性,面定义和邻接性三种拓扑关系。多边形或者弧形作为图形文件存储,而INFO文件夹与coverage共享同一个工作空间来存储属性数据。
基于对象的数据模型是矢量数据模型的最新成员,它把地理空间数据作为其对象,而对象可以表示成林区公路等这样的空间要素。另外它把空间数据和属性数据存储于同一个系统中,并允许一个空间对象和其他一系列的方法和属性相关联。
3 栅格数据模型
对于连续变化的一些空间现象,比如土壤变化,降水量等,矢量数据模型的表现不是很好,对于这种连续的数据最好选择栅格数据模型。栅格数据模型是地理信息系统中不可缺少的数据模型,它用规则的网格来覆盖空间,网格中的各个像元的值表达了空间现象的变化。栅格由像元,行,列组成,每个像元都有一个值,用来代表该位置上的空间现象特征,且可以分为浮点型和整型栅格数据。同时,像元的大小也决定了栅格数据的分辨率,像元越小,分辨率越高,但系统分析处理就越消耗时间。
栅格数据结构指的是栅格数据存储的方法和格式。主要包括逐个像元编码,四叉树和游程编码。逐个像元编码把像元的值赋在行列式中,游程编码用拥有相同像元值的组和行来记录像元的值,而四叉树是用递归的方法将栅格分解成象限。
栅格数据和矢量数据可以相互转化,当把矢量数据转换成栅格数据时,首先建立能够覆盖矢量数据范围的栅格,且所有像元的初始值为0,然后改变点,线的像元的值,最后用多边形的值来填充轮廓线的内部;而想把栅格数据转换成矢量数据的时候,则要经过线细化,线提取,以及拓扑关系重建这三个步骤。
4 矢量数据分析
根据GIS的应用领域不同,GIS的分析范围也不相同。在矢量数据的分析中,包含建立缓冲区和地图叠置的重要概念。建立缓冲区把地图分成了两块区域,其中地图要素包含点线面,建立缓冲带从而产生缓冲区,比如以地图中河滨缓冲区为例,为了保护渔业,在河两岸,也就是线要素的两侧要形成一定宽度的缓冲区。另外,地图叠置是指把图层的属性和几何要素组合,从而形成新的图层。输出图层包含所有输入图层的属性,但几何形状则是输入图层的交集。在GIS软件包中,叠置方法都是基于布尔连接符,也就是AND,XOR,OR。
5 栅格数据分析
栅格数据分析主要有栅格数据分析环境,局域运算,自然距离量测运算,分区运算,邻域运算,地图代数等工具。数据分析环境中分析掩膜可以决定分析的范围,但必须注意其中no-data的涵义为数据缺失。局域运算通过数学函数来得出输出栅格中的像元值;分区运算会测量每个分区的周长,重心,厚度和面积等。通过两个栅格来进行分区运算,输出栅格对每个分区都进行概括后得到量测值和概括统计值。
6 属性数据的管理
GIS不仅包括空间数据,也包括属性数据,而属性数据用来描述空间要素的各种特征,它的管理非常重要。通常属性数据以行列结构存放于属性表中,分为要素属性表和非空间数据表,分别用来存放几何要素和由数据库软件包管理的文件。一般采用数据库管理系统来管理这些属性数据。属性数据的输入包括输入字段,选择数字化的方式以及属性数据的校核。数据库的管理包含表格中字段与数值管理和表格管理,其中字段管理包含字段删除和添加,通过分类和计算后可以生成新的数据。
在属性数据分类时,首先用新字段存储分类的结果,然后选择数据子集,最后将选择的数据子集赋值。通过对属性数据的计算也能生成新数据,过程是定义新字段,然后通过公式计算将现有字段赋予新的属性值。
总之,地理信息系统的数据是所有应用的基础,由于地理信息系统在国家资源管理和灾害防控中有特殊的重要性,其发展也日新月异,因此,对其数据的管理也会与时俱进。
参考文献
[1]朱光,赵西安,靖常峰.地理信息系统原理与应用[M].北京:科学出版社,2010.
[2]崔铁军.地理信息服务导论[M].北京:科学出版社,2009.
[3]朱定局.GIS数据结构与算法基础[M].北京:科学出版社,2012.
[4]陈健飞,连莲.地理信息系统导论[M].北京:电子工业出版社,2014.
作者单位
1天津市天兴房地产信息咨询有限公司 天津市 300000
2天津市国土房管局测绘中心 天津市 300000