基于ArcGIS Geodatabase的多源海图数据融合研究
摘 要:由于空间数据的数据来源、数据格式、数据结构的不同,需要采用一定的技术方法才能将它们合并在一起使用,这就产生了数据融合问题。本文提出了多源矢量海图数据融合的理论和方法,引入Geodatabase数据模型,将多种文件格式的数据源融合到统一的数据库系统中,并且对空间数据融合中的几个关键技术进行了探讨。
关键词:数据融合;数据模型;Geodatabase
A study on the integration of multi-resources Chart data based on ArcGIS Geodatabase
Yin Xiao-hui①② Wang Li-wei②
① Institute of Surveying and Mapping,Information Engineering University,Zhengzhou 450052
② Navy Press,Tianjin 300450
ABSTRACT: Because spatial data has different sources, different fomat and different structure, we should use some technical methods to share them. Then, it cause a problem of data integration. This paper brings forward solutions for Chart data integration. We choose Geodatabase to solve this problem. It mixes multi-resouces data which use file format together in an uniform database system. And, we discuss some key technical methods to solve the problem of data integration.
Keywords: data integration; data model; Geodatabase
1 引言
不同的GIS应用部门在同一地区、同一比例尺的空间数据往往采用不同的数据源(外业实地测量、航空摄影图像、卫星图像、地形图、海图、航空图和各种各样地图)、不同的空间数据标准、不同的的数据模型及空间物体分类分级体系进行重复采集。这不仅造成了人力、财力的巨大浪费,还引发了空间数据的多语义性、多时空性、多尺度性、存储格式的不同以及数据模型与存储结构的差异等,给GIS部门之间的数据共享和数据集成带来极大困难[1]。海图生产过程中同样存在这样的问题,因此,将数据融合技术应用于海图生产工作具有极大的现实意义。
2海图数据源
目前,国际国内数字海图大致有以下几个数据源[2]:
(1) 各国官方海道测量部门提供的符合IHO S-57标准第三版的ENC。
(2) 挪威C-MAP公司提供的CM93/3矢量海图库。
(3) 德国的SevenCS公司提供的DNC (Direct ENC)矢量海图库。
(4) 英国航道测量局(UKHO)出售的光栅图。
(5) 我国航保部出版的中国海域的数字海图,其格式为VCF (Vector Chart Format),其编码为ArcInfo中的数据格式。
(6) 交通部海事局出版的中国港口图,其电子海图数据可以按IHO S-57格式提供。
而数字地图的数据源主要是ArcInfo的Coverage、Shapefile格式及其作为交换格式的E00格式,和MapInfo的MIF格式。
3数据融合理论与方法
空间数据融合是指[3]将同一地区不同来源的空间数据,采用不同的方法,重新组合专题数据,补充物体的分类分级和属性,进一步改善物体的几何精度,消除以下差异:空间物体在不同的空间数据模型中多次采集所产生的数据描述上的差异;相同或不同的数据模型采用不同的分类分级方法采集所产生的要素属性差异;空间数据的应用目的不同表现在要素综合详细程度上的差异以及多次数字化所产生的几何位置差异。
根据数据源不同,空间数据融合分为矢量数据融合和栅格数据融合以及矢量数据与栅格数据的融合。本文主要对矢量数据融合的问题进行讨论。
空间数据融合可以有以下几种思路[4]:
一是保持各图种各自的要素编码和数据格式,通过对不同图种作快速切换显示的方法实现不同数字地图的共用,保持各图种处于相互独立的状态。
二是以一种数据编码为基础,将另一种要素扩充到该要素编码集上,并用该要素数据格式作为数据格式的统一标准。
三是设计一种能融合多种数据的空间数据模型及其数据格式,研制实现多源数据融合的软件,统一符号系统。
显然,只有第三种方法才能真正实现不同数字图种之间的统一。这种方法将空间物体在各种各样的空间数据模型中多次采集所产生的差异以及相同的数据模型几何位置多次数字化和物体类型不同的抽象概括所产生的空间数据结构、几何位置和要素属性等的统一处理,在最大程度上实现多种数据源的完全转换。
4 Geodatabase数据模型
Geodatabase是ArcGIS 8引入的一个全新的空间数据模型,实际上是建立在DBMS之上的统一的智能化的空间数据库。它采用面向对象技术将现实空间世界抽象为由若干对象类组成的数据模型,每个对象类有其属性、行为和规则,对象类间又有一定的联系。用户可以在已有的空间数据模型之上建立符合应用需求的扩展模型。因此,它不仅接近于人类对地理空间世界的认识,而且还具有较好的客户化能力和扩展能力。
Geodatabase是一个地理数据统一存储的仓库,所有数据(矢量数据和栅格数据)都能在同一数据库里存储并中心化管理。其模型结构如图1所示:
与以往的数据格式相比,Geodatabase的优越性主要体现在它对要素的建模上。它搭建了一个数据仓库的模型框架,这样用户可以轻易地创建智能化要素,模拟真实世界中对象的作用和行为。另外,Geodatabase还兼容了ArcInfo以前的Coverage和Shapefile格式,避免了数据格式的共享问题。所以,我们希望使用Geodatabase数据模型来描述海图数据。
5数据融合的关键技术
数据融合需要解决以下几个方面的问题:
5.1 数据模型的融合
数据模型的融合是指将两种以上的不同数据模型融合成一种新的数据模型,这种新的数据模型应能最大限度地包容原数据模型,然后将不同数据模型的数据向新的数据模型转换。因此,数据模型融合的关键在于新的数据模型的设计,我们引入Geodatabase数据模型作为统一数据模型将多种数据源的海图数据向Geodatabase目标数据转换。Geodatabase的要素类是对现实地理世界的对象化。在空间数据库中,要素类的表现形式就是关系数据库中的一个表,该表可以统一存储空间数据和属性数据。由于模型转换时涉及到目标间多对多映射的复杂关系,还有地理信息的多语义性,我们需要对Geodatabase模型进行合理的设计,尽量减少在数据模型转换的过程中造成的信息损失。
5.2物体分类分级的统一
物体的分类、分级统一,主要是解决两种数据源由于分类分级所采用的方法和分类、分级的详细程度不同所产生的差异。这种差异主要体现在地理要素编码上。我们需要研究出一种新的要素属性编码方案,这种方案应能基本上保持对已有编码体系的兼容性,又能克服它们所存在的缺点。兼容性可以通过相应的转换机制实现,即能方便地将旧的编码转换到新的编码系统中。新的编码方案应能更加科学地体现出要素的分类特点,使要素分类更加合理;应能充分提供对每一要素属性作详尽描述的能力,保证要素属性描述的完备性。将数字地形图、航海图、航空图所有要素综合分类、分级、统一定义和统一编码,是实现各图种数据共享、相互兼容,便于不同比例尺数据相互转换的重要步骤。
新的数据模型仍然采用原coverage数据模型的分层模式,将整个电子海图数据分为14个专题层,29个物理层(表1为1-6层示例)。其中,海洋陆地层、资料档案层和图幅索引层为单独设立的3层,用来宏观地描述海洋陆地包括深浅水域的具体分布即对海图资料采用情况及电子海图的出版、归属、相关说明等信息作一一表述。
海图将要素分成测量控制点、陆地方位物、地貌、水系、居民地、交通运输、管线和垣栅、海洋/陆地、水深/底质、港口设施,助航设备、碍航物、近海设施、航道、区域界线、服务设施、水文/磁要素、图幅索引、数据档案、英文注记、图面配置等21个大类,每个大类包含多个要素类和一个注记子类如表2所示。
实现物体分类分级统一的基本方法是建立目标转换对照表,将同一目标的编码、属性一一罗列,进行对照转换。有些没有对应关系的目标无法建立对照表,这时就要对该目标和属性进行重构。
5.3几何位置的融合
由于数据获取时采用的数据源不同、比例尺不同、作业员的个人素质有差异,以及更新的时间不同,同一地区的数据经常存在着一定的几何位置差异。几何位置融合是一个比较复杂的过程,需要用到模式识别、统计学、图论以及人工智能等学科的思想和方法。
几何位置融合应包括两个过程:一是实体匹配,将两个数据集中的同一地物识别出来;二是根据两种数据源的几何精度将匹配的同名实体合并。实体匹配的依据包括距离度量、几何形状、拓扑关系、图形结构、属性等。匹配的算法有几何匹配、拓扑匹配和语义匹配等。对同名实体的几何位置进行合并,首先要对数据源的几何精度进行评估,根据几何精度,合并应分两种情况进行讨论。如果一种数据源的几何精度明显高于另一种,则应该取精度高的数据,舍弃精度低的数据;对于精度相近的实体,还要区分点、线、面来探讨合并的方法。点状对象融合方法有[6]片面最近邻居连接方法(one-sided nearest-neighbor join method)、相互最近方法(mutually—nearest method)、概率方法(probabilistic method)和标准化权重方法(normalized—weights method)等。线状对象的合并主要采用关键点融合法和数学形态学方法。
5.4拓扑重建技术
空间关系划分为无拓扑(Cartographic Spaghetti)、链节点拓扑(Chain-node)、平面图拓扑(Plane Graph)和全拓扑(Full Topology)四种拓扑等级。地理信息的各种数据源采取的拓扑结构不尽相同,有CDC数据源的全拓扑和无拓扑结构,也有S-57的链拓扑结构。海图数据库中数据的完整性是非常重要的。Geodatabase提供了两种机制用于构建空间数据完整性——平面拓扑和几何网络。平面拓扑是地理要素间的空间关系,是对相连或相邻的点、线、面之间关系的科学阐述,具有在连续投影变换下保持相对关系不变的特性,它是确保数据质量的基础。拓扑能提高数据的空间分析能力,并且在确保GIS数据库质量方面扮演着重要的角色。拓扑的实现依赖于一组完整性规则,它定义了空间相关的地理要素和要素类的行为。几何网络用于模拟线性系统,如道路交通网络。支持丰富的网络跟踪和分析功能。网络是由一系列相互连接的点和线所组成的系统,一个网络是一个连接图。网络元素的连通性是网络分析的基础,另外,相互联通的网络元素本身的属性也可以控制网络的流通。在ArcCatalog下建立几何网络,如图2所示:
6 结束语
多源海图数据的融合是一项非常复杂的工作,尤其各数据模型转换的信息缺失问题一直没有得到很好的解决。我们引入了ArcGIS的Geodatabase数据模型,将各种文件数据通过融合技术存储到统一的数据库数据模型中。通过对空间数据融合,消除了因空间数据模型、物体的分类分级和几何位置的精度等引起的差异,为实现空间数据的共享,扩大空间据使用范围,减少空间数据的维护和获取费用,同时也满足了特定用户要求的空间数据生产,提高数据生产效率和质量,对整个地理信息产业的发展有着举足轻重的作用。