GIS空间数据的误差校正
摘 要 主要介绍了图形输入过程中引起误差的原因、误差校正的原理及一些常用的误差校正方法,特别是在MAPGIS中应用的分块误差校正方法,实践表明效果很好,最后还简要地介绍了图形精度的评价.
关键词 数字化,控制点,误差校正,数据精度.
现代计算机技术和自动控制技术的发展,使机助制图技术发展很快.机助制图主要可分为编辑准备阶段、数字化阶段、计算机编辑处理和分析实用阶段、图形输出阶段等.在各个阶段中,图形数据始终是机助制图数据处理的对象,它用来描述来自现实世界的目标,具有定位、定性、时间和空间关系(包含、联结、邻接)的特征.其中定位是指在一个已知的坐标系里,空间实体都具有唯一的空间位置.但在图件数字化输入的过程中,通常由于图纸变形等因素,使输入后的图形与实际图形所在的位置往往有偏差,即存在误差.本文主要介绍数字化过程中产生的误差和误差校正的方法以及对误差精度的评价.
1 图形数据误差
图形数据误差可分为源误差、处理误差和应用误差3种类型.源误差是指数据采集和录入过程中产生的误差,如制图过程中展绘控制点、编绘或清绘地图、制印和套色等引入的误差,数字化过程中因纸张变形、变换比例尺、数字化仪的精度(定点误差、重复误差和分辨率)、操作员的技能和采样点的密度等引起的误差.处理误差是指数据录入后进行数据处理过程中产生的误差,包括几何变换、数据编辑、图形化简、数据格式转换、计算机截断误差等.应用误差是指空间数据在使用过程中出现的误差[1].其中数据处理误差远远小于数据源的误差,应用误差不属于数据本身的误差,因此本文着重介绍数据源误差及其校正方法.
在图件数字化输入过程中,通常的输入方法有扫描矢量化、数字化仪跟踪数字化、标准数据输入法等.通常将一幅地图按一定的数据结构数字化得到的数据一般存在如下误差:(1)由于地图纸张变形所产生的误差;(2)由于数字化时地图定向所产生的误差;(3)由于数字化读数所产生的误差;(4)数字化操作产生的各种粗差.这些误差的性质有系统误差、偶然误差和粗差.由于各种误差的存在,使地图各要素的数字化数据转换成图形时不能套合,使不同时间数字化的成果不能精确联结,使相邻图幅不能拼接;所以数字化的地图数据必须经过编辑处理和数据校正,消除输入图形的变形,才能使之满足实际要求,进行应用或入库.
一般情况下,数据编辑处理只能消除或减少在数字化过程中因操作产生的局部误差或明显误差,但图纸变形和数字化过程产生的随机误差,必须经过几何校正,才能消除.由于造成数据变形的因素很多,对于不同因素引起的误差,其校正方法也不同,具体采用何种方法应根据实际情况而定,因此,在设计系统时,应针对不同的情况,应用不同的方法来实施校正.
2 误差校正方法
输入到计算机中的图形,实际上都是通过其位置坐标(x,y)来表示,因此校正过程实质上是找一种数学关系(或函数关系),描述变换前图形坐标(x,y)与变换后图形坐标(x′,y′)之间的换算,其数学关系一般描述为
这个数学关系常表示为二元多项式一次、二次或三次及更高次表达式.
为了求得上式的未知系数,首先寻找图形中已知坐标的位置点,称为控制点.这里所说的图形控制点,实际上是指能代表图形某块位置坐标的变形情况,其实际值和理论值都已知或为可求得的点.如图形中经纬网交点,它可指示一幅图的位置情况,其周围点的位置坐标往往是以其为依据的.在一幅图中,具体经纬网点的理论坐标可以经计算或根据标准经纬网求得,为此,经纬网点往往作为校正用的控制点.其他如三角点、水准点、方里网的交点等都可以通过坐标表查得或通过实际的数学公式计算而得其真值,因此这些点也可以作为控制点.其次是如何选择控制点的问题,控制点的多少决定了其位置计算关系式中的最高次数.为了使校正后的图形各处校正效果都比较好,必须使控制点选取在图形各处且分布比较均匀,特别是边界、四角要有控制点,以避免图形校正不能满幅.增加控制点数目和增加多项式次数可以提高精度,现在一般采用的方案为:控制点在4至7个时,用双线性变换公式,即
X=a1+a2x+a3y+a4xy,
Y=b1+b2x+b3y+b4xy.
控制点为8至19个时用二次多项式;控制点为20至49个时用三次多项式;控制点为50个以上时,用四次多项式并不再增加次数,因再继续增加控制点和增加次数,位置精度增加很少而计算量增加很多,浪费了机时.实际上采用不同次数的多项式,分别适用于不同的变形校正.一次多项式变换,即仿射变换是一种比较简单的一次变换,在进行直线变换和平行线变换时效果相当好,但不同方向上的长度比发生变化.二次变换是一种含二次项的变换,高次变换同二次变换相比,只是它含有常数项.这两种变换的实质是:制图资料上的直线经变换后可能为二次曲线或高次曲线,它适用于原图有非线性变形的情况.在实际校正过程中,具体选哪一种,要看具体的变形而定:若满足线性,如平移、缩放等最好用仿射变换;若满足二次型或高次型最好用二次变换或高次变换.
对于给定的控制点,将每个控制点理论值和实际值代入所选公式进行对比,求出公式中的校正系数,根据校正系数,即可对图形进行校正变换.那么,如何选择数学关系并进行校正计算呢?下面介绍几种方法.
2.1 几何变换
在数字化过程中,由于地图定向,即数字化仪坐标系与地图投影坐标系不一致所产生的误差,可以通过坐标旋转得到校正.
设XOY系为数字化仪坐标系,xoy系为经平移旋转后的地图投影坐标系,其坐标变换公式为
x=Xcosα-Ysinα,
y=Ysinα+Ycosα.
式中α可通过共同点在两系中的坐标求得,即
tanα=(yX-xY)/(xX+yY).
如发生平移或比例变化,则选择平移或比例变换进行校正即可.
为了校正由于纸张伸缩和地图定向引起的系统误差,可采用同素变换进行数据校正.同素变换是一种比较简单的一次变换,设数字化的坐标为(X,Y),经同素变换后的坐标为(x,y),则同素变换的公式为
x=(A1X+A2Y+A3)/(C1X+C2Y+1),
y=(B1X+B2Y+B3)/(C1X+C2Y+1).
2.2 最小二乘法线性校正
在实际校正过程中,由于造成变形的因素很多,有机械的、也有人工的,如数字化后的图是放大了,还是缩小了,放大或缩小了多少倍,是局部变形还是整体变形,是某些图元与实际不符,还是整个图形都发生了畸变等,实际参数很难估算;因此很少通过几何变换即可完全校正图形.为此,一般采用上述介绍的一次或高次多项式进行校正.
从理论上讲,控制点越多,分布越均匀,校正的效果越好.当方程次数与控制点的个数相同时,这样总可以使控制点满足精度要求.但当方程次数增高时,控制点外的其他位置点将按照曲面拟合路径进行变换,而图形输入过程中产生的误差很少满足这种关系,因此控制点外其他点的误差反而会增大,离控制点越远,变化越大;所以在实际使用中很少用高次变换,一般用得较多的是一次变换,即仿射变换和双线性变换,也称双一次变换.
当选定一数学关系时,如一次多项式或二次多项式,按照解方程组未知数与方程个数必须相同的原则,一次多项式选取3个控制点即可求出未知系数,二次多项式选取6个,双线性多项式选取4个控制点即可.如果所给控制点数多于方程所要求的个数,为了使其尽量满足各个控制点,可运用最小二乘法求解其校正系数.由于最小二乘法只能使各个控制点的真值与图形输入值的平方差达到最小,当控制点很多时,往往很难达到地图精度的要求[2].
2.3 分块校正
图形控制点实际上是分布在图形中的一系列坐标位置点,校正的目的是通过这些已知的控制点,来校正整幅图形,使其满足精度要求.一般情况下,由于数据的相关性,图形中某一点的位置误差与其附近控制点的误差最接近,受这些控制点的影响最大;距离越远,影响越小.为此,可以将这些控制点形成一个个小区域,使该区域内的点仅受相应区域上的控制点控制.最简单的方法是将这些控制点形成一个个三角形,所有的三角形组成了一个三角网,每个三角形内的点用该三角形上的3个控制点来进行校正.故可用仿射变换,即
通过这种计算,所得的结果图件中,控制点可以完全达到所给定的值.每个三角形内部的点,都使用该三角形的校正系数来进行校正变换.相邻的两个三角形由于共边,所以在公共边上的点,用两边的校正系数进行校正都可以,跨接相邻三角形的曲线不会出现跳跃现象.但对于三角形外的点需作特殊处理,为避免这种情况,在被校正图形的边缘处,要想办法选取控制点,用外推的方法一般会产生较大的误差.
那么如何构成三角形网呢?这实际上是一个三角剖分的问题.自动生成三角剖分的基本问题,是如何将有界平面上所有n个互不重合的参考点(在此为控制点)结成一张满足下列条件的三角形格网:(1)三角形格网中的所有网格(剖分)都是三角形;(2)全部n个参考点都是三角形格网的结点,三角形格网共有n个结点.可利用一步法、分步法或应用数学形态学等方法来生成三角形网[3].
合并相邻的三角形,可以形成四边形网,对于每个四边形,可选用双线性变换关系式.利用四边形的4个顶点,即可求出每个四边形内数据的校正系数.每个四边形内的数据都通过双线性变换关系式,根据所得的校正系数进行校正,则校正结果图件中的控制点也可完全达到真值.特别是对于小比例尺区域图来说,图中都有经纬网,通常一个经纬网格就是一个四边形,可作为一个校正单元,并对经纬网格进行统一编号.为了建立四边形格网,计算校正多项式系数,应按一定的顺序数字化所有经纬网的交点,将它们作为校正控制点,而经纬网交点的理论值可由坐标表查取或根据投影坐标公式求得.根据控制点的值,求得校正多项式的校正系数,从而可对网格内图形元素的数字化点进行校正.
在MAPGIS中,就是采用这种校正方法,实际应用表明,效果很好.值得注意的是,由于是分块进行校正,任一条具有行政意义的边,可能隶属于不同的校正单元,所以必须进行接边处理.
3 图形精度的评价
由于引起误差的因素比较多,因此评价起来也有困难,本文介绍一种对比方法.所谓对比方法就是将数字化后的数据通过绘图机输出产生回放图件,将此输出图件(一般是透明片基)套合在数字化原图上,选择明显的地物点、格网点、图框交点等量测其目标位移的误差,分别统计并计算出单位产品平面或高程中误差.地物点的平面误差计算为
高精度检测
等精度检测
其中:Xi,Yi为检测值;xi,yi为数字地图中点的坐标值;Mx,My分别表示地物点的X方向、Y方向的点位误差;n为平面检测点数.
相邻地物点间距中误差或点状目标位移中误差、线状目标位移误差按下式计算
式中:Δs为数字地图的回放
图与数字化原图套合后经量测的点状或线状目标的位移差;n为量测边的条数或点状/线状目标的个数[1].
4 误差校正的应用
MAPGIS软件有很强的编图制图能力,其中提供了误差校正功能模块,由于最小二乘法只能使各个控制点的真值与图形输入值的平方差达到最小,当控制点很多时,往往很难达到地图精度的要求.因此MAPGIS软件使用了分块校正方法,其校正过程如下.(1)原图数字化.即从地图编稿图或地理底图上采集数据数字化,包括扫描矢量化、数字化仪数字化,形成图形数据文件.(2)图形编辑处理.对于由于操作员跟踪线迹和线划时,出现重叠、漏采、输入差错等个别错误,借助编辑系统的功能,进行交互式编辑修改.对于由于纸张变形、定点误差、设备精度等引起整幅图形出现偏差,进行误差校正.(3)为了对输入的图元文件进行校正,首先得确定图形的控制点,通过采集控制点功能输入校正图形所用的控制点.控制点的采集要均匀,而且采集的控制点越多,控制越精确.(4)装入图形文件,键盘输入或直接在图上采集图形中控制点的实际值.(5)直接从键盘输入理论值或从标准数据文件中采集理论值.(6)根据采集的控制点构造格网,并计算每个格网的校正参数,然后进行相应文件校正.(7)显示校正后的图元文件,检查校正效果,若仍未达到要求的精度,继续前述步骤.
实践表明,用这种方法校正输入的图件,可以完全达到图件输出精度的要求.实际上这种方法对控制点校正效果很好.为了进一步减小源误差,避免误差传播,可在数字化图件开始就控制数据误差.如提高数字化仪和扫描仪的精度,提高操作员的实际操作能力和应用水平;在采集过程中,通过回归统计、自动推演等方法求出采集点数据误差的纠正关系式,这样在开始输入点过程中,就可以进行数据校正.
参考文献
1 马智民,俞全宏,姜作勤.应用地理信息系统设计与实现.西安:西安地图出版社,1996. 117~119
2 赫普克;田佩俊译.误差理论与平差计算.北京:煤炭工业出版社,1989. 37~38
3 柯正谊,何建邦,池天河.数字地面模型.北京:中国科学技术出版社,1993. 57~58