省级地理信息资源元数据转换探讨

省级地理信息资源元数据转换探讨

摘要:地理信息资源元数据是对测绘成果资源进行梳理整合的成果,能有效促进测绘成果资源的共享与应用。以山东省省级地理信息资源元数据为例,在对生产元数据标准和目录服务系统元数据规定进行对比分析的基础上,设计元数据快速转换流程,并通过开发程序实现省级地理信息资源元数据的快速转换。

关键词:元数据标准;元数据分析;元数据转换

地理信息资源是国家基础地理信息资源的重要组成部分,为了实现地理信息资源更广范围、更深度的共享,测绘部门启动了国家测绘地理信息成果目录服务系统项目,建成了地理信息资源、展示及应用平台,实现了部级站点与各省市测绘主管部门间的测绘地理信息成果目录数据的集成管理,为社会公众提供了测绘地理成果信息的查找、评价、获取、利用以及其他服务,其中,目录系统元数据的采集成为系统运维管理的一项长期工作内容。元数据是关于数据和信息资源的描述性信息,地理信息资源元数据是地理信息空间相关数据和信息资源的描述信息。目前,基础地理信息数字产品元数据生产工作主要依据GB/T19710―2005《地理信息元数据》[1]、CH/T1007―2001《基础地理信息数字产品元数据》[2]等规定,目录服务系统元数据采集工作主要依据《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》等规定。针对基础地理信息数字产品元数据生产,测绘单位相继设计实现了各类元数据批量生产工具,提高了生产效率[3-5]。针对更新升级前的目录服务系统元数据采集,设计实现了基于XML的地理信息网络分发服务元数据的转换方法和工具[6],但对升级后的目录服务系统元数据采集,缺乏相关的元数据采集方法及工具。本文结合山东省地理信息资源目录服务系统元数据采集需求,通过对生产元数据标准和目录服务系统元数据的规定进行对比分析,设计目录元数据快速转换流程,并基于C#和GDAL(GeospatialDataAbstractionLibrary)实现了目录元数据的快速转换。

1元数据对比分析

结合《基础地理信息数字产品元数据》和《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》这2项元数据标准,从元数据对象范围、元数据内容、元数据格式、元数据采集要求和元数据汇交要求5个方面进行对比分析。

1.1元数据对象范围分析

《基础地理信息数字产品元数据》标准规定了数字栅格地图、数字正射影像图、数字高程模型和数字线划图4种数字产品的元数据内容、结构和格式。《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》选取了测量控制点、矢量地图数据、数字高程模型数据、数字栅格地图数据、影像数据、模拟地形图等主要测绘地理信息成果的元数据作为管理对象。前者的对象范围限于传统基础测绘成果数字产品,后者的对象类型更加广泛,规定的对象范围涵盖了前者的对象范围。

1.2元数据内容分析

《基础地理信息数字产品元数据》标准规定的元数据内容是有关数据源、数据分层、产品归属、空间参考系、数据质量、数据更新、图幅接边等信息,规定的数字栅格地图、数字正射影像图、数字高程模型和数字线划图的元数据项依次是106项、92项、106项和121项。《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》根据测绘地理信息成果目录服务的实际分发需要,选取元数据实体集、标识、覆盖、限制、参照系和分发6个子集,并将子集细化为实体和元素。前者围绕生产、建库、更新和分发的各个阶段对元数据内容进行了详细全面的记录;后者围绕分发服务需求,选取分发相关的元数据项,增加了所属项目等元数据项,删除了数据生产、更新等相关的元数据项。

1.3元数据格式分析

《基础地理信息数字产品元数据》标准中规定,元数据文件是一个纯文本文件,采用左边为元数据项、右边为元数据值的存储结构,不限字节数,文件的数据标识为Metadata。《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》规定,元数据的存储格式采用ESRIShapefile格式,采用空间图形数据挂接属性信息的方式记录元数据信息。后者选用的ESRIShapefile格式,既记录了元数据属性信息,也记录了元数据的空间图形信息,相比前者的文本文件格式,后者能更直观地展现元数据的空间范围。

1.4元数据采集要求分析

《基础地理信息数字产品元数据》和《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》均定义了元数据项、数据类型、值域和填写要求,但前者未对属性项的填写要求作出明确细致的采集规定,后者考虑到采集过程中的实际情况,对采集转换的元数据填写内容作了更明确的规定。例如,前者因年代久,规定的诸如参考系等属性项值域信息已不能满足当前采集要求,后者对限制信息、参照系信息、测绘成果类型等属性项值域作了详尽规定,必须严格依照值域填写;关于生产时间采集,前者定义为整型、采用YYYYMM形式表示,后者定义为字符串、采用YYYY-MM-DD形式表示,后者相比而言更加精确。

1.5元数据汇交要求

《基础地理信息数字产品元数据》规定数字栅格地图、数字正射影像图、数字高程模型和数字线划图4种数字产品的文件格式中都必须有元数据文件,但未做具体的汇交要求。《全国测绘地理信息成果目录服务系统元数据规定(试行稿)》结合系统建设要求,明确规定了元数据汇交文件格式、命名和汇交内容。

2目录元数据转换流程

以山东省地理信息资源目录元数据制作为例,设计目录元数据转换流程实现元数据快速转换。

2.1目录元数据模型创建

依据管理对象类型及数据内容规定,创建各类省级地理信息资源数据目录元数据模型,主要包括元数据文件、字段对照表及快视图等信息。其中,元数据文件存储格式采用ESRIShapefile格式,坐标系为CGCS2000坐标系,字段对照表为Excel文件,记录元数据属性字段对应的中英文字段名称等内容。

2.2原始元数据文件汇总

基础测绘成果元数据文件是按标准分幅存储的Excel文件,为方便元数据的批量转换,在对原始元数据文件的数据内容进行分析的基础上,将多个元数据文件实体属性汇总到一个Excel文件,表头为原始元数据文件的属性项名称。

2.3原始元数据检查

为确保转换后的元数据质量符合要求,应确保原始元数据内容的正确性。在进行元数据转换前,对原始元数据文件属性值进行检查修改,检查字段的完整性、必填字段的正确性,排查错填项、漏填项,对不规范的元数据值进行规范化处理。

2.4元数据通用信息赋值

针对元数据信息中的通用信息或固定不变的信息,采用统一赋值的方式进行设置,如同一生产批次DLG元数据的分发单位及链接地址、数据版本、所属项目及整体现势性等共性属性信息,可批量赋值。

2.5字段对应关系配置

字段对应关系主要是设置原始元数据文件的数据项与目录元数据模型的数据项之间的对应关系,获取元数据属性信息表到目录元数据模型的对应关系。

2.6目录元数据转换

实现批量原始元数据文件实体数据到ESRIShapefile格式元数据的批量转换,导入特定类型的目录元数据模型和元数据汇总表,通过字段对应配置文件实现目录元数据的快速转换。转换完成后,按照汇交要求,生成符合命名规范的目录汇交文件。

3设计与实现

以目录元数据转换流程为基础,设计并实现目录元数据转换工具。选用MicrosoftVisualStudio2012为开发工具,C#为开发语言,Excel文件读取选用Excel组件,元数据转换选用GDAL组件,日志记录选用Log4net组件。GDAL是用于读写空间数据的跨平台开源库,现有大部分GIS或者遥感平台都采用了GDAL作为底层构建库。相比ArcEngine二次开发而言,使用GDAL可快速读写矢量数据,无需安装任何软件平台。工具支持控制点数据、矢量地图数据、数字高程模型数据、数字栅格地图数据、影像数据、模拟地形图在内的主要测绘成果类型的目录元数据转换制作,提供原始元数据文件汇总、原始元数据属性检查、元数据属性项赋值、字段对应关系配置和元数据转换制作等功能。本文以矢量地图数据中DLG元数据转换为例,介绍系统功能实现:1)原始元数据文件汇总,实现原始元数据文件的批量添加与属性信息的汇总功能。2)原始元数据属性检查,对关键的元数据属性项及属性值进行检查,主要检查属性值是否填写,填写内容是否在值域范围内等。3)元数据属性项赋值,提供元数据通用信息的统一赋值功能。4)字段对应关系配置,通过加载原始元数据文件与目录元数据模型,以目录元数据属性项为准,对原始元数据属性项进行一一对应,并将字段对应关系保存为配置文件。5)元数据转换制作,针对选定的测绘成果类型,添加原始元数据汇总表、配置文件和目录元数据模型,实现目录元数据的快速转换。

4结语

结合山东省地理信息资源元数据转换工作实践,通过对目前使用的2种元数据的采集标准进行对比分析,设计并实现了目录元数据转换流程,提高了目录元数据制作效率,具有一定的实用性。随着测绘地理信息成果的不断涌现,需要在今后工作中紧密围绕元数据标准不断完善元数据的快速转换功能。

作者:王凤娇 李玉琳 平宗玮 单位:山东省国土测绘院