小议地质学资源整合方法

小议地质学资源整合方法

1煤地质学网络信息的类型

(1)煤地质行业政策法规及技术标准

行业政策法规和技术标准是各种网站的另一类主要信息资源。这部分的资源需要突出专业性和最新性,也就是说,各网站要根据自己的特色领域及时更新该部分的信息。同时,各网站也提供了相关信息的查询服务。这些政策法规和技术标准是以文字和表格的形式表现,通常在后台是用数据库技术进行支撑,有利于网站及信息的维护。

(2)煤地质行业科研数据

煤地质行业科研数据在煤地质网络信息资源占有着很大的比重,其中科研数据主要是以数据库的形式提供,包括科学实验数据、地质勘探数据、实际生产数据。通常每个网站都是以自己现有的资源为基础,建立专题数据库。这些数据库可以提供模糊、精确的信息查询。这些数据一般情况下也是以文字和表格的形式表现,当涉及地形图、地质图时,会采用GIS的相关软件来进行显示,可以做到空间数据和属性数据的充分结合。

(3)煤地质行业学术资源

煤地质行业学术资源具有其他网络信息无法比拟的优势。目前的煤地质行业学术资源按照资源类型来分划分,主要包括:书目信息、电子出版物、会议及学位论文、教育教学信息、导航指南等。这些网络煤地质行业学术资源的信息内容庞杂、数量大,传播范围广、速度快。与传统出版的学术资源相比,具有明显的速度和成本优势,但是用户要求信息的质量高,尤其是查全率和查准率。这些资源的种类很多,因此,这些信息的表现形式也是多种多样的,用户在使用时需要下载相对应的专业软件。

(4)煤地质学网络交流信息

在各类煤地质学相关网站上都建有各种煤地质学领域的论坛,也称BBS。他开辟了一个公共空间供用户浏览、查看其中的信息,这些信息的类型非常多,可以是电子书籍、期刊、演讲稿、课件等等。这些煤地质学网络交流信息尚未被纳入面向社会公众的正式出版渠道,通常被称作“灰色文献”,与传统的交流信息方式相比具有及时性、时代性和世界性。这些信息还具有自由性和动态性,容易导致信息在一定范围内的无序状态。但总的来说网络交流已经成为研究人员获取非正式出版的学术信息的重要来源。

(5)煤地质学其他网络信息

煤地质学网络信息本来就是一个非常广泛的概念,不同的用户所关注的信息的角度是不同的。各类煤地质学网站除了提供上述的信息类型外,还提供了大量的与煤地质学相关的政治、经济、人文以及历史等方面的信息。这些信息具有影响煤地质学科发展的重要因素,因此,也受到广大煤地质学工作者的密切关注。但是这类信息所占的比重不大,并且具有很强的随机性,所以这类信息不是网络资源的重点,也不是研究的重点。

2煤地质学网络信息的数据类型

煤地质学信息的数据类型大体上可分为空间数据类型和非空间数据类型。

2.1空间数据类型包括矢量数据、栅格数据、遥感数据、照片等图像数据

①矢量数据:通过对各种地质专题图的数字化,或是野外地球物理勘探、地球化学勘探得出的数据,例如,储量预算图、综合柱状图、剖面图等。②栅格数据:各种地质专题图用扫描等数字化的方法形成的栅格文件,例如,数字化后的地形地质、水文地质图等。③遥感数据:通常为TM、SPOT等类型的卫星影像和红外、高光谱等航空照片,通过专业软件解释为可以为煤地质学服务的数据,如勘探区的遥感监测图。④照片:包括对对物体宏观和微观的照片,例如,野外采集标本的手标本照片或光学显微镜下的照片。

2.2非空间数据类型主要为文本型数据和数字型数据

①文本数据:包括空间数据的属性信息及各种报告、文档等,例如某地区的地质勘探报告、煤炭资源预测与评价报告等。②数字型数据:主要是指表格数据,涉及工程地质、环境地质、水文地质以及煤质类数据等。

3煤地质学网络信息特点

网络信息是以网络为纽带联结起来的信息资源和以网络为主要存贮、传播、交流方式的信息资源,是通过计算机网络可以利用的各种信息的总和。它具有信息内容的多变性、载体的多元化、数据的半结构化、信息组织的非线性化等特点。煤地质学网络信息除了一般网络信息的基本特点之外,还具有它本身的特点。

(1)煤地质学信息的准确性任何信息都需要具有准确性,对于煤地质学信息来说,更需要强调信息的精确性和准确性。例如勘探区地质剖面图、钻孔数据以及综合柱状图等通常是精确到米;对于地球化学数据,通常需要根据国家标准来确定数据的准确度,其精确度通常比钻孔数据的高;对于煤炭储量数据需要精确计算统计,煤炭类型和各煤矿储量数据要求正确可靠,煤炭的生产计划及国家大的政策法规制定都将以这些信息为依据。

(2)煤地质学信息的空间性煤地质学信息具有很强的空间性,无论勘探数据还是分析数据,都密切与空间位置相关。钻孔资料是在特定的地点得到的数据,煤盆地的基础地质信息也和所处的地球板块相关。所有这些煤地质学的研究都是在一定区域范围内进行的,因此,相应信息的获取、管理、开发等都应该按区域为单位进行,脱离了空间构架,煤地质学信息也就失去了存在的意义。

(3)煤地质学信息的多时态性煤地质学信息的多时态性可以表现在地质体和地质现象产生的时间性、煤田勘探工作的阶段性。地质现象是地质历史进程某一阶段的产物,它的产生需要几十年或几百年为一个周期;煤田勘探工作可以分为普查、详查、精查等几个阶段,通常以年为变化周期。利用地学过程的连续性,结合地质学信息的空间性,可以充分的表达出煤地质学地质过程的内在规律。

(4)煤地质学信息的关联性和复杂性煤地质学信息之间存在很强的关联性和逻辑性。重、磁、电测量资料、地震资料、地球化学勘探资料以及各种钻井资料可以得出各种地层信息、古生物信息、构造信息、岩性信息等,根据这些信息以及遥感信息可以建立起地质体模型,从而解释出煤盆地的形成过程。利用地球化学信息可以进一步得出煤盆地中煤质数据,为煤炭的工业应用提供基础性信息。由于信息应用目的的不同,对信息的需求也不同,不同的应用强调不同的空间对象实体,使得数据呈现很强的复杂性,这就说明,不可能通过同一表达方式满足所有的需求。必须根据数据的特点和用户的需求,按照不同的主题信息进行多重表达。

4煤地质学网络信息资源整合方式

随着信息化进程的加快、网络信息资源数量的急剧增加,需要对网络信息资源进行整合的要求越发强烈。国内外专家学者从不同的角度出发,对“网络信息资源组织”的理解和概念做出了不同的解释,但其本质都是对信息组织是对信息资源对象进行收集、加工、整合、存储,使之有序化、系统化的过程。其目的是为了检索信息、利用信息。对煤地质学网络信息资源的整合就是要根据信息的特点来确定信息的整合方式,以此满足不同用户的需求。从整合方式上来看,可以选用文件方式、数据库方式、学科门户网站方式以及搜索引擎方式。但是,在整合的过程中要充分考虑煤地质学网络信息资源的特点,针对不同类型的煤地质学网络信息,采用能够体现数据特色的资源整合方式,达到既能实现信息的整合又能保持信息的原始性和自身性的目的。目前常用的方式和方法主要包括以下三种。

(1)当信息资源为科学数据时,为了保持数据的可读性、可检索性及可用性,可选择数据库作为该信息资源的整合方式,例如,中国煤炭特性数据库的建立、“地球科学概论”辅助教学图片库系统的开发等。

(2)对于地质信息中特有的地质现象类信息,可选用学科门户网站的整合方式,并以虚拟现实技术作为整合的技术手段,将无序的地质信息及地质现象组织起来并建立彼此之间的联系。当然在对这些信息进行组织时,要从考虑信息的重要性、传递性以及容量大小的角度来考虑,充分体现出该学科门户网站的内容特性。例如,体验式地质教学虚拟平台建设。

(3)对于一般的网络信息,通常选用学科门户网站的整合方式,并以超文本技术作为整合的技术手段,将各种信息素材通过超级链接组织成一个新的信息整体,同时要建立一个良好的导航链接,能够使用户快速在新环境中定位。

用户在使用上述三类整合后数据时,可以使用谷歌、百度等方便、快捷的搜索软件,但是对于专业性搜索来说,还存在很大的弊端,例如对一些常用煤地质学专业词汇进行搜索时,得出的搜索结果量如表1所示。在这些大量的搜索结果中,用户往往很难找到自己想用的信息,究其原因,是因为这些搜索引擎通常不会去考虑这些专业词汇的学名、俗称、同义词、近义词等等,这样就缩小了专业检索的范围;在信息准确性和真实性方面,他们也很难进行保证,这样又盲目扩大了专业检索的范围,增加了用户的工作量。为了避免上述两种情况的出现,在对煤地质学网络信息进行二次整合时,可以在煤地质学领域应用垂直搜索理念和技术,面向该领域的网站,对他们这些网络资源进行抓取、分析、整合,最后针对用户的需求,提供准确而专业的信息搜索服务。

5结语

网络信息资源整合是网络信息资源多样化、信息服务个性化发展的产物,是网络飞速发展的必然趋势。本文从信息总体特点、信息数据类型、信息类型分析了我国煤地质学网络资源的特点,在此基础上,提出了遵循“针对性”原则的整合方式,对不同来源、不同类型的煤地质学信息资源进行整合,在进行二次资源整合时,提出了采用垂直搜索理念和技术,从而有效提高网络信息资源的整体利用效果。

本文作者:郝伟、曹代勇、彭宏钊 单位:防灾科技学院灾害信息工程系、中国矿业大学(北京)煤炭资源与安全开采国家重点实验室、中联煤层气国家工程研究中心有限责任公司