核科学资料机构仓储系统建设

核科学资料机构仓储系统建设

【摘要】论文论述建立核科学资料的机构仓储系统的必要性,阐述基于DSpace构建核科学资料的机构仓储系统的方案,制定了该系统的体系架构和工作流程。该系统能加强科研人员间的学术交流,加速学术研究的进程。

【关键词】机构仓储;DSpace;核学科资料

1引言

随着计算机与网络科学技术的飞速发展,数字化的信息服务已深入社会生活的方方面面,计算机、网络已成为科研人员获取信息的基本手段,便捷的网络电话、平板电脑等已成为科研人员获取信息的有效补充,获取信息的平台也越来越多样,在此大背景之下,越来越多的高校开始注重数字科研信息的整合与共享。

2机构仓储

东华理工大学是一所以核科学与地学为特色的高校,自成立63年来,为国家培养和输送了大量的核能源方面的专业人才。作为东华理工大学重点学科的核科学各专业在发展中,各学院、实验室产生了许多各种各样格式的核科学相关科研资料,但因各学院、实验室之间相互独立,交流较少,而发表后的科学研究成果受版权保护等影响,无法充分共享,这对科学研究产生不利影响。因此,有必要建立一个信息平台供核科学研究人员存储与自己的相关资料和学术成果,该系统要求能够永久保存科研资料同时支持访问者进行检索、查看等功能,这种系统称为机构仓储系统。目前,机构仓储软件主要有DSpace、Fedora、Archimede、Bepress等[1]。

3DSpace系统

3.1DSpace简介

DSpace系统是由麻省理工学院与惠普公司合作开发的一套数字资源存储系统,可以收集存储各种格式的数字资源并进行。该系统是一个开源系统,用户可以根据工作特点和实际需要对该系统进行定制和扩展[2]。该系统在我国使用比较广泛。

3.2DSpace的特点

①开放源代码。DSpace是一个开源软件平台,用户从其官网免费下载后可以自由进行修改与使用。该系统使用的其他软件也是开放的源代码,如PostgreSQL、JDK、Apache等[3]。②支持各种文件类型。DSpace可以管理和保存各种形式的数字对象,包括论文、报告、声频、视频、科学图表、地理信息数据、数学等,方便处理核科学中各种格式的资料。③检索功能比较强大。DSpace的检索和索引通过API接口,允许在指定范围内进行检索、重建索引等,并提供许多检索特色。④界面简洁友好。DSpace用户界面是基于Web的,提供上传、搜索、管理以及审核等界面。⑤用户群多。全球许多机构应用DSpace来进行保存分享作品文件与研究资料,高校图书馆中利用最多是利用DSpace建立各种机构知识库,如清华大学、厦门大学等。⑥使用简便。DSpace系统支持Linux和Windows环境,利用浏览器即可配置管理,使用非常方便。

4基于DSpace构建核科学资料的机构仓储

根据DSpace的上述特点与核科学产生的资料的特殊性,本文基于DSpace建设核科学资料的机构仓储系统,系统采用DSpace的三层体系结构。按照从上而下的顺序这三层依次为应用层、业务层与存储层。上层通过DSpace所提供的应用程序编程接口(API)调用下层,从而实现相关功能。

4.1应用层设计

应用层是系统与用户之间进行交互的层,科研人员可以通过该层上传科研资料,用户可以通过该层实现信息服务。系统所有的功能都是通过应用层与用户实现交互,为用户提供服务。应用层由Web界面、数据导入与导出及统计工具等模块组成:①Web界面。系统采用B/S模式,用户只能通过浏览器对系统进行访问。②数据导入与导出。科研人员不管上传的数字资源是什么格式,都能通过主动文档开放协议来进行转化,转成统一的格式存储于系统中。③统计工具。利用DSpace系统原有统计源码可以实现访问次数、浏览次数、检索词等信息进行统计展示。

4.2业务层设计

业务层主要负责系统用户管理、权限管理、已上传资源管理及其他系统管理等功能。主要功能如下所示:①资源命名。为了实现资源的长期保存与共享,系统通过使用句柄为每个资源条目创建永久的URL,可以保证该资源名称的独一无二性。②工作流管理。指用户开始上传到资源整个过程。每一个工作流包括选择要提交资源归属、提交资源信息与全文、审核员审核等步骤工作流。信息提交功能是本系统的核心功能。本系统增加了外部数据提交和馆间数据提交两种工作流,使得核科学资料的共享方式变得更加灵活多样。外部数据提交者为各学院、实验室在系统中注册的科研工作者,提交员按照系统要求对资料进行著录后将资料提交到工作流中等待审核员审核。若审核员在审核过程中发现资料不完整,如铀矿地质资料文字不完整、地质图缺失、勘查许可证没有复印件等情况时,将资料驳回并附驳回意见供提交者修改。修改后若资料审核合格后进入编辑元数据工作流,最终成为本地仓储的数据条目。馆内数据提交为图书馆信息采集人员将收集的核科学资料直接进行元数据编辑。本系统支持各种格式资料的采集,包括常用的文本格式如doc、txt、pdf等,常见的图片资源格式jpg、png、bmp等和常见的媒体资源格式mp3、wav等。③索引、检索和浏览。系统利用DSpace系统的API可以按照不同的分类创建索引,利用免费的Lucene可以实现对字段、全文检索的支持。④用户、用户组与授权、认证。DSpace系统原有的注册方式允许任意用户注册,不符合核科学资料管理的安全性要求。因此,将系统原有的注册方式改为审核注册,只有认证审核过的用户才能使用系统。本系统采用分级权限,由权限分配模块完成。普通用户仅能浏览、搜索和下载本系统中保存的数字资料;科研工作者,除浏览等权限外,还有上传资源的权限;质量审核工作人员,具有审核上传数字资源的能力;超级管理员具有全部操作与管理的权限。

4.3存储层设计

存储层管理后台数据库,组织管理存储数据资源,是系统的基础支持层。本系统采用关系型数据库管理系统PostgreSQL作为后台存储库。PostgreSQL是一款开源数据库管理软件,可以利用SQL语言实现数据的插入、查询及修改等操作。系统存储的数据资源则包括科研人员上传的数字资源、各模块的工作流、用户个人信息、检索的索引信息等。

5结语

核科学资料的机构仓储系统是在DSpace系统基础之上进行二次开发,针对东华理工大学具体情况和核科学资料特点,对该系统的功能进行了扩展和优化。该系统能实现对东华理工大学各学院、教研室及实验室在科研中产出的学术论文、图表、地理信息数据、实验数据等资料的长期储存,并以此构建同行科研人员之间进行资源共享与学术交流,促进东华理工大学科研成果的传播,提高科研人员学术知名度,为进一步提高东华理工大学核科学特色办学提供积极探索的一步。

【参考文献】

【1】孙坦,陶俊.2002-2009年国外机构仓储评价研究述评[J].图书馆建设,2010(4):6-9.

【2】邵伟.基于DSpace的文献仓储系统的设计与实现[D].成都:电子科技大学,2013.

【3】都平平,蔡莉娴,等.开放源码软件及开源软件DSpace在图书馆的应用[J].现代情报,2009(3):150-158. 

作者:危志明 单位:东华理工大学图书馆