地市级图书馆网络资源的采集与整理

地市级图书馆网络资源的采集与整理

【摘要】随着网络技术的发展,信息的采集和整理等工作已成为数字图书馆建设发展的重要方面。怎样利用信息技术的优势加速传统图书馆的转型升级,是当前地市级图书馆临着的重要课题和必经之路。

【关键词】地市级图书馆;网络资源;采集;整理

随着互联网的高速发展,人类社会进入信息化时代,传统的服务方式和信息获取渠道发生了深刻变化,用户在享受电子文献带来的便利的同时,又常常为冗余、无效的信息所羁绊。而面对庞大离散的信息流,如何高效采集信息,并通过自动化技术对信息进行筛选和判别,是当前各类电子资源服务机构的重要责任,更是加速实体图书馆向数字化图书馆转型的重要环节。相对于国家馆及各大省级馆,地市级图书馆基于同样肩负文化共享及数字图书馆建设使命,对于信息的采集、资源的整合利用、软件建设等方面面临更紧迫的任务。

一、地市级资源采集与整理面临的问题

当前,传统图书馆的发展与网络技术的日新月异未相吻合,相反,多数地市级图书馆自动化系统还处于比较低的水平。主要还是以手工采集、组织。手工采集是指图书馆工作人员在浏览过程中,发现所需要的信息后,手工下载保存。该方式检准率高,但效率低下,不能满足信息时效的要求,面对互联网中变化无常的海量信息,图书馆信息内容收集员不得不频繁地登录各大网站利用搜索引擎进行信息资料的发现、跟踪与下载等人为操作。普及利用成熟的商业化软件还欠缺条件。如清华同方KSpider网络信息资源采集系统等,这些商业化软件的优点是技术成熟、操作方便、功能完善,大型图书馆采用的较多,但这类软件价格昂贵,中、小型图书馆由于经费限制难以承受,同时中、小型图书馆对自动采集的功能要求比较单一,因为对于地市级图书馆受用性不大。不以本馆实际出发。诸多地市级馆都尝试购买如万方、超星等学术性较强的数据库,以此丰富自己的数字资源,而忽略对于本地所需求或具有本地特色的网络资源采集和数字资源的构建,或者购买的商业电子资源具有重复性。利用率不高。

二、图书资源采集与整理的规则

网络信息资源的采集和整理是一项系统工作,需要充分运用现代信息技术,并与政府、新闻出版、教育、科技、图书馆等多个部门间进行大规模合作,才能顺利完成。而在实际操作中,必须考虑到多个问题:

(一)需求分析。需要哪些资源作为主要信息流,哪些作为馆藏补充,哪些需要重点关注,挖掘资源背后的数据,哪些只需要作为现有的扩展,直接引用一次。

(二)资源分类。结合各种网上资源的比重、数量、质量、存取方便程度、可靠性、更新周期、使用成本等特点,从中提取中可用于采集、整理、、共享的资源。

(三)资源整合。将采集到的资源以何种形式组织、管理、呈现,为读者提供什么样式的展示界面。(四)资源保密。主要包括馆藏数据安全、文献管理集成系统运行安全和运行环境的安全。馆藏数据安全主要指馆藏数据信息的安全保密和完整准确,即数据信息不被泄露、修改、丢失或破坏;文献管理集成系统运行安全主要指系统不被非法或越权使用、不被破坏及泄露读者个人信息等方面。

三、地级市进行资源高效采集与整理的手段

为实现与传统图书馆相类似的信息服务功能,又要提高读者获取信息的能力和便捷程度,建立信息服务平台需要依托电子技术、通信技术及计算机科学中的一些先进技术,如数据库技术、网络技术、数字多媒体处理技术、智能检索技术等等,来实现互联网资源的采集、整合、处理、转换、流通等功能。

(一)充分利用开放式储存资源及免费资源。开放式储存资源提倡“作者付费出版,读者免费使用”。它使图书馆获得大量丰富的免费集中整理完善的信息资源,缓解了经费困难问题。如:香港科技大学科研成果仓储、清华大学图书馆的《推荐学术站点》、国家科技图书文献中心搜索的《免费电子》期刊数据库等较专业性的导航、免费检索和全文链接服务的Socolar开放式平台。一些互联网专门搜集期刊的网站如电子杂志联盟、号称全球最大的电子杂志平台ZCOM电子杂志等,这些都是免费注册就可以阅读的。

(二)搭建资源采集与整理平台。借鉴国际先进、成熟和可扩充的图书馆自动化采集系统,并辅以汉化等开发工作,建成真正实现Web界面和C/S体系结构的软件平台,使用信息检索协议连接国内国际标准信息检索应用系统,并加入读者线上交流、资源共享、信息上传下载、文献服务地图等功能,建成共享平台体系。同时,提供采集整理设备的良好物理环境,充分考虑到人员进出、附近电力设备干扰等情况,采取一定的防尘、防静电、恒温、稳压措施,减少系统故障发生。引入先进信息检索技术。如利用Web数据自动采集方式检索、抓取、匹配,校验、匹配等操作,迅速提取符合需求的信息,并摘录保留。将所有获得的信息资源按照固定的记录格式存储组织,再通过中介搜索、关键字动态调整、数据库重组压缩等技术形成待搜索数据元。这是较为便捷有效的方法之一。

(三)建立完善特色馆藏数据库。分层次、按类别为读者制作专业期刊目录并存档备查,特别对网络信息中的有本地相关学科或专题下载,转化为二次文献、三次文献印刷型产品再提供给读者,在此基础上逐步建立起独具特色的馆藏数据库。对采集来的信息进行分类,按行业专题来分类,按行业专题来编辑软件,建立本地区数据库,以方便用户和读者检索、使用。同时,定期清理维护数据库。对已不具有使用价值和保存价值,流通极低的电子资源和数据作及时清理,将可能仍有潜在历史价值的电子资源转为光电数据备份,已成废物的予以清除。

(四)建立共享机制,争取上级资源。将物理馆藏与虚拟馆藏相结合,原始文献与加工文献相匹配,打造精品资源。地市级图书馆应主动打破行业分割,与周边科研、高效、党政机关等部门数据资源库相融合,建立统一布局、统一规范、统一接口的综合数据体,实现远程登录、及时查询、集中整理的功能。积极申请省级馆、国家馆浏览权限的开放。

(五)重视标准化、规范化。标准化的数据库系统不仅保证其可靠性、系统性和兼容性,而且有利于实现真正意义上的网络资源共享。可主要分为两大点:一是数据加工处理标准化,二是数字资源描述语言和标引语言规范化,三是系统基本技术规范化。

四、完善周边配套措施

(一)强化图书馆队伍建设。一方面要优化人才资源的配置,向社会招聘或有计划地引进图书情报专业和计算机人才充实到图书馆队伍;另一方面,加强对现有工作人员的专业继续教育,像包括服务意识、知识结构、专业技能等方面进行培训,建立激励机制及奖惩制度,激发从业人员的积极性和创造性。

(二)网络数据收集整理的最终目的是服务读者,做好本馆数字资源的宣传是当务之急。许多图书馆只重视资源的采集整理、建设维护,但忽略了宣传和推送,积极争取读者参与和支持。要帮助读者尽快熟悉、掌握检索技巧,提高信息利用水平,提出良好建议。要持续地对现有读者、未来可发展读者、一般短暂的信息需求者进行培训,使他们具备利用图书馆、网络获取信息和过滤甄别信息的能力,补充基本的图书情报、专业知识,提升组织信息资源的协调能力,引导其争做资源采集的“情报中介人”或“信息导航员”。总之,地市级图书馆对网络资源的采集和整理在技术层面级和制度层面都还存在很多需要探索和完善的地方,本文主要提出一定的思路供修正。

【参考文献】

[1]陈天文.网络Web信息资源自动采集入库的实现[J].图书馆学刊,2010(10).

[2]金雪梅.网络信息的采集和组织策略[J].科技文献信息管理,2004(3).

[3]黄建辉.公共图书馆数字资源建设方略[J].数字与缩微影像,2011(3).

[4]杭仁满.信息时代互联网给图书馆带来的变化[J].中国校外教育.

作者:贺晨风 单位:重庆市北碚图书馆