高校图书馆利用关联数据的意义

高校图书馆利用关联数据的意义

 

1背景   2006年,TimBerners-Lee提出“linkedDate”的概念,其原理是用一种轻型的、可利用分布数据集及其自主内容格式、基于标准的知识表示与检索协议、可逐步扩展的机制来实现可动态关联的知识对象网络,并支持在此基础上的知识组织和知识发现。[1]自关联数据出现以来,便得到了快速发展和业界的追捧,BBC、纽约时报与路透社等机构纷纷加入到了关联数据的出版行列。那么什么是关联数据?维基百科中定义:关联数据是语义网的主题之一,描述了通过可链接的URI方式来、分享与连接Web中各类资源的方法。[2]关联数据用来和联接各类数据、信息和知识,通过对大千世界万事万物及其相互之间关系进行机器可读的描述,使互联网进化为一个富含语义的、互联互通的知识海洋,从而使任何人都能够借助整个互联网的计算设施和运算能力,在更大范围内,准确、高效、可靠地查找、分享和利用这些相互关联的信息和知识。它是互联网发展到语义网时代、提供对任何网上资源和数字对象进行“编目”和“规范控制”的基础性技术,是数字图书馆进行信息资源和服务的核心技术之一。[3]高校图书馆作为信息资源最重要的存储地之一,必然要利用关联数据来提升自己的服务。   2高校图书馆利用关联数据的意义   2.1进一步加强数据资源整合   随着信息技术的不断发展,高校图书馆需要不断丰富和拓展自己的服务方式和服务手段,需要帮助用户实现资源发现的内在相关性和快捷性,以提高服务质量及用户的满意度。国外的一些图书馆常常通过实施资源发现服务来扩展其目录检索界面,浏览动态更新的结果,展示更多的馆藏信息。关联数据可以为扩展高校图书馆的书目信息提供结构化的数据基础,为用户提供新的知识访问服务;关联数据也可以让图书馆关联到更广泛的信息资源,不仅可以帮助用户判断是否是所需要的图书、期刊资源,还可以帮助用户获取图书馆以外的信息。高校图书馆还可以将自己的资源为关联数据,使用户再链接返回到图书馆。这就需要图书馆不断整合各类已有的数据资源,提供高质量的资源让用户访问,而且高校图书馆要加强与档案馆、博物馆等相关机构之间的沟通交流合作,加强数据资源的交换和再利用,并主动进行数据之间的整合与开发利用,然后提供给用户使用。如中国民航大学同波音公司合作,由波音公司提供设备并安装调试,建成了除美国本土之外高校第一个在线系统,即MyBoeingFleet,简称MBF;还和空客公司合作开发了Airbus?World系统,这两个特藏资源的建成,在教师同学中广受欢迎,且每每有国内外的重要客人来访,校领导总要陪同参观,据不完全统计,2009年就接待参观二十余批次,还作为一些民航特色专业课的第二课堂。[4]如果民航大学图书馆把这个特色馆藏数据成关联数据,就可以大大提高利用率,增加用户的回头率,提高图书馆的知名度。   2.2进一步加强教科研的交流   高校图书馆最主要的功能之一就是保障学校的教科研活动正常开展,随着高等学校越来越重视科研及学术交流活动的日益频繁,高校图书馆也越来越多地参与教科研过程中不同阶段的活动。例如,图书馆馆员帮助研究者发现他们研究成果的引文影响力;同样,图书馆员也开发和利用机构仓储系统来帮助机构保存、管理和再利用那些已经出版的和没有出版的研究资料。目前,已经有一些机构仓储软件开始支持语义服务和关联数据,通过为仓储内的资源提供统一的标识以及资源之间的关系,实现对语义数据的存储和语义服务。[5]在教科研活动中,用户更关注的是各类数据的准确性及研究成果被引和再利用的情况,或者希望通过研究出版物找到第一手资料、更多相关的数据信息、共享教科研活动的数据及发现更多对类似主题感兴趣的作者。而关联数据正是解决了这一问题,它通过HTTP/URI机制,帮助用户直接获得数字对象,发现更多的相关信息以及他们如何得到资助的信息并允许用户下载原始的研究数据。   2.3进一步扩展图书馆平台   关联数据不但减轻了Web网络中整合分布式异构数据源的复杂性,同时也推动了图书馆对关联数据的新应用。关联数据对于图书馆在Web上书目数据和规范数据具有重要意义,与网络时代的图书情报工作关系非常密切,是互联网发展到语义网时代,对网上资源和数字对象进行“编目”和“规范控制”的基础性技术,是图书馆进行信息资源和建设的核心技术之一。[6]鉴于高校图书馆长期积累的数据优势,可以增强与外部世界的联系,增强及扩展图书馆的知识发现平台,不断提高图书馆的服务水平。同时可以集思广益,充分挖掘现有图书馆领域的相关专业知识,如元数据模型、元数据模式、标准和协议等,重新定义需求、编制指南、开发新标准,鼓励图书馆界将它们的各类数据和规范档以关联数据的形式到互联网上,提高图书馆数据在万维网上最重要的语义数据提供者,并探索和寻求与其他相关领域的数据和应用进行协同的可能性。[7]因此,我国高校图书馆应当尽早重视关联数据这一技术,及早投入一定的资源和人力进行研究开发和应用推广,使图书馆大量的权威数据在互联网上占一席之地并为广大用户提供更准确的数据。   2.4提升社会服务能力   当前,增强社会服务功能,参与经济社会发展是高等教育的重要历史使命。总书记在庆祝清华大学建校100周年大会上强调指出:全面提高高等教育质量,必须大力服务经济社会发展,自觉参与推动战略性新兴产业加快发展,自觉参与推动区域协调发展,自觉参与推动学习型社会建设,为社会提供形式多样的教育服务。[8]关联数据是以公开的WEB形式存在的,这就可以满足互联网数据共享的需求。在关联数据云图中,有许多关联资源可以作为图书馆的资源库和知识库,可以利用云图中的关联开放数据进行图书馆资源的扩展用关联,为用户提供更丰富且更有意义的检索结果。[9]这样,高校图书馆可以为用户提供高质量知识资源访问,提供其他机构资源的相关链接并扩大知识源的使用范围,从而不断扩展关联数据,增强自身价值的同时提升社会服务能力。#p#分页标题#e#   2.5加强利用与再利用   目前,关联数据所涉及的数据类型和学科领域迅速扩展,从早期的地理信息、生命科学数据和百科词条等,发展到目前涉及媒体、出版、政府信息和图形图像等,几乎无所不包,2007年5月开放关联数据(LOD)云图中仅有的12个开放数据集,增长到2011年9月的295个开放数据集,其中包含310多亿个RDF三元组,5亿多个关联链接。[10]数据就是为了更好的利用与再利用,关联数据可以把高校图书馆的资源和外部世界相互连接起来,也可以实现一次写入、反复使用,可以在更广阔的范围内开放扩展服务,如扩展目录检索界面、展示馆藏信息与浏览更新结果等,可以在同一个系统内部或全国范围内都可以提供快速利用与再利用,这样,高校图书馆可以不断增强自身的社会价值。   3高校图书馆利用关联数据的注意事项   3.1改善用户界面,提高交互性能   服务是图书馆永恒的主题,而如何让自己的服务使用户满意是图书馆人不停的追求,图书馆人对用户界面清晰友好,交互性能强也有着较高的要求和标准。从用户的角度看,关联数据的最大好处是可以提供多个分布式异构数据源的整合关联的访问。关联数据浏览器允许不同的用户在不同数据源之间进行浏览,不过目前在关联数据的导航和检索结果显示方面还不尽人意,需要进一步完善[11]。例如,关联数据浏览器的导航控制应该为用户提供实体之间的前进和后退功能,关联数据浏览器需要从传统以文件为中心转向以实体为中心的浏览视图,改变为用户提供应用服务的角度和焦点。另外,用户不仅需要查看实体之间的链接,还需要方便地分析图书馆的数据源。因此,高校图书馆利用关联数据时应注意改善用户界面,提高交互性能。   3.2有效解决无效链接   知识组织整理方法是图书馆学最富有生命力和动态性的领域之一。[12]在关联数据总量呈几何级数增长的今天,如何维护关联数据之间的联系,有效解决无效链接问题,需要对关联数据进行定期清理和维护,在新数据加入时,要及时对原有数据进行更新并给出正确的相关链接。当前,关联数据的网络Web体系结构允许死链接的存在,但过多的死链接无疑将使客户端发出大量的无效HTTP请求,从而降低使用效率。[13]因此,高校图书馆应该充分发挥自己的强项,充分保证数据源的有效性及可利用性。   3.3注意保护隐私   当前,公众对保护自身隐私越来越关注。关联数据的最终目的就是将不同来源的数据整合到一起,这就为侵犯隐私提供了机会。目前,要解决这个问题还有待于公众增强自我隐私保护意识,还需要通过技术和法律相结合的手段来加强信息的甄别,从而使公众放心大胆的使用新技术,也使提供服务的高校图书馆在隐私侵权方面做到零风险。