关联数据高校知识管理论文

关联数据高校知识管理论文

1关联数据

1.1关联数据内涵

关联数据是一种数据和关联的方法,其中数据是指采用RDF(ResourceDescriptionFramework,资源描述框架)和HTTP(HypertextTransferProtocol,超文本传输协议)技术在Web上结构化信息;数据关联是指采用RDF链接技术在不同数据之间建立计算机可理解的互联关系。关联数据由WWW(WorldWideWeb,万维网)的发明人TimBerners-Lee于2006年提出。作为一种全新的语义工具,关联数据支持SPARQL(SimpleProtocolandRDFQueryLanguage,RDF查询和数据获取协议)语言的检索。关联数据强调建立已有信息的语义标注和实现数据之间的关联,具有框架简洁、标准化、自助化、去中心化、低成本的特点,是一种轻量级的语义网解决方案,为构建人机理解的数据网络提供了根本性的保证。

1.2关联数据构建基本原理

在构建和实现关联数据过程中所要遵循的基本原则可以归纳为以下4点:一是以URI作为所有事物的标志名称;二是保证所有人都能通过HTTPURI访问这些标志;三是访问者在访问某个具体标志时,可以获取相关信息;四是尽可能保证提供的URI具有相关的性质,以此保障访问者可以了解更多的信息。关联数据的应用原理可以描述为:在标准化的数据资源表示、检索协议基础上,利用自主格式及分布式数据集等手段,逐步实现知识网络中对信息资源、知识对象的动态关联,并能够进一步实现对知识资源的组织及对知识资源的发现。所以说,关联数据不仅对知识资源的发现有重要作用,还积极地影响到知识的组织过程。

2高校知识资源的分布特征

知识资源指可以反复利用的、建立在知识基础之上的、可以给社会带来财富增长的一类资源的总称,它是个人和组织“记忆”的综合,不但存在于文件、资料、计算机程序和档案之中,还存在于人们头脑、实践以及规范之中。随着国家创新体系的重构,高校在国家创新体系中所发挥的创新动力源和创新主体地位不断得到加强,使得高校在知识转移、科研创新过程中产生并积聚了大量宝贵的知识资源。与此同时,高校作为社会创新大系统中的一个开放子系统,在与外界持续的交互过程之中需要不断地输入知识、情报以维持自身的序性。概括起来高校知识资源有以下几点分布特征。

2.1知识资源数量庞大且类型复杂

以2012年为例,高校R&D项目(课题)经费内部支出达到467亿元,发表科技论文1062512篇、出版科技著作38101种、专利申请授权数达到37490件,较2011年均有大幅增加。除此以外,高校在教学、科研过程中还产生了大量的教学课件、科学数据、调研报告、学位论文等非正式公开出版的灰色文献资源,其不但是对白色文献资源的有力补充,而且其蕴含的知识内容往往更为直接、具体,具有极大的科学研究价值。除了各种异构的文献、多媒体、实物知识资源外,高校师生在长期的学习、教学、科研实践中所形成的方法技巧、经验、心得体会等隐性知识更是高校最为重要的知识资本,是其核心竞争力的重要载体。除了高校原生知识资源,网页、学科论坛、OA仓储、SNS网络、博客、微博等新兴知识分享传播平台上同样存在着大量异构的对高校教学科研具有极大价值的外生知识资源。

2.2围绕学科分布及“中心化”聚类

高校学科建设内容及其战略发展规划引导甚至支配着高校人、财、物的配置,使其围绕高校的学科建设情况、科研能力、研究课题进行多层次、多渠道、最优化的配置。高校资源配置的学科导向性决定了高校知识资源的生产、传播、共享与创新总是在高校学科建设规划的范畴内开展,知识资源围绕高校所建学科分布。在同一学科范围内,高校知识资源按其知识内涵具有明显的“中心化”类聚特征,围绕众多中心点进行学科知识资源的聚类,各中心点可以是课程、学习任务、研究方向、科研课题乃至单个的学者。

2.3知识资源之间关联性和持续性强

科学技术分支化和综合化趋势的加强,高校相对固定的学科建设体系以及师资、物质资源的配置使得高校知识资源之间关联性、持续性较强。这种关联性、持续性对知识资源的发现、共享及挖掘利用具有极大的参考价值,能有效促进知识资源的使用与转化。高校知识资源之间的关联性与持续性可以外显为所属学科分支、科研团队、科研项目、个体在知识空间、时序、组织结构等不同维度上的各种关联。如同一科研团队在一定时期所产出的知识资源成果一定是关联持续的,团队个体所产出成果与团队集体成果也可能是关联的,同一个团体在一定时期内所主持的不同科研项目所产出知识成果也是关联的。

2.4隐性知识的广泛性

高校作为传道授业解惑的场所,以国家科研创新的重要组织主体在其长期的社会功能发挥过程中积聚了大量的重要的隐性知识,这种经验、窍门、方法、技巧等内隐性知识广泛存在于高校教师及学生的主体认知空间之中,并在高校教学研过程中发挥着重要乃至关键性的作用。当前高校隐性知识的传播共享以课堂传授、课余交流、学术交流、学术研讨会等面对面的交流为主,其传播共享渠道的单一性以及缺乏对其有效的挖掘整理序化,在很大程度上制约了高校隐性知识的传播与共享,造成了隐性知识资源的浪费。

3基于关联数据的高校知识管理体系构建

新的信息环境下,高校知识管理体系的重点是对不同学科、异质、异构的显性及隐性知识进行组织、重组、聚合、关联,形成以资源为节点、资源之间关系为连线的知识资源的动态资源链接视图,并在此基础上构建基于高校师生信息需求特征的知识挖掘、知识传播与共享以及知识服务子体系。基于高校知识资源特点,本文构建了一个适应新信息环境特点的基于关联数据的高校知识管理体系模型。

3.1知识存储层

高校在其教学、科研过程中,在其内部沉淀了大量异构的内生及外生知识资源,资源以其不同的载体形态分布存储于不同的节点之上。高校知识资源主要由文献型知识资源,包括学术期刊、论著、调研报告、教学课件、讲义等,各类自建或购买数据库,图书馆OPAC系统,网络资源以及存在于师生认知空间中的隐性知识构成,知识资源或资源库位于框架的最底层。

3.2知识过滤与挖掘层

由于知识数量的剧增,造成了知识检索与使用事实上的困境,知识过滤与挖掘就是从大量知识集中识别出有效的、新颖的、潜在有用的知识资源。当前各高校学科知识过滤与挖掘主要由图书馆学科馆员负责,其知识过滤与挖掘方法、标准主要基于学科知识馆员自身认知水平及知识结构,使得知识过滤与挖掘的质量存在一定的缺陷。新信息环境下高校知识过滤与挖掘应具备科学性与开放性特征,通过引入一系列新的知识挖掘过滤技术,如协同过滤、关联规则等,提升知识过滤与挖掘的智能化、科学化与个性化程度。开放性包括主体的开放性与客体的开放性两方面,主体开放性指知识过滤与挖掘的参与主体不限于图书馆等传统知识服务组织,而构造一个师生广泛参与的开放的信息资源推荐、过滤与挖掘体系,使得知识资源的过滤与挖掘结果更具权威性与知识性,客体开放性指知识过滤挖掘对象客体不仅包含各类异构显性知识资源,还应包含师生隐性知识的过滤与挖掘。

3.3基于关联数据的知识地图绘制

知识地图是一种帮助使用者找到知识的导航系统和知识管理工具,是一种显性的、形象化的知识关系网络,能够直观地展示知识存储地、知识人、知识间的关系。通过构建高校知识资源的知识地图实现对高校信息环境中各类异构知识资源,包括显性、隐性知识资源以及资源之间的关系进行揭示、整合。利用关联数据对过滤与挖掘所产生的有价值知识资源提供统一规范的元数据描述与表达,并提供一体化的元数据管理与服务的框架。各个节点即具体的知识单元,节点之间的连线用来表示各知识单元之间的聚合、关联、继承等关系。通过对知识资源的特征提取及内容分析确定知识单元组成,根据知识单元之间的共引、共现等关系,确定知识单元之间的关联关系。底层各类型元数据建立到知识图表层中知识单元的映射关系,从而构建一个基于知识图表的知识资源关联网络,揭示出异构显性知识资源以及存在于师生认知空间中的隐性知识资源所蕴含的知识内涵,实现显性及隐性知识资源在概念、语义上的整合。

3.4知识组织

按高校知识资源分散集中的特点,将知识地图中的知识单元按学科领域、研究方向、课题、任务实践等具体应用领域进行不同粒度的划分聚类,实现知识资源以应用为导向、以用户信息需求为中心的组织与配置。各具体应用领域基于底层知识地图、知识单元之间的关联而产生联系,通过引入时间坐标,还可以描绘出学科领域、科研实践行为的发展脉络,预测其发展趋势。

3.5知识服务

根据著名的知识螺旋(SECI)模型,知识创造的过程就是一个知识社会化、外化、组合、内化等4个过程的不断联结、循环,使得个人知识扩展到组织的整体知识,同时促成新知识的产生。知识服务层基于底层高校知识的序化组织,推动高校显性及隐性知识的社会化、外化、组合及内化过程的发生,并将新产生知识资源回馈到知识存储层以构建一个动态循环的汇聚个人及组织智慧的信息环境。知识服务层主要由知识检索、学科知识服务、知识社区等子系统组成,知识检索子系统基于底层知识应用环境,提供结合知识应用语境并满足用户信息需求的知识浏览、检索接口。学科知识服务是由高校信息服务机构提供的基于分析和基于知识资源内容的参考咨询服务和用户培训服务,学科知识服务通常以学科馆员为纽带,通过网络、电话、到院系、到课题组等方式将高校所积聚的知识资源传播转移到底层用户应用环境之中,其具体服务模式包括定题服务、情报调研服务、信息素养培训服务等。知识社区则是在高校中构建一个开放、面向具体学科应用环境的以知识发现、传播、共享、挖掘与创新为目标的知识交流、共享与创新平台,围绕知识单元或应用任务,对显性知识、隐性知识、信息技术与人进行有效整合。知识服务层在其服务功能实现的过程中,需要不断地对固有知识进行序化、整理,促进知识的高效传播与共享,在其过程中会不断发现、产生新的知识,新知识将以文献、条目等形式回馈至知识存储层以数据库、专家库文献等形式进行保存。

4结语

本文对关联数据内涵及其基本原理进行了介绍,通过引入基于关联数据的知识地图并以其为工具对高校所积聚的显性与隐形知识资源进行基于学科知识主题的记录与整合,以学科知识主题及其相互关联关系为核心构建了一个知识的存取、共享、挖掘与回馈子体系,实现不同形式、不同层次、不同学科知识基于知识语义的关联与集成,并在此基础上构建一个语义关联的知识应用环境,从而形成一个以学科知识为导向的动态、开放的知识生态体系,实现高校知识管理能效的有效提升。

作者:董坤 单位:中南民族大学图书馆