标签技术在高校文档知识管理中的应用

2022-09-21 16:20:57 来源:写作指导

标签技术在高校文档知识管理中的应用

摘要:该文介绍了文档知识管理和标签技术背景,分析了高校文档知识管理的现实需求和应用难点,结合文档知识管理和标签技术的应用现状,从个人应用和学校应用两个角度阐述了高校文档知识管理中应用标签技术的具体思路,研究了标签体系设计、平台一体化设计等关键问题和解决思路,提出了“云平台+终端应用”的架构设计思路。

关键词:标签;文档管理;知识管理;高校

高校作为国家人才培养和科学研究的重要基地,是典型的知识密集型组织,无论从个人还是学校各级组织,每天都要处理大量的文档,分类复杂、搜索不便、协作共享困难等问题成为高校文档知识管理的核心问题。标签技术提供了便捷有效的文档知识组织与管理手段,利用标签技术提高学校文档知识管理水平对提升师生的学习效率以及学校的管理与工作效率具有很强的现实意义。

1相关技术概述

1.1文档知识管理

知识管理(KnowledgeManagement,KM)是涉及人、知识管理技术和组织的一种管理思想与方法,组织可以通过知识管理实现知识创新,提高竞争力[1]。知识管理包括显性知识管理和隐性知识管理。知识管理系统是知识管理的技术手段和核心工具,实现知识的创造、存储、转移和应用。文档知识管理属于显性知识管理,主要管理用户自己创建或经常使用的文档资料,如Word文档和PDF等各种格式的文档[2]。文档知识管理是知识管理的重要组成部分,以文档为核心,实现文档的科学高效的组织、归档、分类、检索与查阅。目前,语义、人工智能、数据挖掘等新技术逐渐应用到文档知识管理系统建设中。

1.2标签技术

标签(也成标注)是指用户自定义标签,即用户使用自定义的标签词语对网络或系统中的资源进行标注、管理[3]。这里的用户可以是资源的管理者,也可以是资源的使用者。标签技术本质上是一种分类法,通过群体自发的标注行为对资源进行分类也称为社会标注系统或协同标注系统。随着Web2.0的发展,标签技术广泛应用于博客、知乎、豆瓣等应用,通过对资源使用相关性关键字标注,有助于资源的描述和分类,便于检索和分享。在不同的应用场景中,标签的过程可分为人工标注和自动标注两大类,人工标注是用户手工确定关键字对资源进行标注;自动标注则是采用自动识别或语义分析等技术对目标资源进行标注。传统的社会标注系统一般采用用户人工标注方式,标签采用扁平化结构来组织,标签之间无语义或语用关系,这种无结构标签集在一些应用场景中也带来难以维护、价值降低、检索效率较低等问题。

2高校文档知识管理的需求分析

2.1个人文档知识管理

多维度的文档分类需求。随着电子化办公的不断普及和发展,高校师生越来越依赖计算机开展日常学习、工作和科研,产生大量办公文档、课件、作业、论文、科研报告等电子文档,并日积月累不断增加,文档的分类存放变得越来越复杂。不少用户甚至习惯性堆放信息,即将文档堆积在计算机桌面或某个临时目录,管理和使用都很混乱;有经验一点的用户采用树状多级目录结构来管理文档,还有的采用时间顺序目录结构来管理,无论是树状结构还是时间顺序结构,都无法很好地解决文档的多维度交叉分类问题,比如“2018年工作总结”文档,业务属性上它应属于树状目录中的工作总结子目录,可时间上它又属于2018年目录,除非复制两份,否则我们无法将其同时归属到两个维度的目录结构中来管理。文档快速查找定位需求。在计算机中查找文档是每个人日常使用的高频操作,传统的查找方式包括根据自己的记忆和经验逐级展开树形目录,找到相应的文件;或者基于目录名、文件名、文件后缀进行搜索,这些查找定位方式要么操作复杂、要么不够精确,查找效率较低,而且无法解决多维度综合查找的需求。

2.2学校文档知识管理

学校文档知识管理属于组织内的文档管理,如职能部门、学院的内部文档管理,或者全校层面的某类文档管理,如档案、教学课件等。学校文档知识管理其定位是服务于学校层面、部门层面及全体师生,和个人文档知识管理的需求相比,学校文档知识管理具有集中存储、文档量大、管理要求严谨等特点。除了常规的多维度分类、查找定位以外,还有文档知识库管理、更复杂更严谨的标签分类体系、存档与分享、智能搜索、知识挖掘等需求。另外,高校存在大量信息化系统,例如OA系统、档案管理系统、图书资源系统、网络教学系统等,这些系统也产生大量文档,如何将这些文档纳入到学校文档知识管理,实现集成的、统一的、标签化管理,成为高校文档知识管理一个很棘手的特色需求。

3标签在高校文档知识管理中的应用思路

3.1个人文档管理中的标签应用

高校个人文档管理的目标群体主要包括老师、学生和各类工作人员,传统的基于资源管理器的文档管理无法满足多维分类、便捷查找的需求。标签化管理可以很好地解决这些问题,在面向个人文档知识管理中应用标签技术时,需要考虑如下功能定位。(1)层级标签体系。支持多层级(树形结构)的标签体系,标签之间可以建立层级语义关系。(2)多维度标注。支持对文件或目录的多维度标签描述,对一个文档使用多个标签,将同一标签应用到不同文档。(3)自动标注。除了手工标注外,支持基于文档的基本属性进行自动标注,通过分析文件名、文件类型、时间甚至文档内容自动打标签。(4)综合搜索。支持多维度标签组合搜索,支持标签间的继承关系,提供合并、排除等复杂搜索规则。(5)标签备份和导入。可将文档的所有标签数据导出备份或恢复。(6)可替代资源管理器。在工具中能够提供文件和目录的基础管理功能,如创建、复制、粘贴、移动、删除等,从而替代资源管理器。目前面向个人文档知识管理的工具软件主要有Tabbles、TagLyst、TagSpaces等,有的工具只能运行在Windows系统中,有的支持Windows、OSX、Linux等跨平台使用。从功能上来看,这些工具基本可以满足高校师生基于标签的个人文档管理,但无法同时满足学校组织层面的文档管理应用,从统一平台、集成共享的角度需要通过定制开发来实现。

3.2学校文档管理中的标签应用

(1)基于标签的高校图书馆个性化知识服务。高校图书馆提供图书、电子图书、论文等大量文档和知识资源,传统的图书管理与服务信息系统使用的是传统的资源分类方式,用户参与度不高。可以在现有图书信息系统中的知识组织、信息检索、知识服务等功能中扩展标签服务,提升图书资源的个性化知识服务。建立用户可参与的图书资源自主标签机制,用户根据自己的理解,对图书资源进行个性化标注,形成用户自主创建的扁平化标签集,和图书资源已有的层次化主题分类体系相结合,提供基于标签云的一种新的资源检索和定位服务。对用户创建的标签进行关联挖掘,还可以找出资源之间的隐性关联以及用户的隐性需求[3]。根据用户在图书信息系统中的资源浏览、借阅等访问行为,自动给用户添加标签,建立系统自动标注的用户画像标签集,为基于智能推荐算法的个性化服务提供基础。(2)电子档案标签服务。随着信息化技术的应用,高校档案管理逐渐进入电子化发展阶段,除了纸质档案外,各类Office文档、电子图片、视频、纸质档案扫描件等电子文档成为高校档案管理的重要资源。通过在档案信息系统中应用标签技术,可以扩展电子档案的分类方式,提供多维度的档案分类组织,实现便捷的电子档案检索和关联性查找。由于档案管理是一项非常严谨的业务工作,和图书资源的标签技术应用不同,档案的标签不能采用开放式的社会标注系统,用户自发的标注关键词随意性大、描述准确性和严谨度不高,容易衍生出标签集混乱等问题。因此,管理员标注方式是档案管理标签技术的首选,应用树形结构化标签体系比扁平化标签体系要更适合这一场景,当然,适当通过自动标注方式提供一些基础性标签服务,可以降低管理员手工标注的工作量。(3)文档知识库标签服务。高校日常教学、管理、科研活动中会产生大量电子文档,如教学活动中的课件、教学视频、讲义、作业、实习报告、课程设计、毕业论文;管理工作中的日常办公文档(收文、发文、工作计划、工作总结、规章制度、办事流程、新闻稿、工作报告、会议纪要)、项目文档(可行性研究报告、立项书、专家评审书、招投标文件、项目验收报告)、年鉴、大事记、发展规划、党建工作文档、工作照片、视频;科研活动中的项目申报、中期检查、结项验收、研究资料、研究成果、学术报告等。这些文档具有个人文档和组织(部门或学校)文档双重特征,通过学校、部门分级应用或教学、科研等业务条线应用,组成了高校内部的重要文档知识库。在高校文档知识库的管理中引入标签技术很有必要,通过个人标注、官方标注相结合,实现文档知识库的多层级、多维度分类和高效检索,而且随着文档的积累,针对海量级的文档利用NLP等技术进行特征挖掘并自动标签标注,找出文档的隐性关联,实现文档价值的进一步提升。

3.3关键问题和解决思路

3.3.1标签体系设计

标签体系设计是高校文档知识管理中的重要基础,需要设计一套科学合理、运行有效的标签管理体系来适应个人文档管理、学校文档管理等不同应用场景。标签体系设计可以采取受控标签和非受控标签相结合的方式,受控标签是学校官方提供的,符合国家有关标准的标签,结构严谨,不完全开放维护;非受控标签是用户自定义的标签,全体用户范围内开放性维护;如档案管理应用中应以受控标签为主,用户自定义标签为辅,个人文档管理则可以使用用户自定义标签为主,受控标签为辅。标签管理可以采取标签云和标签树结合,用户自定义标签主要采用扁平化标签云结构,管理简单,维护方便;受控标签主要采用层次结构的标签树,逻辑清晰,管理严谨。在标签标注方式上,应采取自动标注和人工标注相结合,研究人工智能技术的融合应用。

3.3.2平台化一体化设计

高校文档知识管理应作为一个整体来规划和设计,采用统一平台、整合共享、个性应用的理念,融合个人文档知识管理和学校文档知识管理的需求,实现一体化文档存储、管理、分享、归档和个性化服务。在平台架构上是一个“云平台+终端应用”的结构,云平台实现文档的云端存储、应用部署、服务接入、交换共享、标签体系管理等功能,终端应用是根据个人文档管理、学校文档管理的特殊场景需求设计的桌面程序、手机APP等,和日常学习、工作中的电脑使用、手机使用深度结合,提供便捷的文档本地化加载、管理、上传下载、文档标注等功能。平台一体化设计中还有一个关键点是和学校各类资源、信息系统的集成、对接和共享,建立和教学平台、图书馆系统、OA系统、档案系统、科研系统等各类信息系统的接口对接,各系统中产生的文档直接可以进入文档管理云平台,打通文档的产生、标注、上云、下载、分享、检索等应用的全过程。

4结语

标签技术为高校文档知识管理提供了新的组织管理方式,是提升高校文档知识管理水平的有效技术手段。标签技术目前在高校领域的应用还处于发展初期阶段,具有广泛的应用前景。高校文档知识管理需充分考虑个人和学校的双重需求和不同应用场景的适用性。应用受控标签和非受控标签相结合、标签云和标签树相结合、自动标注和人工标注相结合的设计理念,采用“云平台+终端应用”的一体化设计架构可以更好地解决高校文档知识管理中的难点问题。

参考文献

[1]嵇娟,牛芳,翟丹妮.知识管理系统的研究综述[J].改革与开放,2018(10):113-114.

[2]王赟芝,黄玉婧.科研用户个人知识管理工具采纳影响因素研究[J].图书馆学研究,2018(18):91-98.

[3]曹娟.标签在高校图书馆中的应用研究与启示——以中山大学图书馆和剑桥大学图书馆为例[J].图书馆学研究,2016(12):8-13.

作者:王雁军 黄儒乐 单位:北京林业大学信息中心