高校期刊需求可视化分析方法

高校期刊需求可视化分析方法

1引言

随着信息技术的发展,专业期刊越来越多,价格也不断升高,高校不可能通过购买全部期刊资料满足所有读者的文献需求。即使将高校所有相关学科的文献全部购买,也存在因学科发展不平衡而导致相当部分文献利用率不高、资源浪费的现象。因此,高校在购买期刊时能够做到有针对性,用有限的经费最大限度地满足大多数老师和学生对期刊的需求,是高校图书馆文献资源建设的重要任务。完成这一任务的关键点在于准确地掌握师生的需求。高校图书馆主要是通过深入院系访谈师生收集信息,或是通过问卷调查法,或是通过调查学校学科设置等方法来确定读者的期刊需求。但这些调查方法不能很好地发挥资源建设人员的主动积极性,调查结果很容易受到调查对象主观性和随意性的影响,很难做到全面精准地掌握读者期刊需求情况,导致图书馆的文献资源建设存在较大的偏差。如何为高校对期刊种类需求分析以及期刊订阅提供量化依据,是目前高校图书馆文献资源建设急需解决的问题。一所高校所有学科团队时所引用的文献,可以反映该高校对文献资源的需求情况。近年来,国内外许多学者采用引文计量分析方法定量评估读者对期刊的需求。隋桂玲等通过引入期刊使用率和保障质量的概念,将吉林大学哲学专业教师所选期刊和论文中引用期刊排序,定量描述期刊在该专业中的被需求程度和学术价值,以指导图书馆的期刊资源建设。李海霞等以哈尔滨工程大学船舶工程学院教师发表的论文引文为统计源,采用引文分析法,从引文数量、引文类型、引文语种、引文年代以及高引期刊等进行统计分析,揭示期刊馆藏资源建设中存在的问题,提出合理配置期刊资源、优化馆藏期刊结构、改进传统服务方式等措施有助于提高馆藏期刊资源保障率,满足教师对期刊资源的需求。王兆勇等对南京陆军指挥学院2004—2011年内容为公开的43篇博士学位论文的引文数量、引文年代、引文语种、引文类型等方面进行分析,并对图书馆文献资源建设提出参考建议。焦坤等以相关学科科研人员发表的SCI收录论文为研究对象,利用引文分析法从资源性质、期刊数量、被引频次三方面分析外文资源对SCI收录期刊论文的引文资源保障情况。李东升以福建工程学院发表的外文论文为研究对象,采用引文分析法对引文及其载文期刊分布、学科分布等进行文献计量分析,对馆藏外文期刊资源保障能力进行评估,有效地反映了高校的外文期刊需求情况。Alves等对巴西圣卡塔琳娜联邦大学2012年提交的博士论文中文献的出版年份和引用模式进行研究,研究方法被应用到改善图书馆的工作流程,不断优化该图书馆的馆藏发展政策。Riahinia分析了2003—2008年伊朗5所大学的图书馆和信息科学学位论文的引文行为,以指导高校图书馆对图书和电子资源购买的决策。上述研究表明虽然通过引文计量分析可以为图书馆的期刊需求进行定量化研究,但很难做到实时、动态化分析与研究,很难实现特定期刊实现高校学科建设的精确评价。近年来,美国德雷赛尔大学计算机与情报学陈超美教授开发的信息可视化软件CiteSpace专门针对文献的共引进行分析,挖掘文本空间的知识聚类和分布,并可以显现文献的动态应用情况,为期刊资源在学科建设中的实际贡献提供更为精确的定量化分析。本文利用信息可视化分析软件CiteSpaceV对某高校2006—2016年所发表的外文核心期刊论文的引文进行可视化分析,获得该高校学者所引用期刊的来源分布及年度变化趋势等科学数据,为高校图书馆调查了解读者期刊需求工作提供一种新的方法,为图书馆的文献资源建设改革提供新思路。

2数据来源和处理

在WebofScience核心合集的SCI-E数据库中,以某高校的英文名为检索词,使用“地址”与“机构扩展名”两个限制字段,检索2006—2016年内出版的学术论文。选取检索结果中文献类型为Article和Review的记录导出,形成该高校SCI收录学术论文数据集。利用CiteSpaceV软件对所检索到的学术论文数据集进行可视化处理。相关功能参数设置如下:时间区间为2006年—2016年,时间切片为1年;阈值选择TOPN,N=100,即每个时间切片内提取前100条数据;节点选择引用期刊(CiteJournal)。

3基于被引频次的期刊需求分析

作者引用文献受多种因素影响,但最主要的因素为该文献对作者的研究起到支撑作用。期刊的被引频次可用来反映作者对期刊的需求程度。某高校发文作者对期刊引用次数越大,说明其对该期刊需求程度越高。使用CiteSpaceV对数据进行期刊引用分析,结果以知识图谱的方式呈现,如图1所示。图1中节点的大小表示期刊被引频次,节点越大被引频次越高,节点越小被引频次越低;标识的节点为被引频次前5%的期刊节点。表1列出被引频次前5%的23种期刊信息。图1中其他期刊被引频次信息可以通过“Export”菜单中的“NetSummaryTable”命令导出查看。经统计,被该校SCI收录论文所引用2次以上(含2次)的期刊有457种,总被引频次为12785次。每种刊的平均被引频次约28次,被引频次在28次以上(含28次)的期刊共有121种。被引频次在400次以上的期刊仅1种,被引频次在300—399次之间的有3种期刊,被引频次在200—299次之间的有4种期刊,被引频次在100—199次之间的有23种期刊,被引频次在50—99次之间的有53种期刊,被引频次为3次的有60种期刊,被引频次为2次的有104种期刊。高校图书馆资源建设的经费是有限的。在订购期刊时,期刊的性价比分析至关重要。图2显示了某高校被引频次与被引期刊数量的变化曲线图,被引频次越多的期刊,其数量越少,大多数期刊的被引频次比较少。在图书馆期刊资源建设时,购买被引频次高的期刊,性价比相对较高。原因有二,一是期刊利用率高,二是期刊数量少,购买所需的经费也较少。相反地,由于被引期刊大多数都集中在低被引的部分,期刊被引次数较低,利用率不高,而期刊数量相对较多,购买时需要花更多的经费,性价比偏低。性价比高的期刊应该优先订购。高校在遴选订购期刊时,阈值选择非常关键。一般地,被引频次-被引期刊数量曲线存在着拐点,这个拐点可以作为该高校的订购期刊时阈值选择的依据。图2所显示的某高校被引频次-被引期刊曲线的拐点在10—20之间,该高校可以依据自身的经费情况选择阈值。被引频次大于阈值的期刊在该高校的性价比较高,应该积极建设,而被引频次低于该阈值的期刊在该高校的性价比较低,在经费不充裕的情况下可以暂时不订购。

4基于被引频次年度变化的期刊需求分析

4.1通过突发性检测掌握期刊的需求变化

高校对期刊的被引频次是动态变化的,这种动态变化情况也可以指导高校更加精准地遴选订购期刊。在CiteSpace可视化分析软件中,可以对某高校对期刊引用的突发性进行检测。对期刊引用的突发性是指某高校对该期刊的被引频次在某一年度突然发生较为剧烈的变化。利用CiteSpace可视化分析软件的突发性检测(Burstdetection)功能,可以获得近11年来被引频次急骤变化的期刊情况。表2列出了某高校被列期刊的突发性。在表中最后一列中,粗线代表具有突发性的年份。细线表示没有发生突发性的年份。某高校对期刊的突发强度越大,说明该高校对该期刊的被引频次变化较大。通过突发性强度可以估计到某高校对该期刊的需求程度。

4.2通过被引频次年度变化精准把握期刊需求

通过突发性检测可以获取期刊引用的突发性所发生的年份,但在该年度的需求是否增长还需要结合高校对某期刊的引用年度变化情况进行分析。如图3所示,在CiteSpace可视化知识图谱中可以快速地查询到指定期刊的引用年度变化情况,其中粗线部分为具有突发性的年度变化。从该图可以更为方便地观测到高校对期刊引用的年度变化趋势。有些期刊在11年内的被引频次较高,但这些被引大多数集中在前些年,而近年来被引次数较少,说明近年来该高校对这些期刊的需求在不断降低。同时,有些期刊的总体被引次数较低,但在最近年的被引次数急骤升高,说明该高校对这些期刊的需求在不断增强,在期刊资源建设时应该将这些期刊纳入订购的范围。图4显示了某高校对3本期刊的引用年度变化情况,可以看到,该高校对期刊JPHYSCHEMC的引用有逐渐增长的趋势,具有这种增长趋势的期刊应该优先纳入订购目录。对于期刊JLESS-COMMONMET,该高校对其的引用全部发生在前几年,而2012年以后的年份引用次数全部为0,像这种期刊虽然总体被引频次较高,但该高校对其需求程度是偏低的。而对于期刊NATPHOTONICS,引用全部发生在2015年和2016年,而且呈上升趋势,虽然该期刊的总被引频次不高,但该高校对其的需求急骤增长,也应该优先列入期刊订购目录。

5基于中介中心性的交叉学科期刊资源需求分析

期刊的性价比不但可以从引用频次上来考查,还可以从受众面上来体现。从基于期刊共被引分析的CiteSpace知识图谱网络中,可以读出一种期刊与其他期刊的共现情况。笔者认为共现的期刊越多,受众面就广;共现的期刊越少,受众面就小。在CiteSpace中,使用中介中心性(BetweennessCentrality)这个指标来发现和衡量节点在网络中的重要性,具有高中介中心性的节点通常是网络中的关键点或转折点。图5中带有清晰外圈轮廓的节点,是具有高的中介中心性的节点,即它们在连接其他节点或者几个不同的聚类上发挥着重要作用。高中介中心性节点代表的期刊,即是某高校引用的期刊网络中的重要期刊。即使引用频次不高,但有可能是关联着多个学科领域、受众面广的基础期刊或包含交叉学科的期刊。如SUPERLATTICEMICROST和JPHYSESCIINSTRUM两本期刊被某高校的引用频次均为5次,如果仅根据被引频次确定订购期刊目录,此二本期刊很难列入订购期刊目录。但由于其学科的覆盖面较广,需求面较宽,也应该订购。所以根据期刊的中介中心性可以遴选出那些被引频次较小但学科需求面较宽的期刊。

6结语

本文以某高校在2006—2016年被WebofScience核心合集收录论文的引文为研究对象,运用信息可视化软件CiteSpaceV进行统计和分析,生成的相关知识图谱展示了该高校引用的期刊及其突发性、引用年度变化和中介中心性。并结合期刊引用频次及动态变化和学科覆盖面,探索了一套高校期刊需求分析方法,为高校在订购期刊时遴选订购期刊目录提供参考。得出以下结论:(1)利用对被引频次与被引期刊数量曲线的拐点信息,可以为高校遴选出性价比高的期刊;(2)通过对期刊11年期间被引频次的突发性和动态变化情况可以精确地把握期刊的需求情况,可以提高高校订购期刊的精准性;(3)利用期刊的中介中心性可以遴选出那些被引频次较低但学科覆盖面宽的期刊。本文方法不仅可以为核心外文期刊资源的建设提供参考,而且还可利用CNKI和SCPOUS等数据库导出的数据进行可视化分析,为高校图书馆对其他文献信息资源建设全面调研提供参考数据。