期刊被引时间因子研究

期刊被引时间因子研究

学术期刊作为知识媒介推动知识的传播与交流[1],高质量的期刊通常刊载对应研究领域具有权威影响力的论文[2]。对学术期刊的影响力进行科学评价,有利于提升期刊质量,促进期刊长远发展[3]。因此,科研人员不断探寻期刊评价的新方法,其中,借用网页之间的引用关系以确定网页重要性的PageR鄄ank[4]是科学评价期刊较受欢迎的方法。PageRank算法最早由美国斯坦福大学研究生Page和Brin所提出[4],其核心思想是根据网页链接到其他网页和其他网页链接到本网页的引用关系来计算网页的得分,并且根据分值进行排序[5]。网页链接与期刊引用之间具有极高的相似性,科研人员将传统的PageRank算法引入期刊评价能够解决影响因子只考虑被引数量而不考虑被引质量的缺点[6],如苏成等人利用传统的PageR鄄ank算法从排除自引和不排除自引两个角度计算Pag鄄eRank值来评价期刊影响力[7]。后来经过科研人员的不断改进,产生了一系列改进的PageRank期刊评价方法,如Cheang等人通过区分引文类型的方法对PageR鄄ank算法进行改进,实现相同学科期刊的横向评估[8];Yu等人提出一种基于PageRank多链接互相强化的期刊排名模型,该方法不仅考虑引文的数量和质量,而且同时考虑了论文、作者、期刊之间的相互强化关系[9];Yan和Ding将引文、作者等因素融入PageRank算法,提出P-Rank算法用于异构网络中的期刊评价[10]。国内也有不少学者改进PageRank算法来评价期刊,如喻依等人利用PageRank算法和HITS算法分别计算期刊的PageRank值、权威值和中心值,探讨三种值在期刊评价中的优缺点[11];苏成等人构建能消除创刊时长和期刊载文量差异的优化PageRank算法,并探讨了该算法的特性、优缺点和适用范围[12];刘珍提出基于随机约化算法改进的PageRank算法,将期刊之间的互引关系和引用次数结合,同时兼顾期刊之间不同的引用权重,来评价期刊影响力[13]。多数PageRank改进算法在期刊评价中已取得了不错的效果,本文拟在PageRank算法的基础上,用期刊被引网络中的相对h指数对期刊被引次数加权,结合时间异质性因子,构建评价期刊影响力的新指标———CTIF-PR因子。该因子能综合期刊的引文数量、引文质量、载文时间异质性等期刊影响力因素,使期刊影响力评价更加科学、合理。

1基于PageRank算法的期刊影响力评价模型

1.1期刊影响力

PageRank算法简介将期刊之中的相互引用关系替换网页之间相互引用关系[11],建立期刊之间的互引网络矩阵,以此方法计算各期刊的PageRank值(下文用PR值代替)。

1.2修正影响因子

影响因子(一般为两年IF)已成为国际和国内评价期刊的重要指标[14]。传统的影响因子计算方法如公式(2)。针对以上不足,本文在影响因子的基础上,提出了一种新的修正影响因子,即在公式(2)中载文量P不变而将被引次数C的引文年限扩展为包含统计年度在内的前两年及后两年,其目的是更科学地统计期刊载文年论文的被引数量。

1.3引入加权计算的时间影响因子

俞立平根据传统影响因子时效性差、隐含权重不合理等问题[15],提出了2年时间影响因子,时间影响因子能够根据载文时间的差别对期刊被引数量和载文量进行赋权,使影响因子计算更为科学。在修正引文年限的影响因子基础上,结合时间影响因子计算方法,得出改进的时间影响因子,如公式(3)。

1.4建立期刊被引网络

期刊的被引质量是评价期刊影响力的关键因素,不同期刊的引用价值不同,代表不同的被引质量。期刊h指数是指该期刊所发表的全部论文中最多有h篇论文至少被引用了h次[16]。本文利用李超提出的相对h指数[17]表征引用期刊的质量,首先,建期刊被引网络,如果期刊j被i1,i2,i3…in期刊引用,那么每个引用期刊j的相对h指数在被引网络中表示为公式(4)。。

1.5期刊影响力

CTIF-PR算法将PageRank算法用于期刊被引网络,结合公式(1)、公式(5),得出改进的PageRank新算法,即CTIF-PR算法,见公式(6)。由于PR值的结果和CTIF计算的结果数量级相差较大,我们对期刊的PR值进行了归一化处理。

2实证研究

2.1数据来源及处理

本文数据来自中国知网CNKI数据库,在CNKI数据库下载图书情报领域的61种期刊论文,检索时间为2015年1月-2016年12月,去除单年载文量少于30篇的期刊,最终选取44种图书情报领域期刊(《大学图书馆学报》《国家图书馆学刊》《情报杂志》《情报理论与实践》《图书与情报》《中国图书馆学报》等)。为方便表述与计算,给44种期刊编号。下载统计44种期刊2015年、2016年两年内载文的被引数据,被引年限区间设为2015年1月至2019年10月,排除期刊自引后,根据公式(7)建立期刊间的互引矩阵:淤根据44种期刊2016年的被引关系建立期刊互引矩阵,如表2所示(部分);于根据44种期刊2015年和2016年两年的被引关系建立期刊互引矩阵,如表3所示(部分)。利用公式(6)计算44种期刊的CTIF-PR值,为对比分析,同时利用传统的PageRank算法计算44种期刊的PR值。CTIF-PR值排名与PR值排名结果如表4所示(部分)。

2.2结果分析

2.2.1PR值与CTIF-PR值评价结果的排名与对比分析

从表4可以看出,PR值排在前五位的期刊为《图书情报工作》《农业图书情报学刊》《图书馆学刊》《新世纪图书馆》《图书馆研究与工作》,这些期刊是在2015年和2016年与其他期刊互引关系最密切的期刊,上述期刊2015年、2016年的载文不仅被其他多个期刊引用,而且也在后续发表的文章中引用了其他多个期刊的论文。《中国图书馆学报》《图书情报知识》《图书与情报》等这几个优秀期刊的PR值并不高。究其原因在于:淤大部分期刊载文量高。由于每个期刊载文量较大,且都同属于一个学科大类下,所以期刊之间的互引关系差别并不明显,因而PR值的差值并不大。于个别优秀期刊引文量低,被引量高。如《中国图书馆学报》作为图书情报领域的优秀期刊,虽被其他多种期刊引用,但因其引用其他同领域非核心期刊论文较少,导致其评价效果并不理想。CTIF-PR值排名与PR值排名相比,上升变化大于20名的期刊有《中国图书馆学报》《大学图书馆学报》《图书情报知识》《图书与情报》《图书馆杂志》《情报学报》,究其原因主要有三点:淤载文量低,被引量高,典型的例子是《中国图书馆学报》《图书情报知识》以及《大学图书馆学报》,这三种期刊2015年和2016年的载文量非常低,公式(6)时间影响因子CTIFj的表达式[见公式(5)]中,载文量P在分母中,显然P值越小,CTIF-PR值越高。于载文量高,被引量高,典型代表是《图书馆杂志》和《图书与情报》,这两种期刊的被引量极高,且在该期刊的互被引网络中被h指数高的期刊引用次数也非常多,因此,这两种期刊的排名上升。盂载文量低,被引率高,如《情报学报》,该期刊PR值较低的原因是,该期刊主要刊载情报学中新算法及实践应用的文献,很少涉及图书馆学领域概念,导致与偏向图书馆学研究方向的期刊没有引用关系,所以其PR值低,但加入CTIF因子后,其被引期刊都是被引次数大,h指数高的期刊,因此该期刊上升名次较多。下降变化大于20次的期刊有《图书馆学刊》《图书馆研究与工作》《农业图书情报学刊》《河南图书馆学刊》。其原因有两点:淤载文量过高,《图书馆学刊》《农业图书情报学刊》《河南图书馆学刊》三种期刊都因其2015年、2016年的载文量都为800篇左右,相比于其他期刊的载文量高很多,导致CTIF值低,因此下降的幅度大。于被引量过低,《图书馆研究与工作》期刊2015年、2016年的载文被其他期引用次数仅为136次,且136次引文是较为平均的分布于其他期刊,其在未来几年的载文也较多地引用了其他期刊2015年和2016年的载文,导致其PR值排名高。但136次的引文量相比其他期刊的引文量要低得多,公式(6)时间影响因子CTIFj的表达式[见公式(5)]中,引文量C在分子中,显然C值越小,CTIF-PR值越低。

2.2.2CTIF-PR与影响因子的敏感性对比

为说明CTIF-PR因子的评价效果,绘制44种期刊的CTIF-PR值与各期刊对应的影响因子(2017年)排名变化图。从图1可知,CTIF-PR因子与影响因子总体上的排名趋势具有相似性,如在影响因子排名处于第一、第三位的《中国图书馆学报》(R)和《图书情报知识》(M)两种期刊,在CTIF-PR排名中仍然处于第一、第三位;在影响因子排名处于后面几名的期刊,如《当代图书馆》(AI)、《贵图学苑》(AK)、《科技文献信息管理》(AO)、《图书情报论坛》(AM)等其排名变化名次仅为一或保持不变。但是就各期刊而言,也有一定的差异,如情报学领域期刊《情报杂志》(E)、《数据分析与知识发现》(G)、《中华医学图书情报杂志》(T),这三种期刊的CTIF-PR排名较影响因子排名有较大的降低,而图书馆学领域期刊《图书馆建设》(H)、《新世纪图书馆》(W)、《晋图学刊》(AG)的CTIF-PR排名较影响因子排名有较大的升高。从CTIF-PR与影响因子排名变化中可以发现,大部分图书馆学领域的期刊排名都有所上升,大部分情报学领域的期刊排名都有所下降。由此可推测:2015年1月至2019年10月间,图书情报学领域的期刊载文中引用2015年1月至2016年12月间图书馆学领域的载文较多,而引用相同时间段内的情报学领域的载文较少。

2.2.3CTIF-PR与影响因子的相关性分析

对44种期刊的CTIF-PR值与影响因子进行Spearman相关性分析。从表5可知CTIF-PR因子与影响因子(2017年)的相关性系数为0.882,具有高度相关性。二者相关性高的原因在于,CTIF-PR因子是在影响因子的基础上进行改进,扩展了期刊的被引年限使载文充分达到引用峰值,并且融入期刊引文链接关系、载文时间异质性、期刊质量等因素计算而来的,同时也说明了CTIF-PR因子的合理性。

2.2.4CTIF-PR与影响因子的区分度分析

利用变异系数(C)进一步分析44种期刊CTIF-PR与影响因子区分程度。变异系数是衡量一组数据中各观测值变异程度的统计量[19],具体计算公式表示为(7)。

3结语

本文在PageRank算法的基础上,提出一种融入被引时间因子的期刊评价因子———CTIF-PR因子。从因子的设计原理上看,CTIF-PR因子对期刊影响力的评价更全面,主要表现在:淤该因子对传统影响因子引文年限进行扩展,能保证被评价期刊的载文年论文达到引用峰值;于在引文链接基础上,突出被评价期刊本学科领域内互引关系,综合期刊被引质量、被引数量、载文时间异质性等多种期刊影响力因素,使评价结果更加科学;盂在一个期刊的被引网络中通过利用相对h指数对期刊的引用质量进行加权,能够区别不同期刊对研究期刊的贡献度;榆融入时间异质性计算加权时间影响因子,能综合不同期刊的引用数量和期刊自身载文量,且具有较强的时效性。从因子的评价效果看,对图书情报领域44种期刊的评价结果显示,核心期刊排列在前,非核心期刊排列在后,且在期刊评价中比影响因子具有较好的时效性、更高的敏感性和区分度。因此说,CTIF-PR因子能够科学、合理地评价期刊的影响力。本研究仍有不足之处,如期刊的引用是发表晚的论文引用发表早的论文,本文在建立引文网络时,只从被引关系的角度考虑待研究期刊两年载文的被引期刊,而没有考虑期刊两年载文所引证的期刊。后续研究中,我们将考虑从期刊引证关系建立互引网络,以进一步提高期刊影响力评价的科学性和合理性。另外,本文仅以图书情报学期刊为例分析CTIF-PR因子的应用效果,在他学科领域的期刊评价中是否有效尚需做进一步研究。