科技期刊网站功能与内容建设

科技期刊网站功能与内容建设

2015年,中国知网的《中国学术期刊影响因子年报》中,首次了学术期刊影响力指数CI,它是一个复合指标,将总被引频次和影响因子结合起来进行期刊评价,后引起了业内广泛的讨论。对学术期刊影响力指数的原理进行深度分析,并结合具体的期刊评价进行实证研究,有助于改进学术期刊影响力指数CI,丰富科技评价理论与实践。将总被引频次和影响因子相结合来进行期刊评价,影响最大和最早的应该是CSSCI期刊评价,它是将这两个评价指标进行标准化处理后进行加权汇总,总被引频次的权重是0.2,影响因子的权重是0.8,方法简捷。关于学术期刊影响力指数(CI)的研究,由于该指标推出时间还不长,总体上讨论不多。杨浦[1]认为CI有引导期刊向指标优化组合方向发展的作用,认为在选取指标时,除了考虑指标自身的重要性,还要兼顾指标之间的独立性;处理指标时,除了进行归一化处理,还要加入修正因子以平衡指标提升难度的公平性;设定引导方向时,除了考虑数学上的合理性,更要符合期刊发展规律。丁筠[2]以图书情报领域19种核心期刊为研究对象,对CI指数与22种传统期刊计量指标的相关性进行分析,得到与之显著相关的15个指标,经主成分分析消除这15个指标间的相关性后,将其用作BP神经网络预测模型的输入向量,对CI值进行预测,结果显示了较高的预测精度。从现有研究看,关于CI指数的研究总体不多,研究视角也相对单一。本文在分析CI指数原理的基础上,分析其中存在的不足,并提出改进建议,最后以中国知网图书情报学期刊为例加以实证和分析。

1学术期刊影响力指数CI的原理

1)期刊影响力排序空间。将需要评价的同一学科学术期刊评价指标总被引频次(TC)、影响因子(IF)标准化处理为tc、if,将其散点图映射到一个二维空间,CNKI称为“期刊影响力排序空间”。

2)期刊影响力等位线。定义影响力最大的期刊为(1,1),各期刊与其距离为。显然,R越小,说明期刊与极大值的差距越小,期刊影响力越大。期刊影响力相等点连成的线即为期刊影响力等位线,是一段圆弧。

3)期刊影响力指数CI。期刊影响力指数(AcademicJournalCloutIndex,CI),是根据期刊统计年度总被引频次(TC)和影响因子(IF)综合计算所得。学术期刊影响力指数示意图如图1所示,其理论极大值为2,理论极小值为0。此外,为了防止单纯为了追求总被引频次(TC),盲目扩大发文量而降低学术质量,从而影响CI计算的公正性,中国知网提出量效指数(JMI)。对学术期刊进行JMI由大到小排序,取排名前5%且可被引文献量大于平均可被引文献量的期刊作为需要修正CI的期刊名单,对这些期刊的TC所占权重进行修正,CI中的TC和IF的权重比例为1?1,被调整期刊的TC权重根据JMI大小分别降低至0.2~0.05。

2学术期刊影响力指数CI的不足之处

1)评价指标权重大小不合理。顾名思义,《中国学术期刊影响因子年报》是每年一次的,为什么每年一次呢?这是因为期刊论文和引文每年是不断变化的,每年一次,可以反映期刊论文和引文的变化特点,综合反映期刊影响力情况,但是这种变化对于总被引频次和影响因子有本质区别。根据总被引频次的定义,该指标是期刊创刊以来的所有论文在统计年度的被引次数,对于连续的两个评估年度而言,来源文献变化是很小的,比如《情报学报》1982年创刊,2015年计算总被引频次时,来源文献为1982—2015年期间34年发表的所有论文,2016年计算总被引频次时,来源文献为1982—2016年期间35年发表的所有论文,来源文献变化量是很小的,大致增加了1/34。采用总被引频次进行评价,其实评价更侧重期刊历史存量。再看影响因子,相比总被引频次而言,其来源文献会变化较大。继续以《情报学报》为例,2015年的影响因子,其来源文献是2013—2014两年;2016年的影响因子,其来源文献是2014—2015两年,这样两年的影响因子,其来源文献有一半是相同的,一半是新的,变化率大致为50%。采用影响因子进行评价,更注重期刊的年度流量。总被引频次评价更侧重于期刊历史影响力评价,而影响因子更侧重期刊近期影响力评价,两者有本质不同。俞立平[3]认为在进行期刊评价时,评价指标的时间轴并不统一。俞立平、孙建红[4]认为总被引频次是一个存量指标,和影响因子等流量指标结合使用时一定要慎重。既然影响因子年报是每年,那么应该更关注学术期刊近期影响力的变化,这样影响因子的权重就应该高一些,而总被引频次的权重就应该低一些。但实际上,CI计算时默认总被引篇频次与影响因子权重相等,不经意间违背了评价的初衷。

2)归一化方法导致数据分布偏倚。为了说明这个问题,本文以2016年《中国学术期刊影响因子年报》[5]中的图书馆、情报学期刊的相关数据加以说明。2016年年报中,图书馆、情报学期刊共43种,根据公式(3)、公式(4)标准化后,影响因子与总被引频次的散点图如图2所示,由于数据分布偏倚,更多的点位于正方形的右下角,也就是说,总评价中,总被引频次相对较高的期刊将取得较好的得分,大多数期刊均是如此。

3)CI调整系数k的确定并不严谨。为了防止片面追求总被引频次,盲目扩大发文量而降低学术质量的情况,CI计算提出了根据期刊量效指数(JMI)排序,降低总被引频次权重k的计算方法,降低幅度为0.05~0.2。但如何确定k值大小并没有一个规范的计算公式,这种做法本身并不严谨,要么是统一系数,根据不同学科、不同类型期刊情况调整权重系数k本身值得商榷。CI作为一种计算期刊影响力的复合指数,不宜确定k值有太多定性的成分。在计算CI时应该追求计算公式的简捷性,不宜在一个公式中附加一些其他条件。

4)部分评价结果与现实相差较大。2016年年报中,图书馆、情报学期刊排在前几位的期刊分别是《中国图书馆学报》《图书情报工作》《情报杂志》《情报理论与实践》《情报科学》《大学图书馆学报》,其基本数据如表1所示。由表1可见,《中国图书馆学报》排在第一,但《大学图书馆学报》仅仅排在第6位,该期刊是图书馆、情报学的重要期刊,再仔细研究数据就会发现,总被引频次较高的期刊具有优势,《大学图书馆学报》由于总被引频次最低,尽管影响因子排在第2位,但总体排序结果并不理想。

3学术期刊影响力指数CI的修正

1)修正评价指标的权重。根据前文分析,CI对于总被引频次和影响因子几乎是等权重的,只不过对部分期刊采用k值进行计算调整,适当降低了总被引频次的权重。但是等权重处理客观上使得每年来源文献信息更新量很小的总被引频次权重偏大,总被引频次更多是存量性质的指标,影响因子才是流量性质的指标,年报应该更多反映期刊近年来的信息,因此在评价时,总被引频次与影响因子不能等权重处理,借鉴南京大学中国社会科学研究评价中心的做法,将总被引频次的权重设为0.2,影响因子的权重设定为0.8。

2)修正归一化处理方法。由于总被引频次的数据分布更加离散,极大值与极小值之间相差很大,导致采用公式(4)标准化后,数据分布严重偏倚,客观上又变相增加了总被引频次的权重。为了降低这种现象,借鉴回归分析中处理异方差的方法,首先将总被引频次与影响因子取对数,然后再进行归一化处理。当然,对于影响因子也采用同样的方法进行归一化处理:这样经过归一化后,总被引频次与影响因子的散点图如图3所示。与图2相比,新的归一化方法使得数据分布更加均匀,降低了数据偏倚程度。

3)舍弃权重调整系数k。既然权重调整系数的确定有待试算,降低了CI指数计算的科学性,因此干脆将其舍弃。

4新CI指数计算结果分析

4.1修正CI指数评价结果

采用修正的CI指数,重新进行计算,结果如表2所示。排在前几位的期刊分别是《中国图书馆学报》《大学图书馆学报》《图书情报工作》等,对比修正前将《大学图书馆学报》排到第6位,要合理很多。需要说明的是,《情报学报》之所以靠后,是由于CNKI并没有该期刊的论文数据,无法下载,导致作者引用较少。无论是CI指数排序,还是修正CI指数排序,图书情报类前18位期刊与CSSCI图书馆、情报与文献学前18位期刊均相同,从这个角度,CI指数、修正CI指数具有较高的可信度,但修正CI指数对前几位期刊的排序更合理,效果更好。

4.2修正CI指数与CI指数数据分布比较

修正CI指数与原CI指数散点图如图4所示,可见修正CI指数显著提高了原来得分较低的CI指数值,但对原来高得分的CI指数提升有限,所以修正CI指数是一种鼓励后进的评价指数。

4.3修正CI指数与其他指标的相关系数

修正CI指数与CI指数、影响因子、总被引频次的相关系数如表3所示,所有指标之间的两两相关系数在1%的水平下均通过了统计检验,修正CI指数与CI指数的相关系数为0.877,与影响因子的相关系数为0.840,总体较高,但与总被引频次的相关系数不高,仅为0.514。相对于CI指数与影响因子高达0.905的相关系数,修正CI指数与其他指标的相关系数并不高,说明其能提供更多的期刊评价信息,不会导致评价时指标信息趋同。

5结论

本文分析了CI指数存在的评价指标权重设置不合理、归一化方法导致数据分布偏倚、调整系数k的确定并不严谨等问题,导致图书馆情报学CI指数排名前几位的期刊排序不够合理,提出了修正CI指数。结果表明,修正CI指数更加简捷合理,评价结果更加合理。当然,由于本文仅仅以图书馆情报学期刊为例进行了研究,至于其他学科,有待进一步进行深入分析。