学术期刊论文下载量的年内时间规律

学术期刊论文下载量的年内时间规律

0引言

随着互联网的发展,网上论文下载与阅读很大程度上已经取代了纸质期刊,成为广大科技工作者进行研究的重要知识来源。由于网上电子文献的下载量可以精确测度,学术界越来越关注论文下载量及下载量相关指标的科学评价功能[1-3]。研究网上论文下载的时间规律、季节规律、月度规律等,一方面有助于研究科研人员的工作规律,注重劳逸结合,提高科研效率;另一方面,也有利于缩短网上出版时滞,扩大网络文献资源,提高网上文献的利用效率,做好网上文献服务。关于从时间角度进行论文下载量的研究,Moed[4]对单本期刊的下载量进行了历时和共时分析,发现该刊论文的下载量在6个月之内就能达到总下载量的40%,下载半衰期为12.6个月,明显短于被引半衰期。Wanetal.[5]建立了下载量即年指标(downloadimme鄄diacyindex,DII),认为下载量即年指标可以作为一个早期评价指标。熊泽泉、段宇锋[6]随着时间的增长,下载行为更多地转化成为引用行为;初期高下载及低下载论文的下载量可作为后期被引量预测的依据之一;而初期中下载量论文,下载量与被引量相关性较差。许新军[7]通过对图书馆学情报学期刊下载量半衰期的实证分析研究,发现期刊下载量半衰期明显小于被引半衰期和引用半衰期,与被引半衰期之间存在显著的相关性。刘雪立[8]认为下载量半衰期属于反向评价指标,即下载量半衰期越大,期刊影响力越小。关于论文下载量与其他文献计量指标关系的研究成果比较丰富。Kurtzetal.[9]采集美国天文学领域中922位博士的论文数据,尝试进行论文下载量与被引量的相关关系以预测个人未来学术成就的研究。Bro鄄dyetal.[10]、Bollenetal.[11]等研究发现,论文的下载次数对将来被引用次数有积极影响。Hari[12]认为下载次数与被引用次数是文献价值的共同体现,可以考虑利用先期的下载次数对后续被引用次数进行预测,进而对影响因子、半衰期等引用计量指标进行预测。Lietal.[13]的研究显示,Mendeley社区的论文被标记次数与论文的被引次数存在显著的正相关关系。Schloegletal.[14]比较了后1-5年下载量与被引量的关系,发现2年后所获得的下载和被引之间的相关系数为0.510,而发表5年后的相关系数为0.630。但也有少数学者研究发现论文下载量与被引指标无关,Urbanetal.[15]考察瑞典哥德堡大学健康科学研究院研究人员的论文,发现下载和引文之间不存在相关性。关于论文下载量的影响因素研究,Jamalietal.[16]通过比较不同标题的论文,发现提问式标题和较短标题的论文被下载的次数更多。Danieletal.[17]建立论文下载量和引文关联模型,研究发现论文下载量受文献可见性、读者兴趣和成熟度等的影响。孙振凯[18]分别统计了《国际地震动态》和《地震地质》的篇均被引频次和篇均下载量,认为出版专辑有时正面影响很大,但多数时候影响不明显,其中时效性、首发性和专辑质量是影响这两个量的关键因素。王贤文、毛文莉等[19]认为通过获取研究者正在下载的科学文献信息,可以反过来判断科学家目前正在从事的研究主题,提出基于科学文献被下载的即时信息,辅以科学文献在社交媒体中被关注的信息,实时追踪某一领域的研究趋势、挖掘研究热点、探测研究前沿。赵杰、何洁等[20]研究发现,论文下载动机、认知和能力对行为主体下载决策有直接的正向影响;信息需求、人格情绪、外在因素和经验对下载决策存在间接的正向影响。谢娟、龚凯乐等[21]利用元分析研究下载量与被引量关系,发现下载量与被引量呈正性的强相关关系,论文质量、引证时间窗、下载时间窗及下载数据源对二者的相关关系存在调节效应,其中,论文质量的调节效应最为明显。从现有的研究看,关于论文下载中时间因素的研究,一些研究关注下载量与半衰期的关系,以及随着时间的推延,二者关系的发展变化。也有少量研究关注下载量的历时性和共时性。一些学者基于即年指标和被引半衰期的原理,提出了论文下载即年指标和论文下载半衰期的概念。关于论文下载量与其他文献计量指标关系的研究成果比较丰富,涉及其与被引频次、影响因子、半衰期指标等。关于论文下载次数的影响因素也有一些研究,涉及标题特征、出版专辑、下载动机、信息需求、论文质量等等。总体上,关于从时间角度研究论文下载规律的研究,在以下方面需要深入:第一,参照影响因子计算的时间界定,过去两年发表的论文,在统计当年每个月的下载量如何?每个季度的下载量如何?上半年与下半年的下载量如何?论文下载量呈现何种规律与特征?这方面需要进行研究。第二,为什么会呈现这样的规律或特征?在我国大多数科研人员在高等院校工作的情况下,论文下载量与高校的暑假、寒假制度以及重大传统节日有何内在联系?与部级课题申报的时间窗口又有什么关系?第三,弄清论文的下载高峰,对于高校图书馆做好网上信息服务有什么启示?本文拟以图书馆情报与文献学期刊为例,基于中国知网CNKI的引文数据,对学科期刊同一年度不同月份的论文下载次数进行深度分析,试图回答上述问题并进行进一步讨论。

1研究数据

本文基于中国知网CNKI的引文数据库进行研究,关于研究学科的选择,以2017-2018版CSSCI期刊为依据,选取图书馆情报与文献学期刊进行研究,共有20种期刊。由于《情报学报》相关数据网上信息不全,而《图书馆》也存在信息难以检索现象,所以舍弃这两种期刊,实际研究对象为18种期刊。关于论文下载量的研究时间窗口,本文重点研究同一年度内不同月份论文的下载量及其规律,参照影响因子计算的时间窗口界定,以过去两年发表的论文在统计当年的下载量来进行研究。即2015-2016年发表的论文,在2017年的每月下载量数据来进行研究。这是因为,第一,论文下载量是论文引用量的基础,这方面学术界已经取得共识,先下载,后引用。第二,与影响因子保持同一时间窗口,便于研究下载量和影响因子之间的关系。第三,即使许多期刊尚未到达论文下载量的峰值,但这影响不大,因为下载量比被引量的时间更短,有可能期刊被引尚未到达峰值,但下载量已经达到峰值,此外,对于一个学科而言,所有期刊的同一时间窗口不管是否下载量是否达到峰值,仍然具有可比性。

2实证结果

2.1

期刊论文的下载量峰值分析图书馆情报与文献学所有期刊各月下载量如图1所示,下载量最高的月份是3月,其次是1月和3月,而下载量最低的月份在8月,其次在7月。2月有一个小的波谷,其他相对平稳。图书馆情报与文献学18种期刊2017年各月度下载量如表1所示。可以比较清晰地发现,绝大多数期刊的论文下载高峰是在3月份,而绝大多数期刊的论文下载量较低的月份是8月份和2月份,并且几乎所有的期刊在2月份有个小波谷。此外1月、2月、3月、7月下载量的离散系数较低,因此有必要对各期刊论文下载的高峰和低峰月份做进一步的详细分析。下载量极大值的月份出现在3月为主,18种期刊中,有17种下载量极大值月份为3月,只有1种出现在1月;下载量次极大值月份以4月和1月为主,18种期刊中,有7种在4月,7种在1月,2种6月,一种3月,一种5月。下载量极小值以8月为主,18种期刊中有17种在8月,1种在7月;下载量次极小值出现的月份以7月为主,18种期刊中有17种在7月,1种在8月。

2.2期刊下载量的季度分析、半年度分析、季节分析

由于中国知网检索难以界定具体日期,只能通过年度进行检索,因此本文以公历日期分析各季度论文下载量、半年论文下载量,并根据农历的春夏秋冬来分析季节的下载量。2017年农历春夏秋冬节日时间为:2017.2.3立春,2017.5.5立夏,2017.8.7立秋,2017.下载次数的不同时间分类统计见表3。从季节看,春天无疑是下载量的最高峰,其次是冬天,再次是夏天,最后是秋天,并且所有期刊均呈现这种规律,没有期刊是异常的。从离散系数看,春季和冬季下载量离散系数低,夏季和秋季离散系数高。从季度看,总体排序以1季度下载量最高,其次是2季度,然后是4季度,最后是3季度。但是并非每种期刊均呈现这种规律,个别期刊异常,《图书情报工作》2季度下载量就超过1季度。从离散系数看,第一季度离散系数较低,其他季度离散系数较高。从半年下载量统计看,所有期刊上半年下载量均超过下半年下载量。从离散系数看,上半年离散系数小于下半年离散系数。

2.3论文下载量的进一步分析

论文下载量一定程度上反映了科研人员从事科研工作的繁忙程度,而下载量的极大值与极小值比较分析可以反映出这种繁忙程度的相对水平。当然,对于繁忙程度的分析,单纯以某种期刊分析并没有意义,但从学科角度进行分析还是可以说明一定的问题。用每月论文下载量分别除以极大值和均值,再分别乘以100,结果如表4所示。下载量与极大值之比反映了各个月科研负荷与最繁忙时科研负荷对比情况。而下载量与均值之比反映了各月科研负荷与均值的比较情况。从下载量与极大值之比看,最低的为8月,下载量与极大值之比为34.04%,也就是说,8月相对科研负荷只有最忙时候的三分之一。2月份的科研负荷为56.38%,由于春节在2月,因此相对而言春节的科研负荷并不低。从下载量与均值之比看,下载量最高的3月,下载量与均值之比为157.84%,科研负荷超过均值50%以上;下载量相对较低的8月,下载量与均值之比为53郾73%,应该属于正常状态。2月下载量与均值之比为89.00%,考虑到寒假期间,这样的科研负荷并不低。类似地,季节、季度、半年度下载量与极大值及均值之比如表5所示。从季节看,秋季下载量与极大值之比为64.59%,下载量与均值之比为79.45%,跟月度数据相比比较平稳,主要原因是计算的时间跨度有所增加所致,这样就平抑了月度数据相对较大的波动。从季度数据看,三季度下载量与极大值之比为59.73,下载量与均值之比为72.39%,同样小于月度数据的对应指标值。从半年数据看,下半年下载量与极大值之比为73.14%,与均值之比为84.48%,数据差距进一步减小。原因同样是计算的时间跨度由1个月改为3个月和半年所致。

3结论与建议

3.1中国论文下载量呈现稳定的时间规律

中国论文下载量呈现稳定的时间规律基于CSSCI图书馆情报与文献学期刊,基于中国知网的引文数据库研究表明,中国论文下载量呈现稳定的时间规律,这就是3月份是论文的下载高峰,8月份是论文下载的低谷,次低谷是7月份。2月份论文下载量存在1个小波谷。从季节看,论文下载量从高到低的顺序是春、冬、夏、秋。从季度看,论文下载量从高到底的顺序是一季度、二季度、四季度、三季度。论文上半年的下载量大于下半年。春季和一季度是论文下载的高峰期,原因有以下几个:一是“一年之计在于春冶,春节过后,新年伊始,广大科研工作者纷纷谋划新思路,开展创新研究。二是国家社科基金、国家自然科学基金申报均在寒假期间,要写出高质量的申请书,必须下载查阅大量文献。第三,职称申报、科研考核往往在年底,春季开始做科研,有一定的提前空间。第四,高校本科生需要准备毕业论文,3月份开学后也是下载高峰。

3.2论文下载量反映的科研负荷总体不低

论文下载量反映的科研负荷总体不低论文下载量一定程度上反映了广大科研工作者的科研负荷,或者是科研工作强度。本文研究发现,最低的8月下载量大概是3月最高下载量的三分之一;8月下载量是每月平均下载量的一半。考虑到8月是暑假阶段,即在一年最闲暇的时候,这样的比例并不低。此外,2月份是春节放假期间,下载量与极大值之比为56.38,与均值之比为89%。这个比例也比较高,主要原因是寒假期间面临国家社科基金、国家自科基金的申报,许多科研工作者在假期仍然要抓紧时间从事科研工作,下载和阅读文献仅仅是其工作的一个部分。

3.3建议将两大基金申报改到9-10月

建议将两大基金申报改到9-10月本文研究发现,8月份论文下载量最低,其次是7月份,并且9、10月份的论文下载量也低于上半年的正常月度,再考虑到暑假时间接近2个月因素,相对而言,7~10月份科研负荷尚有可提升空间。而2月份在寒假期间,加上春节,理应完全休息,但是论文下载量并不低。所以适当考虑降低春季科研压力,提高暑假期间科研压力,这有利于提高综合的科研绩效。所以建议将国家社科基金、国家自科基金的申报截止时间改到每年的9-10月,寒假期间适当防空,有助于广大科研工作者放松心情,激发创新活力,从而更好地进行创新。当然,由于本文仅以图书馆情报与文献学期刊进行的相关研究,对于其他学科论文下载的时间规律有待进一步研究。