期刊学术价值和被需求程度量化表征方法

期刊学术价值和被需求程度量化表征方法

0引言

学术期刊是高校教师快速了解本领域研究进展、有效进行学术交流的重要工具之一.许多研究表明,科技论文所引用的参考文献中80%以上是期刊.所以,期刊在高校科研活动和学科建设中有着重要的作用.由于每个高校的学科都有自己的学术特色和研究方向,因此,在不同高校,即使同一学科,对期刊的需求也存在很大的差异.因此,准确、全面了解各高校学科教师对期刊的需求,客观、准确评估学科所需期刊的学术价值和被需求程度,从而合理规划和建设期刊馆藏,实现图书馆按各学科需求配置期刊资源的精准服务,已成为近年来高校图书馆管理工作者的重要课题之一.过去,图书馆采编人员曾用采访、问卷等方法了解师生对期刊的需求.这种方法虽然能直接从反馈信息中了解教师对期刊的需求,但也存在如下弊端:(1)由于不同研究领域教师对期刊需求的不同,而且往往只有部分教师接受采访和返回问卷,使采集的期刊信息不能完整、准确地反映学科需求;(2)采编人员自身专业的局限性,很难客观评估所采集的期刊的学术价值和使用价值,导致不能合理有效地进行馆藏期刊的规划和建设.近年来,国内外许多学者开始用引文分析法来了解学科对文献的需求,评估图书馆对文献需求的保障水平,为图书馆文献资源建设提供依据.如BarskyE对加拿大不列颠哥伦比亚大学数学系师生2011年发表的148篇SCI收录论文做了引文分析,给出了引文文献类型和各种文献的引用比例,发现期刊占81%、图书占15%、会议论文占10%、arXiv的预印本论文占1%和其他占2%.JoelSam对加纳大学情报学专业1998—2004年的67篇硕士论文进行引文分析,给出该专业文献需求和保障情况;国内学者曾晓牧通过利用引文法分析清华大学数学系师生2010—2012年发表的SCI论文的参考文献,阐明了该学科在科研工作中常用的文献类型,常用期刊的出版年、种数、学科分布、影响因子等,在此基础上,有针对性地开展了数学学科服务;李峰、祁思妍、刘良璧等对学位论文进行了引文分析,通过分析引用文献类型、被引频次、H指数,确定了不同学科文献需求的范围,并探讨了已有资源的保障状况.然而,上述研究都只给出了某一学科所需文献的种类及其比例分布,鲜有评估文献在该学科的学术价值和需求程度方面的研究.虽然,个别作者通过期刊引频递减排序来说明期刊对学科的重要性,但没有给出这种排序所遵从的统计规律及其在期刊评价中的作用和意义.我们知道,期刊具有知识更新快,专业性强,种类繁多,引用信息量大和学术水平差异大的特点.因此,一个学科所需期刊的种类、引频及其统计规律,不仅反映期刊在该学科的学术价值和被需求程度,还可以反映学科的研究特色和学术水平.对于一个学科来说,所引用的期刊种类一般是非常多的.而且,由于教师需求和期刊自身的专业特色和学术水平的差异,使各期刊引频差异也很大.因此,如何通过对期刊引频等数据进行数理统计分析,定量评估某一期刊在学科中被需求程度和学术价值,并按需求程度和学术价值进行合理的排序和分类,不仅对图书馆期刊资源规划和建设是十分必要的,而且对该学科教师和学生文献调研有重要的指导意义.本文将以吉林大学无机化学学科为样本,通过对该学科师生所发论文中的引文数据进行统计分析,给出该学科所需期刊的种类,研究其所遵从统计规律的数学表达式及其统计意义,探索其学术价值和被需求程度的定量表征方法,为图书馆期刊建设和精准服务提供量化依据.

1学科教师所需期刊来源及统计结果

学科教师中所引用的期刊,可以反映学科对期刊的需求.所以,本文以吉林大学无机化学学科全体教师在2012—2016年期间所中引用的参考文献为研究样本,开展期刊需求的研究.本文以WebofScience—SCI数据库为数据源,采用基本检索,检索式为“作者+地址(JilinUniv,CollChem,StateKeyLabInorganSynth&PreparatChem)”,时间跨度确定在“2012”到“2016”.我校无机化学共有40名教师,将每位教师发表的论文进行检索、统计后,建立学科教师所需期刊数据库.结果显示,五年来有37名教师共发表外文论文1213篇;发表在168种外文期刊上;引用期刊文献49488次1446种.其中引用中文期刊14次11种,引用外文期刊49474次1435种.

2期刊被需求程度和学术价值的量化表征方法

如何评估前面统计的1446种期刊在无机化学学科建设中的重要性,对于图书馆文献资源规划和建设是非常重要的.本文采取通过对这些期刊按引频和被使用率从高到低排序的办法评估这些期刊的学术价值和被需求程度.

2.1相对引频排序

引频即某一期刊的被引次数,是用来评价某一期刊学术价值的重要指标.我们将无机化学学科教师所引用期刊,按引频从高到低排序.为了清晰反应某一期刊在所引用期刊中的学术价值和地位,本文引进相对引频的概念:相对引频=某期刊被引用次数/引频最高期刊的引用次数×100%.将所需期刊按相对引频从高到低排序,如表1所示.由于引用期刊的种类太多,表1只给出部分引用期刊.为了方便和清晰反映所有期刊排序的统计变化规律,我们以期刊在引频排序中的序号为横坐标(为数学处理方便,序号用从0开始的整数.每个序号代表相应的一个期刊,如序号为0的代表“JournalofTheAmericanChemicalSociety”等),以相对引频为纵坐标,做出所有期刊相对引频随排序序号的变化,横坐标每个自然序数代表一种期刊.结果如图1(A)中红色实心圆所示.同引频排序相比,相对引频排序能更清晰的反映某一期刊在无机化学学科教师所需期刊中的学术价值和地位.如:对于InorganicChemistry期刊,如果只给出其引频1645,我们很难判断其在该学科的学术地位.但如果给出相对引频36.84%,就可以知道该期刊与最高引频期刊的差距,也就能清晰了解其在该学科的学术地位和价值.相对引频越高,说明此期刊在该学科的学术价值越大,地位越高.

2.2使用率排序

我们知道,期刊引频反映的是期刊的被引用次数,不代表引用的人数.换句话说,期刊的引频高并不意味着引用它的人数多.实际上,对于一个特定的学科,一个期刊是否被学科所需求,是由该期刊是否被该学科的教师所引用决定的.而期刊被需求程度应由该学科中使用这一期刊的教师人数决定的.因此说,引频排序虽然在一定程度上反映学科对期刊的需求,但并不完整、准确反映这一需求.为解决这一问题,本文引入期刊使用率(简称使用率)概念:使用率=使用某期刊的教师人数/教师总数×100%.这里“引用某期刊的教师人数”按如下方法计算:如果一个教师在所发表的论文中引用过该期刊或在该期刊发表过论文,不管引用多少次和发表过多少篇论文,都算作有一位教师引用该期刊.将期刊按使用率从高到低排序,如表1所示.同相对引频排序一样,我们以每个被引用期刊在使用率排序中的序号为横坐标,使用率为纵坐标,做引用期刊的使用率随期刊使用率排序序号的变化图,如图1(B)中红色实心圆所示.显然,这种排序可以清楚定量反映该学科教师对某期刊的需求程度.期刊使用率越高,说明这种期刊的需求程度越高.表1列出按相对引频和使用率排序的前110种期刊.可见,期刊按相对引频和按使用率排序还是有很大的差别的.引频反映期刊在该学科的学术价值(或地位),而使用率反映的是期刊在该学科被需求程度.因此,只用引频排序来说明学科对期刊的需求是不全面的.用引频和使用率相结合能更全面反映学科对期刊的需求.目前学术界通常用期刊的影响因子(IF)评价期刊的学术水平,影响因子越高,意味着期刊的学术水平越高.但影响因子的大小与研究领域有很大的关系.如:化学领域期刊的影响因子普遍高于物理领域,因此,用影响因子很难评价不同领域期刊的学术水平和价值.对于特定学科,由于每个学科都有自身的研究特色和学科交叉,因此,用影响因子法很难评价某一期刊在该学科的学术地位和被需求程度.如:图1(A)和(B)分别给出无机化学教师所需期刊相对引频排序和使用率排序与IF的关系图.由图可见,某些IF高的期刊,其相对引频或使用率并不一定高.这说明对于某一特定学科,IF并不适合用来评价期刊的学术地位和需求程度.近年来,国内外许多学者把评价科研工作者学术水平的h指数法扩展到评价某一学科或研究领域期刊的学术水平上来,即通过将期刊引频按从高到低有序排列来评估期刊的学术水平或价值.然后,利用h指数法筛选出该领域高水平期刊,即把那些排列序号小于等于引频的期刊,称为该学科或领域的h核心期刊.按照h指数法和表一,可以得到无机化学学科期刊的h指数是85,即h核心期刊共有85种.但从表一可见,在相对引频排序中,序号大于20的期刊,相对引频已经小于10%.把相对引频小于10%的期刊也看做是该学科的高学术价值期刊,似乎与高水平期刊的定义不符.另外,用h指数法选取的h核心期刊只能反映这些期刊的学术价值,并不能准确反映老师对期刊的需求.因此,用h指数法确定一个学科的核心期刊似乎是不合适的,也缺少理论根据.为了准确反映无机化学学科对期刊的需求,我们提出新的评价方法.我们将所有引用的期刊按相对引频和使用率排序.同图一做法一样,以排序序号为横坐标,相对引频或使用率为纵坐标,画出所有所需期刊相对引频和使用率随期刊排序序号的变化.如图2(A)和(B)黑方块所示.从某期刊在图中的排序位置,就可以清楚的看出其在该专业的学术地位和被需求程度.将图2(A)和(B)进行数据拟合,发现期刊相对引频和使用率排序都随期刊序号增加按双e指数衰减的规律减少,拟合的准确度分别达99%和99.7%,说明拟合是十分可靠的.拟合出来的双e指数衰减曲线如图2(A)和(B)红实线所示.如果用N和Y分别表示相对引频和使用率,n为期刊序号,则相对引频N和使用率Y随期刊序号n的变化可分别表示为:我们知道,y=y0e-x/t是一个e指数衰减函数,这里e≈2.718.其基本特征是:当x从0增加到t,y迅速从y0减小到y0/e(即y0的36%),而当x从t增加到∞时,y缓慢减少.也就是说,y的衰减主要发生在x=0~t的范围.所以,t被称为描述e指数函数衰减的特征参数.t越小,说明衰减的越快.许多物理过程遵循e指数衰减的规律.如:放射性元素辐射强度(I)随时间(x)的衰减可以表达为:I=I0e-x/t,其中,I0是x=0时的辐射强度,t表示当放射性元素辐射强度从I0减小到I0/e时所用的时间.由于x>t以后,I辐射强度的衰减非常缓慢,而且剩余的辐射强度已经很小.所以,t被称为该放射性元素的寿命.如果一个放射性元素辐射强度的衰减用两个e指数衰减函数表示,如:公式(1)和(2),说明该元素通过两个过程衰变.tN1和tN2或tY1和tY2分别表示元素在两种衰变过程的寿命.由于公式(1)和(2)都是由两个e指数衰减函数组成,根据e指数衰减函数的数学和物理意义,我们推断吉林大学无机化学学科教师大体可以分成研究特色不同的两个研究群体.由于研究特色的差异,他们对期刊的需求和引用有所不同.N1e-ntN1代表群体一相对引频递减排序的统计规律,由公式(1)可见,N1=65.54%,tN1=1.98,考虑到n为整数,取tN1=2.这样,N1e-ntN1说明:序数n=0的期刊(JournalofTheAmericanChemicalSociety)在群体一中的相对引频最高,为64.54%.对于序数2的期刊(ChemicalCommunications),其相对引频降到N1/e(23.75%).这意味着群体一教师论文中的引频主要集中在表一中序号为0~2的头3个期刊,说明这3个期刊对于群体一的教师来说,具有很高的学术价值.N2e-ntN2代表群体二相对引频递减排序的统计规律.与群体一的讨论相似,N2=31.14%,tN2=23.这说明在群体二的论文中,序数n=0期刊的相对引频最高(31.14%),序数n=23的期刊,其相对引频降到N2/e(11.46%):这意味着群体二教师论文中的引频主要集中在表1中序号为0~23的头24个期刊.这说明这24个期刊对于群体二的教师来说,具有很高的学术价值.综合以上的讨论,利用公式(1)中的tN1和tN2,我们可以把图2(A)中相对引频排序曲线按序号分成三个区域,即0~2,3~23和24~1445区,如图2(A)所示.为了清晰区分0~2和3~23区,在图2(A)中加上一个插图.由图2(A)可见,在0~2区的三种期刊,对于两个群体来说都是高引频期刊,相对引频在100%~54.74%.称为该学科期刊的高引频区;3~23区,相对引频在40.69%~8.67%,为中引频区;而24~1445区的相对引频是8.62%~0.02%,引频相当低,称为低引频区.我们注意到,在高引频区,虽然这3个期刊只占总引用期刊数的0.2%,但这三种期刊都有很高的引频,三个期刊的引频占所有被引用期刊总引频(简称占频比)的19.3%,平均每个期刊的占频比为6.4%.尤其排名第一的JournalofTheAmericanChemicalSociety(JACS)的相对引频(100%)占频比(9%)远远高于排名第二的AngewandteChemie-InternationalEdition的58.7%和0.9%,说明这三种期刊在该学科有着非常高的学术价值和地位,而JACS更突显出在该学科学术价值和地位.这与三个期刊在化学领域的实际情况完全符合.在中引频区共有21种期刊,占总被引用期刊的1.5%.21种期刊的占频比达到34.2%,平均每种期刊的占频比为1.6%.在低频区有1422种期刊,占总被引用期刊的98.3%,占频比为42.9%,但平均每种期刊占频比只有0.03%,远远小于高引频区和中引频区的平均占频比,说明低引频区中的期刊学术价值很低.从以上分析讨论可以看出,利用公式(1)中的tN1和tN2,可以对期刊的学术价值进行评估、排序和分类.同样,利用方程(2)中tY1和tY2,可以把图2(B)中使用率排序曲线分成3个区:即序号在0~109,110~706和707~1445区,如图2(B)所示.由图2(B)可见,在0~109区,使用率在92.5%~45%,即在该区的期刊至少有大约45%以上的教师使用,故称为高使用率区;在110~706区,使用率在5%~45%,称为中使用率区;在706~1445区,使用率只有5%~2.5%,使用此区期刊的教师数很少,称为低使用率区.从前面的讨论可以看出,tN和tY可以分别用来反映期刊在一个学科的学术价值和被需求程度,并对期刊进行分类.本文将根据图2(A)和(B)各区中的相对引频、占频比和使用率,筛选出高引频和高使用率期刊群,并定义为该学科的核心期刊.从图2(A)中相对引频排序分区讨论可知,高引频区和中引频区都具有较高的引频,两个区的期刊共有24种期刊,即表一中序数为0~23的期刊,虽然期刊数值占所有引用期刊的1.7%,但占频比却高达57.1%,即一半以上的引用来自这24种期刊.这充分显示了这些期刊在该学科高水平的学术价值.由图2(B)可见,由序号数为0~109期刊组成的高使用率区有110种期刊,虽然期刊数只占所有引用期刊的7.6%,但每个期刊都具有较高的使用率(92.5%~45%),表明这些期刊具有很高的被需求程度.在中使用率区中,尽管某些期刊也具有较高的使用率,如序号在110~158期刊,使用率在45%~30%,但它们的相对引频却很小,在1.35%~0.45%,占频比只有0.1%~0.07%,说明这些期刊学术价值较低,不满足核心期刊要求的高引频条件.根据以上讨论,我们把图2(A)中高引频和中引频区的24种期刊,和图2(B)中高使用率区的110种期刊定义为该学科的核心期刊.为了说明期刊相对引频和使用率的关系,我们在图3中绘出所有引用期刊按使用率递减排序方式的排序规律,如图中黑心方框(■)所示,横坐标中每个期刊序号代表着在使用率排序中的一种期刊.同时,在图3中也标出使用率排序中每个期刊的相对引频,如图中红实心圆(●)所示,从而给出在使用率排序中期刊相对引频的变化规律.由图3可以看出,在高使用率区,相对引频随期刊序号增加从100%迅速减小到1%左右,在中使用率和低使用率区,相对引频缓慢从1%减少到0.02%.我们注意到,高使用率区的110种期刊包含了由相对引频确定的24种高引频期刊,而且,高使用率区与中使用区的边界恰是相对引频从快速减小到缓慢减小的拐点.这说明无机化学学科的核心期刊为高使用率区中的110种期刊.这110种期刊不仅具有高的使用率,而且有高的引用率,代表着该学科学术价值和需求程度最高的期刊,是图书馆必须保障的期刊.另外,我们注意到,在中使用率区,尽管期刊的相对引频都在1%以下,但其使用率却在42.5%~5%.其中,许多期刊(如:序号在110—210期刊)还有20%~40%的使用率.这意味着尽管中使用区的期刊被引用较少,但仍有许多教师查阅和使用.表明相对引频或引频排序不能完整、准确地反映教师对期刊的需求.引入使用率排序对于了解学科对期刊的需求是必要的.以上研究结果表明:对于一个确定的学科,只要利用各种数据库收集到该学科老师中引文期刊的引频信息,通过对所引用期刊相对引频排序和使用率排序进行数学拟合,就可以根据拟合得到的数学表达式中的特征参量,定量评估期刊的学术价值和被需求程度,对期刊分类排序,确定学科的核心期刊.从而解决了图书馆期刊采编人员受专业知识的限制,不能主动、客观、完整、准确的评估学科所需期刊学术价值和被需求程度的问题,为图书馆期刊资源建设提供了可靠的量化依据.由于本方法是以学科老师引文期刊的引频数据为基础,以期刊引频排序和使用率排序数学表达式中的特征参量为判据,且期刊引文数据收集和处理简单、易学、好操作.因此,这种表征方法更具有科学性、可靠性、针对性和可操作性.

3结语

本文通过对吉林大学无机化学学科教师中所引用期刊及其引频数据的统计分析,阐明了该学科所需期刊的种类和数量.提出了分别用期刊相对引频和使用率描述期刊在该学科的学术价值(或地位)和被需求程度的概念,并给出相对引频(N)和使用率(Y)递减排序随期刊序数n变化的数学表达式.论证了公式中参数tN1,tN2和tY1,tY2分别在相对引频排序和使用率排序中的统计意义.提出利用参数tN1和tN2定量评估期刊在该学科的学术价值,利用参数tY1和tY2定量评估期刊在该学科被需求程度,以及利用这两种参数确定该学科核心期刊的新方法.该方法不仅有助于图书馆采编人员自主、客观和准确的了解学科对期刊的需求,合理规划和建设期刊资源,同时对学科教师和学生文献调研工作有一定的指导意义.