多学科期刊论文学科划分方法

多学科期刊论文学科划分方法

1研究方法

本文采用参考文献与团队地址认知词两种分析方法进行多学科期刊论文的学科划分。首先,利用论文参考文献来源期刊所属学科确定单篇论文学科划分;其次,利用地址认知词划分未能依据参考文献方法确定的论文以及没有参考文献的论文。本文选择JCR分类体系为桥梁,一方面利用SCI/SSCI期刊全简称对应表进行参考文献分析,明确参考文献来源期刊的学科属性,从而实现论文的JCR学科划分;另一方面选择JCR分类对生命科学学科进行界定。这样,JCR分类体系将SCIENCE期刊论文与生命科学之间联系起来。

1.1参考文献分析方法

参考文献分析方法指利用论文参考文献来源期刊的学科属性确定单篇论文学科。Glanzel针对多学科期刊论文的学科划分,提出Item-by-Item主题分类模式的重复应用,直至确定多学科论文学科属性。该方法将以期刊分类为基础的学科划分细化到单篇论文,具有一定的进步意义,针对NATURE、SCIENCE期刊的实证研究显示明确划分学科的论文比例分别为70.2%、72%。该方法的不足之处在于:第一,部分论文缺少参考文献,Glanzel统计的1993年数据中大约3%的SCI论文缺少参考文献数据;第二,论文二级参考文献数据量大、操作困难,且多学科期刊自引率和互引率较高,方法的重复应用效果不理想。参考文献学科属性的确定依据其来源期刊的学科属性,获取汤森路透SCI/SSCI期刊全简称对应表,该表涵盖期刊全称、简称、所属JCR分类及影响因子等相应数据。利用此表可将SCIENCE期刊论文参考文献中的期刊简称对应全称和相应JCR分类,从而实现论文的参考文献分析。每篇论文的学科划分不唯一、不排他,本文划入生命科学的论文同时可归为其他学科。为了尽量减少遗漏,本文将SCIENCE期刊论文参考文献中生命科学论文比例超过10%(笔者硕士论文题目为《基于SCIENCE论文的生命科学学科主题演化研究》,利用共词聚类分析方法探究生命科学学科核心主题及主题演化趋势。本文所划定的生命科学论文数目即为硕士论文数据源。本文从减少遗漏的角度出发,确定了10%这一临界值,假使不为硕士论文服务,本文临界值会适当上调。)的论文划入到生命科学学科。

1.2地址认知词分析方法

Debruin基于“同一学科科学家形成相关性的认知活动、论文反映其相同的认知兴趣”,这样一个假设,提出了以“地址认知词”确定论文学科属性的方法。认知词为表明科研学科、难题、研究方法或者目标的词,可以由此来确定单篇论文的学科属性。该方法将整体地址字段拆分,去除与学科划分无关的国家、组织、邮编、模糊意义词,只留下可以反映出单篇论文学科划分的词汇,即认知词,如Med、Biol等。表1呈现了SCIENCE期刊论文地址字段的数据结构。利用逗号分隔将地址字段分解为四级:一级字段为机构名称;二级字段通常为大学和研究所的院系、分支机构,地址认知词主要出现于这一字段;三四级字段通常为城市名称、邮编、国家名称。表1中前三篇论文可由二级字段中认知词明确判断学科属性,后两篇论文缺少认知词,在其一级机构名称中也未包含明确的认知词,地址认知词分析方法无法判断该类论文学科属性。Debruin同时提出该方法的一个局限,“所选学科论文中可能不包含一致的地址认知词(notcontainthecorrespondingcognitivewordsintheiraddresses),可作为辅助手段结合其他方法进行多学科期刊论文的学科划分”。虽然这个局限在多学科期刊论文学科划分中表现的更加明显,但该方法有效的挖掘了地址字段对划分多学科论文学科属性的潜力。于是,本文将两种方法结合使用,确立了“参考文献分析为主,地址认知词分析为辅”的多学科期刊论文学科划分思路。