学术期刊可见度提高途径

学术期刊可见度提高途径

信息技术的发展带来信息体量的爆炸式增长,逐渐改变了学术内容的传播方式。学术论文的网络出版、开放获取(OpenAccess,OA)等方式使得网络上学术论文的数量呈几何式增长。研究人员获取学术内容的主要渠道逐渐从图书馆的纸刊、单一数据库平台,转向了更加综合、智能化的搜索引擎。Google、百度等搜索引擎公司都推出了学术搜索服务。越来越多的高学历研究人员更倾向于使用基于网页的搜索引擎进行跨库、跨平台搜索。如何在海量的信息中增加可见度,是每一本学术期刊都需要面对的挑战。除了抓住“学术质量”这一根本之外,如何将新兴的网络搜索技术应用到期刊网站管理、文章在线出版及OA管理中,也是学术期刊必须思考的头等大事。事实上,国内外已经出现了很多搜索引擎优化(SearchEngineOptimization,SEO)公司,帮助企业网站进入搜索高排名。在学术出版界,也有大型出版公司,如Taylor&Francis,推荐期刊或学者个人使用SEO技术提高其文章在搜索引擎中的可见度。国内外有很多网络技术领域的学者专门破解搜索引擎的排名算法,给出了一些参考意见。但是,很少有人将这些有效的算法应用到学术出版管理中去。即便是看似专业的SEO,使用的都是一些笼统的、粗线条的方式,比如增加链接、增加外部引用等,对其内在的原理及影响因素未作系统的分析,更对学术出版知之甚少。因此,SEO在提高学术期刊可见度方面,很难做出有的放矢的方法和决定。国内也有一些学术期刊界的从业人员注意到,如何提高网络时代学术期刊的可见度及显示度将是一个重大问题。有些研究,比如付雅静和钱俊龙对于提高学术内容在数字出版中的显示度的研究,给期刊编辑及出版人一定的启示,但更多的研究更倾向于从编辑的人为因素着手,提高编辑对期刊营销或某一出版方式的认知,从而提高期刊的可见度。这些研究都缺乏从技术的角度提高学术内容的可见度的发展策略。本文讨论了国内外的搜索排名算法,总结出影响搜索结果排名的6大主要因素。针对这些因素,提出了一些基于网络技术的应对策略及实施建议,以期提高学术期刊及其文章在搜索引擎中的可见度。

1可见度的定义及影响因素

1.1可见度的定义

在传统的学术数据库中,很多学者讨论文章或期刊的“可见度”(visibility)或含糊其辞或毫不讳言地指向“引用率”(citation)[9-10]。很显然,在“引用”之前,还有一个最关键的过程,就是如何让期刊或者期刊上的文章呈现在目标用户面前,吸引他们点开或者下载进行阅读。一般情况下,用户通过输入“关键词”,搜索引擎输出的搜索结果会长达50~100页,用户真正会点开链接阅读的不过是前50个。根据Google的用户调查显示,搜索结果排名越靠前,被阅读的概率越大,被引用的概率也越大[10]。因此,定义“期刊可见度”为:期刊的主页或者期刊在网站上的学术文章在以其主题词、关键词为搜索词的搜索结果中排名靠前的程度。排名越靠前,可见度越大。

1.2影响可见度的因素

搜索引擎公司一般视排名算法为最高机密。很多学者只能通过各种数学算法,进行反推。PageRank值是指使用PageRank算法计算出来的网页值。PageRank算法是斯坦福大学的LarryPage和SergeyBrin于1996年首次提出的[11],其思想是通过分析网络的链接结构获得网络中网页的重要性排名。比如,有一个链接,有源头网页A指向目标网页B,那么目标网页B的重要性不仅是由这条A→B的链接决定,更重要的是,还与源头网页A的重要性相关。换句话说,B的PR值部分是由A贡献的。所以,A的分值越高,B得到的贡献分值也会越高,B的PR值也会相应提高。现在几乎所有的搜索引擎都会使用PageRank算法给网页分配一个分值。不管其他因素有哪些,PageRank值是决定网页排名最重要的因素。URL、域名、头部域及内容等因素都是与具体的网络技术相关的因素,而这些恰恰是期刊在建立期刊网站时最容易忽略的内容。根据文献的线性回归算法进行的三轮收敛运算结果,对以上各种因素进行了平均值计算,得到以上因素对网页排名的影响情况。同时,文献的算法也指出,虽然图1中的6个因素在提高网页排名至50到20页时起到了至关重要的作用,但是如果想要进入前10页的话,这6个因素之外的其他因素的作用会更加突出。因此,除了考虑这6大因素外,也必须综合考虑其他因素。

2提高可见度的技术对策

2.1增加含金量高的外部链接

很多SEO提供商会鼓励网站增加更多指向本网站的链接,而并不关心源头网页的质量。根据PageRank的算法,源头网页的质量才是衡量链接含金量的重要指标。因此,争取更多分值更大、“含金量”较高的网页作为源头网页指向期刊的网站或文章,才是增加期刊可见度的有效方法。但是,盲目地追求指引链接,而不考虑目标用户,也是错误的。提高期刊可见度的本意是将期刊更有效地推广到目标用户的面前,而不是盲目地扩大点击率,因此可以采取以下举措。尽可能多地加入学术期刊或论文的链接服务平台。包括开放获取目录,尤其是DirectoryofOpenAccessJournals(DOAJ)这样有公信力、影响大的目录;DOI查询库,比如CrossRef这样收录多、影响广泛的DOI机构。这些新兴的数字出版管理形式和手段都会提供源文及源刊链接,并且这些大型网站本身就具有较高的影响力和PR值。建立与其他期刊的联系,互通链接,形成由相近学科和交叉学科期刊组成的期刊网络。这些期刊网络会吸引兴趣相近或者相关的研究人员,有的放矢地针对目标用户。建议每一篇文章的作者或者引用者在其个人主页、社交媒体上源文链接。《南京航空航天大学学报(英文版)》(《TransactionsofNanjingUniversityofAeronauticsandAstronautics》,TNUAA)就在ResearchGate上拥有官方账户,并与期刊主题相关的学者建立了互相关注的联系。曾经在TNUAA上发表文章的作者会在ResearchGate上其文章的最新状态,并给出原文链接指向TNUAA的官网。依靠社交媒体的人际网络会大大提高期刊网站的PR值。

2.2利用网络技术管理期刊网络出版

大多数情况下,期刊出版方在建立期刊网站时,只注意到了网站的内容、形式和美观,而忽略了一些可以增加期刊网站在搜索引擎中的可见度的技术手段。针对每一个影响因素,笔者总结出以下几种方法,可以有效地提高期刊或期刊文章的可见度。这些方法分两个方面,一是针对期刊主页,二是针对网页上的文章。

3学术期刊的实施策略

以上技术策略在具体实施的过程中,可能会关联到IT技术部门的工作,也可能会涉及期刊推广运营部门的工作。因此,期刊编辑不仅需要在编辑论文时注意技术细节,也需要积极配合其他部门的工作。一般情况下,需要注意以下3点。

(1)注意在论文主要位置出现的主题词的书写及频率

能够引起搜索引擎注意的关键位置主要集中于网页的网址、文章题目、文章的各级标题及主题词。因此,编辑在加工论文时,要注意文章的各级标题。在标题中出现的文章的主题词,尽量不用缩写;主题词尽量以全拼的形式出现在重要部分,比如摘要、关键词等部分。

(2)网站内容时提醒技术人员注意技术细节

在网页的HTML源码中的主要标签中加入期刊的名称、文章的题目、期刊的描述等内容,以及在文章的网页版中加入各级小标题的标签,都是技术人员在建立网站时的工作。因此,我们需要与技术人员保持良好沟通,时刻注意期刊及文章主要部分在HTML源码中的标签形式,以提高网页的可见度。

(3)尽量加入更多收录原文链接的各大数据平台,维护期刊论文原文链接的有效性

鉴于PR值的重要性,学术期刊应当尽可能加入更多有影响力的数据平台,以期增加含金量高的外部链接。因此,编辑应当多注意新兴的、数据量大的原文收录平台,提供的原文链接可以指向本期刊的原文。更重要的是,编辑要注意与技术人员保持沟通,维护原文链接的有效性。经常性的原文链接失效不仅会影响搜索结果的排名,也会影响期刊网站的可信度。

4结语

笔者根据近期的搜索引擎反推算法总结出影响期刊可见度的6大重要因素,并且针对这些因素,提出了一些可以利用的技术策略,改进期刊文章源码,提高期刊在搜索引擎中的可见度。本文以国内外航空类期刊为例,对这些技术做了详细的说明。笔者在研究中发现,针对期刊网站的一些可见度提高技术已被知名期刊运用,但是运用得并不全面;而针对文章的一些可见度改进技术在学术期刊中则非常罕见,只得选用科技新闻文章作为例子进行说明。笔者下一步的研究工作是尽快将以上方法全部运用到《南京航空航天大学学报(英文版)》的新版网站建设中去,并且总结、统计和对比这些方法对期刊可见度的影响,并利用实践数据比较各方法的优劣。