胡健飞,孟鲁洋,张胜军
学术期刊的影响力,人一定意义上讲,其实质主要是指期刊所承载的学术成果对科研活动的学术贡献程度。目前评价期刊学术影响力的主要指标是期刊的影响因子,其基本算法为:影响因子=某期刊自统计年前两年发表的可被引文献在统计年被统计源文献引用的总次数 (被引频次)/该刊自统计年前两年发表的可被引文献总量。该公式中的分子被称为被引频次。按照公式,很显然,被引频次越高,则该刊的影响因子越大,进而认为该刊的学术影响力越大。那么,真实情况是这样吗?由于真实的被引频次是衡量论文及期刊学术影响力的核心因素,因此有必要对其进行深入探究。本文以王志红的文章[1]为例,选择文中第31条参考文献和第15条参考文献,从学术贡献程度等方面来做简单的比较与说明,如表1所示。
表1 同篇论文中被引文献的学术贡献程度比较
从表1的对比可得出结论:两篇参考文献在此文中的被引频次均为1,但对该文的学术贡献程度截然不同;或者说,某篇论文从两种期刊中各引用一篇论文,那么,这两篇被引文献对该论文的学术贡献程度及作用不同;进而从期刊角度看,这两种被引期刊对该论文的学术贡献程度及作用也不同,本文称之为学术贡献值的差别。在实际调研中发现,引文间的学术贡献值差别很大。
李静等[2]从另一角度证实现有的被引频次统计方法不能完全真实地反映期刊的学术影响力,且认为发表文章少而精的综述类期刊在影响因子方面具有明显优势。相比非综述类期刊,综述类期刊更容易在较短的时间内获得高的影响因子。这是由于综述类期刊的文章往往涉及内容比较宽泛,虽然在学术上没有非综述类期刊的文章那样专业、深入,但被引用的可能性要大得多。因此,得益于现行的期刊影响因子计算方法,在两种期刊具备同等发文量时,即分母一定的情况下,分子中的被引频次越多则影响因子越大。这种现象导致了综述类与非综述类期刊的被引频次不能真实地反映各自的学术影响力,进而严重降低了影响因子的合理性。
通过调研[3-5],笔者提出基于学术贡献值的概念来计算被引频次。引文的学术贡献值就是从学术角度确定的,每篇参考文献对本论文研究内容及观点的学术影响程度或学术参考价值占所有参考文献贡献度。显然,各篇引文对于某篇论文的学术贡献价值有差别,无视这种差别,将全部引文都赋予同样一个频次的被引量,必然无法准确反映被引文献及期刊的影响力。因此,本文提出一种比较合理的修正方法:为参考文献增加学术贡献值标注。标注的方法及原则如下:
(1)设定某篇论文的全部参考文献对该文的学术贡献程度之和为100%。这里的百分比是指所有参考文献之间相比较的一个指标,与作者自身的创新与原创性没有关系。
(2)作者按被引文献对本文的学术贡献程度,由大到小对参考文献排序。
(3)要求作者对每条参考文献标注学术贡献值,将各条参考文献对本文研究内容的学术贡献程度统一用百分比值定量标注,总和等于100%或1。例如,作者从学术角度认为,某篇参考文献对本论文研究内容及观点的学术影响程度或学术参考价值大概占所有参考文献的15%,即可标注其学术贡献值为0.15,一般取小数点后两位数即可。
(4)学术贡献值可标注于引文文献首部,便于数据库中进行排序、筛选、统计等。
基于学术贡献值的概念来计算被引频次的具体方法示例如下[3]:
(1)标注学术贡献值。作者从学术角度,依据每篇参考文献对本论文研究内容及观点的学术影响程度或学术参考价值占所有参考文献贡献度的比例,进行学术贡献值的标注,见图1。
图1 引文学术贡献值标注示意图
(2)计算某期P刊论文Px被某期S刊论文Si的真实引用频次Pxsi。某期P刊论文Px被某期S刊论文Si的真实引用频次Pxsi的计算公式如下:
图2 真实被引频次计算示意简图
上述被引频次计算体现的方法是影响力算法发展的趋势,否则将无法真实体现被引文献以及被引期刊的学术影响力。行业专家对该算法给予肯定,同时从专业角度指出了它在实践推广中可能出现的作者主观性偏差,以及现实的可操作性问题。笔者与同事通过实践研究,提出相应的完善与实施方案,以期打破“平均频次”的现状,进一步提高该方法的研究价值和意义。具体实施方案如下:
①引入三方修正及沟通机制,修正与完善学术贡献值的标注。即在作者标注的基础上,由编辑或第三方专家(如审稿专家)结合论文的学术内容对学术贡献值进行修正,同时由责编与作者进行沟通及认可。由此,通过作者、编辑与审稿专家从各自的专业角度进行修正,以确保参考文献学术贡献值的客观与科学。另外,通过有效的修正工具,可以较为便利地完成这一过程。
②本文构建并验证了一种较为直观、快捷的换算方法,实现了参考文献学术贡献值的快速标注与调整。作者、编辑、审稿专家均可采用这一方法直观、快速地调整具体的学术贡献值。示例及步骤见图3。
图3 参考文献学术贡献值换算示例图
(3)基于被引频次计算(1)(2)结果,可计算某期P刊论文Px被某期S刊引用频次Pxs,公式如下:
其中,n为S刊某期发文数;Pxsi为某期P刊论文Px被某期S刊论文Si真实引用频次(引入学术贡献值的被引频次)。
(4)计算某期P刊全部论文被某期S刊引用频次P某期s某期,公式如下:
其中,n为P刊某期发文数;Pxs为某期P刊论文Px被某期S刊引用频次。
(5)最后,计算出基于学术贡献值的,某统计年P刊被所有期刊自统计年前N年引用的真实总频次PN。
上述(1)-(5)说明了基于学术贡献值的某统计年P刊被引用的真实总频次的计算方法及原理。在实践中,以期刊为单位,通过数据库的操作来统计某刊该年被引的真实总频次也是简单可行的,即统计某年P刊被所有期刊引用的总频次,可基于标注了参考文献学术贡献值的该年全文数据库,直接运用数据库程序的筛选、提取等功能,最后求和即可。实现过程示意如表2。通过该修正,可以更真实地反映引文的学术参考价值,进而为期刊的学术影响力算法修正奠定基础。
新的思路及方法总会带来争论。在调研探讨过程中,作者得到许多行业前辈的肯定、鼓励及建议,有的学者也提出了一些颇具代表性的疑虑。例如,这种貌似向作者转嫁负担以换取学术评价系统微小优化的做法是否可行;由作者对每条参考文献进行量化估值是否会引发人际关系问题;是否会带来负面引用及加剧引用操纵等学术问题。笔者认为,理清疑惑,坚定研究方向,有时比研究本身更重要。因此,通过讨论,明辨是非,对于本文思路的理解是非常必要的。
表2 基于学术贡献值的某统计年P刊被引用的真实总频次数据库统计实现过程示意表
(1)持有“转嫁”观点的人,自身的学术态度不够端正。这与长久以来不重视参考文献,认为参考文献是做给编辑部及评估部门看的态度有关。实际上,作者原本就应该对参考文献负责任,如果连自己参考和引用了哪些前人成果、引用参考的具体程度都搞不清,那研究论文是如何形成的?难道编辑及评估人员还会比论文作者本人更了解该文的引用情况吗?所以,不存在“转嫁”的说法,而是将本应由作者完成的工作回归其本人,这是合理的,也是可行的。此外,对被引频次真实性的探讨与修正绝不是所谓的“微小优化”。它关系到整个期刊影响力算法的客观性及真实性,是影响因子算法的基础以及不断完善与发展的必然趋势。
(2)“引发人际关系问题”的说法突显了当今一些学者的功利与浮躁心态。国学大师陈寅恪言学术应秉承:独立之精神,自由之思想。如今一些所谓的专家不是专心做学问,而是以人际关系为重,以是否得罪人为考量。难道传统的“平均频次”不会引发人际关系问题?对所有的引用成果一概赋予同一频次的引用量,这本身就是对学术及学者的不尊重、不公平。笔者认为,应该更多地鼓励创新思维,而不是堂而皇之地冠以“问题”而封杀之。
(3)关于“负面引用及加剧引用操纵”,这一质疑是片面的。现有的评估系统没有负面引用现象吗?为了提高刊物影响因子而大量自引、互引等现象难道还不严重吗?任何好的方法及工具都有两面性,可以科学地使用它,造福学术研究;也可以利用它来达到非学术目的。因此,所谓“加剧”,是人的问题,而不是方法的问题。
事实上,该方法为我们提供了一种抵制人为操纵引用的思路。例如,某些期刊大量发表一些非研究类的,但有利于提高被引频次的文章,如短评、商榷、社论、讲话等;而通过作者对每篇参考文献学术贡献值的认真标注,不仅有利于编辑及审稿人员对论文的深入理解,还可基于实际情况降低这些引文的被引频次,较为准确地反映引文的学术贡献程度,从而抑制人为的被引频次操纵行为[6-7]。
总之,需要强调的是,该方法注重的是一种思路,是打破传统算法中“平均频次”弊端的必然趋势。它也许不完美,但却代表了一种突破,一种建设性的思路。正因为它能引发争议,才具有它的价值。没有争论就没有进步,希望能将这种思路及思考的方式分享给更多的同行研究者,给大家带来更多的学术讨论及启发。
目前普遍采用的影响因子算法,在时间跨度上,通常是基于统计年前两年的可被引文献在统计年的被引频次,以及统计年前两年发表的可被引文献总量,即时间跨度是两年。但是,许多研究结果表明,这种时间跨度的采用有很大的缺陷,认为统计年前两年是引文高峰期的观点,是不科学的。
袁润等[8]指出:人为地将引文的峰值硬性规定为其发表后的1-2年,显然是不合理的。因为某些学科的引文峰值期可能会延长为3-4年或更久,还有许多专业学科要吸收大量的经典学术思想和成果,其引文往往是若干年前的。另据万方数据2013年版年度引证报告[9]可知:期刊统计年被引半衰期的均值为:4-5年,或者说,统计年被引频次中最新的一半是在4-5年内完成的。
陈波等[10]通过统计证明,引文高峰期的时间跨度应该是一个变化的量。时间跨度的变化会有两种可能:一是跨度区域后移;二是跨度区域变长。被引高峰期时间跨度不一定出现于文章刊发后的2年内,也未必是3年或5年,而可能是一个变数。目前国际通行的算法中,把计算影响因子的时间跨度规定为2年的做法无法反映这种动态变化,需要作动态修正。
通过表3的统计数据可以看出,每种专业期刊的被引半衰期(被引高峰年份跨度)随着时代的发展,都在变长。这是与各期刊的办刊水平提高、办刊周期缩短、论文水平提高、网络引用密度增长等有关。由于各刊的被引半衰期均有显著增长,现均值大概为4-5年,最长的有8-10年。也就是说,期刊的被引高峰期在不断的延长,远远不是2年所能涵盖的,所以传统影响因子算法中以统计年前2年为时间窗口的做法,越来越无法全面反映被引期刊的影响力。
对于被引时间跨度及期刊影响力的时效性问题,许多学者也提出了有价值的解决方案。
俞立平[11]提出存量指标的概念,存量指标是指自期刊创办以来,对期刊总体水平的评价指标;认为目前的评价指标中,真正的存量指标主要有总被引频次和h指数。另外,为了弥补总被引频次这个存量指标的缺陷,他还提出期刊历史影响因子(History Impact Factor,HIF)的概念,其定义为:期刊历史影响因子是截至统计年度,期刊总被引频次除以期刊载文量再除以期刊办刊年限的值。计算公式为:HIF=TI/(A*T),TI(Total Impact)表示总被引频次,A(Articles)表示期刊的年载文量,T(Time)表示期刊办刊年限。
表3 2005年与2012年20种图书情报类期刊被引半衰期比较
该观点重视存量的因素,启示研究者应更深入地研究时间因素对影响力评价的作用,包括被引半衰期及h指数等。但在实践中,因各刊的创刊时间、每年刊期数以及每期发文量差异很大,在评价时会出现很多问题。因此,该方法得出的期刊影响力指标是否能科学地反映期刊的实际影响力还有待深入探讨。
白云[12]、王娟[13]、何文[14]等学者的研究认为,期刊的被引高峰期基本包含于其被引半衰期内。因此,采用被引半衰期作为统计时间跨度来修正影响因子,不仅能很好地兼顾影响因子的相对性和变动性,还能把期刊最能够表达自己影响力的“时段”体现出来。
期刊被引半衰期是指期刊在统计年被引的所有论文中最新一半的时间跨度,即该刊在统计年被引用的全部次数中,较新一半的引用数是在多长一段时间内累计达到的。由定义可知,该指标既是一个相对指标,也是一个变动指标:被引文献最新一半,代表相对性;被引文献最新一半的时间跨度,代表变动性。被引半衰期主要反映被统计期刊影响力的时效性、生命力。
笔者认为,被引半衰期可以作为影响因子动态修正的统计时间跨度指标,但仍有不少局限性。使用被引半衰期来作为影响因子计算的时间跨度,虽然较之目前通行的自统计年前两年的时间跨度有很大进步,也比较接近期刊在被引高峰期的影响力,但对于很多被引高峰期持续时间较长的期刊,该时间跨度会忽略掉一部分影响力较高的时段。另外,除了被引高峰期的影响力外,影响因子还应包括其他主要的高水平时段,特别是平均水平以上的影响力时段,否则无法反映期刊影响力所涵盖的主要时间跨度。
本文通过计算与统计图情类较有代表性的两个学术期刊《中国图书馆学报》与《图书情报工作》在以2016年为统计年的被引文献出版年份分布情况(见表4、表5)[15-16],查证相关观点。从表4可看到,《中国图书馆学报》在2016年被引用次数中,最接近50%累计百分比的是2011出版年(第6年),累积达到54.13%,因此其被引半衰期为:
《图书情报工作》2016年被引用次数中,最接近50%累计百分比的是2012出版年(第5年)累积达到的51.62%,因此其被引半衰期为:
显然,《中国图书馆学报》在自统计年第6至第13年(2011-2004年)仍有100-374的被引频次,这与被引高峰期(第2至第5年,即2015-2012年)440-564的被引频次较接近。《图书情报工作》在自统计年第6至第12年(2011年-2005年)仍有201-1141的被引频次,且考虑到该刊2009年前仍为月刊的因素,那么这几年的被引量仍是相当大的。
因此,该统计也证实了期刊影响力的计算应以更长的时间跨度为基础,而不是仅仅以统计年前两年、五年或被引半衰期内的发文量来计算。另外,时间跨度应该是一个视具体期刊不同而动态变化的量,而不可能是一个固定的时段。
有学者提出,能否直接使用被引全部年份跨度或称被引全衰期(即期刊在统计年被引的所有论文出版年份的时间跨度),作为影响因子计算的时间跨度?从表4、表5也可分析查证,例如,由于两刊被引时间跨度达到了创刊年,而创刊年可被引文献在被统计年的被引频次与创刊年的发文量相比非常少,这是由于各种非学术原因造成的,属极端情况,并会大幅降低期刊在统计年的真实影响因子值。另外,在该时间跨度内可能会包括很多非学术因素引起的零引用年份,其间不正常的发文量也会降低影响因子的真实值。也就是说,存在大量极端情况,会对期刊的真实影响力产生干扰。所以,被引全部年份跨度所代表的影响力,因为其中包括的极端情况较多,不能真实地反映统计年期刊在被引高峰期及被引高水平期的影响力。因此,直接使用被引全衰期作为时间跨度来计算影响因子也有很大缺陷。
通过统计及比较分析[17-19],本文提出基于被引分布均值的思路来确定影响因子算法的时间跨度。简单讲,就是基于期刊统计年被引频次在各出版年分布的算术平均值(简称被引分布均值)来界定时间跨度的终点。因为依此思路确定的时间跨度,可以较好地涵盖期刊影响力的高峰期以及平均值以上的大部分高水平时段,同时又排除了影响力衰减的低水平以及极端的零引用等时段,比较真实地反映了期刊影响力的强度与广度。具体思路及方法如图4所示。
表4 《中国图书馆学报》2016年被引文献的出版年份分布
表5 《图书情报工作》2016年被引文献的出版年份分布
依据表4、表5数据,举实例并绘制图表说明:
图4 基于被引分布均值界定影响因子算法的时间跨度示意图表
上述计算结果及表4、表5数据均体现在图5及图6中。
图5 《中国图书馆学报》2016年被引文献的出版年份分布统计图
从图中可直观地看到,基于期刊统计年被引频次在各出版年分布的算术平均值来确定时间跨度,不仅可以包含期刊影响力的高峰时段,也涵盖了其影响力涉及的主要出版年份,避免了零引用及低引用等非主要影响力分布时段对算法的影响。而且,使用这种方法还有诸多原因及优点。
(1)相比传统的基于统计年前两年的时间跨度,它是一个随各刊具体情况变动的量,比固定的时间跨度更合理,更接近实际状况,是对现有影响因子算法的动态修正。
(2)理论上,该算法是基于算术平均值界定时间跨度的终点,即以反映影响力平均水平及以上的时间跨度来计算。这就意味着它将期刊影响力在平均水平以上的年份包含在内,也就必然涵盖了期刊影响力的高峰时段、高水平时段,以及其他主要出版年份。同时,在实践检验过程中,本文研究人员发现,由于很多极端情况的存在,如优秀期刊因创刊较早而在创刊年被引用偏低、有的期刊因改名或改制等因素导致当年被引偏低等。这些极端的非学术因素使得期刊影响力计算不能正常反映期刊的高峰及主要年份影响力。而本文以平均水平以上的年份来界定时间跨度,且不包括零引用年份,客观上规避了大部分无法准确表达期刊影响力的出版年份,使得基于该时间跨度的影响因子能正确地反映期刊的影响力。
图6 《图书情报工作》2016年被引文献的出版年份分布统计图
(3)该算法概念清晰,易于计算,具有较强的可操作性。
总之,通过上述分析比较,无论是采用两年的时间跨度,还是采用被引半衰期,或是采用被引全衰期等均存在明显的缺陷,无法较准确地反映期刊的影响力。因此,运用被引频次分布均值来界定时间跨度,在理论上更接近实际情况;在实践中通过数据库进行统计、运算也具备较简单、方便的可操作性,不失为一种理想的尝试。
确定了真实被引频次以及基于被引分布均值的时间跨度,对于传统影响因子算法的修正就水到渠成了。假设以2016年为统计年,则计算P期刊影响因子的模拟算法过程演示如下:
(1)基于期刊统计年被引频次在各出版年分布的算术平均值(简称被引分布均值)来界定时间跨度的终点。进而确定计算影响因子的时间跨度,设为N年(详见本文2.2)。同时,假设P刊在统计年2016年被引的所有年份论文的数量为Z。
(2)统计P刊自统计年至特定出版年内(由被引分布均值界定,即N年,可包括统计当年)刊发的可被引文献总数,设为FN。
(3)基于前述的学术贡献值算法,计算P刊在自统计年至特定出版年内(由被引分布均值界定)的全部可被引文献在统计年被各刊引用的真实总频次,设为PN(详见本文1.2)。
(4)计算期刊P的影响因子:
以上就是修正后的期刊影响因子算法演示。算法中提出了学术贡献值与被引分布均值的概念,从而可以基于更接近实际的被引频次及期刊影响力时间跨度来计算影响因子。
本文提出并探讨了学术贡献值及被引分布均值的概念及思路,并尝试对期刊影响因子进行修正,但研究的前提与基础仍然是同一专业学科内可比较的期刊。随着科学发展及学科的融合、交叉,以往为单一学科的期刊不同程度地趋于多学科化。另外,一直以来存在的综合性期刊如大学学报,因包括了各种学科,学科之间几乎没有可比性,其期刊的影响因子或影响力的量化指标如何进行计算比较[20-21],如何构建一个能真实反映多学科期刊影响力的指标体系,仍有待研究。
[1]王志红.我国图情领域期刊论文在线百科的利用特征探析[J].图书情报工作,2016,60(19):99-107.
[2]李静,黄翊彬,赵红梅,等.影响科技期刊影响因子的期刊因素分析与思考——以SCI收录的眼科类期刊为例[J].编辑学报,2013,25(4):356-358.
[3]陆伟,孟睿,刘兴帮.面向引用关系的引文内容标注框架研究[J].中国图书馆学报,2014,40(6):93-104.
[4]刘雪立,方红玲,王梅英,等.2009年7347种SCIE期刊文献计量学指标统计分析[J].中国科技期刊研究,2011,22(1):44-52.
[5]刘雪立.10种国际权威科技期刊影响因子构成特征及其启示[J].编辑学报,2014,26(3):196-300.
[6]王凌峰,叶涯剑.期刊影响因子操纵行为及抑制策略[J].编辑学报,2012,24(6):567-570.
[7]范少萍,张志强.期刊撤销影响因子的构建及其与期刊影响因子的关系[J].大学图书馆学报,2014,32(2):76-84.
[8]袁润,王慧,闫永君.累积影响因子及其实证研究[J].图书情报工作,2010,54(16):36-39.
[9]北京万方数据股份有限公司.2013年版中国科技期刊引证报告(扩刊版)[M].北京:科学技术文献出版社,2013.
[10]陈波,靖晓莉.学术期刊影响因子修正——基于期刊学科综合性及网络发行视角[J].图书情报工作,2009,53(24):133-136.
[11]俞立平.历史影响因子:一个新的学术期刊存量评价指标[J].图书情报工作,2015,59(2):89-92.
[12]白云.中国人文社会科学期刊被引半衰期分析研究[J].云南师范大学学报(哲学社会科学版),2006,38(4):127-130.
[13]王娟,郑春厚.JCR5年期影响因子实证分析[J].图书情报工作,2012,56(4):143-147.
[14]何文,叶继元.期刊影响因子与被引半衰期关系之比较研究——以图书情报学期刊为例[J].新世纪图书馆,2015,36(4):39-43.
[15]中国科学文献计量评价研究中心,清华大学图书馆.中国学术期刊影响因子年报(人文社会科学)[M].北京:《中国学术期刊(光盘版)》电子杂志社有限公司,2016.
[16]中国知网.CNKI中国引文数据库[EB/OL].[2017-08-08].http://58.194.172.13/rwt/CNKI_CRLD/http/PJTXMLUDN3WXTLUPMW4A/REF/AnalysisproductType=JOURNAL.
[17]陈云鹏,高柳滨.学科期刊平均影响因子的新算法[J].图书情报工作,2009,53(18):141-144.
[18]俞立平,潘云涛,武夷山.基于分位数回归的期刊影响因子影响因素研究[J].图书情报工作,2010,54(16):145-148.
[19]杨涛.中国50所大学网站的网络影响因子比较分析[J].图书情报工作,2004,48(6):47-50,54.
[20]袁培国.中文文科期刊影响因子评价作用之反思[J].南京大学学报(哲学·人文科学·社会科学),2011,48(3):133-139.
[21]史庆华.影响因子评价专业学术期刊的科学性与局限性[J].现代情报,2006,26(1):35-36,40.