收藏 分享(赏)

多源数据融合的论文影响力评价指标构建.pdf

上传人:爱文献爱资料 文档编号:21752402 上传时间:2024-04-21 格式:PDF 页数:10 大小:1.36MB
下载 相关 举报
多源数据融合的论文影响力评价指标构建.pdf_第1页
第1页 / 共10页
多源数据融合的论文影响力评价指标构建.pdf_第2页
第2页 / 共10页
多源数据融合的论文影响力评价指标构建.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第36卷第3期2023年9月Vol.36 No.3Sep.2023闽南师范大学学报(自然科学版)Journal of Minnan Normal University(Natural Science)多源数据融合的论文影响力评价指标构建廖文通,陈添源(闽南师范大学图书馆,福建 漳州 363000)摘要:从多源数据融合的视角出发构建论文影响力评价指标,可以丰富评价指标的维度和内容,提升指标的科学性和可信度.综合论文的引证文献学术生命力、期刊质量和数量、二级引证文献数量、基金数量和机构学术声誉等多维信息,根据期刊质量对引证文献的权重系数进行差异化处理,并建立数学模型计算引证文献的学术生命力;结合论

2、文的期刊质量、二级引证文献数量、基金数量,论文创新性等因素计算论文的影响力.实证分析结果表明,该指标对引证文献的学术生命力、期刊质量等因素敏感,适合用于论文影响力的计算.关键词:多数据源;初始影响力;直接影响力;间接影响力;MMI指标中图分类号:G353.1 文献标志码:A 文章编号:2095-7122(2023)03-0116-10Constructing of evaluating index for papers influence with multi-source data fusionLIAO Wentong,CHEN Tianyuan(The Library of Minnan

3、Normal University,Zhangzhou,Fujian 363000,China)Abstract:Based on the idea of multi-source data,an index is proposed to evaluate the papers influence,which can enrich the indexs structure of dimension and contents,and thus the scientificity and credibility of indicator are promoted.To establish the

4、index,many information of the paper is considered,such as the academic vitality,the quality and the quantity of citations,the quantity of secondary citations,the number of funds and the institutes academic reputation.According to the journals quality of the citations,the weight coefficient of the ci

5、ting paper is differentiated,and a mathematical model is designed to calculate academic vitality of citing papers,combining with the journals quality of the paper,the quantity of secondary citations,the number of funds,and innovation of papers.The results of empirical analysis show that the index is

6、 sensitive to the academic vitality of citations and applicable to the evaluation of the papers influence.Key words:multi-source data;initial influence;direct influence;indirect influence;MMI index学术论文影响力是评价学者或研究机构科研绩效的重要依据,对于科研工作成果的认定、科研人员学术水平的评估、人才选拔、科研基金申请等工作有着非常重要的意义.目前,关于单篇论文学术影响力的评价方法,许多学者从不同的

7、角度进行探索,并取得了较多的成果.基于被引频次的影响力评价方法是最为典型的评价方法之一,最早是由Garfield1于1955年提出.目前广泛应用的H指数也是一种基于被引频次的评价方法2,由其衍生的有G指数、Q指数、RA指数等,业已被拓展到更加广阔的领域,如期刊评价、学者学术评价和论文影响力评价等3-7.基于被引频次的评价方法,将被引频次等同于论文影响力,这类评价方法侧重于等同看待引证文献的数量(即被引频次),忽视了引证文献的质量差异.有鉴于此,一些学者把引证文献的质量因素纳入评价收稿日期:2022-11-29基金项目:福建省高校图工委基金一般项目(FJTGW202244)作者简介:廖文通(19

8、74),男,汉族,四川乐山人,硕士,讲师.廖文通,等:多源数据融合的论文影响力评价指标构建第3期方法.如:邱均平等8把论文的期刊质量纳入论文质量评价指标;龙莎等9构造出一个包含论文出版期刊水平、论文被引用情况和论文获奖情况等多项指标的论文学术评价体系;吴勤10提出的引证强度则引入了期刊质量因素;何春建11则从二级引证文献的角度探索了引证文献的质量评价.上述评价指标尽管取得了较好的结果,然而单维的数据来源易造成评价指标的单一性.事实上,被引频次仅是论文影响力的外化表现,若融合基于论文内容角度的评价指标,更能挖掘论文潜在的影响力;同时,单一化的评价指标过于笼统,不够精准,已不满足当前科学研究评价的

9、各类应用场景和需要.例如,没有考虑引证文献衰老、新发表论文和零被引论文的影响力评价等因素.关于单篇论文的学术影响力,许多学者从不同的角度进行探索,除了典型的被引频次评价方法外,还有专家评议、引文内容评价和引文网络评价等.1)专家评议,即论文的质量和影响力由相关领域的专家评判,其评价结果更具权威性.目前应用较为广泛的F1000因子,可视为在线专家评价系统12-13,通过专家对论文进行评级和评分,为科研人员提供快速发现、评价等功能.2)基于引文内容的评价方法则通过分析引用动机、引用功能及引用情感关系等,将引证行为分为多种类型,如正面引用,负面引用和中性引用等,从而评判被引论文对引证文献的贡献与价值

10、14-18;此外,还有学者通过论文在引文中出现的位置、次数,及引用内容的篇幅等因素,确定论文的重要性和同引文的相关性等19-20.3)基于引文网络的评价方法:根据论文在引文网络中的层级及网络节点的权重计算论文的影响力21-22,基于PageRank的评价方法、ScholarRank及PrestigeRank等评价方法均为引文网络分析方法23-25.除了上述方法,近年来出现的补充评价指标Altmetrics,从社交网络及社会影响力的角度探索论文影响力的评价26-27,为评价论文影响力提供了新思路.上述评价方法存在一定的局限性,专家评议的缺陷是主观性强,易受专家自身知识背景及其他因素的影响;同一篇

11、论文,存在专家评审意见不一致的情况;基于引文内容的评价方法则需要用到人工智能、自然语言处理技术、文本处理技术和文本挖掘技术等对引用动机、引用情感等进行分析,导致工作量较大、效率不高;基于引文网络的评价方法则是评价结论具有一定的随机性,在不同的文档集中,由于引文网络节点的数量变化、网络拓扑结构的变化等原因,导致同一篇论文在不同文档集中的评价结果不一致.有鉴于此,本文从融合多源数据的研究视角出发,在被引频次基础上融入论文社会关注度、基金资助情况、作者合作情况、论文主题热度和论文学术质量等评价内容,建立数学模型挖掘论文潜在的影响力和引证文献的学术生命力,结合引证文献的期刊质量和二级引证文献数量等因素

12、,对学术论文影响力进行多维度评价.1 评价指标构建1.1 指标构建思想目前,多源数据融合被广泛应用于科学计量的众多场景28-30,它能较为全面地解释和描述论文影响力.故此,根据评价数据信息来源的不同,将论文影响力分为两类:一类是显性影响力,这类影响力可以通过数据直观体现,指标包括引证文献数量、二级引证文献数量和下载量等显性变量;另一类为隐性影响力,指标包括期刊质量、作者合作度、机构学术声誉、论文主题热度和论文创新性、基金数量和社会关注度等隐性变量,这些维度需要建立数学模型进行转换量化,故称为隐性影响力.显性影响力由初始影响力、直接影响力和间接影响力构成.刚出版的论文不宜用被引频次、下载次数等指

13、标评价,而是依托论文所在的期刊质量进行评判;通常采用该期刊的平均被引频次来代替;这种源于论文期刊质量的影响力称为初始影响力.尽管这种影响力属于隐性影响力,但其计算主要依据期刊的平均被引频次,故将其归为显性影响力.由引证文献产生的影响力称为直接影响力;直接影响力的计算需要1172023年闽南师范大学学报(自然科学版)考虑引证文献的老化现象及引证期刊的质量.事实上,ESI数据库通过将引文数据限定为近十年以确保引证文献的学术生命力,引证刊物限制为WOS核心合集以确保引证刊物的质量,只是这种处理方式略显简单.此外,二级引证文献的数量一定程度反映了引证文献的质量,故直接影响力主要由引证文献的学术生命力、

14、期刊质量、二级引证文献数量等因素决定.二级引证文献通过对引证文献(即直接引证文献)贡献影响力,从而对源论文间接贡献一定程度的影响力,这类影响力称为间接影响力.隐性影响力则从三个维度进行评价,作者合作度和机构学术声誉、论文主题热度和创新性、基金数量和社会关注度.作者合作度高,机构学术声誉越盛,关注的学者群体越大,其潜在的影响力越大.论文主题热度和创新性则从论文内容维度评价影响力,主题热度和创新性越高,其学术价值也越高,越能吸引更多学者投入后续研究,从而增强论文影响力的扩散能力.基金数量则体现了政府和相关科研管理部门的意志和态度,社会关注度则是指论文主题词在各类媒介中出现的频率,一定程度反映了社会

15、需求和社会关注,这也是隐性影响力的重要构成因子.图1为评价指标的结构示意图.1.2 新指标的数学模型如图1所示,论文评价指标由显性影响力和隐性影响力两部分组成.其中,显性影响力的构成要素包括期刊等级、引证文献数量和质量、二级引证文献数量等内容;隐性影响力的构成要素则包括机构学术声誉、论文内容(包括主题热度、主题创新性等)、基金数量和社会关注度等.本节主要内容是对这些影响因素构建数学模型并进行科学量化,并在此基础上建立论文的影响力评价指标.1.2.1 显性影响力的数学模型初始影响力的大小定义为该期刊近几年篇均被引频次.随着时间的逐步推移,论文自身学术质量成为决定影响力的重要指标;与此同时,初始影

16、响力的作用则会逐渐减弱.假设初始影响力随时间以同等比例衰减,若论文A在t0年出版,则论文A在t年的初始影响力的计算公式为e0=-Cs(t0)t-t0.(1)其中:-Cs(t0)为论文出版时该期刊s年的篇均被引频次;为初始影响力的衰减比例.直接影响力的计算融入引证文献的学术生命周期因素,即文献老化现象;现有的评价方法已不适用,论文影响力评价指标显性影响力隐性影响力期刊等级引证文献数量与质量二级引证文献数量机构学术声誉作者合作度论文内容基金数量社会关注度 图1 论文影响力评价指标体系Fig.1 Evaluating index system of paper influence118廖文通,等:多

17、源数据融合的论文影响力评价指标构建第3期例如负指数方程,B_K方程等31-32.为此,建立数学模型计算引证文献的学术生命周期,设c(t0t)为某学科t0年出版的论文中在t年仍具有学术生命力的论文数量,c(t0)为该学科t0年被引用的论文总数,a(t0)、a(t)分别为该学科在t0和t年出版的论文总数,可得文献学术生命力的数学模型,即c(t0t)=c(t0)a(t0)a(t)e-(t-t0)+b.(2)其中:b为参数,可自行设置.根据学科特点选择合适的参数,公式(2)能较好地拟合真实数据,应用公式(2)对“图书情报与数字图书馆”学科的数据进行模拟计算,结果如图2所示:若某论文在t0年有p(t0)

18、篇引证文献,从平均值的意义,这p(t0)篇引证文献中在t(tt0)年时仍有学术生命力的论文数量,理论上应为e(t0t)=p(t0)a(t0)c(t0t).(3)直接影响力的计算还要考虑引证文献的质量,可从两个维度评价:一是引证文献出版刊物的质量;二是二级引证文献的数量.因引证文献的出版刊物可分为期刊、图书及报纸等文献载体,而引证文献的类型又分为期刊论文、学位论文(硕士和博士)及会议论文等文献类型.故此,把期刊分为一级期刊、核心期刊和普通期刊三类,把图书和博士论文视为核心类,硕士学位论文、会议论文和报纸等视为普通期刊类,同时赋予不同权重系数.具体计算公式为q=1h(1)+2h(2)+3h(3)c

19、.(4)其中:h(k)为第k类引证文献的数量;k为相应的权重系数;c为当前被引频次.二级引证文献的数量体现了论文学术内容的扩散速度和强度,从另一个角度反映了引证文献的学术质量,也应予以考虑.令I=c1c1t-t0+1c1为二级引证文献数量,则I为二级引证文献的平均扩散速度.设二级引证文献对直接影响力的贡献率为4结合公式(4),可得引证文献学术质量的计算公式为q=q(1+4I).(5)注:图中实线为真实值(*表示),虚线为模拟值(o表示).图2 图书情报与数字图书馆学科的被引论文数与自然年的关系Fig.2 The relationship between the number of cited

20、articles and the natural year of Library&Information and Digital Library1192023年闽南师范大学学报(自然科学版)结合公式(3)至公式(5),可得直接影响力计算公式为e1=q(1+4I)r=t0tp(r)a(r)c(rt).(6)间接影响力是二级引证文献通过直接引证文献产生的影响力,目前已有学者关注二级引证文献对被引论文影响力的贡献11.计算间接影响力时,关键是确定被引论文对二级引证文献的相关性,而相关性由引证文献的参考文献数量决定,参考文献越多,相关性越小,反之亦然.设该学科主题论文的平均参考文献数为N,二级引证文献

21、的数量为h(n),则间接影响力的计算公式为e2=h(n)N(t-t0+1).(7)综上所述,令间接影响力对显性影响力的贡献率为,其值可根据经验或具体学科情况自行设置(如,设=1),则显性影响力的计算公式为e=e0+e1+e2.(8)1.2.2 隐性影响力的数学模型隐性影响力的计算需要对论文内容及学术质量等进行量化,采用LDA模型提取论文的主题词,设某论文的主题词集合为w1w2ws,作者机构集合为u1u2ur,该学科主题论文总数为M,对于作者合作度和机构学术声誉贡献的隐性影响力,计算公式为e3=(1-1R+k)1+i(1+g(ui)M)/r,(9)其中:R为作者数量;g(ui)为机构ui在该学科

22、主题发表的论文数;i为机构ui的学术声誉等级系数;(1-1R+k)项表示作者合作度,k为参数,一般取值范围在25,论文作者数量越大,论文合作程度越高,潜在影响力越大;1+i(1+g(ui)M)/r项体现了机构声誉及机构在该主题领域的科研成果数量,实际应用中,可将机构学术声誉分为若干等级,现分为3级,分别为1=12=0.73=0.5.论文主题热度和创新性所贡献隐性影响力的计算公式为e4=(1+p(wi)M)(1+e-(t-T(wi)S),(10)其中:S为关键词数量;函数p(wi)表示该学科至少包含一个主题词wi的论文数量,其值越大则说明论文科研热度值越大,受到学者关注度越高;T(wi)为主题词

23、wi在该学科首次出现的时间节点;e-(t-T(wi)S为论文的各主题词在该学科中新颖性的平均值,可以反映论文的创新性,其值越大,论文创新性越高,贡献的隐性影响力也越大;参数为关键词新颖性的衰减比例系数(假设与公式(2)中的论文学术生命力的衰减比例一致).基金数量和社会关注度则从政府、科研管理部门和社会影响等维度贡献影响力,其计算公式为e5=1+S(j(wi)1+S(|i|(i).(11)其中:j(wi)为论文出版后主题词在第j类媒体中出现的频次,媒体种类包括报纸、网站和电视台等.由于这些数据可能偏大,故采用Sigmoid函数处理.i为论文第i个基金的金额,|i|为基金的等级,如国家机基金、省部

24、级基金、校级基金和企业基金等,设基金最高等级为1,由于基金数额一般较大,为保持量纲一120廖文通,等:多源数据融合的论文影响力评价指标构建第3期致需要加入压缩系数(基金一般以万为单位,故通常取为万分之一),也采用Sigmoid函数处理.实际应用中,媒体数据采集难度较大,故本文只采用几个主流报纸的数据.综上,论文隐性影响力的计算公式为e=e3+e4+e5.(12)1.2.3 论文影响力的计算根据前述显性影响力和隐性影响力的计算方法和公式,考虑到两类影响力所占比例易受取值范围、变化幅度和变化速率等影响,采用乘积方式处理.构建的影响力指标包含多层级,如初始影响力,直接影响力和间接影响力,同时又包含基

25、金数量、机构学术声誉等多个维度,故命名为MMI指标(即多层级、多维度指标,multi-layers&multi-dimensions index).MMI指标的计算公式如下MMI=(1+e)e,(13)其中:为隐性影响力的权重系数(设=0.5),用来调节隐性影响力在论文影响力中的比重,实证中可根据实际情况自行调节.2 实证分析2.1 数据采集及预处理对于任意一篇论文,统计其年度被引频次、总被引频次、引证文献的出版期刊、二级引证文献数量、作者数量、基金数量等,及该学科的年度出版文献总数和年度被引文献总数,以上数据可从CNKI数据库检索获取.而基金金额、媒体数据等则需要通过其他渠道采集数据.按照前

26、述对于期刊的三类划分,其中一级期刊数量较少,核心期刊次之,普通期刊最多.由于一级期刊和核心期刊数量较少,故采用手工分类的方法.以“图书情报与数字图书馆”学科为例,参照国内一些高校一级期刊的认定结果,确立 中国图书馆学报大学图书馆学报情报学报 等5种期刊为一级期刊,核心期刊则出自CSSCI的评价标准,其余的期刊则归入普通期刊.先构建引证文献的出版期刊集合D0,一级期刊集合D1,核心期刊集合D2,上述集合中的数据均为刊名(字符串),然后计算D1中的数据出现在D0中的频次,即为引证文献中一级期刊的引证频次,同理可得核心期刊的引证频次,剩余的数据则为普通期刊的引证频次.2.2 参数设置计算论文影响力需

27、要设置较多参数,具体设置方法是,公式(2)中的三个参数b体现了该学科的文献计量内涵,由本学科的文献计量学规律决定.根据数学模型,“图书情报与数字图书馆”学科的参数设置为:=0.3=0.13b=0k=2,公式(3)中的参数k为期刊类别的权重系数,一级期刊的权重设为 1,即1=1,其他两类期刊的权重分别为2=0.83=0.6.公式(4)中的扩展强度系数4=3,公式(1)中的=0.9.2.3 计算过程数据均源自CNKI数据库,检索条件限定于期刊论文,语言种类限定于中文,学科为“图书情报与数字图书馆”,对检索结果通过被引频次排序,从被引频次为100200的论文中随机选40篇论文作为样本进行分析,论文以

28、编号表示.对40篇论文分别就被引频次、e(t0t)、MMI指标和TVF指数11进行比对,具体结果如下表1所示.2.3.1 MMI指标各成分对MMI指标的影响本小节分析MMI指标的主要影响因素.1212023年闽南师范大学学报(自然科学版)表1 40篇论文的MMI指标和TVF指数Tab.1 MMI index and TVF index of 40 papers论文序号A1A2A3A4A5A6A7A8A9A10A11A12A13A14A15A16A17A18A19A20A21A22A23A24A25A26A27A28A29A30A31A32A33A34A35A36A37A38A39A40被引频次

29、199198190189182180179177176176175173170170168165162161159159159157154153153152150150150148147147147145142140140139139138出版时间2002200320092000200120032013200320132008200220081998200320082000201420042011200720042005200119992004199820142004200119982009201219982017201020122007200520002000q0.650.810.670.6

30、40.710.680.650.650.690.640.680.600.770.710.760.670.660.70.670.680.690.650.690.750.670.710.710.670.660.660.630.680.710.800.640.700.650.670.700.71I0.380.430.500.320.400.500.630.320.700.610.220.550.520.340.400.270.340.260.390.350.430.260.430.390.200.470.430.490.470.260.600.440.380.470.320.310.380.320.4

31、80.38e(t0t)58.9578.1668.1868.2431.3157.50110.2835.70116.1877.1823.6456.4028.7828.5094.0935.83102.8660.80113.0749.3039.6550.4922.4230.3236.8724.57113.1760.2925.2538.7883.2479.9113.46117.7474.4778.9675.3565.8517.9423.25e03.941.692.611.131.291.694.031.435.932.861.423.240.804.381.973.196.594.873.622.381

32、.291.951.552.871.761.134.502.301.961.132.192.042.5919.153.304.933.691.780.993.19e141.0472.7457.3742.9924.5348.68103.2422.46103.0070.7413.4344.5928.4120.5579.1921.8869.4838.0081.4134.3431.2329.5617.6524.8120.0121.0291.9449.9320.1722.6773.1962.2710.20114.8647.1752.7352.3842.8915.2317.78e23.103.614.562

33、.443.003.776.622.357.195.041.624.393.482.453.131.813.571.823.212.512.911.82.682.411.342.864.143.162.881.54.253.522.237.712.282.352.391.912.682.14e 1.291.171.291.161.321.381.311.161.291.411.151.421.161.161.421.311.321.151.351.161.291.171.151.741.161.311.381.281.171.311.161.171.211.341.311.161.581.151

34、.161.16TVF648.32689.83578.01584.1641.4693.08517.15496.62543.57647.66408.79584.17792.62503.24461.46458.19314.04393.15377.8415.13530.93371.44565.44563.9323.84662.9326.29554.09591.96416.39508.58356.54545.09276.34316.93279.78383.87366.79572.24484.32MMI79.09123.69106.1773.5647.8491.50188.4941.46191.02134

35、.0825.9489.3051.6543.26144.1444.49132.2070.39147.8061.9858.2852.8034.4656.2736.5141.39169.9890.8439.6441.87125.82107.5124.11236.6787.3094.82104.6473.3629.8636.51MMI-r19101220281533227391727306298225232426372535334163431911401181413213836注:以“图书情报与数字图书馆”学科为例;*论文序号为被引频次的排位;MMI-r为MMI指标排位.122廖文通,等:多源数据融合

36、的论文影响力评价指标构建第3期首先,分析引证文献的学术生命力.由表1可知,直接影响力在MMI指标中的占比最大,其中比例最大的是论文A18,为63.49%,比例最小的是论文A24,为53.5%,比例超过60%的论文共31篇.而直接影响力又主要取决于引证文献的学术生命力.因此,引证文献的学术生命力是MMI指标的关键因素.分别选取MMI排位前三位和末尾三位的论文,分析其引证文献的学术生命力特征.由表2知,MMI指标排名前三位的论文发表时间较新,最早的一篇发表于2013年,最近的则发表于2017年.一方面,由于时间跨度不长,被引频次数量并不突出,如论文A34,发表于2017年,被引频次145,被引频次

37、排第34位.另一方面,因为论文发表时间不长,从而引证文献老化现象不明显,如图3虚线所示.排名末尾三位的论文则相反,论文发表时间较早,MMI排位最后的论文A33发表于1998年,另外两篇分别发表于2000年和2002年.这三篇论文引证行为的高峰期较早,引证文献老化现象相对突出,其学术生命力下降趋势明显,如图3实线所示.事实上,由学术生命力的计算公式(2)知,引证文献的学术生命力取决于引证行为的发生时间;例如论文A2(2003年)和A28(2004年),尽管发表时间较早,但近几年的引证数据维持在一定的水平,故其学术生命力仍处于上升趋势,如图4所示.表2 MMI指标排位前3位论文和末尾3位论文Tab

38、.2 Top 3 papers and bottom 3 papers in MMI ranking论文序号A34A9A7A39A11A33被引频次145176179139175147发表时间201720132013200020021998e019.155.934.030.991.422.59e1114.86103.00103.2415.2313.4310.20e27.717.196.622.681.622.23MMI指标236.67191.02188.4929.8625.9424.11MMI指标排位123383940图4 引证时间对学术生命力的影响Fig.4 The influence of

39、 cited time on academic vitality其次,分析引证期刊质量和二级引证文献数量对MMI指标的影响.这两类因素关系到直接影响力的计算.为了便于分析,假设MMI指标的其他因素不变,用引证文献的学术生命力替代直接影响力,即在MMI指标中用e(t0t)取代e1,记为MC,通过论文排位的变化,可以反映引证期刊质量与二级引证文献的数量对MMI指标的影响.为了考察隐性影响力对MMI指标的作用,在MMI指标中去除隐性影响力的因素,即令公式(13)中的参数=0所得指标记为ME.对40篇论文分别计算其MC、ME指标值及相应的排图3 论文出版年及被引频次Fig.3 Publication

40、year and citations of papers年度1232023年闽南师范大学学报(自然科学版)由表4知,同MMI指标相比,采用被引频次对论文进行排序,40篇论文中,排位上升的论文23篇,排位下降的论文17篇,所有论文排位发生变化;排位波动最大幅度为33位,波动幅度超过20的论文9篇,波动幅度超过10的论文22篇.故MMI指标对论文排位的影响范围和影响强度均较大.同样,由表4可知,同MMI指标比,应用TVF指数对论文排序,排位上升的论文23篇,排位下降的论文17篇,排位波动最大幅度为39位,排位波动幅度超过20位的论文13篇,波动幅度超过10的论文27篇.与TVF指数相比,MMI指标

41、对论文排位的影响范围较广,40篇论文的排位均发生变化,且排位波动幅度普遍较大.3 结语基于多源数据思想提出一个多层次、多维度的论文评价指标,即MMI指标,从学术论文影响力表现形式的视角将影响力分为两类:即显性影响力和隐性影响力.显性影响力由初始影响力、直接影响力和间接影响力构成;从MMI指标的计算公式可知,显性影响力综合考虑了论文出版期刊等级、引证文献数量和质量、引证文献的学术生命力、二级引证文献的数量及二级引证文献同引证文献的相关性等因素.隐性影响力则从两个维度探讨论文潜藏的影响力,一个维度是论文自身内容和质量,如论文的主题热度、主题创新性等表4 论文影响力的排位变化(C、TVF指标同MMI

42、指标对比)Tab.4 Ranking changes of the papers influence(Comparison between Citations,TVF index and MMI index)指标CTVF排位上升2323排位下降1717排位变动4040变动比例/%100100最大上升幅度2829最大下降幅度3339幅度20913幅度102027最后,分析隐性影响力对MMI指标的影响.由表3知,若不纳入隐性影响力,排位上升的论文11篇,排位下降的论文9篇,排位不变的论文20篇,排位变动的论文20篇,各占论文总数的50%,故影响范围较大,排位波动最大幅度为2位,影响强度不大.但是,

43、这并不意味着初始影响力与间接影响力不重要.因为所选40篇论文的被引频次偏大(介于138199),使得直接影响力在MMI指标中的占比较高,导致初始影响力、间接影响力和隐性影响力的作用不明显.但在实际工作中,多数论文被引频次偏低,此时初始影响力、间接影响力和隐性影响力等因素对论文最终排位的作用则较为明显.2.3.2 MMI指标与其他指标的对比从MMI指标与被引频次对比的角度分析:被引频次是构成论文影响力的重要元素,在较长时期内,被引频次可等同于论文影响力.应用MMI指标、被引频次(用C表示,即Citations)和TVF指数11分别对40篇论文进行排位,以MMI指标的排位为参照,对比论文在其他指标

44、下的排位,可以体现不同指标间的差异,比较结果见表4.表 3 论文影响力的排位变化(MC、ME指标同MMI指标对比)Tab.3 Ranking changes of the papers influence(Comparison between MC index,ME index and MMI index)指标MCME上升1411下降199排位变动3320变动比例/%82.550最大上升幅度61最大下降幅度62注:*MC为MMI指标中用e(t0t)替代e1所得指标;ME为MMI指标中不纳入隐性影响力的指标.位,并与MMI指标的排位进行对比,对比结果见表3.由表3知,同MMI指标相比,e(t0t

45、)取代e1后,排位上升的论文14篇,排位不变的论文7篇,排位下降的论文19篇,排位变化的论文共计33篇,占论文总数的82.5%,说明MMI指标纳入引证期刊质量和二级引证文献数量后,对论文排位的影响范围较大;排位上升最大幅度为6位,下降最大幅度也为6位.124廖文通,等:多源数据融合的论文影响力评价指标构建第3期内容;另一个维度则包含了作者合作度、机构学术声誉、基金资助情况和社会关注度等内容.由于这些内容不能直接用于计算影响力,为此,通过构建数学模型对上述内容进行了科学的估算.总之,同现行的其他指标相比,MMI指标具备多数据源的特点,一定程度弥补了数据来源单一的缺陷,同时也丰富了评价指标体系的维

46、度和内容,其评价结果可信度更高.最后,以“图书情报与数字图书馆”的40篇论文为例,同其他指标进行对比,从对比结果来看,MMI指标的每一个主要组成部分都对影响力的最终排名产生一定程度影响,这表明MMI指标的各组成部分都是不可或缺的,同时这也验证了MMI指标的有效性.目前,论文影响力的评价指标已逐步朝着精细化、复杂化的趋势发展,纳入的评价指标日益多维全面,例如论文下载量、引证机构级别等,如何科学精准纳入和量化论文影响力评价,仍是值得关注的问题,也为论文影响力评价指标的进一步完善指明了方向.参考文献:1 GARFIELD E.Citation indexes for science:A new di

47、mension in documentation through association of ideasJ.Science,1955,122(3159):108-111.2 HIRSCH J E.An index to quantify an individuals scientific research outputJ.National Academy of Sciences of the United States of America,2005,102(46):16569-16572.3 龙艺璇,赵庆峰,赵星辉.Q指数:一种考虑了时间因素的新型h指数J.图书情报工作,2017,61(7

48、):91-95.4 金碧辉,ROUSSEAU R.R指数AR指数:H指数功能扩展的补充指标J.科学观察,2007,2(3):1-8.5 奉国和,莫幸清,郑伟.H 指数综合赋权及应用研究J.情报理论与实践,2019,42(2):56-61.6 EGGHE L.Theory and practice of the g-indexJ.Scientometrics,2006,69(1):131-152.7 SCHUBERT A.Using the h-index for assessing single publicationsJ.Scientometrics,2009,78(3):559-565.8

49、 邱均平,马瑞,程妮.利用SCI进行科研工作者成果评价的新探索J.中国图书馆学报,2007,33(4):11-16.9 龙莎,葛新权.科技论文学术水平评估J.科技与管理,2007(1):133-135,138.10 吴勤.基于引证强度的学术论文质量评价方法研究J.情报学报,2007,26(4):522-526.11 何春建.单篇论文学术影响力评价指标构建J.图书情报工作,2017(4):98-107.12 檀旦.F1000与传统文献计量学指标的相关性研究J.中国科技期刊研究,2016,27(1):111-115.13 WARDLE D A.DoFaculty of 1000(F1000)rat

50、ings of ecological publications serve as reasonable predictors of their future impact?J.Ideas in Ecology Evolution,2010(3):11-15.14 刘盛博,丁堃,张春博.基于引用内容性质的引文评价研究J.情报理论与实践,2015,38(3):77-81.15 王剑,高峰,满芮,等.基于引用频次和内容分析的引文分布与动机关系研究J.情报杂志,2013(9):100-103.16 张艺蔓,马秀峰,程结晶.融合引文内容和全文本引文分析的知识流动研究J.情报杂志,2015,34(11):

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 综合论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报