国际数字图书馆研究主题分析

2011-07-17 06:26:54任俊霞哈尔滨工业大学图书馆黑龙江哈尔滨150001
图书馆建设 2011年12期
关键词:共词数量论文

季 莹 任俊霞 郁 鸿 (哈尔滨工业大学图书馆 黑龙江 哈尔滨 150001)

“数字图书馆”( Digital library) 一词由美国在 1991 年首先提出[1]。20余年来,数字图书馆已成为评价一个国家信息基础水平的重要标志,与此同时,数字图书馆相关的理论与实践研究也受到世界各国的重视。1995 年我国国家图书馆开始跟踪国际上数字图书馆的研发进展,1998 年由国家立项实施“中国数字图书馆工程”。经过10余年的努力,我国数字图书馆工程建设取得了丰硕的成果,相关研究也一直是图情领域的热点。本文通过对科学引文索引(Science Citation Index,简称 SCI)和社会科学引文索引(Social Sciences Citation Index, 简称SSCI)收录的2000—2010年的有关数字图书馆的研究论文进行统计分析和研究主题数据挖掘,揭示了国际数字图书馆研究的现状和前沿热点。

1 研究方法与数据来源

1.1 研究方法

某一学科领域文献的关键词术语的使用频次和共现频次可以反映该学科的研究主题或热点问题,能够统计关键词术语的使用频次和共现频次的方法即共词分析方法。Monarch认为,“共词分析就是通过对相关文献的代表性术语之间的联系强度的分析,得到某一学科领域研究发展的方式和趋势。”[2]共词分析的原理就是统计出一组文献中的关键词、主题词或名词短语在同一篇文献中出现的次数,计算出词汇的共现频次,并形成由这些词对关联所组成的共词网络。网络节点之间的距离可以反映主题内容的亲疏关系。在共词分析的基础上,以共词出现的频率为分析对象,利用聚类的统计学方法把众多分析对象之间错综复杂的共词网状关系简化为数目相对较少的若干类群之间的关系并直观地表示出来的过程称为共词聚类。通过聚类分析能把关联密切的主题聚集在一起形成类团,表达某一领域分支的组成[3]。

本文运用文献计量学方法对SCI和SSCI收录的数字图书馆研究论文进行计量评价,并对研究数据的研究方向和影响力等进行了定量分析。计量对象主要包括文献量(论文数量和引文数量)、作者数(个人或团体数量)、词汇数等。

共词分析工具选取美国德雷塞尔大学(Drexel University)信息科学与技术学院陈超美博士开发的CiteSpaceⅡ软件[4],笔者通过共词词频分析法和共词聚类分析法考察有关数字图书馆的研究论文的主题领域和研究热点。

1.2 数据来源

本文数据来源于SCI和SSCI检索平台——ISI的Web of Science数据库。检索主题字段为“digital librar*”,年代限定在2000—2010年。根据中国科技信息研究所发布的中国科技论文统计结果的统计指标,笔者将文献类型限定为Article(论文)、Proceedings Paper(会议论文)、Review(综述)、Letter(函件)。

2 数字图书馆研究论文概况

SCI和SSCI在2000—2010年共收录数字图书馆研究论文1 706篇。论文总被引量达7 264次,篇均引用次数为4.26次。论文数量从2000年的149篇增长到2004年的223篇后呈逐年下降趋势,2007年跌至121篇,之后的4年变化不大(见图1)。这主要是受会议论文的影响,2002—2006年会议论文数量较多,而之后的会议论文数量锐减,导致近几年的论文总量也呈现出下滑的特点。但仅从Article(论文)的发文数量来看,数字图书馆研究的成果还是在缓步增加的。

在此期间中国作者(仅包括大陆地区和港澳地区)共发表数字图书馆研究论文127篇,占全部文献的7.44%,排在美国和英国之后,位列世界第三(见表1)。发文数量的年代分布趋势与论文整体趋势相似,如果除去会议论文数量的影响,Article(论文)数量变化不大。

中国数字图书馆研究论文的被引总频次为532次,篇均引用次数达到4.19次,略低于全部论文的篇均引用次数,这说明我国作者论文的影响力接近但略低于平均水平。

3 数字图书馆研究论文计量分析

3.1 论文作者及作者机构分析

在数字图书馆研究方面,发文数量排在前几位的作者是弗吉尼亚理工大学计算机科学系Fox E A,发表论文27篇;巴西米纳斯联邦大学计算机科学系Goncalves M A,发表论文20篇;新西兰怀卡托大学计算机科学系Witten I H,发表论文18篇;新加坡南洋理工大学Goh D H L,发表论文17篇和Theng Y L发表论文15篇。

在我国数字图书馆研究方面,发文数量排在前几位的作者是中国数字图书馆工程专家组成员、清华大学信息技术研究院 WEB 与软件技术研究中心主任邢春晓,共发表论文8篇,占我国作者发文总量的6.3% ;原清华大学计算机技术与应用系主任周立柱,发表论文7篇;浙江大学计算机学院院长庄越挺,发表论文6篇;香港中文大学系统工程和工程管理系杨传智,发表论文5篇。

数字图书馆研究论文来自世界各国的1 000多个机构,发表论文数量最多的前10个机构均为大学(见表2)。中国发表论文最多的前10个机构同样也是国内著名的大学(见下页表3)。作者机构署名为我国图书馆的论文共33篇,其中上海交通大学图书馆6篇,北京大学图书馆2篇,上海图书馆2篇,清华大学图书馆2篇。

3.2 论文发表出版物分析

1706篇有关数字图书馆研究的论文共发表在431种期刊及会议录等出版物上。发表数字图书馆研究论文数量最多的前10种出版物如表4所示。其中,发表论文数量排名第1位和第2位的期刊在2006年之后、排名第10位的期刊在2003年之后都被SCI和SSCI剔除,这也是造成近几年SCI和SSCI收录的数字图书馆研究论文减少的原因之一。

表2 发文数量排名前10位的机构

表3 发文数量排名前10位的国内机构

3.3 研究主题聚类分析

数字图书馆研究包括多种理论和技术,而且研究的热点主题也是随着研究的拓展与深入而动态发展的。为了了解国际上该领域的研究主题及前沿热点的发展趋势,本文使用CiteSpaceⅡ信息可视化软件对数字图书馆研究论文的数据进行共词分析和聚类分析。将2000—2005年和2006—2010年两个年代的统计数据分别导入CiteSpaceⅡ中,对其进行关键词共现和聚类分析,即得到两个阶段的研究热点主题,再分别计算得出两个阶段的关键词共现频次(见表5、下页表6),绘制关键词共现图谱(见图2、图3)。图中每个节点代表一个关键词,节点之间的连线代表两个关键词之间的共现关系。共现图谱中节点之间距离越近,说明两个关键词的相关度越大。若干个关系密切的节点就形成了一个知识群体,也就是说由关键词将知识聚类为相关的领域。

表4 发文数量排名前10位的出版物

表5 2000—2005年论文关键词共现频次排

表6 2006—2010年论文关键词共现频次排名

2000—2005年SCI和SSCI共收录数字图书馆研究论文1 010篇。根据图2的共现图谱和表5的关键词共现频次排序可以看出,这个阶段的数字图书馆研究以信息检索技术、电子出版问题和用户研究为主。主要研究主题为:

主题1:电子出版相关研究,包括出版成本、版权问题、电子存档、同行评审、电子期刊影响因子等。

主题2:信息检索技术,包括网络检索技术、检索系统设计、文本检索技术、识别技术。

主题3:数字图书馆管理,包括知识管理、服务模式等问题。

主题4:图书馆用户研究,包括大学图书馆用户研究,其他类型图书馆的用户教育、用户行为和心理研究。

主题5:网站建设研究,包括网站架构、统一门户认证及整合检索等。

2006—2010年SCI和SSCI共收录数字图书馆研究论文696篇。与2000—2005年相比,该阶段的研究主题有了一些变化,数字存储、信息服务、用户个性化成为研究的热点,信息检索技术也增加了很多新的内容,其主要的研究主题有:

主题1:数字存储,包括存档管理、国家图书馆及大学图书馆数字资源的存储研究等。

主题2:信息检索技术,包括信息可视化、图像索引和检索、视频检索、数字图书馆互操作、pathfinder算法和语义技术的应用等。

主题3:用户个性化研究,包括用户的差异研究、行为研究、个性化界面、个性化检索等。

主题4:数字图书馆服务研究,包括数字化参考咨询服务、数字文献传递、知识管理等。

主题5:数字资源组织与利用研究,包括元数据收割,电子期刊、互联网资源、搜索引擎等的质量、服务、访问研究等。

4 结 论

通过对数字图书馆研究论文及我国学者在该领域发表论文的多角度分析可以看出,国际数字图书馆研究经过20多年的发展,研究的主题热点已由单纯的数字资源组织建设和相关标准建立的研究逐步转向注重用户的个性化需求、信息检索新技术开发及数字资源的永久保存等方面的研究。知识检索、Tag标签技术、Mashup位置感知技术[5]等新技术的引入使数字图书馆服务的内容、手段、时空都发生了质的飞跃。

我国的数字图书馆研究论文数量虽然从排名上看比较靠前,但与美国、英国相差甚远。我国的论文大都出自于国内知名大学的计算机科学领域专家的笔下,而图书馆员作为数字图书馆的直接服务人员,其研究成果却屈指可数。事实上,数字图书馆研究离不开信息技术的支撑,但也同样需要对资源进行整合、对服务进行转变、对用户进行培训。因此,针对数字图书馆的相关服务和资源建设的研究可以成为图书馆员进行研究的突破口。

针对国内数字图书馆建设与研究的具体情况,笔者认为要从以下几个方面开展工作:(1)积极开展国际交流与合作,与国外的研究机构进行合作研究;积极争取和参与国际协作的科研项目,力争在国际先进的科学研究队伍中占有一席之地,提高自身的国际影响力。(2)加强国内的合作交流,与上海交通大学、清华大学等相关研究机构建立合作关系,跟踪并关注他们的研究动向与成果。(3)关注国外图情高水平研究的进展,跟踪本领域的国际会议预告并积极参与会议论文的撰写。(4)加强外语学习,打破国际交流的语言壁垒。总之,我国数字图书馆的建设与研究要立足国内,走向世界,加强学习研究的氛围,开展更高层次的学术研究,使中国的数字图书馆科研水平迈入世界先进的行列。

[1]李 玮. 1995年以来我国数字图书馆研究和发展综述[J].图书馆学刊,2005(6):53-55.

[2]Monarch I A.Information Science and Information Systems:Converging or Diverging? [EB/OL]. [2011-06-01].http://www.caisacsi.ca/proceedings/2000/monarch_2000.pdf.

[3]钟伟金,李 佳,杨兴菊.共词分析法研究:三:共词聚类分析法的原理与特点[J].情报杂志,2008(7):118-120.

[4]Chen Chaomei. CiteSpace II: Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J].Journal of the American Society for Information Science and Technology, 2006(3): 359-377.

[5]李春旺,李 宇.2009欧洲数字图书馆会议(ECDL)述评[J].现代图书情报技术,2009(11): 1-5.

猜你喜欢
共词数量论文
统一数量再比较
基于突变检测与共词分析的深阅读新兴趋势分析
图书馆建设(2018年5期)2018-07-10 09:46:40
头发的数量
基于共词知识图谱技术的国内VLC可视化研究
基于关键词共词分析的我国亲子关系热点研究
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
我国博物馆数量达4510家
现代企业(2015年5期)2015-02-28 18:51:08
2013年5—12月最佳论文
新闻前哨(2014年1期)2014-03-12 22:10:06