高校图书馆民国期刊数字化模式研究
——以西北师范大学为例

2015-02-14 03:56:24权静妮
图书馆学刊 2015年5期
关键词:西北师范大学年份民国

权静妮

(西北师范大学图书馆,甘肃兰州 730070)



高校图书馆民国期刊数字化模式研究
——以西北师范大学为例

权静妮

(西北师范大学图书馆,甘肃兰州 730070)

高校图书馆 ;民国期刊;数字化建设

文章以西北师范大学图书馆馆藏民国期刊的全文数字化实践为例,阐述了民国期刊数字化模式选择及共建共享的实现过程,分析了民国期刊数字化存在的问题,旨在使民国文献得到更有效地保护和更广泛地利用。

民国期刊是指1911至1949年时期在中国国内出版的期刊,是我国文化遗产的重要组成部分,具有丰富的思想文化价值,其文献价值不在古籍善本之下。据统计,民国期刊主要收藏在一些大型公共图书馆内[1],如国家图书馆、上海图书馆、南京图书馆,虽然单体高校图书馆收藏的民国文献所占比例不大,但收藏民国文献的高校图书馆数量很多。很多民国期刊都面临着遗失或是损坏的危险,因此,民国期刊的数字化有着十分重要的意义。

目前部分有实力的高校图书馆已自建了民国文献数据库,但对于一般高校图书馆来讲,由于收藏的民国文献数量不多,自建数据库要耗费一定的人力物力,而且缺乏统一标准,因此建设结构、著录标准、检索平台、阅读浏览器纷杂。而民国期刊本身就有它的特殊性,它既不同于现在的出版物,也有别于古籍,所以数据库建设者在无可依据时便只简单要求数据库能反映出自己所要表达的意思,今后条件成熟时很难共建共享。因此,共建共享的建设模式是高校图书馆目前比较可行的方法[2]。

1 民国期刊数字化现状

1.1 国家图书馆民国中文期刊库

为了有效地保护文献、利用文献,国家图书馆早已完成馆藏民国期刊的缩微胶片制作,近年来又开展缩微胶片的数字扫描工作,预计将在三年内完成近600万拍缩微胶片的数字转换,现提供4,351种期刊电子影像的全文浏览。资源库遵循边建设边服务的原则,将不断追加更新资源库内容。1.2 CADAL(高等学校中英文图书数字化国际合作计划)

CADAL(China-America Digital Academic Library)是一个由国家投资,作为公共服务体系一部分的数字图书馆项目,同时得到“中美百万册书数字图书馆合作计划”美国合作方给予的软硬件系统支持。已建资源:民国书刊(未区分书刊)236,594册;在建资源:民国文献20万册(期),包括民国图书4万册,民国期刊14万期,民国报纸2万期。

1.3 《大成老旧刊全文数据库》

收录清末自有期刊以来到1949年以前中国出版的6,000余种期刊,共12万多期,150余万篇文章。提供公开检索。检索途径:题名(篇名)、作者、内容提要、刊名。检索一览显示:题名、作者、刊名、年卷期。1.4 《全国报刊索引》民国时期期刊全文数据库(1911—1949)

《全国报刊索引数据库》是由文化部立项、上海图书馆承建的重大科技项目,由上海图书馆《全国报刊索引》编辑部负责研制和编辑,具有文献信息量大、检索点多、查检速度快等特点。计划收录民国时期(1911—1949)出版的两万余种期刊,一千五百余万篇文献[3]。

二次文献共建共享网络服务平台是《全国报刊索引》编辑部利用现代化信息技术和服务手段,联合海内外广大图情界同仁,在特色资源、近代文献等珍贵文献抢救和发掘方面的合作共建。该平台旨在促进图书馆数字资源建设的优势互补,提升知识服务的能力与共享水平,丰富数字资源,实现资源共享的全面性、多样性、互动性和个性化,通过文献传递网络平台以及馆际合作结算系统,实现文献增值,提高图书馆文献服务的社会效益和经济效益[4]。

2 数字化模式的选择

2.1 西北师范大学图书馆收藏民国期刊的现状

西北师范大学图书馆共收藏民国期刊2,550种8,356册,学科门类主要为人文科学、社会科学,少部分为地方政府公报、年鉴及校刊等,内容广泛丰富,具有很强的史料性和学术性。其中散期刊物种数所占比例较大,收藏较全。

2.2 模式的选择

本着“平等合作,资源共建,服务至上,利益共享”的原则,《全国报刊索引》提供了四种合作模式以供选择。①参建方独立进行数字资源加工,提供数字资源服务。②双方共同建设数字资源,《全国报刊索引》提供数字资源服务。③双方共同建设数字资源,共享数字资源服务。④委托《全国报刊索引》进行数字资源加工业务。西北师范大学图书馆结合实际选择了第三种建设模式。

3 数字化实现过程

3.1 流程图(见图1)

图1 流程图

3.2 划到及质量评定

3.2.1 划到规则。①原件索取号。格式为种类号/册数号开头至结尾,如:12368/43653-58;5816,其中12358为该刊的种类号,43653为该刊的馆藏第一期真本的真本号,43685为该刊馆藏最后一期真本的真本号,5816为该刊复本的复本号。②刊名。期刊中有副刊名时,一律将正刊名写在前,副刊名写在后,中间用冒号分开,例如,茶话:美丽。③副刊名与并列刊名。刊名库里有外文刊名,添加到并列刊名里。④出版年份。根据第一本期刊的出版时间填写到年。⑤出版周期。根据第一本期刊及第二本期刊之间的出版周期填写周刊、月刊、双月刊、季刊、半年刊或年刊,日刊等,如果修改刊名、复刊号、创新号,要注意添加、补充出版周期。⑥编辑单位或个人。用第一本期刊后面的信息,“发行”要空开一格并用方括号,例:教育月刊编辑;三圣阁佛教净业社[发行];如果“编辑”和“发行”都是一个单位,著录为:教育月刊社编辑[并发行]。⑦填写期刊沿革情况。改名以后新刊应写在期刊沿革里,继承《旧刊名》(XXX年-XXX年);改名后原来的旧刊在期刊沿革里情况里写:XX年XX卷XX期改名为《新刊名》。⑧填写备注字段。该字段仅作补充说明使用,主要为:注明科技类,原件文字不清,同一本期刊,珍本、复本重复扫描,XX年XX卷XX期拆成234、244二期,刊名、卷期错。

3.2.2 划到质量评定标准。允许差错率为1‰,即1,000本划到期刊差错率应控制在1本以内,单项数据差错率控制在3‰。

3.3 文件目录命名

①文件与目录命名时,只能使用大写字母(A-Z),下划线(_)和阿拉伯数字(0-9)。②第一层目录。种类号_册次号_刊名。册次号中,如果是珍本,则前面加Z,复本加F,如1234_Z56789_K上海周刊或者1234_F5678_K上海周刊。③第二层目录。年份,年份为4位,如果不知道真实年份,则用0000代替,如果是跨年度,取前面一年,如果有不确定的年份,在不确定位以X代替,如193X或者19XX。④第三层目录。V卷_N期,卷为3位,期为3位,不足位前面补0。如V006_N002。如果没有卷的信息,用V000代替。如果有总期号与当年的卷期,则使用当年卷期[5]。⑤文件层命名。每个文件命名用于标识扫描的每一页图像,文件的命名规则为:XXXX,取四位,从0000开始,无封面从0001开始。

3.4 扫描

3.4.1 扫描文件命名规则(文件夹分为三级)。第一级为种类号加刊名,格式为种类号_数字_刊名,其中数字通常取0,若相同种类号下有多种刊名期刊则第一种刊取0,第二种取1,依次类推,如:03790_0_江苏。第二级为年份,年份为4位,年份的输入必须是初版年份,只有再版年份无初版年份可参阅有关目录,予以确认后输入。如果不知道真实年份,则用0000代替,如果是跨年度,取前面一年,如果有不确定的年份,在不确定位以X代替,如193X或者19XX。第三级为卷号加期号,卷为3位,期为3位,不足位前面补0。如果没有卷的信息,用V000代替文件的命名规则为:XXX,从001开始[6]。

3.4.2 扫描操作基本原则。以充分反映原件原貌为原则进行扫描。即对原件中的黑白文字页采用黑白扫描;有文字透字的以及其他单色或彩色的页面采用300dpi 24位彩色扫描,以TIFF无损压缩格式存储。

3.5 数据提交

由于扫描生成的TIFF格式数据是无损压缩,所以生成的文件比较大,不适合网上提交,故采用硬盘存储,通过邮寄的方式提交数据。

3.6 数据的发布

上海图书馆将该馆提交的TIFF格式数据经过技术处理后通过光盘方式向我馆无偿提供一份,供我校在校园网范围内使用。

4 存在的问题

4.1 版权问题

我国现行著作权法第二十一条规定:公民的作品,其发表权、本法第十条第一款第(五)项至第(十七)项规定的权利的保护期为作者终生及其死亡后五十年,截止于作者死亡后第五十年的12 月31 日;如果是合作作品,截止于最后死亡的作者死亡后第五十年的12 月31 日。根据此规定,尚有部分民国期刊登载的文章属于著作权保护期内的公民享有著作权的作品,这部分作品著作权中的经济性权利,一般由原始著作权人的继承人享有。但由于年代久远等诸多因素,这些著作权人大多已无法查明。因此,我馆馆藏的个别民国期刊还有版权问题有待解决[7]。

4.2 费用问题

虽然上海图书馆按扫描单页支付一定的费用,但费用太低,勉强能够支付西北师范大学图书馆外聘扫描工作人员的工资,给工作的开展带来了一定的难度。

4.3 共享问题

虽然上海图书馆给西北师范大学图书馆返还了一套加工好的数据光盘,但这些数据因涉及二次版权问题难以提供共享。

5 结语

本项目实施过程中,在期刊全文图像处理、期刊题录信息著录、期刊主题标引等方面积累了一定的经验,为今后进一步开展民国期刊全文数字化研究奠定了基础。在今后的民国期刊全文数字化研究中,需要进行以下工作。①加强用户管理功能。民国期刊全文数据库为用户提供多途径检索及全文阅览功能。对于不同用户应该分设不同权限进行管理,以分别提供检索查询、全文浏览等不同服务。②全文文本化处理。在现有民国期刊图像数据的基础上,开展全文文本化处理,实现全文图像与全文文本的同时展现,满足用户多途径利用的不同需求[8]。

综上所述,该建设模式实现了对民国期刊的有效检索与全文浏览,但是为了满足民国挖掘研究的需要,还应进一步对现有数字化信息进行后续深化研究,从而使之得以充分利用。

[1] 王雅戈等. 民国文献数字化整理研究——以民国农业文献数字化整理为例[J].图书情报工作,2009(11):63-66.

[2] 孙琴.民国文献数字化建设现状分析研究[J].山东图书馆季刊,2008(1):71-73.

[3] 编目精灵Ⅲ.民国期刊全文数据库四种 [EB/OL]. [2012-05-15].http://catwizard.net/posts/20120515195152.html.

[4] 全国报刊索引[EB/OL].http://www.cnbksy.com/.[5] 李肖.基于adobe acrobat professional的民国期刊数字化建设——以《农学报》为例[J].农业图书情报学刊,2012(8):36-38.

[6] 上海图书馆民国期刊数字化技术手册.

[7] 中华人民共和国著作权法[M].北京:知识产权出版社,2001.

[8] 何艳艳.两大民国期刊数据库比较研究[J].山东图书馆季刊,2008(3):66-68,74.

(编校:周雪芹)

2015-04-23

权静妮(1973—),西北师范大学图书馆馆员。

G250

A

1003-1588(2015)05-0067-03

猜你喜欢
西北师范大学年份民国
西北师范大学作品
大众文艺(2023年9期)2023-05-17 23:55:52
西北师范大学美术学院作品选登
特殊的一年
西北师范大学美术学院作品选登
西北师范大学美术学院作品选登
他们为何都爱民国?
电影(2018年10期)2018-10-26 01:55:26
民国人爱刷朋友圈
百家讲坛(2016年6期)2016-09-28 08:10:15
什么是闰年?
一样的年份
科学启蒙(2016年5期)2016-05-10 11:50:30
更正