我国数字资源长期保存策略研究综述

2013-09-20 06:22:14伍若梅
图书馆学刊 2013年4期
关键词:数字信息文献数字

张 杰 伍若梅

(上海理工大学图书馆,上海 200093)

随着信息社会的快速发展,计算机软件和硬件以及文件格式不断更新,人们难以对数字资源有效快速地存取。刘喜球认为即使用于数字资源保存的硬件和存储介质完整无缺,但其存取技术的过时也不可避免[1]。刘家真也指出维护数字信息长期存取的技术措施大多是复杂、昂贵与困难的,都要受到财务、技术与人的因素的制约[2]。从而使得数字资源长期保存问题越来越引起社会的重视。2008年11月由中国科学院国家科学图书馆联合有关图书文献机构在北京召开了主题为“国家数字文献资源长期保存服务体系建设”的数字图书馆高层论坛首届年会,呼吁国家教育科研机构和文献情报机构要充分认识数字文献长期保存的战略重要性和现实紧迫性[3]。因此,探讨和选择数字资源的长期保存运行策略,从而有效地实现数字资源的长期高效存取,是数字资源建设必须解决的重要课题。

1 我国数字资源长期保存策略研究现状

利用C N K I(中国期刊全文数据库)对数字资源长期保存策略研究的期刊文献进行统计,以“数字资源长期保存”*“策略”和“数字信息长期保存”*“策略”为限定条件,从1999年至2011年共检索相关期刊文献45篇。按年份划分,发表论文分布如表1。

表1 数字资源长期保存策略问题研究论文年份分布

从表1可以看出,我国关于数字资源长期保存的策略问题研究,1999~2007年发文量较少,2008~2011年为研究高峰,发文量占总发文量的66.7%,说明学者对这方面的研究已经足够重视。

2 数字资源长期保存存在的主要问题

目前国内若干文献机构从不同的角度对数字资源长期保存进行了实践,取得了一定的进展。笔者在分析国内学者研究成果的基础上,总结出主要存在的几方面问题。

2.1 技术问题

技术问题主要是载体寿命和技术格式与更新两方面的问题。很多学者提出了载体使用年限和载体退化的问题,王萍认为目前这类载体主要是磁盘及C D-R O M,使用寿命为30年,最好的材质也不过100年;磁盘使用寿命更短,大约10至20年,与上千年的纸质相比可谓短暂即逝[4]。李文、周建军、李肖军认为载体一般以光、电、磁为介质,一旦受到高温、潮湿、空气污染等影响,载体退化就造成了信息的丢失[5,6]。技术格式与更新问题,王萍、李文、张绍武认为数字资源格式的多样性、软硬件更新频繁造成旧的数字信息不能被新的硬件设施和软件系统读出以及管理与使用上的不便[4,5,7]。周建军、李肖军认为海量的数字资源以各种格式进行保存,缺少统一的格式[6]。

2.2 管理问题

管理问题主要包括公共标准、法律法规、安全问题。公共标准问题,周建军、杨小云、崔明新等学者认为我国数字信息保存缺乏相关的可被广泛接受的标准。需要制定通用的技术标准与组织管理协议,降低数字信息在新旧平台间转换的难度,减少数字信息长期保存的费用[6,8,9]。秦建宁认为公共标准的缺乏是数字资源难以长期保存的根源之一[10]。关于法律法规问题,杨小云等学者认为在信息专门立法中应包括确认数字图书馆对数字化资料进行管理和保存权利的条文,从而保证这部分资料成为图书馆的永久馆藏[8]。熊燕认为数字资源保存过程中信息获取、提供服务和存储管理几个环节都涉及相应的知识产权问题[11]。安全问题方面,杨小云、刘家真等学者认为数字信息媒体的腐坏带来信息的丢失,而且容易遭受灾难性的损失比如战争、水灾、技术更新、系统升级、格式转换等[8,12]。杨小云等学者认为网络的不安全性,已成为限制其发展的最大障碍[8]。陈芳仪称世界上已发现4000多种病毒,而且每年以12.5%的速度递增[13]。

2.3 经济问题

数字资源长期保存需要投入大量的资金,由于资金有限,如何合理利用资金也是目前面临的主要问题之一。丁丽鸽认为如果没有一个稳定的、可持续的资金支持体系,数字资源的保存将不可能得到有效实施[14]。戴艳清认为目前存在的主要经济障碍包括:①长期投入与短期收益的不平衡。②潜在利益关系的冲突。③数字信息生命周期的管理链断裂。④我国数字资源长期保存项目之间大多存在交叉重复问题[15]。陈益君、丁梅娟认为数字资源的维护费用受到人员培训的费用和权利许可交涉的费用的制约[16]。国家图书馆副馆长陈力认为,对于重要的数字资源,特别是带有战略性的资源和文化遗产的保存,我国还没有拿出足够的资金来支持[17]。

2.4 选择问题

在资源选择上熊燕认为没有必要保留所有的数字资源,应拟订一个鉴定与选择的策略,将有保存价值的数字资源挑选出来长期保存[11]。媒体的利用寿命是需要考虑的因素之一。司莉认为在媒体选择上,数字信息是存贮在各种类型的物理媒体上的。新型媒体还在不断涌现,其使用寿命也各不相同[18]。张绍武认为相比传统媒体,数字信息媒体容易变质,容易遭受灾难性损失,对存贮环境的要求较高且使用寿命较短,因此,如何提高产品质量,增强数字媒体的耐久性,已成为数字信息长期保存要解决的问题之一[7]。

3 数字资源长期保存策略研究

3.1 技术策略(见表2)

表2 数字资源长期保存的技术策略

在保存数字对象的原始版本之外,还需要保存一个简单的、低技术含量的、经过干燥处理的数据版本,是数字保存策略的附加方案,是一种以防万一的策略[21]。数据考古技术 将损坏媒体以及损坏和过时的软硬件环境进行恢复数据内容的方法与手段。数据再造 从原始的字节流中恢复数字资源的原貌,并保证数字资源的可读性和可用性[21]。通用虚拟计算机(UVC)基于风干的保存策略由Raymond Lorie正在创建一个通用的解码机器,它用一种简单的程序在后台运行来保存数字信息[21]。数据再生技术 将技术过时的数字资源适时地转到所谓品或纸上[10]。自动存储包括:直接连接存储(DAS)、网络连接存储(NAS)、存储局域网(SAN)、ISCSI技术、内容寻址存储(CAS)。在对数字资源进行包装过程中,将该数字资源所需的运行环境一起打包,从而实现在其他环境下运行该程序包[10]。标准化技术 将数字资源转换成一种或多种主流格式,一种特定的格式[22]。硬件博物馆 保存计算机中的文件和软硬件,并保持它们的生命力[23]。服务器存储保护技术封装技术包括:ISCSI技术、全自动备份技术、事务跟踪技术、自动检验技术、内存纠错技术、热定位技术。

目前,国内学者对技术策略的选择存在不同观点。熊燕认为应根据既定目标选择合适的保存技术,形成一个可行的、安全的混合保存技术策略[11]。婉玲、吴振新、郭家义认为采用哪种技术方案,关键取决于被选择需要保存的资源[23]。张艳敏、马秀峰认为我国采取的主要技术策略是数字迁移、仿真、更新等[17]。黄维莉称目前已达成共识的方法主要有拷贝、迁移和再生性保护[24]。王晖认为基于风干的保存策略和基于U V C的保存策略也是数字资源长期保存的主流保存策略。司莉认为数字图形输入板适用于文献和数据库的长期存取,如年度报告、政府法律文献、珍贵艺术品等,而对于一些用途有限、需要定期删除的文献则适合采用迁移策略[20]。刘喜球提出采用分布连保式网络存储[25]。通过对国内学者所提技术策略的研究,笔者比较赞成熊燕的观点。

3.2 管理策略

管理策略主要从标准规范、法律法规、安全策略、合作保存及责任机制、建立开放系统这几个方面进行研究。

3.2.1 标准规范。建议使用一些标准格式,如SGML、HTML、TIFF、CCITT Goup4 Fax、JPEG、MPEG、Kodak’s PhotoCD[18]。丁丽鸽认为从数字资源长期保存系统实现的角度看,数字资源长期保存中涉及的标准主要有系统层次的标准、业务层次的标准和数据层次的标准[14]。我国在2002年6月由国家质量技术监督局颁布了《开放式电子出版物结构1.0》,为电子出版物的内容表述提供了规范,这是我国第一个关于数字资源的国家标准[10]。

3.2.2 法律法规。熊燕认为应建立电子出版物的呈缴制度和数字版权保护制度,以利于数字资源保存工作的顺利进行[11]。婉玲等人指出在制定数字资源长期保存策略时不仅要考虑版权法,而且还要考虑相应软件版权保护问题[23]。杨小云等人认为妥善解决知识产权和版权问题的有效措施就是要制定相关知识产权法、版权法、合同法、缴送制等。中国科学院国家科学数字图书馆项目制定了“国家科学数字图书馆数字资源采购技术要求(草案)”,其中专门对资源采购中的“数字资源长期保存要求”做出规定[8]。

3.2.3 安全策略。秦建宁、熊燕认为数字资源的安全问题主要集中在网络安全上。在大多数情况下,数字资源的安全管理应采取以下策略:①访问控制;②信息保密;③抗否认;④制定严格的法律法规[10,11]。秦建宁还提出面对日益严重的网络犯罪,必须建立与网络安全相关的法律法规,对确保网络安全可靠地运行将起到十分有效的作用[10]。袁丽华、包平认为一是要加强用户认证,二是要采用加密手段,三是要设定访问权限,四是要做数据备份[26]。

3.2.4 合作保存及责任机制。婉玲、吴振新、郭家义认为数字资源长期保存不仅仅是图书馆、档案馆、博物馆等文献机构的责任,内容创造者、出版商等也应当承担相应的责任。图书馆尤其是科学图书馆必须要对科学资源提供长期获取服务,国家图书馆应当担负起建立国家存档库的责任。同时需要数字对象生产者(如科学家)、提供者(如图书馆)、传播者(如出版商、网站)等之间相互合作,需要图书馆之间相互合作,需要国家、国际层面上的合作[23]。秦建宁、刘家真认为涉及信息形成者、信息系统设计者、出版发行者、信息用户与信息提供者。馆际之间的合作、文献收藏馆所与技术部门、产业部门、标准部门的合作[10,27]。范文兰认为应建立不同层次的合作机制:①国际合作;②国家级别机构之间的合作;③纵向合作(即个人与机构、基层机构与省级机构、省级机构与国家机构、国家机构与国际机构之间的合作)等[28]。刘喜球提出用分布连保式网络存储[25]。戴艳清提出建立国家层面的数字资源合作保存网络[15]。张玫、李麟等也认为有必要建立国家保存体系[29]。黄维莉提出开展全方位的广泛合作保存网络,例如我国拟建的国外科技文献数字保存网络[24]。戴艳清提出由国家图书馆牵头,参与国际合作项目[15]。

3.2.5 建立开放系统。王晖指出有必要建立一个全国性数字信息归档保存系统,使之对全国文化、经济、科技、社会等领域的数字信息的存贮和存取承担管理责任,使之成为我国数字信息的资源基地[21]。刘家真认为通过维护数字信息可处理性与迁移的交替或同时进行,可维护数字信息的长期存取;执行该策略的前提条件是建立一个开放系统[2]。中国科学院文献中心提出了一个数字保存技术系统,其中,数字保存技术分属于保存管理、摄入、仓储、管理和访问5个功能块[17]。张绍武、东野广升、东野广锋、于嘉提出建立全国统一的数字信息归档系统,保证数字信息长期可获取[7,30,31]。

3.3 经济策略

经济策略是能否顺利开展数字资源长期保存的重要因素之一,能否长期持续地对数字资源进行保存,需要资金的支持。丁丽鸽认为编制一个科学的资金需求计划,清楚认识保存项目中存在的经济风险;多渠道筹集数字资源长期保存费用,除了依靠行政资金外,还必须有主要来自于数字资源用户的使用费用和一些大集团的赞助;实施集中分布合作保存模式[14]。熊燕认为要大力做好宣传工作,让数字保存理念深入人心[11]。张艳、马秀峰称目前我国各项目资金主要来源于国家或政府机构专项投资、图书馆业务经费分配、出版商赞助、用户赞助等[17]。戴艳清提出开展数字资源长期保存项目立项前的论证,避免盲目投资[15]。

3.4 选择策略

3.4.1 资源的选择。目前许多专家提出首先保存容易丢失、与未来有关联且有重要价值的数字资源。王晖建议研究和创建确定什么是必须保存的数字资源特征属性的工具[21]。秦建宁指出保存重要的科学数据,特别是“原始数据”[10]。戴艳清认为首先应识别并优先保存有消失危险的数字信息资源;其次是选择有重要价值的资源进行保存[15]。

3.4.2 媒体的选择。杨小云、魏鑫、吴玉玲、司莉指出现有一种高密度的只读存贮光盘H D-R O M,是C D-R O M光盘存贮能力的180倍,而价格只是它的一半,是很好的选择[8,18]。杨小云等学者还提出从存贮技术来看,光盘的D V D系列的存贮设备较有前途,将光盘与磁盘阵列结合起来,让高速的磁盘阵列作为光盘库的大容量缓存,可以满足海量的数字图书馆的存贮要求[8]。周建军、李肖军、刘家真指出缩微胶卷被认为是唯一能够接受的存储载体,其寿命至少可达300年[2,6]。张艳等学者认为我国的数字资源保存介质以D V D、C D、磁带、录像带为主[17]。我国的国家标准《电子文件归档与电子档案管理规范》对长期归档保存的文献媒体选择进行了推荐。“本标准推荐采用的媒体,按优先顺序分别是:只读式光盘、一次写入光盘、硬磁盘、可擦式光盘等[10]。

4 结语

笔者对国内学者数字资源长期保存策略研究成果进行总结归纳,主要从技术策略、管理策略、经济策略、选择策略这4个方面进行探讨。目前研究对数字资源长期保存没有形成成熟的策略方案,学者基本上从理论的角度进行探讨,正处于初步阶段。通过对国内学者研究成果的归纳,希望今后数字资源长期保存项目在一有研究成果基础上得以快速发展。

[1] 刘喜球.中小型图书馆数字资源长期保存的对策[J].科技文献信息管理,2009(3):8-61.

[2] 刘家真.数字信息保存的策略[J].情报学报,2000(4):349-353.

[3]图书馆界呼吁建设国家数字文献资源长期保存服务体系[J].现代图书情报技术,2008(11):71.

[4] 王萍.数字信息资源长期保存策略探析[J].湖南第一师范学报,2009(4):134-138.

[5] 李文.试论数字资源的长期保存问题[J].惠州学院学报:社会科学版,2005(2):103-106.

[6] 周建军,李肖军.数字资源长期保存的技术障碍及对策[J].数字兰台,2009(8):4-5.

[7] 张绍武.数字信息长期保存的策略取向[J].图书情报工作,2000(6):41-44.

[8] 杨小云,魏鑫,吴玉玲.数字资源长期保存存在的问题及对策[J].农业图书情报学刊,2009(11):30-33.

[9] 崔明新.数字资源长期保存的技术策略初探[J].现代化管理,2008(3):55-57.

[10] 秦建宁.数字资源长期保存研究进展及发展策略[J].图书情报工作,2010(6):236-240.

[11] 熊燕.数字资源长期保存的策略研究[J].农业图书情报学刊,2010(4):124-127.

[12] 刘家真.保护数字信息长期存取研究综述[J].情报杂志,1999(7):32-35.

[13] 陈芳仪.数字文献资料的保护[J].江苏图书馆学报,1997(4):53-55.

[14] 丁丽鸽.非技术因素对数字资源长期保存的影响及应对策略[J].山西档案,2010(2):28-30.

[15] 戴艳清.原生数字资源长期保存的经济策略研究[J].图书馆杂志,2010(11):9-17.

[16] 陈益君,丁梅娟.数字资源管理与利用研究[M].北京:科学出版社,2003:207-209.

[17] 张艳敏,马秀峰.中外数字资源长期保存策略比较研究[J].图书馆学研究,2009(6):29-32.

[18] 司莉.数字信息面临的挑战与对策[J].图书馆杂志,1999(3):1-3.

[19] 赵永超.基于仿真的数字资源长期保存策略[J].情报探索,2009(1):89-91.

[20] 司莉.数字文献长期存取技术策略比较研究[J].大学图书馆学报,1999(5):35-37.

[21] 王晖.数字信息长期保存的技术策略[J].情报探索,2008(10):111-114.

[22] 王清飞,刘琳.数字资源长期保存的策略探讨[J].江西图书馆学刊,2008(3):33-35.

[23] 宛玲,吴振新,郭家义.数字资源长期战略保存的管理与技术策略[J].现代图书情报技术,2005(1):56-59.

[24] 黄维莉.数字资源长期保存策略研究[J].图书馆学刊,2009(7):68-70.

[25] 刘喜球.中小型图书馆数字资源长期保存的特点及其策略[J].工作研究,2008(9):120-122.

[26] 袁丽华,包平.国外数字资源长期保存及我国的发展策略[J].新世纪图书馆,2009(2):9-11.

[27] 刘家真.保护数字信息的长期存取策略[J].武汉大学学报,1999(4):146-149.

[28] 范文兰.数字信息长期保存的合作问题探微[J].图书馆学研究,2007(11):23-25.

[29] 张玫,等.中国图书馆数字文献资源长期保存现状调查[J].图书情报知识,2009(2):47-51,59.

[30] 东野广升,东野广锋.数字信息长期保存策略探讨[J].情报科学,2001(7):743-744.

[31] 于嘉.数字信息长期保存的策略探讨[J].河南图书馆学刊,2005(6):14-23.

猜你喜欢
数字信息文献数字
Hostile takeovers in China and Japan
速读·下旬(2021年11期)2021-10-12 01:10:43
北京尚水数字信息产品介绍
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
大东方(2019年12期)2019-10-20 13:12:49
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
心理学报(2019年7期)2019-07-06 07:10:54
答数字
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
商情(2017年1期)2017-03-22 16:56:36
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12
成双成对
数字信息时代图书馆职业权利缺失与回归路径
图书馆论坛(2014年9期)2014-03-11 18:48:08