信息化视角下国外科技档案管理研究进展与特点*

2014-06-10 03:32:54安小米郝春红
档案与建设 2014年7期
关键词:检索档案管理科技

董 宇 安小米 钱 澄 郝春红

(1.北京石油化工学院经济管理学院,北京,102600;2.中国人民大学信息资源管理学院,北京,100872;3.中国人民大学数据工程与知识工程教育部重点实验室,北京,100872)

1 研究背景

目前,国内对国外科技档案研究的关注度较低,采用“外国”、“国外”、“西方”、“科技档案”、“科研档案”、“科技文件”、“科研文件”、“科技文档”、“科研文档”、“科技数据”和“科研数据”的组合字段对CNKI数据库进行题名检索,检索到的相关期刊只有6 篇,2005年以后的数量仅3 篇,总体数量上较少。在研究内容上,2007年发表的《中外科研档案管理的现状比较及借鉴》,从科研档案的概念、服务对象、管理模式等几方面对中外科研档案管理进行了研究,得出了值得我们学习借鉴的国外科研档案管理经验[1]。在2007年发表的《国外科研文件和档案管理研究》中,作者在国外相关术语的涵义、国外科研文件和档案管理的特点、规律、存在的主要问题等方面对国外科研文件和档案管理进行了阐述,并指出了国外科研文件和档案管理今后的发展趋势[2]。2005年以前发表的相关文献有4篇,1996年的《国外科技报告的收藏与利用》,文中给出了收藏国外科技报告的2 种途径、国外科技报告的管理方法及使用方式[3]。另外3 篇内容只集中在国外科技报告的获取方法上[4-6]。

上述研究揭示,至今国内尚无从信息化视角开展的国外科技档案管理研究。目前,信息化对整个信息资源管理的影响巨大,技术手段的飞速更新,使信息资源的管理模式变化很大,这其中也包括科技档案的管理,而在全球信息化过程中,西方国家一直走在其他国家的前列,及时了解西方国家科技档案管理的现状、发展情况及发展过程中取得的经验和教训,对我国的科技档案管理将会提供有益的参考。本文从科技档案管理发展历程、科技档案管理中存在的问题及对策等几方面对英文文献进行了调查研究及分析。

2 文献调查结果分析

本文将科技档案看成直接来源于科学研究和科技生产活动的原始记录,是科技活动中形成和接收的具有一定保存和利用价值的科技数据、报告、文件、信息和知识等科技信息资源。在文献调查过程中对Web of Science 三大引文库、ProQuest 系列数据库、EBSCO进行相关检索。

2.1文献检索结果分析

根据检索结果揭示:与“科技档案管理”直接相关的文献几乎没有,故可以认为:国外对于专门研究“科技档案管理”这一课题的关注度很低。而查询到的与“科技档案”这一课题相关的文献有以下的特点:

1.涉及到“管理”方面的内容较少;

2.关注最多的主题主要涉及到“国外科技档案管理的技术手段”等内容上。

根据上述的检索情况,可以认为:国外并不将“科技档案管理”单独作为一个问题来研究,只将其划归为“档案管理”的一部分,其“管理”方面的内容会在“档案管理”中阐明。

在我国档案工作基本术语(中华人民共和国档案行业标准 DA/T1—2000)中档案指“国家机构、社会组织或个人在社会活动中直接形成的有价值的各种形式的历史记录”,科学技术档案指“反映科学技术研究、生产、基本建设等活动的档案”[7]。国外并没有对应的科技档案概念和专用的科技档案词汇用于概括上述综合性的科技领域活动档案,国外文献中使用最多的是science archives、science data、science information、 science information resource、 science records、science knowledge、science reports 等词汇,这些主题的文献都与上述定义的涉及“科技档案”的概念有关联,本文选择了其中涉及有价值的各种形式的历史记录的内容和直接来源于科技活动的内容,作为主要的研究对象,探索国外科技档案管理与发展的规律。

2.2 国外科技档案及其管理的发展历程分析及特点

从发展历程上看,以信息化技术手段划分,经历了3 个不同的阶段,分别为科技档案的计算机电子化管理(1967-1994)、科技档案的分布式计算机网络化管理(1994-2000)、科技档案的互联网大数据智能化管理(2000-2013),详见表1。

在科技档案的计算机电子化管理阶段,计算机的使用率较低,性能也与现在的计算机相差很大,如何将计算机技术应用到科技档案管理中去是当时国外研究的主题,例如,在研究美国国家航空航天局(NASA)如何处理从宇宙飞船传回地球的数据时,研究的重点也是放在单机版的计算机应用上[8]。而在其他领域,如何使硬拷贝的科技档案转化为计算机可识别的文件,如何使用单机版的计算机管理科技档案等方面的研究成为主流。

在科技档案的分布式计算机网络化管理阶段,国外研究主要关注如何利用计算机网络对科技档案进行管理,一些主要数据档案机构,例如美国校际社会科学数据中心(ICPSR),为了能给数据管理者和个人研究人员提供更好的服务,运用网络技术建立起数据集成系统。通过这个集成系统,可以使研究人员能够搜索到存档在世界各地各类机构的数据集,可以对文档进行详细研究,可以使用简单的分析工具对数据集进行分析探究,并对数据集进行抽取或完整拷贝,所有活动均在这个集成系统中完成[9]。在临床学领域,有学者采用竞争网络技术,来实现对列表信息的存储和检索[10]。这个时期,人们也开始研究互联网技术在科技档案管理方面的应用,美国国家空间科学数据中心(NSSDC)建立了基于网络的数据系统来支持交互数据的可视化及其分发[11]。

从检索到的国外文献可以看出,2000年以后,国外对科技档案管理的研究重点已放到互联网时代的科技档案的利用上,探讨的问题主要是采用何种技术才能更好的利用科技档案,这标志着国外在研究上已处在科技档案的互联网大数据智能化管理阶段。而是否在科技档案管理中加入智能化的分析利用功能,正是划分这两个阶段的依据。对于这个阶段国外科技档案管理相关内容的研究是本文的重点,研究内容包括:国外相关科技档案管理的措施、技术手段,利用及服务,主要问题及对策等,可为我国提高科技档案管理水平提供有用的参考。

根据检索结果,国外科技档案管理按所应用的领域分布有以下特点:

·科技档案的研究领域主要集中在社会科学、地球科学、生命科学、天文科学及信息学这5 个领域中。

·科技档案的研究一直处于平稳上升的趋势。

·在各学科领域中,对于科技档案的研究内容主要集中在科技档案管理的技术手段的研发上。

2.3 国外科技档案管理面临的一些问题及对策

从可获取的文献分析得出,国外科技档案管理最为关注的问题与对策涉及两个方面:

1 科技档案的归档范围制定

在科技领域有一种观点,即使在我们不知道信息、数据和软件最终用途时,我们还是有必要对这些信息、数据和软件进行归档保存。但考虑到成本等因素,在实际过程中并不能完全做到这一点。所以,会出现由于科技档案的归档保存范围制定不当造成的管理问题,例如,在2006年以前,NASA 在管理行星科技档案过程中,制定了一般性的科技档案归档方案,其初步设计如下[12]:

·由试验团队中的一组准备科技档案,小组成员中应包括档案工作者。

·试验团队中的另外一组进行科研规划和仪器操作,但是不参与归档活动。

这就出现了科研规划和仪器操作信息无法找到其最终的存档方式,造成了归档保存范围的缩小,NASA的解决方案是:由试验团队中的第三组完成与上述档案有关的任务,同时,对仪器操作正确性和数据有效性进行核实,并将结果直接反馈给科研规划组。此方案的缺点是:任务存档的设计和实施没有按照常规成熟的软件标准去执行,使信息(包括软件等)和数据不能经常按计划传送到最终的任务归档部门[12]。

3 科技档案的有效利用

电子环境中,为使科技档案更便利更有效地被人们利用及服务,搭建一个良好的人机交互平台是一个重要的技术手段,三维可视化交互平台可以使客户更直接有效对科技数据进行分析利用,但面临许多问题:虽然能够提供可视化的一些新技术已经存在,但是它们在学术期刊出版界中的应用还处于尝试性阶段。这些出版商不愿意采用这些技术的原因有很多,具体包括:很难将准备和分发内容的新方法与现有的工作流程相结合;对于读者和投稿者来说,不能确定其新颖的呈现方式的真正价值等内容。可行的解决对策是:促使出版商、作者、图书馆、软件开发商和相关科学家共同协作开发[13]。目前,三维可视化交互平台的开发还不完善,还有许多问题需要解决,将是今后国外科技档案管理领域的一个重要研究方向。

4 结论

从检索到的国外文献可以看出,2000年以后,国外对科技档案管理的研究重点已放到互联网时代的科技档案的利用上,探讨的问题主要是采用何种技术才能更好地利用科技档案以及如何在科技档案管理中加入智能化的分析利用功能。

普遍采取的做法是:开发适合本领域的科技档案管理(包括收集、储存等功能)系统,并在此基础上增加语义网技术、数据挖掘技术、人工智能技术等手段的智能分析模块。

从所属领域上看,空间技术方面的内容较多,其中美国NASA 方面的内容不仅多,而且处于每个时代的最前沿,一方面:空间技术是前沿科学,对每个国家的其他领域的科学发展有很大的带动作用,另一方面:空间技术领域的科技档案海量,科技档案的管理、利用等要求最迫切。

同时关于如何保护科技档案的信息安全也将是今后科技档案管理研究中一个长期存在的热点话题。

国外并不存在对应于我国的“科技档案管理”概念,我国科技档案管理涉及多种科学技术活动,国外并不存在将所有科学技术活动看成一个综合对象开展的科技档案管理研究。科技档案管理不是独立的研究对象,只是“档案管理”的一部分。本文局限于将science archives、 science data、 science information、 science information resource、science records、science knowledge、science reports 看 成 来源于科技活动的有价值的历史记录,作为研究对象,探索国外科技档案的管理与发展规律。未来研究将选择更多类型的科学技术活动探索不同类型的科技档案的管理与发展规律。

?

[1]安小米.中外科研档案管理的现状比较及借鉴[J].中国档案,2007(8):60-61.

[2]安小米.国外科研文件和档案管理研究[J].北京档案,2007(5):40-41.

[3]李家瑞,黄崇安.国外科技报告的收藏与利用[J].图书馆杂志,1996(5):24-25.

[4]赵婷婷.国外科技报告全文的获取途径[J].科技信息,2009(13):379.

[5]翁赓年.国外科技报告及其检索法[J].药学实践杂志,1984(3):32-35.

[6]作者不详.国外档案情况—美国国家档案馆的科技档案[J].档案学通讯,1979(2):25-26.

[7]国家档案局.中华人民共和国档案行业标准—档案工作基本术语(DA/T1-2000)[S].北京:8中国标准出版社,2000.

[8]Ludwig G H.Space sciences data processing[J].IEEE Transactions on Nuclear Science,1967,NS-14(1):626-632.

[9]Rockwell R C.An integrated network interface between the researcher and social science data resources:In search of a practical vision[J].Social Science Computer Review,1994,12(2):202-214.

[10]Cheng K J.Retrieval of clinical science information using an interactive activation and competition network[J].Artificial Intelligence in Medicine,1996,8(4):359-375.

[11]Mathews G J,Towheed S S.WWW-based data systems for interactive manipulation of science data[J].Computer Networks & ISDN Systems,1996,28(13):1857-1864.

[12]Zender J ,Grayzeck E.Lessons learned from planetary science archiving[J].Advances in Space Research,2006,38(9):2013-2022.

[13]McMahon B.Interactive publications and the record of science[J].Information Services&Use,2010,30(1/2):1-16.

[14]Bisco,R L.Social science data archives:progress and prospects[J].Social Science Information,1967,6(1):39-74.

[15]Macêdo M,Cook D,Brown T J.Visual data mining in atmospheric science data[J].Data Mining and Knowledge Discovery,2000,4(1):69-80.

[16]Ananthanarayan A,Balachandran R,Grossman R,et al.Data webs for earth science data[J].Parallel Computing,2003,29(10):1363-1379.

[17]Quan D.Improving life sciences information retrieval using semantic web technology[J].Briefings in Bioinformatics,2007,8(3):172-182.

[18]Cheung K H,Yip K Y,Townsend J P,et al.HCLS 2.0/3.0:Health care and life sciences data mashup using Web 2.0/3.0[J].Journal of Biomedical Informatics,2008,41(5):694-705.

[19]Hambly N C,Collins R S,Cross N J G,et al.The WFCAM science archive[J].Monthly Notices of the RoyalAstronomical Society,2008,384(2):637-662.

[20]Subirats I,Onyancha I,Salokhe G,et al.Towards an architecture for open archive networks in Agricultural Sciences and Technology[J].Online Information Review,2008,32(4):478-487.

[21]Warner G C,Blum J M,Jones,S B,et al.A social science data-fusion tool and the Data Management through e-Social Science(DAMES)infrastructure[J].Philosophical Transactions of the Royal Society A: Mathematical Physical and Engineering Sciences,2010,368(1925):3859-3873.

[22]Unkel S,Trendafilov N T,Hannachi A,et al.Independent exploratory factor analysis with application to atmospheric science data[J].Journal of Applied Statistics,2010,37(11):1847-1862.

[23]Futrelle J,Gaynor J ,Plutchak J ,et al.Semantic middleware for e-Science knowledge spaces[J].Concurrency and Computation: Practice & Experience,2011,23(17):2107-2117.

[24]Cross N J G,Collins R S,Mann R G,et al.The VISTA science archive[J].Astronomy & Astrophysics,2012,548,A119:1-21.

[25]Lombardi M.IEAD: A Novel One-Line Interface to Query Astronomical Science Archives[J].Publications of the Astronomical Society of the Pacific,2012,124(913):254-262.

[26]Jacob R,Krishna J,Xu XB,et al.ParNCL and ParGAL: Data- parallel tools for postprocessing of large- scale Earth science data[C].International Conference on Computational Science (ICCS 2013).Barcelona: Procedia Computer Science,2013,18:1245-1254.

[27]Katayama T,Wilkinson M D,Micklem G,et al. The 3rd DBCLS BioHackathon: improving life science data integration with Semantic Web technologies[J].Journal of Biomedical Semantics,2013,4(1):6.

[28]Oesterreicher S B,Türker C,Panse C.FCC–An automated rule-based processing tool for life science data[J].Source Code for Biology & Medicine,2013,8(1):1-7.

[29]Yang X Y,Dove M T,Bruin R P,et al.An e-Science data infrastructure for simulations within Grid computing environment:methods,approaches and practice[J].Concurrency and Computation: Practice and Experience,2013,25(3):385-409.

猜你喜欢
检索档案管理科技
2019年第4-6期便捷检索目录
档案管理中的电子档案管理
科技助我来看云
档案管理与企业内部控制关系的思考
消费导刊(2017年24期)2018-01-31 01:29:20
科技在线
科技在线
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
科技在线
健康档案管理的“云”前景
中国卫生(2014年11期)2014-11-12 13:11:34
加强工程项目档案管理的有效途径