霍速袁琳
大数据技术、图书馆服务平台、人工智能等技术发展将会影响图书馆的运作与服务,促进学术型图书馆的变革与转型[1]98。大数据环境下,各种资源类型多样、数量庞大、分布广泛、结构复杂[2]83,图书馆资源保障、资源深度利用等方面的工作迎来了各种各样的挑战。图书馆的资源服务、数据服务以及自动化管理同时面临着变革,数据发展驱动着新的转型时期的到来。
新时代的数据发展与技术变迁将图书馆系统的革新推上历史舞台。随着时代的快速发展,传统的数据存储与分析系统已经失去竞争优势。在过去的十年中,高校图书馆失去了对于科学信息的垄断,亟待提升系统价值和服务效能。图书馆面对大量数据和资源的同时,增加了对数据的管理困难,许多高校图书馆一直在试图改变数据收集的效用。图书馆需要拥有足够多的数据和用户参数,并且能够给出理想的检索结果,对指定任务能够作出充分而有效的响应[3]503。
传统图书馆系统的功能滞后与服务制约迫使我们不得不正视这项新的课题,那就是智能图书馆系统的研究与开发。本文通过文献调研与分析,结合国内外实践发展与高校图书馆在资源、服务、管理等方面的业务需要,提出了高校图书馆系统从传统转向智能的整合框架,为相关智能系统的研发提供参考。
1.研究现状。通过文献研究可以发现,从2010年开始,围绕“智慧图书馆”“大数据”“云计算”等关键词展开的研究逐步增多,图书馆智能系统研究已成热点。
国外对于智能系统的研究起步较早。Ranganathan的“图书馆学五定律”中,就提到了智能开发新技术以改善用户服务,满足人类需求,创造未来的问题。国外学者指出,我们面临的是众多类型不同的数据,这些数据都是高速生成的。大数据被列为2017年最重要的战略技术趋势之一。国际数据公司(IDC)在其研究中预估,到2020年末,数字世界的整体增长将达到40ZB。在数据的驱动下,社会各个领域生成了不同主题的数据分析报告,数据系统、数据公司应运而生,越来越多的技术被引入到各种组织机构的业务领域。大数据技术在图书馆信息系统中也有着广泛的影响。数据技术的发展应用到图书馆系统将有助于更好地了解用户需求,提供数据分析报告、优化图书馆管理与服务[3]512。
2008年,美国的Andrew W.Mellon基金会已经开始自助开放图书馆环境的研究。2009年,普林斯顿大学和波士顿大学开展了一项关于资源管理的研究,他们与ExLibris公司合作在2011年研发出一个基于云计算的新型图书馆管理系统。2011年,大英图书馆将国家图书馆数据作为关联数据发布,描述了感兴趣事物的模型。有关图书馆发现系统的研发、图书馆智能系统的探索从技术领域、服务管理、项目介绍等方面层出不穷。数据图书馆系统的研究利用了各种技术,从技术类型、数据源的大数据分析、业务分析、实时处理等方面都有探讨,在智能系统的加工上,给予了我们技术方向和架构思路[4]7。
纵观国内有关图书馆智能系统的研究,随着谷歌模式和百度模式以及各种智能交互工具深入大众生活,图书馆系统发展越发需要加速革新。越来越多的学者和技术人员开始关注图书馆智能系统研发领域,基于发现的检索系统开始在图书馆领域盛行[5]11。然而,无论从资源的角度出发,还是从服务的角度出发,单纯的发现系统都不足以实现智能图书馆系统的业务要求。单纯针对资源的发现系统无法满足数据分析和知识管理的需要,只针对服务的系统也存在数据管理的困境。同时在业务管理上,单纯针对采购或者仓储管理等业务的智能系统,也存在数据管理、系统整合等挑战。构建新时代的智能系统是当下的关键课题[6]76。
我国对智能图书馆系统的研究主要依据国内图书馆系统现存问题、国外智能开发趋势、智慧图书馆架构等问题进行。一方面提出智能图书馆整体架构规范、智能图书馆建设策略,另一方面展开智能系统相关研发。研发课题多见于发现系统、推荐系统、FRID智能管理系统等单独层面的技术研究。技术问题依据国外流行的系统和研发成果进行探索。同时,也对国内主流服务平台进行功能架构等方面的分析,为新型图书馆系统提供参考。在智能系统的研究角度上,主要趋向于态势研究、模式探讨、新技术支撑三个方面。在研究内容上,涵盖框架体系、服务模式、数据管理、系统开发、新技术引入等方面。
2.发展困境。近年来,在数据驱动下,国内外对智能图书馆系统展开了一系列探索。图书馆界对于智能系统的开发和研究以适应数据驱动需求,满足图书馆服务要求,拓展数据管理分析能力,升级智慧发现功能,深化知识服务及职能交互为目标而进行。
当前大数据环境要求图书馆采用新技术、新理念建构智慧型图书馆管理系统,这个管理系统应能整合图书馆各个层面的管理功能与服务需求,提供集资源、服务、管理三位一体的智能服务。然而,不同来源的数据及其累积增长严重制约了图书馆系统的开发。Rubin认为,教育机构在提供图书馆服务方面正处于一个转型时期。高校图书馆用户产生了更多的数据分析、知识管理及智能推荐方面的需求。高校图书馆已经失去了其作为科技信息中心的地位,以上功能的实现效能严重制约了高校图书馆与其用户之间的良好关系,如果不能尽快满足高校用户群变更的服务需求,高校图书馆将失去用户信赖,降低其职能地位。图书馆智能系统的开发已经成为当前高校图书馆业务开展与自身管理的当务之急。
在智能系统发展的道路上,我们面临的最大的问题就是数据本身。这个时代的数据飞速发展与数据技术的不断革新推动着智能系统的研发进程,同时数据也是系统构建的核心和基础。在需求升级与系统转型中,图书馆拥有海量资源信息,数据量丰富而庞大,包括纸质资源、数字资源、空间资源以及相关的系统数据、用户参数、日志记录等。相关数据杂乱无章、大量数据库资源的基础数据难易获取、发现检索收到噪音数据的干扰等问题,都影响着图书馆智能系统的实现。
数据是系统服务的基础和保障,图书馆的数据类型繁多、来源广泛、格式多样、结构各异、质量参差。数据的标准化、规范化是当前制约系统开发的首要问题。与此同时,智能系统的研讨尚处初级时期,理论基础薄弱、实践经验不足,大部分研究仍处于摸索阶段,这项课题的开展亟待深入,扩大不同领域和机构的合作交流。
1.概念认知。智能图书馆是指利用智能技术管理图书馆并提供服务的图书馆。20世纪70年代,美国图书馆学家Frederick Wilfrid Lancaster在他的《走向物质情报系统》和《电子时代的图书馆与图书馆员》中,提出了“电子图书馆”的概念,到20世纪80—90年代,又出现“无墙图书馆”“数字图书馆”和“虚拟图书馆”等概念,智能图书馆就是在这些概念和实践的基础上提出来的[7]72。智能图书馆必须具备智能特征:自主学习、智能控制、信息传感等[8]100。
图1 智能图书馆概念解析
根据我们对于智能图书馆的概念理解,可以认为智能图书馆系统首先必须具备两个条件,即“智能管理”和“智能服务”。智能图书馆系统应当是融合馆长、馆员、用户于一体,集系统管理、自动化办公、数据分析、智能服务于一身,可以提供智能管理与智能服务的智能化系统。
图2 图书馆系统概念解析
2.功能定位。智能图书馆是基于组织结构在智能技术和智能设备支撑下,对图书馆资源进行智能管理与开发,最终实现智能化服务。智能图书馆系统是集系统管理、自动化办公、数据管理与分析、智能服务与一身的面向馆长、馆员、用户提供智能管理与服务的自动化系统。
智能图书馆系统的搭建首先需要明确其功能定位,根据以上分析可以将其功能定位基本确定在智能服务与智能管理两方面。而智能图书馆的服务集合图书馆资源服务和知识服务,基于资源与知识提供智能服务。从资源和服务两个角度出发,可以将智能图书馆系统的功能进行如下解析。
智能图书馆系统基础资源与数据,通过技术支持,实现面向用户、工作者(馆员)、管理者(馆长)的功能定位。
面向用户提供基于数据挖掘、分析、利用、发现、推荐等方面的使用功能;面向工作者提供资源管理、数据获取、数据加工、数据管理、数据服务等方面的系统维护、系统管理、系统分析等应用功能;面向管理者提供数据分析、绩效分析等方面的决策功能。
图3 图书馆智能系统功能定位
1.基本框架。图书馆智能系统应是一个开放、包容、智能的集成系统平台。在传统图书馆系统向智能图书馆系统转型时期,其基本框架必须将传统模式与数据技术相结合。其系统平台的基础是数据,以数据为中心搭建文献数据管理系统、运行数据管理系统、用户数据管理系统、数据统计分析系统、智能门户系统、数据应用控制系统。将图书馆系统管理、自动化工作、资源管理、用户管理、发现检索、知识服务、统计分析、绩效评价等功能集成整合,实现数据(门禁数据、图书借阅数据、资源使用数据、用户数据、访问数据)管理、数据统计、信息发布、发现检索、智能推荐等多个模块功能。简而言之,智能图书馆系统基于资源,依靠数据,实现服务,基本框架如图4所示。
图4 高校图书馆智能系统基本框架
智能图书馆系统应由数据管理、业务管理、系统管理三部分组成。数据管理包含元数据管理、运行数据管理、数据组织管理、数据接口管理。数据管理是在数据获取与处理的基础上进行的,包括资质资源、数据库资源等数据,用户数据、行为数据、各类系统的业务数据以及其他事实数据和衍生数据等等。对获取数据进行加工处理后进行数据管理。元数据管理是指对元数据进行规范化、标准化组织、分析,以及对元数据与资源库进行比对分析产生的数据报告。运行管理是对系统平台整体进行运行分析。数据组织管理是对数据资源进行汇编,提升资源揭示水平和利用效果。结构管理是对数据结构方式进行管理,保证数据的流通与交换。业务管理是对图书馆工作者而言,实现业务管理功能,包括资源采购、编目、典藏等图书馆相关业务的标准管理及办公自动化管理。系统管理主要包括系统参数的配置规则、用户管理、数据分析等等。
2.数据服务。数据服务包括馆藏评价、资源揭示、发现检索、学科决策、数据管理、参考咨询、科技查新等多个方面。(1)馆藏评价是指对纸质资源、电子资源等馆藏资源的评价分析。按照不同学科、根据不同维度和不同指标进行资源支撑分析和利用分析。如馆藏图书、期刊的学科保障率,JCR、ESI等来源刊馆藏保障率,及JCR各分区、各学科保障率,高被引保障情况,数据库收录分析,SCI资源保障情况,机构对标分析,本校学术成果引用馆藏分析,数据库使用情况及绩效分析,纸本资源利用情况分析及评价等等。(2)资源揭示是指对图书馆提供的各类资源的指向导航与主动揭示。在整合分析的基础上,从学科、知识库、资源类型、适用群体等角度,对资源进行加工和展示。(3)发现检索是应用数据技术将多来源资源进行合并整理,实现中外文混检、分面聚类、纸电资源一键检索、智能跨平台获取等等,实现学习型检索与分析发现系统。(4)学科决策是利用数据获取技术,综合各机构数据,将数据进行中外文对比、多数据源标识、学科体系分类及重要机构、学者梳理,建设支撑双一流学科建设的文献数据支撑服务平台。(5)数据管理是对科研数据、教学数据、学者数据、用户数据等数据信息进行分级分类管理,形成科学化、规范化数据管理平台,实现以研究数据管理为基础的学术数据管理与共享平台。(6)参考咨询是通过数据技术搭建海量知识库、进行智能应答、智能检索、咨询绩效等等。(7)科技查新是指利用智能管理系统实现智能化业务委托、进行查看、报告管理、电子签章、财务管理及查新报告自动生成功能。
3.建设原则。第一,数据关联。在资源画像和用户画像的驱使下,智能系统务必保证数据关联原则,运行数据关联扩展。图书馆的基础资源对象是用户,其数据标签包括资源类型、主题、语言、数据库源、年代、学科、用户姓名、ID、IP、类型、院系、身份等等,只有运行数据关联扩展才能保证各项数据分析的实现与效用。第二,数据模型。数据是核心,算法是关键,在系统研发中需要根据系统需要进行数据建模及算法推演,让数据经过算法实现运行,从而获得更多数据结果。第三,数据驱动。数据驱动下,图书馆的各项业务流程及业务目标逐渐演变,智能系统的建构首先必须进行需求分析与业务研究,实现各项业务的共生与融合,优化业务流程,简化业务操作,优化业务管理。
数据驱动下,高校图书馆面临着智能管理与智能服务的变革,满足日益更新的高校用户群的服务需求,需要对传统图书馆系统进行升级转型。智能图书馆系统的建设是提升数据服务效能和系统价值的关键课题。
高校图书馆智能系统的建设要实现智能管理与智能服务两项功能,必须为图书馆管理者、工作者、用户三方面提供相关的应用服务与管理服务。根据用户对象和业务要求,分析数据服务内容,依据建设原则,搭建数据管理、业务管理、系统管理框架,选择恰当的数据模型和算法进行系统研发。
图书馆智能系统的建构在理论基础和实践上尚不成熟,相关探讨出发点和角度各不相同,在综合型智能系统的建设上仍没有提出普遍认可的系统模型。当前,有关Hadoop的技术开发在资源整合和发现推荐等方面较为活跃,是否可以进行业务管理、数据管理等方面的深入开发值得深入探索。总之,创新图书馆管理系统,需要新技术与新理念的融合,跨学科的深度研究势在必行。