图书馆思维的变革:从小数据思维到大数据思维

2016-02-12 21:19:50马晓亭兰州财经大学信息工程学院兰州730020
图书馆 2016年5期
关键词:个性化图书馆思维

马晓亭( 兰州财经大学信息工程学院 兰州 730020 )

·专题研究·

图书馆思维的变革:从小数据思维到大数据思维

马晓亭
( 兰州财经大学信息工程学院 兰州 730020 )

随着互联网的发展、智能阅读终端设备的普及,图书馆的大数据时代已经来临。大数据时代需要有大数据思维。大数据引发图书馆员重新认识数据的价值,使得解决问题的思维从追求因果关系向注重关联关系方向转变。因此,图书馆员的思维模式必须实现从小数据到大数据的转变,才能从海量数据中获取价值,才能为读者提供满意的个性化阅读服务。

图书馆 大数据思维 变革

〔引用本文格式〕马晓亭.图书馆思维的变革:从小数据思维到大数据思维[J].图书馆,2016(5):61-65

1 引言

目前,图书馆界已进入大数据时代。作为新的生产要素和生产力的重要组成部分,大数据已成为图书馆界服务模式变革、管理理念提升、服务生产力发展和读者阅读QOS保障的决定性因素。同时,也为图书馆精准发现读者需求和优化内部业务流程,实现从以服务系统建设为中心向以读者为中心的转变,提供科学的大数据决策支持。

管理咨询公司麦肯锡的报告《大数据:创新、竞争和生产力的下一个前沿》中给出的大数据定义是:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。并指出:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产要素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”[1]大数据研究专家维克托·迈尔-舍恩伯格和肯尼斯·库克耶在编写的《大数据时代》一书中描述大数据具有Volume(海量)、Velocity(高速)、Variety(多样)、Value(价值)的4“V”特性。并明确指出:大数据时代最大的转变就是放弃对因果关系的渴求,而取而代之关注相关关系[2]。这条理论改变了人类对外部未知世界的知识发现和思维方式,提高了人类对外部世界认知和交流的效率与准确度。

伴随大数据时代的到来,图书馆数据环境呈现海量、数据总量指数级递增、数据关系复杂和低价值密度的特点。传统的实验科学、理论科学和计算科学模式,难以实时、准确和快速地发现大数据中蕴含的知识和数据关系,不能有效实现数据到知识、知识到技术、技术到创新、创新到服务之间的转换。因此,图书馆必须转变传统的知识发现和思维理念,构建全新、科学的大数据思维模式,才能高效、实时、精确和快速地发现大数据中蕴含的价值,才能为读者阅读服务和图书馆发展提供可靠的大数据决策支持。

2 图书馆大数据与大数据思维

2.1大数据与大数据思维的关系

大数据的数量、范围和价值密度,是决定大数据可用性和决策科学性的关键因素。因此,图书馆应采用智能、自动化和便捷的数据采集模式,在提高大数据采集总量、广度和价值密度的前提下,大幅度降低图书馆大数据的采集成本。图书馆通常利用监控服务器、服务器运营日志、网络监控器、视频监控系统、用户阅读终端、可穿戴阅读设备和读者管理系统等,完成图书馆相关大数据的采集[3]。

这些大数据具有数据海量、种类繁多、低价值密度和高时效性的特点,并且大数据的价值总量和价值密度是由数据的采集规模、颗粒度、多维度、活性和相关性共同作用。因此,大数据与有限数据在数据环境、数据特点和数据应用方式等方面的差别,导致图书馆必须采取与传统思维不同的大数据思维模式。首先,大数据思维摒弃了传统思维对数据进行随机采样分析的模式,实现了对海量大数据整体的全面性处理与分析。其次,大数据思维更加追求对数据复杂性和所蕴含知识的挖掘,弱化了传统思维模式对知识和信息的精准发现。第三,大数据思维更加注重对数据相关性的发现,而摒弃了传统思维模式对事物因果关系的精准探索。第四,大数据思维的最终目的是实现数据、知识、智慧和决策之间的转化,为图书馆的变革、管理和用户服务提供科学的大数据决策支持。

2.2图书馆大数据思维在数据应用上的三个重大变化

图书馆大数据具有Volume(海量)、Velocity(高速)、Variety(多样)、Value(价值)的4“V”特性,并且读者对图书馆阅读服务有精准、智慧、实时和个性化的需求,因此,图书馆必须转变传统的大数据应用理念,才能高效、全面、精确和低成本地挖掘、发现大数据价值。

对包括与图书馆变革、管理、运营和读者服务相关的数据进行全样本采集,是图书馆大数据思维,在数据应用与传统随机样本处理理念上的一个重要区别。图书馆在传统的数据采集分析中发现,分析结果的精确性与数据采集的随机性成正比关系,而与所采集数据的总量相关性较小。因此,采样对象的局限性、方法的科学性、采样周期在时间轴上的正态分布等,决定着图书馆采样数据的价值和可用性,进而影响着传统数据思维模式的科学性和决策可靠性。伴随图书馆大数据采集技术的发展和采集成本的大幅下降,数据采集已不是制约图书馆全量数据获取和数据全维度保证的主要因素。图书馆可通过高效、实时、经济和低成本的全样数据采集,从多角度和多层面挖掘大数据的价值,为大数据决策提供可靠支持。

多阅读模式和个性化服务保障是读者阅读活动发展的一个大趋势。据统计分析,当前图书馆大数据总量中仅有15%的数据是结构化数据,而85%的大数据是非结构化数据,且随着图书馆服务模式的发展和变革,非结构化数据所占大数据总量的比例逐年上升。受到数据采集技术、工具和方法的影响,大数据的采集与有限数据采集相比,具有较高的不精确性和较低的价值密度。图书馆大数据思维应重点关注大数据带来的高价值和新洞察属性,通过数据的过滤与清洗过程,消除大数据不精确、高混杂性、低价值密度和实时性等特性对大数据思维的不利影响。

大数据思维致力于对数据之间相关关系的分析与发现,取代了传统探求事物因果关系的思维模式,这是大数据思维的又一个重大变化。读者在阅读活动中,其阅读需求、阅读行为、阅读模式和阅读社会关系数据的产生具有较强的随机性。图书馆通过对这些不相关大数据的整理、清洗、转换和分析,可发现大数据之间隐匿的相关性和知识,并基于图书馆大数据分析系统的“分析即服务”支持,为读者个性化阅读活动提供科学、即时的大数据决策支持,而不必过分探究与读者阅读活动QOS保证无关的事物因果关系。

2.3大数据思维与图书馆的大规模个性化定制服务

大数据研究权威维克托·迈尔-舍恩伯格教授在其著作《大数据时代》中描述:大量的数据能够让传统行业更好地了解客户需求,提供个性化的服务[4]。随着云计算技术的发展及其在图书馆界应用的深入,图书馆的大数据采集、存储、计算和传输效率快速提升,其应用成本在服务总成本中所占比例大幅度下降。图书馆可利用云计算技术,对读者阅读活动相关大数据进行全面的采集、高效处理、精准分析和科学决策,以此来掌握每一位读者的阅读需求、模式、爱好和习惯,并为庞大的读者群提供大规模的个性化定制服务。因此,如何提升图书馆大规模个性化定制服务的效率、精确度、实时性和QOS(服务质量)保证有效性,是图书馆大数据思维应重点关注的一个问题。

大数据的4“V”特性,使得图书馆大数据思维必须坚持全面、连续、大规模和快速的数据应用原则,来替代传统小数据思维抽样、片面、局部的模式。通过对大数据全体的价值发现、挖掘、分析和决策,可对图书馆的服务模式变革、读者需求发展、系统管理运营和外部竞争环境变化宏观趋势,给出科学、高效、实时、经济的预测和决策支持。因此,大数据思维的一个主体就是坚持以读者为中心的思维模式。

此外,为庞大的读者群定制个性化的产品和服务,是图书馆服务模式变革的一个重要方向。在个性化服务的定制中,如何在保证服务满足读者个性化需求的前提下,具有较低的服务成本投入和较高的实时性保证,是关系图书馆服务投资收益率的一个重要问题。因此,大数据思维应基于海量数据的决策支持,从关注事物因果性转向数据之间关联性,从因果关系的串联思维转向大数据相关关系的并联思维,努力提升图书馆对读者阅读需求和服务变革发展的感知力,才能实现读者大规模个性化服务定制从量变到质变的过程[5]。

2.4“小数据思维”与“大数据思维”

“小数据”环境下,图书馆的思维与决策常常依据管理者对事物发展的假设做出,以及管理层在图书馆建设、运营和读者服务过程中的经验来制定,然后通过对“小数据”的采集、分析和判断,来验证小数据思维与决策的正确性和可行性。这种“小数据”思维模式具有较强的主观性、随机性和不确定性。大数据思维通过对海量、全景数据的实时分析,可准确发现大数据中隐匿的数据相关性和知识,并基于在大数据中发现的知识来进行大数据决策,具有科学、高效、实时和快速的特点。与“小数据思维”相比,“大数据思维”位于新的数据环境和思维模式中,面临着诸多新的挑战。

核心数据是关系图书馆发展变革、运营管理、QOS保证和综合竞争力提升的关键数据,是图书馆大数据的重要组成。首先,图书馆在大数据思维中,往往过分强调对全量数据的实时、快速处理和分析,而忽视了核心数据在图书馆核心业务决策中的重要性,导致图书馆在大数据决策中主次不分,影响了服务的总体收益率。其次,从数据的来源和范围划分,图书馆大数据可分为内部数据与外围数据两大部分。如何通过内部数据与外围数据的整合,增强图书馆大数据之间的交互性和关联性,是实现图书馆大数据二次增值和提升数据价值总量、可用性、可控性的关键。第三,图书馆的云计算技术水平、数据的共享与开放程度、大数据的分析能力、大数据算法科学性、管理人员的大数据素养、主体业务对大数据思维的依赖程度等,都是关系图书馆大数据思维有效性的关键因素,图书馆在上述任何一个主要环节的失误,都会影响大数据思维的科学性和准确性[6]。第四,时效性是图书馆大数据的一个根本特性,因此,大数据思维随着大数据生命周期的发展,也会有一个发展、成长、成熟、衰退和消亡的过程。图书馆如何依据大数据生命周期发展规律,构建科学的大数据思维失效预警机制,是保证大数据思维与决策科学、可用的关键。

3 图书馆如何构建科学的大数据思维范式

3.1图书馆大数据思维应实现四个纬度的转变

随着云计算和网络传输技术的发展,数据的采集、传输、存储、处理和分析技术,已不是影响图书馆数据思维科学性的主要因素,图书馆的思维模式已从小数据样本思维转向大数据整体思维,使图书馆能够全面、立体和系统地认识自身组织结构和服务的相关性。基于大数据的4“V”特性,图书馆大数据思维应实现四个纬度的转变。

首先,是从定量思维向总体思维的转变。维克托·迈尔-舍恩伯格认为:“我们总是习惯把统计抽样看作文明得以建立的牢固基石,就如同几何学定理和万有引力定律一样。但是,统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史不足一百年。如今,技术环境已经有了很大的改善。在大数据时代进行抽样分析就像是在汽车时代骑马一样。在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式。[7]”当前,图书馆数据环境已实现了从抽样本数据到全样本数据的转变,传统小数据的精准性思维向混乱、复杂的大数据整体思维转化,从探寻事物因果关系向发现大数据间的规律、相关性转化,这必然要求图书馆应站在全数据高度,坚持总体思维的方式。

其次,是从精确思维向容错思维的转变。在“小数据”环境下,图书馆受到数据采集、传输、处理和计算技术的限制,具有数据采集总量小、数据采集随机性强和数据价值密度分布不均匀的特点。因此,为了提升小数据思维、决策的科学性和精确度,图书馆必须保证有限小数据精确、结构化、高价值和可控,并通过小数据精确思维来弥补图书馆在数据采集、传输、处理和计算能力上的不足。大数据环境下,数据的价值总量、相关性是关系图书馆大数据可用性的最重要因素。因此,图书馆必须降低对数据精确性、价值密度和结构化程度的要求,适当忽略数据在微观层面上的精确度,将“小数据”的精确思维向“大数据”的容错思维模式转变。

第三,完成从因果思维向相关思维的转变。舍恩伯格指出:“大数据的出现让人们放弃了对因果关系的渴求,转而关注相关关系,人们只需知道是什么,而不用知道为什么。[8]”小数据样本的有限性,导致小数据所拥有的价值总量和数据可用性有限,只能帮助图书馆解析、证明具体事物内部的因果关系,而不能有效揭示数据之间隐匿的复杂数据关系和巨量知识。大数据思维可以帮助图书馆挖掘出大数据之间存在的复杂、非线性相关关系,理解图书馆管理员、服务基础设施、读者和服务竞争环境之间的复杂相关性,而不需要知道事物或现象背后的复杂深层原因,可直接为图书馆提供大数据决策支持服务。

第四,实现从人工思维向智能思维的转变。通过智慧的感知、分析、集成,来增强图书馆的读者个性化服务响应、信息资源融合、服务平台协同和智能服务能力,是不断提高读者个性化推送服务效率、精确性、交互性、时效性、连续性和业务弹性的关键。小数据时代,图书馆的管理、服务系统处于人工智慧与自动化相结合的半智慧状态,系统的思维方式属于线性、简单、物理的自然思维,不能象“人脑”一样主动、立体、逻辑地分析数据,并在分析过程中实现自主学习和智慧思维。大数据时代,图书馆基于大数据思维而获得的知识和经验,可与物联网、云计算、社会计算、可视化技术等相结合,实现了机器设备和服务系统从自然思维向智能思维的转变,提升了图书馆的智慧思维和智慧服务的能力。

3.2图书馆大数据思维必须以数据价值为中心

当前,随着高速无线传输网络、云计算技术和阅读终端制造技术的发展,图书馆的用户服务已能够满足读者实时阅读、支持快速移动和高速视频播放的需求。图书馆在读者阅读服务过程中产生的大数据,除具备4“V”特性外,还具有在线数据采集、全景数据和可实时快速调用的特点。同时,图书馆大数据也随着图书馆服务模式的变革和发展,其价值总量和可用性快速累积、提升,已成为决定图书馆服务生产力提升和服务模式科学变革的决策依据和可靠保证。因此,图书馆大数据思维必须以数据的价值为中心,才能保证大数据价值的完全发现和科学思维。

传统小数据环境下,图书馆在数据的取样、处理、分析和决策过程往往注重以流程为中心,科学的流程虽然可以提高结构化小数据的思维效率、准确性和经济性,但无法解决大数据本身存在的数据海量、非结构化、复杂相关性和低价值密度等问题。因此,大数据思维应从流程为中心转变到以数据为中心,在大数据的采集、传输、处理、存储和计算上体现出数据核心的理念,不断提升大数据的价值密度和可用、可控性[9]。

此外,图书馆在读者的服务定制和服务提供中,应将以产品服务功能为中心转变到数据价值为中心上来。图书馆在读者服务中,应利用视频监控设备、传感器网络、监控服务器和阅读终端等设备,采集与读者个性化阅读服务相关的大数据。通过图书馆大数据总量的不断积累和增长,实现大数据到知识、知识到科学决策、科学决策到服务保障的转变,完成图书馆个性化定制服务从量变到质变转变的过程。

大数据价值的准确发现和完全提取,是关系图书馆大数据思维科学性的又一个重要因素。伴随云计算技术和数据处理算法效率的不断提升,图书馆的数据处理和计算能力快速增长,但仍不能满足图书馆以指数级增长的大数据处理需求。因此,图书馆的大数据思维应放弃对海量数据处理精度的要求,而将关注点放在对大数据价值挖掘的效率和总量上,不断提升大数据思维的效率、速度和实时性。

3.3数据开放与共享是图书馆大数据思维的必要前提

大数据时代,伴随用户服务和读者阅读模式多样性的发展,图书馆的大数据呈现出多源、海量、实时和动态变化的新发展趋势。图书馆可利用可穿戴阅读终端、智能网络、物联网等,将所有的用户服务过程相关信息和知识数据化,才能确保图书馆全面、适时感知读者的阅读行为和准确判定用户服务质量。

CUP、内存储器和电池性能,是制约图书馆大数据移动采集、实时处理和快速存储有效性的瓶颈因素。随着科技的发展,图书馆服务设备和读者阅读终端的CUP呈现高集成、多核、超高速缓存和散热性好的特点;内存储器具有巨量存储、高速传输和体积小等优点,此外,电池能量的效率高转换、微型、低损耗和持续工作等特性,可支持图书馆移动、高速、动态和不间断地采集与处理数据。因此,对自身大数据的采集、处理和存储能力,已不是影响图书馆大数据思维科学性的主要因素。如何实现图书馆不同部门之间、图书馆与相关第三方服务商之间的数据开放和共享,已成为关系图书馆大数据价值总量快速增长和二次增值的重要问题[10]。

苹果、百度、Facebook、Google、Amazon等公司是世界著名的信息服务与咨询公司,所拥有的大数据总价值、大数据发现与处理效率、大数据的二次增值能力,是关系这些公司竞争力和未来发展的关键因素。图书馆可在保证读者服务安全性和用户隐私的前提下,将读者服务与上述公司的软硬件产品结合,完成对读者服务前置产品和海量用户数据入口的掌控。并通过对海量、异构、持续更新和跨行业的数据共享,实现图书馆大数据的开放、共享、融合和二次增值[11]。

3.4大数据思维应以读者个性化服务定制为目的

目前,随着图书馆生产要素组成和数据环境的变化,其思维模式正在从互联网思维向大数据思维转型。互联网环境下,网络是图书馆服务承载和信息交流的主要载体,图书馆通过互联网完成读者阅读体验反馈、服务质量评估、CRM(客户关系管理)和优质客户群发展等工作。但其有限的数据采集、传输、存储和处理能力,已无法满足图书馆对海量服务与读者个体数据的大数据应用。大数据时代,图书馆通过大数据的全面采集、深度挖掘、系统分析和科学决策,实现了对服务和用户更加全面、详细和精准的认知,有效保证了读者阅读服务更加智慧、精准和个性化。

图书馆大数据思维应以读者个性化服务定制为目的,就是要求图书馆依靠大数据完成读者的精准画像,使图书馆明确读者是谁?有什么个性化阅读需求?阅读社会关系是什么?阅读模式是什么?阅读习惯是什么?同时,图书馆还应基于第三方服务商的大数据资源支持,对所定制读者服务的个性化精准性进行判定和评估,依据读者个性化需求进行动态的阈值设置与校正。此外,图书馆大数据思维的另一个重要目的,是通过大数据实现对读者个性化服务未来发展趋势的科学预测,并依靠预测结果对用户服务系统进行改进和完善,使服务系统具备自主学习、自我优化、自动分析和自觉决策的智能功能,最终实现图书馆读者个性化服务定制的智慧感知、智慧管理、智慧服务和智慧决策[12]。

4 结语

目前,图书馆已进入大数据时代。随着数据采集技术、云计算与云存储技术、高速网络传输技术的发展,图书馆的计算、存储和网络传输性能已不是影响其大数据应用的关键因素。图书馆已能够安全、高效、快速和经济地,从海量、快速变化、多类型和低价值密度的大数据中发现与挖掘数据价值,为图书馆的管理与决策提供可靠的大数据支持。大数据思维、决策的科学性与可用性,已成为关系图书馆大数据价值发现和科学决策的重要因素。

随着图书馆大数据应用环境和主要矛盾的转变,其传统的计算和思维方式已不适应新型大数据应用的需求,图书馆员应重新构建符合大数据应用实际的思维模式。在大数据新思维模式的构建中,图书馆必须将大数据思维与读者阅读服务需求相结合,结合大数据环境变化实际和大数据决策需求,实现样本数据思维到全体数据思维、精确思维到混杂性思维、因果关系思维到相关关系思维的转变[13]。同时,大数据思维还应注重读者的隐私保护,提升读者对大数据决策和大数据服务的可信度,才能确保图书馆员大数据思维的科学性和精确性,才能构建安全、高效、智慧和低碳的图书馆,才能为读者提供基于科学大数据思维支撑的个性化智慧阅读服务。

(来稿时间:2015年12月)

1.(英)维克托 · 迈尔-舍恩伯格,(英)肯尼思 · 库克耶.大数据时代[M].盛杨燕,周涛, 译.杭州:浙江人民出版社,2013:17-21

2.高琳.大数据思维与图书馆知识资源发现[J].图书与情报,2015(1):122-124

3.邬贺铨.大数据思维[J].科学与社会,2014, 4(1):1-13

4.王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013, 36(6):1125-1138

5.和婷.大数据思维对图书馆信息服务工作的启示[J].图书馆建设, 2014(1):64-68

6.杨绎.基于文献计量的“大数据”研究[J].图书馆杂志,2012(9):29-32,37

7.大数据带来的四种思维[EB/OL]. [2015-11-01].http:// www.techxue.com/techxue-12814-1.html

8. Cox B L, Jantti M H. Capturing Business Intelligence Required for Targeted Marketing, Demonstrating Value, and Driving Process Improvement [J].Library & Information Science Research,2012, 34(4):308-316

9.冯登国,张敏,李昊.大数据安全与隐私保护[J]. 计算机学报, 2014, 37(1):246-258

10. NetApp .Big Data Solutions for Government [EB/OL]. [2015-11-01]. http://www.netapp.com/us/solutions/industry/ government/bigdata.html

11.陈宇新.互联网思维PK 大数据思维[EB/OL]. [2015-11-02]. http://mt.sohu.com/20140819/n403586440.shtml

12.陈臣.基于大数据的图书馆个性化智慧服务体系构建[J].情报资料工作, 2013(6):75-79

13.(英)维克托·迈尔-舍恩伯格.大数据时代:生活、工作与思维的大变革[M].周涛, 译. 浙江:浙江人民出版社, 2013:78-83

Change of Library Thinking : From Little Data Thinking to Big Data Thinking

Ma Xiaoting
( School of Information Engineering, Lanzhou university of Finance and Economics )

〕With the development of the internet industry, popularity of smart reading terminals, the era of big data in library has arrived, the era of big data requires big data thinking. Big data make librarian rethink of the value of data, and the pursuit of causality shifts to the pursuit of relevance in problem solving. So the librarian’s thinking must change from little data thinking to big data thinking, to get value from endless data, and can provide satisfactory personalized reading service for readers.

〕Library Big data thinking Change

G250.76

马晓亭(1974-),女,硕士,副教授,研究方向:大数据、数字图书馆建设。

猜你喜欢
个性化图书馆思维
思维跳跳糖
思维跳跳糖
思维跳跳糖
思维跳跳糖
坚持个性化的写作
文苑(2020年4期)2020-05-30 12:35:12
新闻的个性化写作
新闻传播(2018年12期)2018-09-19 06:27:10
图书馆
小太阳画报(2018年1期)2018-05-14 17:19:25
上汽大通:C2B个性化定制未来
飞跃图书馆
满足群众的个性化需求
中国卫生(2015年1期)2015-01-22 17:20:15