基于“分众阅读”建设大数据阅读分析平台的设想

2020-12-12 09:35:02
卷宗 2020年28期
关键词:馆藏图书馆用户

高 蓉

(苏州工业园区图书馆,江苏 苏州 215123)

随着信息技术的高速发展,图书馆积累的数据急剧增长,如何透过“大数据”推动服务创新,提高服务精准度,提升馆藏利用率成为当务之急,借助新技术,从大量的、复杂的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中人们事先不知道的、但又是潜在有价值的信息,建立有效、精准的分析模型,建立图书馆大数据仓库,实现图书馆数据的总枢纽,具有较强的扩展能力,并以松散耦合方式运行,建立图书馆知识服务与业务建设决策模型及评估体系、用户行为价值挖掘、用户信息数据中心、读者信用体系模型、信息发布平台等。为图书采访馆员提供决策分析,为读者提供个性化的阅读推荐服务,提升馆藏利用率及读者兴趣度,吸引更多居民阅读,实现“为书找读者,为读者找书”,提升服务效能。

1 定义及意义

大数据(Big data),是一个数据集,其特点为容量大、类型多且复杂、存取速度快、应用价值高,传统的数据处理应用软件完全不足以应对。由于数据集非常庞大,所面临的挑战包括抓取、存储、分析、数据管理、搜索、共享、传输、可视化、查询、更新和信息隐私等等。大数据的价值在于可以进一步用于参考预测分析,用户行为分析,高级数据方法(包括人工智能),而不仅仅停留在数据集的大小本身[1]。

“数据”是一个相当宽泛、丰富的概念了,不仅仅指传统的结构化数据(如数值型、数字型),更包括海量的非结构化数据——文本、音频、视频,特别是由于传感器、物联网、互联网等技术的发展,诸如人类的肢体动作和社会行为、物体的状态和运动轨迹等都可以作为“数据化内容”的自动化处理分析可以让机器有智能、让人类更智慧[2]。

“分众阅读”,是根据自身服务环境,用户需求,通过数据统计、挖掘和分析,对目标用户进行细分及分层,基于个人属性、行为特征、社会属性等,在数据库中将用户进行分组,将图书馆的资源与用户阅读兴趣进行对比和匹配,为用户及用户组提供分众化的阅读 服务[3]。

最核心的目标,建立读者细分的分众阅读体系,通过大数据挖掘技术,对读者阅读行为进行跟踪及分析,为用户及用户群体提供精准服务。

意义主要表现为三个方面,第一,基于大数据技术促进图书馆的服务转型,实现“分众阅读”的精准服务;第二,用大数据串联资源与用户,实现“为人找书,为书找人”;第三、大数据平台作为核心,连接新技术应用,包括时下最热技术:人工智能,开创智慧型 服务。

2 调研与借鉴

调研了国内五家图书馆大数据实施现状,大部分图书以采购成熟产品来实现大数据,成熟产品的利端是不需要再重新做顶层设计和建模,采购后直接实施并使用,不需要花人力再去做开发工作,但弊端也是明显的,每个图书馆的特点和特色不一样,导致有些需求并未被挖掘,挖掘深度及其效果不一定能体现其价值。国家图书馆及上海图书馆以自主开发为主的形式建设大数据平台,其中上海图书馆的创新型可视化数据服务与我馆想要达到的效果最为相似,本文作者以上海图书馆为例,介绍上海图书馆的做法,学习并借鉴。

上海图书馆在2012年推出一系列创新型可视化数据服务,平台为自主研发,共分四个方面:一是读者年度个人阅读帐单;二是年度阅读报告;三是流通分析报告;四是实时数据展示的应用[4]。

读者年度个人阅读帐单,主要侧重“个性化”分析,以读者为出发点,来挖掘读者的阅读行为轨迹,形成个性化的内容进行发布,发布的同时,还对界面进行精心设计,增加趣味性,设计与读者的互动环节,加强用户粘性。另外宣传手段上,帐单也是作为一项激励,只发给那些借书册数在中位数以上的读者。

年度阅读报告,通过对系统数据的整体分析,以全数据代替抽样数据,更全面的反映区域内图书馆用户的阅读状况。

流通分析报告,聚集图书馆不同的业务,采用不同的数据集合,对资源建设情况、服务效能进行总结,为馆藏发展、馆藏分布、用户服务策略、宣传推广提供参考。

实时数据展示的应用,图书流通量以小时为单位进行分析,以创意展示的形式在展示屏上展示出来,通过给观众讲故事的形式,吸引读者。

综上所述,上海图书馆从个人阅读帐单到大屏数据展示,充分考虑到用户粘度,从展示效果、页面设计、宣传策略、内容的趣味性等方面着手,目的是吸引读者,用数据讲故事,让阅读成为有趣的事情,增加与读者的互动性,用户的忠诚度也越来越高。故在大数据阅读平台建设上,不仅是技术层面的开发与建设,还需要考虑软性服务因素,包含展示页面的设计,数据内容的趣味性,宣传策略,还要考虑读者心理等,技术与软性服务相结合,才能在大数据的服务效能上体现出价值。

3 建设大数据阅读分析平台功能的设想

3.1 平台架构

图1是根据馆情和需求,设计用户(读者)阅读分析平台的架构层次,分为五个层级,分别为应用层、技术层、业务层、数据层和基础设施。应用层是整个模型的最顶端,由馆藏管理平台、采访驱动平台、数据发布系统和用户系统组成。

图1 平台架构(拟)

3.2 数据源(Data Source)

顾名思义是数据的来源,是提供分析所需要数据的原始信息,在数据源中存储了所有建立数据库连接的信息。数据源包括:用户数据、馆藏数据、流通数据、采访数据、设备数据、网站和移动端数据、数字资源阅读数据等。

3.3 建立分析模型流程

大数据建模的过程不可能一次完成,随着外部环境的不断变化,用户需求也随之改变,建立长期有效的反馈机制非常重要,及时预测变化,及时、快速做出调整对策。

图2 建立分析模型流程图

3.4 平台功能的设想

3.4.1 基于“分众阅读”的个性化服务推荐

借鉴上海图书馆个人阅读帐单、亚马逊书店消费者评级分析法及亚马逊书店的阅读推荐(网站),采用三个分析维度来设计个性化服务推荐模型[5],如下表:

表1 个性化阅读推荐分析维度

针对个人的阅读行为来进行推荐,实现同类型图书推荐、该作者的其他图书推荐、该出版社的同类型图书推荐、新书推荐。

通过分析个人的阅读行为数据,与阅读某类资源的用户群做比对,可以实现阅读该本图书的用户还阅读过的其他图书的推荐方式。

阅读推荐在图书馆“书香园区”APP或微信的“个人阅读帐单”中体现,未来还会设计并实现更多的推荐方式(例微信服务号推送、短信推送等)。由阅读推荐可进行外延,将图书馆的服务用相类似的方式把活动、讲座、展览等信息推送给读者。

3.4.2 基于“资源建设”的服务决策

图3 基于大数据阅读平台的按需采访模式

图书馆采访工作是图书馆一项非常重要的基础性业务工作,我馆的采访工作还停留在传统的采访模式上,国内已出现少数图书馆开展 “你选书我买单”服务,例内蒙古图书馆、苏州图书馆、顺德图书馆等,把部分资源采访的工作转移至最前端(用户)来完成,也就是需求驱动采购模式,让用户在线下书店或线上进行选书并完成借阅,图书馆进行买单的方式,那么这种方式解决了图书馆与下游终端用户之前的联系,有效提高了馆藏利用率。但与上游供应商乃至出版发行机构之间还是传统的采购模式,采购质量、采购预测、采购评估这些问题并未得到有效的解决,本文作者设计运用大数据技术来有效提高图书馆资源采访精准问题。如图3所示。

根据这个图的内容,阐述大数据阅读平台处在中间位置,采集各系统的数据,还需要采集上游供应商的出版信息,通过大数据平台分析处理,为采访馆员提供采购依据,采访馆员制订采访方案及策略,大数据平台定时或非定时,给采访馆员提供实时数据分析结果,根据用户需求方向的变化,及时调整采访策略。

从远景预判,大数据阅读分析平台不仅可提升采访精准度、为用户提供个性化阅读推荐,还可以为出版发行机构提供用户最真实的需求信息,为出版机构出版发行输出参考数据。建设大数据阅读平台,串联资源和用户的同时,还串联图书馆与出版行业,联成一个体系运作,最终实现用户驱动出版,产品为用户服务。

3.4.3 基于“服务数据”为基础的服务效能评估

基于大数据阅读平台的建设,整合图书馆各类业务,包括采编业务、读者服务、参考咨询、专业信息服务、活动推广、讲座展览等,整合图书馆各系统,包括图书管理系统、书香园区网借投递平台、分馆业务平台、数字资源(各数据库)、网站、微信、APP等,通过接口调用数据方式,来实现数据采集、处理、挖掘和分析。

强化管理后台设计与开发,各业务模块根据特定的格式出具各类业务报告,例馆藏建设分析报告、流通服务数据报告,宣传推广服务成效报告、专业服务分析报告等。定期在网站、展示屏等展示服务 数据[6]。

系统自动生成各类报告后,进行二次分析,结合年度工作计划、馆藏发展政策、流通服务计划等,还要结合热点信息,为用户制定个性化的服务推广方案。

3.4.4 数据展示

数据展示分为两块,一块为个人阅读帐单,另一块为大数据展示屏。阅读帐单数据展示,我馆已使用成熟产品,推出个人阅读帐单,让用户了解自己的阅读情况及阅读水平。大数据展示屏,目前在园区图书馆已上线,主要展示实体馆的各类数据、借阅情况分析数据、图书推荐、活动预告及活动效果展示。

4 结论

文化和旅游部越来越重视文化建设,同时也越来越重视图书馆的服务成效,从第六次全国县级以上公共图书馆评估指标,不难看出,对图书馆的服务效能和新技术的应用越来越重视,这就说明,未来图书馆服务效能的提升,需要新技术做为支撑,包括物联网、大数据、人工智能等,借助新技术应用,完善公共文化服务体系,做好顶层设计,实现服务精准、服务创新,建设标准体系,用数据说话,提升服务效能,促进图书馆转型发展。

猜你喜欢
馆藏图书馆用户
馆藏
现代装饰(2022年6期)2022-12-17 01:07:32
博物馆的生存之道:馆藏能否变卖?
艺术品鉴(2019年11期)2019-12-27 09:06:18
知还印馆藏印选——古印篇
图书馆
小太阳画报(2018年1期)2018-05-14 17:19:25
关注用户
商用汽车(2016年11期)2016-12-19 01:20:16
飞跃图书馆
关注用户
商用汽车(2016年6期)2016-06-29 09:18:54
关注用户
商用汽车(2016年4期)2016-05-09 01:23:12
如何获取一亿海外用户
创业家(2015年5期)2015-02-27 07:53:25
介绍两件馆藏青铜器
文物春秋(2014年2期)2014-12-24 21:23:05