1、42探索与创新基于小数据决策支持的公共图书馆个性化精准服务研究白忠睿(甘肃省图书馆 甘肃兰州 730000)摘 要:在当前泛在信息环境中,数据量呈爆炸式增长,信息迅速膨胀,使人们从知识匮乏时代进入了信息过载时代。顺应时代发展趋势,公共图书馆的服务模式从普适性服务向个性化精准服务转变,而小数据的应用给公共图书馆个性化精准服务带来了新的思路。文章厘清了小数据的来源和概念,梳理了图书馆小数据的定义与内容,探讨了小数据应用于公共图书馆个性化服务的价值优势。在此基础上,通过“三中心”的架构来构建基于小数据决策支持的公共图书馆个性化精准服务模式,最后提出在模式构建过程中应关注的问题,以期为公共图书馆精准化
2、服务提供参考。关键词:公共图书馆;小数据;“三中心”;个性化精准服务中图分类号:G258.2;G252.62 文献标识码:AResearch on Personalized and Precision Services in Public Libraries Based on Small Data for Decision SupportAbstract In the current ubiquitous information environment,the explosion of data and rapid information expansion have transitioned
3、 society from an era of knowledge scarcity to one of information overload.To align with this trend,public libraries have shifted their service models from universal services to personalized and precision services.The application of small data offers new insights into personalized and precision servi
4、ces in public libraries.This article clarifies the sources and concepts of small data,defines the scope and content of small data in libraries,and explores the value and advantages of applying small data in personalized services.Building upon this foundation,a framework called the Three Centers is p
5、roposed to establish a model for personalized and precision services in public libraries based on small data for decision support.Finally,key considerations in the model construction process are presented,aiming to provide valuable insights for enhancing precision services in public libraries.Key wo
6、rds public library;small data;Three Centers;personalized and precision service*本文系2021年度甘肃省图书馆馆立科研项目“基于小数据的公共图书馆个性化精准服务研究”(项目编号:GT2021-09)的阶段性成果。*1 引言大数据时代的来临是信息化社会高速发展的必然结果,步入大数据时代的图书馆迎来了前所未有的机遇与挑战,也正在经历着广泛而深刻的变革。大数据成为了当前图书馆研究与应用的热点,而面对利用大数据技术存在的应用成本高、操作难度大、隐私外泄和服务针对性不强等问题,以微观世界为中心的小数据展现出的优势引起了学界的关
7、注,小数据应用于图书馆领域的研究应运而生,并成为了近年来图书馆界的一个热门研究方向。432023 年第 10 期2 小数据与图书馆小数据2.1 小数据概念的产生大多数学者将美国的德波哈尔艾斯汀教授视为第一位认识到“小数据”重要性的研究者,然而经查阅相关资料,发现在此之前已有学者涉足“小数据”研究的领域。但不可否认的是,“小数据”开始引起学界普遍关注,走进大众视野,的确是归功于艾斯汀教授。2012年,布莱恩普罗菲特就提出了“小数据”的概念,预言了“小数据运动”的兴起1。马丁 林斯特龙也在2012年就意识到小数据的重要性,并将小数据思维付诸实践,为获得“SmallData”走访77个不同国家的20
8、00多个家庭进行调查2。另外,有资料显示一个名为“smalldatagroup”的知识社区里相继发现数十篇探讨“小数据”的文章,时间主要集中于20122013年3。直至2013年年底,艾斯汀教授在一场国际会议上作了题为“SmallData,Wheren=me”的报告,由此掀起了“小数据”研究与应用的热潮。她对小数据的定义是“全部有关于 我 的数据”4(smalldatawheren=me),并指出每一个人在上网时或使用各种移动设备过程中都产生了大量的“数据面包屑痕迹”(TrailofDataBreadcrumbs),这些数量巨大来源于不同应用的用户个体数据的总体构成了用户小数据,为揭示人类行为
9、模式规律提供了有针对性的依据,这些在线行为数据被称为大数据时代的“小数据”。2.2 图书馆小数据简言之,小数据是指以个人为中心的全方位的数据集合。这里小数据的“小”并不是指数据总量小,而是强调以用户为中心,重点在于对个体的深度挖掘和精确画像。我国学者基本达成共识,把小数据看作是针对个体用户的全方位、多层次行为模式和情景感知的全部数据集合,进而图书馆小数据就可以定义为读者在阅读活动中和图书馆个性化服务过程中产生的,以读者为核心的用户相关数据。数据内容包括读者的个体特征、社会关系、阅读情景、阅读行为(现时+历史)、阅读需求、涉猎领域、兴趣变化等相关信息,是图书馆发现读者个性化阅读需求和阅读模式变化
10、趋势,制定、完善读者个性化阅读服务策略的重要依据。随着可穿戴设备、个人移动终端设备、传感器网络和视频监控系统等的快速发展与日益成熟,公共图书馆可以实时、便捷地完成对读者相关个人数据的监控和采集,为公共图书馆发现读者的阅读需求提供了直接依据,为保障个性化服务提供了根本遵循。小数据为公共图书馆智慧服务体系和个性化服务模式的构建提供科学的决策支持,为读者提供“量身定制”的智慧化服务,充分体现公共图书馆“以人为本”的精神理念,完全吻合“书是为了用的”的第一定律,并促进“每个读者有其书”“每本书有其读者”的实现,完成资源和用户的双向选择。因此,搭乘小数据的“东风”,为公共图书馆实现精准服务提供了良好契机
11、。3 基于小数据决策支持的公共图书馆个性化服务模式构建本文基于小数据决策支持的公共图书馆个性化服务模式定位“三中心”架构,即存储中心、管理中心和服务中心。存储中心是基础,集中采集和存储完整、多维度的读者小数据;管理中心是关键,通过对数据有效整合与管理,提升读者小数据的科学性、价值密度和可用性,进而实现数据的共享与利用;服务中心是成效,挖掘数据价值,驱动个性化读者服务,让读者享受到更好的服务体验。3.1 存储中心基于小数据决策支持的公共图书馆个性化服务是建立在全面、真实、准确的读者小数据基础之上,因此,存储中心要保证所采集的小数据以读者为中心,通过应用互联网、人工智能、大数据等技术手段,分析读者
12、个性特征、专业背景、兴趣爱好、行为方式等属性,以针对性地服务满足读者个性化需求。小数据的采集内容主要来自于基本特征、阅读兴趣、阅读情景、阅读行为、社会关系、服务反馈六个方面,采集途径和来源方式多样,需要多渠道协同。其中读者的基本特征,相关小数据为读者的性别、年龄、专业、学历等特征数据,来源包括图书馆读者管理系统、开展线上和线下服务时采集的用户基本信息。读者的阅读兴趣,相关小数据为读者阅读的内容、方式、时间区间以及阅读兴趣变化的趋势等,来基于小数据决策支持的公共图书馆个性化精准服务研究44源包括可穿戴设备、无线传感器、第三方增值服务商等。读者的阅读情景,相关小数据为阅读活动的方式、时间、个体位置
13、、移动路径、内容等阅读的动态情景数据,来源包括图书馆内部服务监控系统、通讯运营商、WiFi、GPS等。读者的阅读行为,相关小数据为读者搜索、阅读、评论等阅读活动相关的行为数据,来源包括图书馆阅读终端、线上用户网络搜索、浏览图书资料信息。读者的社会关系,相关小数据为读者的阅读群体,以及和其他读者的交流与反馈数据,来源包括第三方社交平台如微信、抖音、微博、百度等产生的数据。读者的服务反馈,相关小数据为读者的服务满意度评价、服务需求反馈、开展阅读活动的愉悦感数据,来源包括图书馆进行的主动回访、问卷调查、读者留言反馈。3.2 管理中心美国统计学家纳特西尔弗在其著作 信号与噪声 中指出:“如果信息的数量
14、以每天250兆亿字节的速度增长,其中有用的信息肯定接近于零。大部分信息都只是噪声而已,而且噪声的增长速度要比信号快得多。”5在图书馆对读者小数据进行全覆盖、高频率、深层次和不间断的采集时,小数据总量指数级快速增长,导致有效数据隐匿和混杂在噪声中。因此,需要通过对小数据的噪声过滤与整合,提升小数据的科学性与可用性。当前,读者小数据资源分布广泛,结构复杂(结构化、半结构化和非结构化),来源于不同的应用系统和数据库,数据类型和维度呈现多样性,信息分散、数据散落,数据之间相关性较弱,信息不能共享,形成信息孤岛,给基于小数据的决策支持带来了较大挑战。管理中心是基于小数据决策支持的公共图书馆个性化服务模式
15、构建的关键步骤,主要目的有两个,一是对数据清洗整理,让数据可用;二是让数据变得更适合为后续工作提供支持。管理中心将多源数据进行统一管理,主要应用于数据清洗、数据质量管理两个领域,提供小数据一致性,从而提升用户小数据的价值密度和可用性,最终实现跨机构信息共享、跨系统数据集成、跨库网深度融合。在数据清洗领域,针对不完整数据、无效数据、错误数据、不一致数据、不统一数据、重复数据等,从数据的准确性、完整性、一致性、唯一性、适时性、有效性等方面入手,完成缺失值清洗、格式内容清洗、逻辑错误清洗、非必要数据清洗、关联性验证等步骤。在数据质量管理领域,主要是解决数据质量与集成问题,从数据质量角度出发,对数据正
16、确性进行检查并提高数据质量,采用提取、聚合、过滤、选择、转换等方式,对数据进行修剪、归一化、标准化处理,生成满足数据质量要求的数据。依赖丰富高质量的读者小数据为公共图书馆个性化服务提供依据,确保能够精确、高效、快速和经济地应用数据,辅助科学决策。3.3 服务中心服务中心,主要是通过管理中心对于读者小数据的集成、分析和挖掘,甄别个性化阅读需求,洞悉读者阅读心理,促进个性化服务模式从主观经验引导向基于小数据决策支持的个性化服务的转变,实现一种“信息找人”的服务模式。服务中心主要思想可概括为八个字:千人千面、投其所好,主要方法包括基于协同过滤、基于内容、混合推荐等,主要思路为个体特征、集体智慧、共现
17、关系和近邻推荐。通过分析相关读者小数据,制定合理的服务模式,明确服务目标群体,在不打扰读者的前提下,以恰当的时间、适合的方式、匹配的内容完成个性化服务推送。如基于借阅和浏览小数据的分析挖掘,判断读者阅读倾向,借助读书会、讲座、书目推荐等多种形式,有效激发读者的阅读需求、培养读者阅读兴趣,实现图书资源精准推荐。基于读者阅读场景与行为的分析挖掘,实现对馆藏载体、馆藏结构、馆藏数据、馆藏内容的优化调整,以及对数字资源的整合和数字馆藏体系的规划完善。基于阅读兴趣和服务反馈的分析挖掘,明确读者服务需求、服务模式、服务产品、服务满意度和收集反馈意见、建议等。最后,通过对服务中心有效性的评估,实现服务过程的
18、动态优化与完善。基于小数据的精准服务模式,给读者呈现出智能化、主动化、个性化和持续化的服务,同时通过对“三中心”模式的不断优化,提升图书馆服务总成效,让用户享受到更好的服务体验。从“借”到“荐”,从“纸”到“智”,不断适应读者的阅读热情与需求,进一步提高读者的阅读率,让广大读者最大限度地享受个性化的图书资源,推动数字阅读的快速发展,实现读者忠诚度及图书馆服452023 年第 10 期务成效的双提升。4 基于小数据决策支持的个性化服务模式构建中应注意的问题4.1 把握适度原则度是唯物辩证法的一个重要范畴,适度原则是唯物辩证法的一个基本方法论原则。公共图书馆在基于小数据决策为读者提供个性化精准服务
19、的实践中,也需要遵循适度原则。公共图书馆利用小数据决策可以准确预测读者的阅读需求和发现读者阅读的动态发展规律,通过建立与读者之间的即时沟通关系,进行实时推送,完成读者个性化定制服务。然而过于频繁的推送通知容易造成对读者日常生活的打扰,使读者拥有不良的情绪体验,甚至产生负面影响。因此,要把握好精确投放服务的度,摆脱公共图书馆传统的被动服务,也不要陷入过度服务的圈囿,找到被动服务和过度服务之间的平衡点,在用户真正最需要的时候提供主动的合时宜的信息服务,即在恰当的时间、恰当的地点以最恰当的方式,为读者提供精准的阅读广告推送和个性化导读服务,从而达到提高读者满意度、增强公共图书馆服务市场竞争力的目的。
20、4.2 加强数据安全防护措施小数据的安全管理问题是关系到读者满意度和公共图书馆服务可持续发展的关键。因此,图书馆对以读者为中心的小数据安全、隐私保护,应坚持从小数据结构特点与读者个性化服务模式出发,制定可靠的数据安全管理与应用策略,不断提高小数据资源的安全性6。首先,公共图书馆应依据国家相关法律法规,对读者小数据的采集、存储、分析、共享和决策过程进行规范,读者也可依据法律规定与图书馆签署相应的小数据安全使用合同或协议。其次,公共图书馆应始终将读者放在小数据资源安全管理的核心地位,将小数据的管理权限交付读者。在读者认为个人隐私受到侵犯或不希望被打扰时,读者有中断小数据采集与共享、限制数据应用范围
21、和删除隐私数据的决定权。再次,针对用户小数据安全防护问题,可以通过数据敏感信息过滤、脱敏技术(失真技术、加密技术、匿名化限制发布技术)等,在不影响小数据决策科学性和可用性的前提下,删除、隐匿和替换与图书馆读者个性化服务不相关的用户隐私数据7。最后,公共图书馆应构建读者小数据敏感度评估和分级别安全保护制度,通过使用前安全评估、使用时安全管理、使用后保密存储与销毁,实现小数据全生命周期的安全管理8。4.3 注重大数据与小数据的互相融合英国数学家托马斯克伦普在 数字人类学一书中指出:“数据的本质是人,分析数据就是在分析人类族群自身,数据产生于人类社会的各种活动,其价值也在于服务人类社会,让生活变得更
22、加美好。”9因此,公共图书馆不管是基于小数据决策,还是利用大数据分析,目的都是为了更好地服务于读者,只是两者之间的侧重点和处理方式不同而已。小数据和大数据并不是对立的,基于小数据的精准服务不是厚此薄彼,也不是完全与大数据剥离开来。在大数据概念出现之前也并不存在小数据的概念,小数据是大数据的组成、延伸和补充。如果说为宏观服务做支撑是大数据的擅长领域,那么为微观服务做精确的数据支持方面小数据则更有优势,即大数据负责“画龙”,小数据则起到“点睛”的作用。一方面,大数据虽然以一个独特的视角为用户提供服务,但是这个方法还不完善,需要小数据的完善和补充,把大数据和小数据结合起来,结合事物的发展趋势并从个体
23、角度出发,观察和梳理微小的线索,才能更快找出用户的真实需求10。另一方面,小数据的分析很多时候都需要大数据的支持,就如在基于小数据的图书馆精准化服务模式中优化层级时,就需要嵌入大数据的统计分析来向用户反馈数据。所以,小数据和大数据是相互依存、融合共生的,只有两者协同作用,才能实现“1+12”的数据增量,才能更好地推进公共图书馆的精准化服务工作。4.4 运用“二八定律”“二八定律”指出,图书馆服务收益的80%来自占据读者总数20%的高端用户,而占据读者总数80%的普通读者只为图书馆贡献了20%的服务收益6。因此,基于小数据决策支持的公共图书馆个性化服务应重点关注高端用户,提升精品服务意识。公共图
24、书馆通过对读者小数据的跟踪、采样、分析和判断,可根据用户价值对读者进行细分,将其分为高价值读者和低价值读者,并实行差异化管理,按基于小数据决策支持的公共图书馆个性化精准服务研究46照价值最优化原则调整服务资源的分配。基于小数据的公共图书馆个性化服务在保障全体读者服务质量的前提下,要特别关注高价值读者的阅读需求,仔细研究高价值读者的阅读模式,为其“私人定制”具有个性化特征的特色服务和产品,确保为高价值读者提供的个性化服务在阅读时间、地点、内容、模式和综合收益方面评估最优,最终实现公共图书馆阅读服务的综合收益率的大幅度提升和最优化表现。公共图书馆个性化服务运用“二八定律”时还有一个问题亟需关注,即
25、高价值读者和低价值读者是动态变化的,两者在一定条件下可以相互转化。低价值读者具有发展为高价值读者的潜能,高价值读者也有转为低价值读者的可能。因此,公共图书馆基于小数据的决策对读者群的划分必须注重动态生成,需依据读者的阅读内容、时间、模式、终端设备、移动路径、阅读心理与生理变化、反馈评价等小数据构建全方位的读者画像,并据此动态分配服务系统资源,在获取较高服务收益的同时不断提升读者的价值和忠诚度8。5 结语个性化精准服务是一种辅导阅读、引导需求和文献领航的服务,是读者服务工作向更深层次发展的必然结果,也是现代图书馆读者服务工作水平的重要体现。公共图书馆基于小数据决策的支持,以有效的服务手段提供高质
26、量的信息服务,最大限度地满足用户需求,从而实现公共图书馆价值的最大化。小数据的本质特征是“以读者为中心”,公共图书馆对小数据的重视和利用旨在为读者提供更贴心、更实际、更个性的精细化服务,给予读者更多、更细致、更有温度的人文关怀,这恰与公共图书馆“以人为本”的宗旨和理念高度契合;也为“每个读者有其书”“每本书有其读者”“节省读者和馆员的时间”添砖加瓦11。如何安全、高效、经济、快捷地采集、处理和分析小数据,进一步准确地对读者进行个体或群体画像,实现读者个性化定制服务,最终形成一个读者与服务品牌共存的可持续发展模式,充当一个贴身阅读指导和终身学习伴侣的角色,对于新时代、新目标、新征程下的公共图书馆而言,具有重大的研究价值和实践意义。参考文献:1PROFFITTB.BigdatabenefitswithsmalldataEB/OL.2022-12-12.https:/