AIGC语言模型分析及其高校图书馆应用场景研究.pdf

资源描述

1、2023 年第 35 卷第 7 期AIGC 语言模型分析及其高校图书馆应用场景研究符荣鑫1袁杨小华2（1.广西师范大学图书馆，桂林541004；2.广西师范大学生命科学学院，桂林541004）摘要院目的/意义AIGC 的内容创作方式给图书情报领域带来一场新的变革。对比分析 AIGC 大语言模型的优缺点，探讨AIGC 的运行机制，深入研究高校图书馆场景下的应用方案，为智慧图书馆 AIGC 应用选型提供崭新的思路。方法/过程以ChatGPT、文心一言和 Bard 三项 AIGC 应用为例，运用比较分析法进行横向对比研究，归纳总结出 AIGC 的 6 个共同特征和 9个差异特征，提炼出高校图

2、书馆 6 个应用场景模式，探讨可能面临的 4 个潜在风险问题，并提出降低风险的对策。结果/结论研究结果表明，ChatGPT 更适合在高校图书馆的知识服务、学科服务和行政管理等场景中进行资源整合和决策辅助。文心一言更适合在高校图书馆读者服务、技术服务和文化服务等场景中优化服务和辅助创作。Bard 更适合在高校图书馆参考咨询场景中辅助知识问答。采用 AIGC 应用，高校图书馆尽管会面临伦理风险、隐私风险、数据安全和虚假知识泛滥等问题，但更能优化服务环境，提升智慧化服务水平。关键词院 ChatGPT；文心一言；Bard；AIGC；智慧图书馆中图分类号院G250.7文献标识码院A文章编号院1002-1

3、248渊2023冤07-0027-12引用本文院符荣鑫,杨小华.AIGC 语言模型分析及其高校图书馆应用场景研究J.农业图书情报学报,2023,35(7):27-38.收稿日期：2023-05-15基金项目：国家社会科学基金一般项目“新信息环境下高校图书馆共生学科服务的路径预设与实现策略研究”（16BTQ033）；广西哲学社会科学规划一般项目“面向高端学术共同体的情报共生理论与实现研究”（15BTQ002）作者简介：符荣鑫（1984-），男，硕士，工程师，研究方向为计算机信息处理。杨小华（1960-），男，学士，研究馆员，研究方向为图书情报分析DOI院10.13998/ki.issn1002

4、-1248.23-04061 引言近年来袁人工智能应用席卷全球遥人工智能生成内容渊Artificial Intelligence Generated Content袁简称AIGC冤作为其中的佼佼者为人类社会的生产生活方式带来一场悄然的变革袁成为人工智能革命一股不可或缺的力量遥智慧图书馆建设离不开人工智能技术的支撑袁AIGC应用的发展引领着图书馆在野信息化-智能化-智慧化冶建设道路上迈进一大步遥OpenAI公司的ChatGPT尧百度公司的文心一言和Google公司的Bard是目前世界上主流的三大生成式对话系统袁都能与用户通过自然语言进行人机交互袁作为人工智能生成内容应用

5、的先驱袁为图书馆在智慧化组织尧管理和服务等方面带来全新的视野和挑战遥ChatGPT尧文心一言和Bard的系统架构和技术路线各有不同袁解构各系统模型并分析其异同袁研究高校图书馆中的应用场景模式袁能为图书馆AIGC应用选型提供崭新的思路遥研究论文272023 年第 35 卷第 7 期图1 WoS核心合集关键词聚类分析图Fig.1 Keywords cluster analysis of papers downloaded from WoS core collection database2 国内外研究现状2022年11月袁ChatGPT渊ChatGenerativePre-trained

6、Transformer袁聊天生成预训练转换器冤全球发布袁标志着人工智能应用进入快速增长期袁AIGC迎来新的时代1遥紧随着ChatGPT发布袁2023年3月袁文心一言和Bard相继上线袁拉开AIGC鼎足之战的序幕2,3遥作为AIGC的新兴产品袁ChatGPT尧文心一言和Bard基于大语言模型研发袁能够与用户进行自然语言互动交流袁自动生成文本和内容摘要袁帮助人们获取知识和灵感遥截至2023年7月31日袁在WoS核心合集上以野TS=(ChatGPT)OR TS=(ERNIE bot)OR TS=(Bard)OR TS=(AIGC)OR TS=(Large Language Mo

7、del)冶为检索式进行主题检索袁并限定文献类型为野论文冶袁共获得290条检索结果袁关键词聚类结果如图1所示遥在CNKI上以野(主题=ChatGPT)OR(主题=文心一言)OR(主题=Bard)OR(主题=LLM)OR(主题=AIGC)OR(主题=大语言模型)冶为检索式进行主题检索袁并限定文献类型为野学术期刊冶袁共获得1 135条检索结果袁其中袁野图书情报与数字图书馆冶学科分类上有48篇袁关键词聚类结果如图2所示遥从检索结果来看袁中国更注重AIGC应用研究遥涉及关键词野ChatGPT冶的学术论文最早由卢卫红和杨新福4发表袁文章从哲学角度研究ChatGPT人工智

8、能带来的野思维革命冶袁为AIGC应用研究进行了前期探索遥自2023年1月起袁ChatGPT研究出现猛增袁表明AIGC研究在中国呈快速增长的态势遥从聚类分析来看袁国内外都是以野ChatGPT冶为主要研究对象袁国外更倾向于人工智能尧自然语言处理尧大语言模型尧聊天机器人等模型和算法的基础研究袁国内更倾向于生成式人工智能尧学术伦理尧应用场景尧教育数字化转型等人文关系和社会问题的应用研究遥图书情报领域主要从宏观角度研究ChatGPT对图书馆智慧服务的影响尧对策和应用场景袁并对图书馆未来的发展道路提出建设性意见5-8遥国内外研究都以AIGC和ChatGPT为主袁而

9、文心一言和Bard研究较少遥3 AIGC 大语言模型系统分析人工智能生成内容渊AIGC冤白皮书认为院野AIGC既是从内容生产者视角进行分类的一类内容袁DOI院10.13998/ki.issn1002-1248.23-0406研究论文282023 年第 35 卷第 7 期图2 CNKI关键词聚类分析图Fig.2 CNKI keywords cluster analysis又是一种内容生产方式袁还是用于内容自动化生成的一类技术集合遥9冶ChatGPT尧文心一言和Bard作为AIGC的实际产品证明人工智能算法具有智能数字内容创作和自我演化的能力袁都同时具备可持续性尧

10、可创造性和实时性等特征袁也拥有各自不同的特点袁可适用于高校图书馆不同服务场景遥3.1 各系统共同性特征Transformer模型是Google于2017年提出的人工智能机器学习模型袁主要用于自然语言理解处理任务袁其最大特点就是采用自注意力机制解析语言中各部分的关系10遥每个Transformer包含编码器和解码器两个部分袁可任选其中某一部分或多个部分经过多重组合形成新的大语言模型遥Transformer模型的整体架构如图3所示遥ChatGPT尧文心一言和Bard都实现了自然语言理解分析和文本内容自动生成袁能够以自然语言与用户对话袁实时响应用户提问袁提供智能对话服务遥虽然各

11、系统拥有不同的语言模型袁但这些语言模型都是在Transformer模型的基础上分别演化形成的袁因此具有以下共同特征院都有并行化处理能力遥模型采用自注意力机制袁不依赖前一步骤的处理结果袁只依赖于输入向量袁因此可以实现完全并行计算袁提高自然语言处理速度遥都有长文本增强处理能力遥模型优化位置编码袁能从全局直接计算两个词之间的依赖关系袁不容易出现梯度消失和爆炸的问题袁更好的处理长文本内容遥都有多语言尧多任务扩展能力遥采用Transformer模型能够根据具体任务的需要自由调整层数尧注意力层的头数等参数袁扩展模型的适用范围遥都有预训练学习优化过程遥模型无需进行特征工程袁可直

12、接处理原始数据袁减少人工干预成本袁提高模型训练效率遥都有多模态数据强化处理能力遥通过对模型的微调袁能够实现文本尧图像尧音频尧视频等多模态数据的融合袁提高模型的表征能力遥都有泛化迁移学习能力遥通过在大数据上进行预训练袁再根据任务的实际需要对模型参数进行微调袁可实现模型的迁移学习遥这些特征有利于高校图书馆加速融合学科知识和符荣鑫，杨小华AIGC 语言模型分析及其高校图书馆应用场景研究292023 年第 35 卷第 7 期教学资源袁扩展知识服务边界袁优化技术服务方式袁丰富文化服务内容袁提升智慧服务水平遥3.2 各系统差异性特征ChatGPT尧文心一言和Bard都是在Tr

13、ansformer模型的基础上建立起的AIGC应用袁但各系统的任务目标并不相同遥ChatGPT更偏向文本内容自动生成袁文心一言侧重于多模态数据的创作融合袁Bard更关注自然语言对话任务袁因此具有各自的特点遥其特征如表1所示遥3.2.1语言模型架构ChatGPT基于GPT渊Generative Pre-trained Trans-图3 Transformer模型整体架构图Fig.3 Transformer model overall structure项目 ChatGPT 文心一言 Bard 运营公司 OpenAI 公司百度公司 Google 公司语言模型 GPT ERNIE LaM

14、DA 预训练参数/亿 1 750 2 600 1 370 预训练数据量/TB 45 4 1.56 训练数据类型互联网文本数据互联网多模态数据文本对话数据数据来源 2021 年 9 月以前互联网历史文本数据互联网实时搜索、图像、语音、事实数据互联网网页实时数据语言支持多种语言，自然语言中文，自然语言仅英文，对话应答模态支持单模态，文本多模态，文本、图像单模态，仅文本对话任务适用性通用领域任务通用领域任务人机对话任务应用场景自然语言理解，文本生成，语言翻译，文本摘要，代码生成自然语言文本创作，图像生成、语言翻译、代码生成自然语言问答，文本生成，语言翻译

15、可使用地域全球中国美国、英国跨语言迁移能力具备弱目前无可扩展性具备具备具备可解释性相对较弱相对较高相对较弱局限性知识有限，真实性无法保障中文表现显著，英文表现能力较弱训练数据较少，不支持多语言，有时提供多个答案表1 ChatGPT尧文心一言尧Bard特征分析表Table 1 Comparison of features of ChatGPT,ERNIE Bot and BardDOI院10.13998/ki.issn1002-1248.23-0406研究论文302023 年第 35 卷第 7 期图4 GPT模型结构图Fig.4 GPT model st

16、ructureformer袁生成式预训练转换器冤大语言模型构建袁新增反馈强化学习渊Reinforcement Learning from HumanFeedback袁简称RLHF冤过程袁用于增强对输出结果的智能调节袁提高语言模型的识别能力袁具有良好的文本生成和泛化扩充性能11袁其模型结构如图4所示遥GPT模型仅使用Transformer模型中的解码器袁并只保留掩码多头注意力层部分袁提高模型训练速度遥经过3个版本的迭代开发袁利用并行计算的优势袁GPT模型在自然语言理解任务中表现出卓越的性能12-14遥ChatGPT至少采用96层Transformer用于大数据训练袁同时

17、引入评估式强化人工训练代理渊Training an AgentManually via Evaluative Reinforcement袁简称TAMER冤对学习结果进行人工标注袁采用真实性尧无害性和有用性评价标准对输出结果进行评价并提供奖励反馈袁达到快速收敛和完成训练任务的目标遥文心一言基于ERNIE渊Enhanced Representationthrough Knowledge Integration袁信息实体增强语言表示冤大语言模型构建袁融合大数据知识图谱与文本数据进行混合训练袁提升语言模型创作能力15袁其模型结构如图5所示遥ERNIE模型仅使用Transformer模

18、型中的编码器袁在其基础上嵌入知识图谱袁并加入连续学习流程袁将预训练网络分为48层通用语义表示网络和12层任务语义表示网络袁提高多任务训练的灵活性和扩展性16-18遥文图5 ERNIE模型结构图Fig.5 ERNIE model structure符荣鑫，杨小华AIGC 语言模型分析及其高校图书馆应用场景研究312023 年第 35 卷第 7 期心一言作为ERNIE模型的典型应用袁通过多模态数据预训练袁增强跨模态语义理解能力袁能够应用到文本创作尧图像设计等多模态场景中遥Bard基于LaMDA渊Language Models for DialogApplications袁对话应

19、用语言模型冤大语言模型构建袁专门训练人类对话数据袁产生类似自然语言的反馈响应袁为人们学习交流提供帮助19袁其模型结构如图6所示遥LaMDA模型仅使用Transformer模型中的解码器袁将外部知识嵌入到64层Transformer中袁并对生成的识别结果用质量性尧安全性和可靠性3项标准进行量化评分袁综合评分决定生成的响应是否需要重新训练袁最终提高人机问答质量20遥总体来看袁ChatGPT具有更强的自然语言理解能力袁更适合为高校图书馆知识服务提供辅助遥文心一言具有多模态数据生成能力袁更适合高校图书馆内容创作和数据可视化分析遥Bard具有增强人机对话能力袁更适合应用于高校图书馆的

20、参考咨询和智能问答服务场景中遥3.2.2预训练数据策略ChatGPT预训练数据以文本数据为主袁是2021年9月以前采集到的互联网历史数据袁数据量达45TB袁训练参数达1 750亿袁数据规模是3个系统中最大的遥文心一言预训练数据以多模态数据为主袁包括互联网实时搜索尧图像尧语音尧事实等数据袁数据量达4TB袁预训练参数达2 600亿遥Bard预训练数据以互联网实时数据和对话数据为主袁数据量达1.56TB袁预训练参数达1 370亿袁数据规模是3个系统中最小的遥3个系统都采用无监督学习进行预训练袁通过自回归和自编码生成任务学习语言模型袁采用奖励模型对参数进行微调以适应各类下游任

21、务遥ChatGPT依赖大量文本数据训练和人工标引奖励机制获得最佳自然语言理解能力袁能够生成人类无法区别的AI内容袁但由于都是历史数据袁因此不能准确响应2021年9月以后发生的事件遥文心一言和Bard都是采用实时数据进行训练袁具有较强的数据优势遥文心一言采用持续学习和知识蒸馏技术袁训练过程中融合知识图谱袁提升模型处理多模态数据知识的能力遥Bard采用量化评分机制对训练结果进行评价袁提高问题反馈的中立性遥相比而言袁文心一言有更强的知识学习和拓展能力袁能更好的提升高校图书馆知识服务效果遥3.2.3任务适用性ChatGPT在多个领域应用中取得显著成果袁由于其较强的自然语言理解

22、和生成能力袁在知识问答尧对话生成尧文本摘要尧阅读理解尧情感分析等领域表现出卓越的效果遥尤其是人机对话应用上袁生成内容非常接近人类自然语言袁并能辅助用户完成一些复杂的文字工作遥文心一言拥有多模态训练模型的先天优势袁除了ChatGPT的文本交互功能外袁还能进行命名实体识别袁根据用户的文本描述生成虚构图像设计袁辅助设计行业进行图像设计遥Bard专注于人机对话应用袁旨在以无差别的自然语言与用户进行沟通交流袁因此图6 LaMDA模型结构图Fig.6 LaMDA model structureDOI院10.13998/ki.issn1002-1248.23-0406研究论文322

23、023 年第 35 卷第 7 期目前仅限于进行人机对话领域袁将来经过多轮迭代和微调袁也可用于其他领域行业遥由此可见袁文心一言拥有更丰富的应用领域袁更能满足高校图书馆多元化的服务需求袁达到降本增效的目的遥3.2.4语言知识库ChatGPT以英文知识为主袁因此更擅长处理英文任务袁但拥有多语言知识库袁也可处理多语言问答遥应用能够自动识别用户提问所使用的语言袁并生成与用户语言一致的响应袁也可以进行语言翻译袁由于使用自然语言学习模型袁翻译效果略好于机器翻译遥文心一言运营在中国袁更擅长处理中文任务袁也支持英文袁但效果差强人意袁其他语言则不支持遥但文心一言能够不断更新知

24、识库袁在获得新语言知识的条件下袁支持多语言环境不是问题遥Bard目前处于公测阶段袁并不支持除英文以外的其他语言进行对话袁且只有美英地区才能使用Bard袁有较大的限制袁但其英文对话处理能力和应答反馈效果很好遥因此袁文心一言更适合中国高校图书馆的应用环境袁在新知识不断积累和沉淀下袁服务质量会有更大提高遥3.2.5跨语言迁移能力跨语言迁移能力是衡量自然语言学习模型适用范围的重要指标遥ChatGPT拥有多语言知识库袁在处理英文任务的基础上袁能够实现多场景尧多任务尧多语言的统一迁移学习袁表现出跨语言迁移能力遥文心一言主要关注于中文处理任务袁其多语言知识库较少袁跨语言迁移能力

25、受到限制遥Bard不接受除英文外的其他语言进行提问袁但能进行语言翻译袁目前未表现出跨语言迁移能力遥可以看出袁ChatGPT更适合为高校留学生提供多语言学科服务袁实现跨语言无缝交流袁吸纳更多服务对象袁拓展学科服务范畴遥3.2.6可解释性与可靠性可解释性用于探究学习模型内部运作过程袁可解释性越高袁表明学习模型越透明袁产生的结果越容易被人信任遥ChatGPT采用大型语言模型进行预训练袁训练参数多袁训练数据量大袁可解释性相对较差遥文心一言使用知识图谱和持续学习对学习过程进行增强袁可解释性相对强些遥Bard训练参数少袁训练数据量小袁且以对话数据为主袁可解释性更高遥可靠性用于判定

26、自然语言学习模型是否值得信任遥从目前使用情况来看袁无论ChatGPT尧文心一言还是Bard都会在一定程度上对信息判断失误袁容易产生错误的响应误导用户袁因此高校图书馆在使用AIGC应用时要加强人工智能治理袁监控响应内容变化袁及时人工干预修正问题内容袁增强知识的可靠性遥3.2.7模型可扩展性3个系统模型都采用自注意力机制袁因此都具备良好的可扩展性遥ChatGPT未使用知识图谱袁应用于新的领域需要提供海量的文本数据生成新知识遥文心一言拥有知识图谱袁只需建立结构化知识库融入学习模型中就可扩展到新的领域遥Bard在对话数据中增加了知识训练袁目的是为了增强对话响应能力袁使其更接近

27、人类语言袁因此应用于新领域需要将新知识增加到模型中遥3个模型扩展的方式不同袁而文心一言采用的结构化知识库更适合高校图书馆传统数据库管理方式袁减少管理成本袁降低学习曲线遥3.2.8应用可行性生成式对话系统在各领域中都表现出较高的价值遥ChatGPT以优秀的自然语言理解和处理能力袁较高的文本生成创作性能表现出广阔前景袁目前可应用于智能客服尧语言翻译尧文本摘要尧代码生成尧文章创作等领域遥文心一言有多模态预训练模型支持袁能够进行虚拟图像设计袁甚至达到以假乱真的效果袁可应用于文学创作尧商业文案尧中文理解和多模态生成等领域遥Bard的量化评价机制能够产生更接近自然语言的对话袁

28、最适合在智能客服领域中使用袁将来也可拓展到其他领域遥高校图书馆中袁ChatGPT更适合以文本数据为主的知识服务袁文心一言更适合多模态内容生产为主的文化服务袁Bard更适合人机对话为主的智能问答服务袁能够充分发挥其应用价值遥3.2.9应用局限性ChatGPT的训练数据为2021年9月以前的互联网历史数据袁且不会更新袁缺少实时数据袁无法对2021年9月以后发生的事件产生正确响应遥文心一言采用互联网实时数据进行训练袁中文数据训练较为显著袁符荣鑫，杨小华AIGC 语言模型分析及其高校图书馆应用场景研究332023 年第 35 卷第 7 期英文语料数据较少袁跨语言交互表现能力较弱遥

29、Bard训练数据较少袁且以对话数据为主袁目前不支持多语言对话袁有时回答甚至会提供多个答案供用户选择遥3个系统对于文本生成的结果可能会具有一定偏见袁主要原因在于数据集存在偏差或不完整袁同时人工标引可能会带入标引者的个人情感袁影响最终生成结果遥因此袁文心一言尽管跨语言能力表现较弱袁但高校图书馆可利用其实时数据训练能力袁不断更新知识库袁增加新模态数据袁适应高校图书馆不断变化的业务需求遥4 AIGC 在高校图书馆应用场景分析高校图书馆智慧化建设离不开技术革新和服务创新遥目前袁高校图书馆面临人员老化尧管理滞后尧读者覆盖面不足尧技术手段落后尧服务创新不够等问题袁AIGC应

30、用于高校图书馆袁能开启图书馆应用新范式转移袁加快智慧图书馆建设进程袁创新智慧服务模式袁增强图书馆的核心竞争力遥4.1 嵌入知识服务袁提高知识管理效能知识服务需要提升知识解构和整合分析效能遥AIGC具有大数据并行处理和泛化迁移学习能力袁能够通过学习训练和逻辑推理袁智能实现知识解构和整合分析遥采用ChatGPT更适合高校图书馆的知识服务场景袁能提供智能化知识管理方式袁提高知识管理的工作效能遥对知识服务有以下3个方面的影响遥渊1冤优化知识组织体系袁增强知识应用价值遥利用模型的学习推理能力袁从中央知识库的海量信息数据中挖掘知识内在联系袁演化新的知识内容袁建立自我成长的知

31、识服务模式遥渊2冤改进知识管理模式袁提升知识管理效能遥利用模型的自然语言理解与生成能力袁简化复杂的知识管理路径袁降低人力管理成本袁精确识别用户检索意图袁构建用户行为模式袁用问答方式响应用户请求袁增加人工智能系统的亲和力遥渊3冤完善知识甄选标准袁提高知识资源质量遥利用模型前馈网络及奖励机制在人工干预的条件下对知识进一步评价袁通过对知识进行标注袁加强知识的可靠性和可用性管理袁科学判断信息的有效性袁最大限度减少知识带来的偏见与歧视遥4.2 融合学科服务袁赋能高校学科建设学科服务需要整合高校教学资源和学科知识来提高学科服务质量遥AIGC具有自然语言理解和预训练学习能力袁

32、能够自行判别用户意图袁智能生成自然语言响应遥采用ChatGPT更适合高校图书馆的学科服务场景袁Bard则更适合参考咨询服务场景袁能深度提升学科智慧化服务能力袁创新学科服务模式袁提高学科服务效率遥包括以下4个方面的改进遥渊1冤赋能高校学科建设袁辅助学科热点研究遥模型用中央知识库的海量数据追踪学科的发展动向袁建立学科知识图谱袁探求学科内和跨学科的研究关系袁利用野思维链策略冶进一步挖掘学科领域研究热点袁聚焦学科领域前沿袁把握学科发展趋势袁为高校野双一流冶建设提供有力支持遥渊2冤嵌入参考咨询服务袁提升读者服务体验遥大语言模型拥有逻辑推理能力袁在预训练的基础上

33、发掘知识的相关性袁通过采集外部信息不断学习袁扩充中央知识库袁增强自身的自然语言理解和生成能力袁响应咨询回复更为客观袁有效减少人为主观意识对回复内容的影响遥参考咨询由人工咨询方式向智能机器人咨询方式转变袁可提供24小时不间断咨询服务袁提升读者参考咨询服务体验遥渊3冤融合学科分析服务平台袁实现数据分析自动化遥利用模型语言理解生成能力智能识别用户意图袁理解用户需求袁在大数据基础上深入分析学科进展袁收集学科研究数据袁自动生成学科分析报告袁提高报告撰写效率遥渊4冤助力信息素养教育袁创新教育模式遥在模型的知识基础上建立信息素养教育知识库袁将原来平面的尧抽象的知识具体化

34、尧立体化袁提供人工智能生成式对话工具袁学生可定制个性化教学内容袁通过自主提问方式查缺补漏遥全新的智能教学工具袁让每个学生得到个性化尧智能化的信息素养教育遥DOI院10.13998/ki.issn1002-1248.23-0406研究论文342023 年第 35 卷第 7 期4.3 增强技术服务袁构建图书馆新形象技术服务需要增加信息推理和预测方法来强化技术监查能力遥AIGC具有千亿级超参数训练和拓展知识库能力袁能够通过现有知识库推理信息流动向袁预测事件发展遥采用文心一言更适合高校图书馆的技术服务场景袁能改变技术服务模式袁增强技术服务能力袁提升图书馆智慧服务水平遥主要有

35、以下3个方面的新举措遥渊1冤创建图书馆虚拟形象袁营造沉浸式体验环境遥利用模型知识库中的多模态数据信息袁借助视觉尧语音尧文本生成算法自动化生成图书馆3D虚拟形象袁以亲切的形象拉近读者距离袁塑造元宇宙时代图书馆新形象遥加速图书馆线上演变袁打造全新图书阅读场景遥渊2冤构建数字孪生系统袁创新图书馆服务价值遥通过采集图书馆全方位三维数据信息袁在大量知识库的基础上袁快速转换为实时参数化的3D建模数据袁高效构建与现实世界一致的数字孪生图书馆袁连通线上线下资源管理袁读者在线上也能获得与线下图书馆一致的沉浸式服务体验袁创造新的服务价值遥渊3冤监测信息流安全状况袁辅助信息安全

36、系统管理遥利用大语言模型预训练识别的优势纳入信息流检测袁运用代码生成技术生成监测脚本袁能够更快尧更准的提取关键词袁检测信息流中的非法字符袁降低关键词匹配算法导致的误识别率袁提高错敏词的识别准确率袁提升信息安全管理能力遥4.4 优化读者服务袁打造野采编流阅冶一体化平台读者服务需要智能化管理平台提升读者访问体验遥AIGC具有多任务扩展和模型延展能力袁能够根据野采编流阅冶需求扩展任务边界袁优化服务流程遥采用文心一言更适合高校图书馆的读者服务场景袁能实现智能采选和个性化推荐袁提升读者服务体验遥可在以下两个方面改进服务质量院第一袁深度融合智能技术袁打造野采编流

37、阅冶一体化服务遥利用模型强大的运算能力和海量的知识库袁捕获并分析读者荐书信息袁建立智能采选服务平台袁实时推送信息流至野流阅冶服务袁实现图书全流程智慧化管理遥第二袁刻画读者画像袁精准推荐图书信息遥实时跟踪用户信息请求流袁自动分析读者用书尧荐书数据袁根据读者行为刻画读者画像袁利用深度学习算法和自然语言处理技术进行预测和个性化推荐袁帮助读者更精准获取符合其需求的图书资源袁提高借阅服务体验遥4.5 结合文化服务袁丰富文化建设内涵文化服务需要自动生成内容辅助文化创作宣传遥AIGC具有多模态数据处理和内容自动生成能力袁能够根据提示词判断用户需求袁创作新内容遥采用文

38、心一言更适合高校图书馆文化服务场景袁能提升文化创作水平袁拓展文化创作空间袁为图书馆文化建设全面赋能遥例如AI智能写作机器人在融入大语言模型的条件下袁能够快速生成新闻报道袁减少人工干预袁提高采编效率遥利用模型海量的多模态数据袁智能合成虚拟场景袁生成文化宣传设计袁实现智能视频剪辑袁提升设计内容价值袁为新内容创作提供新思路袁激发设计灵感袁缩短设计周期袁加强文化推广袁促进图书馆文化建设向智慧化全面发展遥4.6 赋能行政管理袁辅助图书馆智能决策行政管理需要文本理解和预测能力来辅助决策袁提高行政管理效率遥AIGC具有自然语言理解和生成能力袁能够通过学习训练预测内容袁

39、并有良好的任务扩展性遥采用ChatGPT更适合高校图书馆的行政管理场景袁能建立决策优化预测模型袁用自然语言理解能力提取决策关联内容袁提升模型的可靠性袁为智能决策提供更精准的信息支持遥同时嵌入Office等办公软件袁帮助行政管理人员智能生成公文内容袁根据行文自动生成文章摘要并提出建议及意见袁辅助行政管理人员快速了解行文中心思想袁提高行政管理效率遥5 面临风险及对策由于大语言模型的复杂性和不确定性袁数据的隐符荣鑫，杨小华AIGC 语言模型分析及其高校图书馆应用场景研究352023 年第 35 卷第 7 期私安全和响应结果的中立性都成为新的风险袁我们需要做好准备面临以下挑战遥5

40、.1 伦理风险AIGC应用都是在人工数据集上训练出来遥一方面袁海量的数据不可避免包含某些偏见和歧视的信息袁导致模型算法受到偏见和歧视的影响曰另一方面袁数据的不完整意味着不具有代表性袁在训练过程中可能会产生偏见遥这些都有可能误导社会舆论袁造成信息传播混乱袁严重的会引发潜在的道德冲突和社会分歧遥应对这一问题袁可以深入检查训练数据袁监测语言模型的偏差袁建立去偏策略袁增加多样化训练尧标注和评估方式袁制定更公平尧透明的评价标准来减少偏见和歧视的影响遥5.2 隐私风险AIGC应用在使用过程中会收集大量数据进行演化袁这些数据中可能包含用户的隐私信息遥一方面袁人工智能程序无法

41、自动区别这些信息的隐私性袁在生成文本结果时会自动公开这些信息袁导致隐私信息泄露曰另一方面袁这些数据在共享过程中可能会遭到未经授权的使用者攻击袁访问到相关的隐私数据遥要解决这一问题袁可以采用数据脱敏尧匿名化尧去标识化尧假名化尧差分隐私尧同态加密等大数据隐私计算技术保护数据隐私性袁同时加强数据隐私监管袁确保数据隐私得到充分保护遥5.3 数据安全性大语言模型面向公众开放袁不可避免会受到网络攻击遥目前袁模型攻击尧信息注入攻击尧模型劫持攻击尧海绵样本攻击已成为AIGC大语言模型面临的重要安全问题遥面对这些问题袁可以加强数据安全管理袁采取数据加密和访问权限控制技术

42、最大限度保障数据安全性袁并通过建立相应法律法规袁确保数据安全性得到保护遥5.4 虚假知识泛滥由于大语言模型的复杂性和不确定性袁以及训练数据集可能会存在一些虚假尧过时的知识袁导致生成文本会包括一些模型认为是正确但实际上是虚假的信息袁可能会对用户产生误导遥面对这一问题袁可以加强虚假信息的审查和评估袁对这些内容进行人工标注袁并通过增加多样化训练数据的手段减少虚假知识的影响遥6 结语高校图书馆采用AIGC大语言模型处理信息数据袁能够在系统架构层面拓展信息处理能力袁提升信息处理效能遥ChatGPT具有更强的自然语言处理能力袁适用于高校图书馆知识服务尧学科服务和行政管理场景袁辅助资源

43、整合及智能决策遥文心一言具有多模态内容生成和理解能力袁适用于高校图书馆技术服务尧读者服务和文化服务场景袁辅助内容创作及信息预测分析遥Bard具有增强人机对话能力袁适用于高校图书馆参考咨询服务场景袁辅助24小时智能问答遥随着AIGC内容创作方式进一步发展袁高校图书馆融合AIGC的自然语言理解生成能力袁能拓展多元化应用场景袁构建以内容创作和智慧服务为核心的图书馆生态体系袁打造元宇宙沉浸式图书馆袁创新多维服务模式袁优化业务服务环境袁辅助行政管理决策袁提升智慧化服务水平遥参考文献院1百度百科.ChatGPTEB/OL.2023-03-23.https:/ Baike.Chat

44、GPT EB/OL.2023-03-23.https:/ Baike.ERNIE bot EB/OL.2023-03-23.https:/ Baike.BardEB/OL.2023-03-23.https:/ 年第 35 卷第 7 期Bard/62648598.4卢卫红,杨新福.人工智能与人的主体性反思J.重庆邮电大学学报(社会科学版),2023,35(2):85-92.LU W H,YANG X F.Artificial intelligence and human subjectivityreflectionJ.Journal of Chongqing university of post

45、s and telecom-munications(social science edition),2023,35(2):85-92.5张智雄,曾建勋,夏翠娟,等.回应 AIGC 的信息资源管理学人思考J.农业图书情报学报,2023,35(1):4-25.ZHANG Z X,ZENG J X,XIA C J,et al.Information resourcemanagement researchersthinking about the opportunities and chall-enges of AIGC J.Journal of library and information sci

46、ence inagriculture,2023,35(1):4-25.6曹树金,曹茹烨.从 ChatGPT 看生成式 AI 对情报学研究与实践的影响J.现代情报,2023,43(4):3-10.CAO S J,CAO R Y.Influence of generative AI on the research andpractice of information science from the perspective of ChatGPTJ.Journal of modern information,2023,43(4):3-10.7张海,刘畅,王东波,等.ChatGPT 用户使用意愿影响因

47、素研究J.情报理论与实践,2023,46(4):15-22.ZHANG H,LIU C,WANG D,et al.Research on the influencingfactors of ChatGPT usersintentionJ.Information studies:Theory&application,2023,46(4):15-22.8赵瑞雪,黄永文,马玮璐,等.ChatGPT 对图书馆智能知识服务的启示与思考J.农业图书情报学报,2023,35(1):29-38.ZHAO R X,HUANG Y W,MA W L,et al.Insights and reflections o

48、fthe impact of ChatGPT on intelligent knowledge services in librariesJ.Journal of library and information science in agriculture,2023,35(1):29-38.9中国信息通信研究院.人工智能生成内容渊AIGC冤白皮书渊2022年冤EB/OL.2023-03-23.http:/ VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all youneedJ.arXiv:1706.03762,2017.11OpenAI.Int

49、roducing ChatGPTEB/OL.2023-03-23.https:/ope鄄 RADFORD A,NARASIMHAN K.Improving language understand鄄ing by generative pre-training EB/OL.2023-03-28.https:/ RADFORD A,WU J,CHILD R,et al.Language models are unsu鄄pervised multitask learnersJ.OpenAI blog,2019,1(8):9.14BROWN T B,MANN B,RYDER N,et al.Langua

50、ge models arefew-shot learnersJ.arXiv:2005.14165,2020.15 百度.文心一言EB/OL.https:/ botEB/OL.https:/ SUN Y,WANG S H,LI Y K,et al.ERNIE:Enhanced representa鄄tion through knowledge integrationJ.arXiv:1904.09223,2019.17 SUN Y,WANG S H,LI Y K,et al.ERNIE 2.0:A continual pre-training framework for language unde

展开阅读全文