收藏 分销(赏)

AIGC语言模型分析及其高校图书馆应用场景研究.pdf

上传人:自信****多点 文档编号:831097 上传时间:2024-03-27 格式:PDF 页数:12 大小:7.79MB
下载 相关 举报
AIGC语言模型分析及其高校图书馆应用场景研究.pdf_第1页
第1页 / 共12页
AIGC语言模型分析及其高校图书馆应用场景研究.pdf_第2页
第2页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023 年第 35 卷第 7 期AIGC 语言模型分析及其高校图书馆应用场景研究符荣鑫1袁 杨小华2(1.广西师范大学 图书馆,桂林541004;2.广西师范大学 生命科学学院,桂林541004)摘要院 目的/意义AIGC 的内容创作方式给图书情报领域带来一场新的变革。对比分析 AIGC 大语言模型的优缺点,探讨AIGC 的运行机制,深入研究高校图书馆场景下的应用方案,为智慧图书馆 AIGC 应用选型提供崭新的思路。方法/过程以ChatGPT、文心一言和 Bard 三项 AIGC 应用为例,运用比较分析法进行横向对比研究,归纳总结出 AIGC 的 6 个共同特征和 9个差异特征,提炼出高校图

2、书馆 6 个应用场景模式,探讨可能面临的 4 个潜在风险问题,并提出降低风险的对策。结果/结论研究结果表明,ChatGPT 更适合在高校图书馆的知识服务、学科服务和行政管理等场景中进行资源整合和决策辅助。文心一言更适合在高校图书馆读者服务、技术服务和文化服务等场景中优化服务和辅助创作。Bard 更适合在高校图书馆参考咨询场景中辅助知识问答。采用 AIGC 应用,高校图书馆尽管会面临伦理风险、隐私风险、数据安全和虚假知识泛滥等问题,但更能优化服务环境,提升智慧化服务水平。关键词院 ChatGPT;文心一言;Bard;AIGC;智慧图书馆中图分类号院G250.7文献标识码院A文章编号院1002-1

3、248渊2023冤07-0027-12引用本文院 符荣鑫,杨小华.AIGC 语言模型分析及其高校图书馆应用场景研究J.农业图书情报学报,2023,35(7):27-38.收稿日期:2023-05-15基金项目:国家社会科学基金一般项目“新信息环境下高校图书馆共生学科服务的路径预设与实现策略研究”(16BTQ033);广西哲学社会科学规划一般项目“面向高端学术共同体的情报共生理论与实现研究”(15BTQ002)作者简介:符荣鑫(1984-),男,硕士,工程师,研究方向为计算机信息处理。杨小华(1960-),男,学士,研究馆员,研究方向为图书情报分析DOI院10.13998/ki.issn1002

4、-1248.23-04061 引言近年来袁 人工智能应用席卷全球遥 人工智能生成内容 渊Artificial Intelligence Generated Content袁 简 称AIGC冤 作为其中的佼佼者为人类社会的生产生活方式带来一场悄然的变革袁 成为人工智能革命一股不可或缺的力量遥 智慧图书馆建设离不开人工智能技术的支撑袁AIGC应用的发展引领着图书馆在 野信息化-智能化-智慧化冶 建设道路上迈进一大步遥OpenAI公司的ChatGPT尧 百度公司的文心一言和Google公司的Bard是目前世界上主流的三大生成式对话系统袁 都能与用户通过自然语言进行人机交互袁 作为人工智能生成内容应用

5、的先驱袁 为图书馆在智慧化组织尧 管理和服务等方面带来全新的视野和挑战遥ChatGPT尧 文心一言和Bard的系统架构和技术路线各有不同袁 解构各系统模型并分析其异同袁 研究高校图书馆中的应用场景模式袁能为图书馆AIGC应用选型提供崭新的思路遥研究论文272023 年第 35 卷第 7 期图1 WoS核心合集关键词聚类分析图Fig.1 Keywords cluster analysis of papers downloaded from WoS core collection database2 国内外研究现状2022年11月袁ChatGPT渊ChatGenerativePre-trained

6、Transformer袁 聊天生成预训练转换器冤 全球发布袁 标志着人工智能应用进入快速增长期袁AIGC迎来新的时代1遥 紧随着ChatGPT发布袁2023年3月袁 文心一言和Bard相继上线袁 拉开AIGC鼎足之战的序幕2,3遥 作为AIGC的新兴产品袁ChatGPT尧 文心一言和Bard基于大语言模型研发袁 能够与用户进行自然语言互动交流袁自动生成文本和内容摘要袁 帮助人们获取知识和灵感遥截至2023年7月31日袁 在WoS核心合集上以野TS=(ChatGPT)OR TS=(ERNIE bot)OR TS=(Bard)OR TS=(AIGC)OR TS=(Large Language Mo

7、del)冶 为检索式进行主题检索袁 并限定文献类型为 野论文冶袁 共获得290条检索结果袁 关键词聚类结果如图1所示遥 在CNKI上以 野(主题=ChatGPT)OR(主题=文心一言)OR(主题=Bard)OR(主题=LLM)OR(主题=AIGC)OR(主题=大语言模型)冶 为检索式进行主题检索袁 并限定文献类型为 野学术期刊冶袁 共获得1 135条检索结果袁 其中袁野图书情报与数字图书馆冶 学科分类上有48篇袁 关键词聚类结果如图2所示遥从检索结果来看袁 中国更注重AIGC应用研究遥涉及关键词 野ChatGPT冶 的学术论文最早由卢卫红和杨新福4发表袁 文章从哲学角度研究ChatGPT人工智

8、能带来的 野思维革命冶袁 为AIGC应用研究进行了前期探索遥 自2023年1月起袁ChatGPT研究出现猛增袁 表明AIGC研究在中国呈快速增长的态势遥 从聚类分析来看袁 国内外都是以 野ChatGPT冶 为主要研究对象袁 国外更倾向于人工智能尧 自然语言处理尧 大语言模型尧 聊天机器人等模型和算法的基础研究袁 国内更倾向于生成式人工智能尧 学术伦理尧 应用场景尧 教育数字化转型等人文关系和社会问题的应用研究遥 图书情报领域主要从宏观角度研究ChatGPT对图书馆智慧服务的影响尧 对策和应用场景袁 并对图书馆未来的发展道路提出建设性意见5-8遥 国内外研究都以AIGC和ChatGPT为主袁 而

9、文心一言和Bard研究较少遥3 AIGC 大语言模型系统分析人 工 智 能 生 成 内 容 渊AIGC冤 白 皮 书 认 为 院野AIGC既是从内容生产者视角进行分类的一类内容袁DOI院10.13998/ki.issn1002-1248.23-0406研究论文282023 年第 35 卷第 7 期图2 CNKI关键词聚类分析图Fig.2 CNKI keywords cluster analysis又是一种内容生产方式袁 还是用于内容自动化生成的一类技术集合遥9冶ChatGPT尧 文心一言和Bard作为AIGC的实际产品证明人工智能算法具有智能数字内容创作和自我演化的能力袁 都同时具备可持续性尧

10、 可创造性和实时性等特征袁 也拥有各自不同的特点袁 可适用于高校图书馆不同服务场景遥3.1 各系统共同性特征Transformer模型是Google于2017年提出的人工智能机器学习模型袁 主要用于自然语言理解处理任务袁其最大特点就是采用自注意力机制解析语言中各部分的关系10遥 每个Transformer包含编码器和解码器两个部分袁 可任选其中某一部分或多个部分经过多重组合形成新的大语言模型遥Transformer模型的整体架构如图3所示遥ChatGPT尧 文心一言和Bard都实现了自然语言理解分析和文本内容自动生成袁 能够以自然语言与用户对话袁 实时响应用户提问袁 提供智能对话服务遥 虽然各

11、系统拥有不同的语言模型袁 但这些语言模型都是在Transformer模型的基础上分别演化形成的袁 因此具有以下共同特征院都有并行化处理能力遥 模型采用自注意力机制袁 不依赖前一步骤的处理结果袁 只依赖于输入向量袁 因此可以实现完全并行计算袁 提高自然语言处理速度遥都有长文本增强处理能力遥 模型优化位置编码袁 能从全局直接计算两个词之间的依赖关系袁不容易出现梯度消失和爆炸的问题袁 更好的处理长文本内容遥都有多语言尧 多任务扩展能力遥 采用Transformer模型能够根据具体任务的需要自由调整层数尧 注意力层的头数等参数袁 扩展模型的适用范围遥都有预训练学习优化过程遥 模型无需进行特征工程袁可直

12、接处理原始数据袁 减少人工干预成本袁 提高模型训练效率遥都有多模态数据强化处理能力遥 通过对模型的微调袁 能够实现文本尧 图像尧 音频尧 视频等多模态数据的融合袁 提高模型的表征能力遥都有泛化迁移学习能力遥 通过在大数据上进行预训练袁 再根据任务的实际需要对模型参数进行微调袁 可实现模型的迁移学习遥这些特征有利于高校图书馆加速融合学科知识和符荣鑫,杨小华AIGC 语言模型分析及其高校图书馆应用场景研究292023 年第 35 卷第 7 期教学资源袁 扩展知识服务边界袁 优化技术服务方式袁丰富文化服务内容袁 提升智慧服务水平遥3.2 各系统差异性特征ChatGPT尧 文心一言和Bard都是在Tr

13、ansformer模型的基础上建立起的AIGC应用袁 但各系统的任务目标并不相同遥ChatGPT更偏向文本内容自动生成袁 文心一言侧重于多模态数据的创作融合袁Bard更关注自然语言对话任务袁 因此具有各自的特点遥 其特征如表1所示遥3.2.1语言模型架构ChatGPT基于GPT渊Generative Pre-trained Trans-图3 Transformer模型整体架构图Fig.3 Transformer model overall structure项目 ChatGPT 文心一言 Bard 运营公司 OpenAI 公司 百度公司 Google 公司 语言模型 GPT ERNIE LaM

14、DA 预训练参数/亿 1 750 2 600 1 370 预训练数据量/TB 45 4 1.56 训练数据类型 互联网文本数据 互联网多模态数据 文本对话数据 数据来源 2021 年 9 月以前互联网历史文本数据 互联网实时搜索、图像、语音、事实数据 互联网网页实时数据 语言支持 多种语言,自然语言 中文,自然语言 仅英文,对话应答 模态支持 单模态,文本 多模态,文本、图像 单模态,仅文本对话 任务适用性 通用领域任务 通用领域任务 人机对话任务 应用场景 自然语言理解,文本生成,语言翻译,文本摘要,代码生成 自然语言文本创作,图像生成、语言翻译、代码生成 自然语言问答,文本生成,语言翻译

15、可使用地域 全球 中国 美国、英国 跨语言迁移能力 具备 弱 目前无 可扩展性 具备 具备 具备 可解释性 相对较弱 相对较高 相对较弱 局限性 知识有限,真实性无法保障 中文表现显著,英文表现能力较弱 训练数据较少,不支持多语言,有时提供多个答案 表1 ChatGPT尧 文心一言尧Bard特征分析表Table 1 Comparison of features of ChatGPT,ERNIE Bot and BardDOI院10.13998/ki.issn1002-1248.23-0406研究论文302023 年第 35 卷第 7 期图4 GPT模型结构图Fig.4 GPT model st

16、ructureformer袁 生成式预训练转换器冤 大语言模型构建袁 新增反馈强化学习 渊Reinforcement Learning from HumanFeedback袁 简称RLHF冤 过程袁 用于增强对输出结果的智能调节袁 提高语言模型的识别能力袁 具有良好的文本生成和泛化扩充性能11袁 其模型结构如图4所示遥GPT模型仅使用Transformer模型中的解码器袁 并只保留掩码多头注意力层部分袁 提高模型训练速度遥经过3个版本的迭代开发袁 利用并行计算的优势袁GPT模型在自然语言理解任务中表现出卓越的性能12-14遥ChatGPT至少采用96层Transformer用于大数据训练袁同时

17、引入评估式强化人工训练代理 渊Training an AgentManually via Evaluative Reinforcement袁 简称TAMER冤对学习结果进行人工标注袁 采用真实性尧 无害性和有用性评价标准对输出结果进行评价并提供奖励反馈袁达到快速收敛和完成训练任务的目标遥文心一言基于ERNIE渊Enhanced Representationthrough Knowledge Integration袁 信息实体增强语言表示冤 大语言模型构建袁 融合大数据知识图谱与文本数据进行混合训练袁 提升语言模型创作能力15袁 其模型结构如图5所示遥ERNIE模型仅使用Transformer模

18、型中的编码器袁在其基础上嵌入知识图谱袁 并加入连续学习流程袁 将预训练网络分为48层通用语义表示网络和12层任务语义表示网络袁 提高多任务训练的灵活性和扩展性16-18遥 文图5 ERNIE模型结构图Fig.5 ERNIE model structure符荣鑫,杨小华AIGC 语言模型分析及其高校图书馆应用场景研究312023 年第 35 卷第 7 期心一言作为ERNIE模型的典型应用袁 通过多模态数据预训练袁 增强跨模态语义理解能力袁 能够应用到文本创作尧 图像设计等多模态场景中遥Bard基 于LaMDA渊Language Models for DialogApplications袁 对话应

19、用语言模型冤 大语言模型构建袁专门训练人类对话数据袁 产生类似自然语言的反馈响应袁 为人们学习交流提供帮助19袁 其模型结构如图6所示遥LaMDA模型仅使用Transformer模型中的解码器袁将外部知识嵌入到64层Transformer中袁 并对生成的识别结果用质量性尧 安全性和可靠性3项标准进行量化评分袁 综合评分决定生成的响应是否需要重新训练袁最终提高人机问答质量20遥总体来看袁ChatGPT具有更强的自然语言理解能力袁 更适合为高校图书馆知识服务提供辅助遥 文心一言具有多模态数据生成能力袁 更适合高校图书馆内容创作和数据可视化分析遥Bard具有增强人机对话能力袁更适合应用于高校图书馆的

20、参考咨询和智能问答服务场景中遥3.2.2预训练数据策略ChatGPT预训练数据以文本数据为主袁 是2021年9月以前采集到的互联网历史数据袁 数据量达45TB袁训练参数达1 750亿袁 数据规模是3个系统中最大的遥文心一言预训练数据以多模态数据为主袁 包括互联网实时搜索尧 图像尧 语音尧 事实等数据袁 数据量达4TB袁预训练参数达2 600亿遥Bard预训练数据以互联网实时数据和对话数据为主袁 数据量达1.56TB袁 预训练参数达1 370亿袁 数据规模是3个系统中最小的遥3个系统都采用无监督学习进行预训练袁 通过自回归和自编码生成任务学习语言模型袁 采用奖励模型对参数进行微调以适应各类下游任

21、务遥ChatGPT依赖大量文本数据训练和人工标引奖励机制获得最佳自然语言理解能力袁 能够生成人类无法区别的AI内容袁 但由于都是历史数据袁 因此不能准确响应2021年9月以后发生的事件遥 文心一言和Bard都是采用实时数据进行训练袁 具有较强的数据优势遥 文心一言采用持续学习和知识蒸馏技术袁 训练过程中融合知识图谱袁 提升模型处理多模态数据知识的能力遥Bard采用量化评分机制对训练结果进行评价袁 提高问题反馈的中立性遥 相比而言袁 文心一言有更强的知识学习和拓展能力袁 能更好的提升高校图书馆知识服务效果遥3.2.3任务适用性ChatGPT在多个领域应用中取得显著成果袁 由于其较强的自然语言理解

22、和生成能力袁 在知识问答尧 对话生成尧 文本摘要尧 阅读理解尧 情感分析等领域表现出卓越的效果遥 尤其是人机对话应用上袁 生成内容非常接近人类自然语言袁 并能辅助用户完成一些复杂的文字工作遥 文心一言拥有多模态训练模型的先天优势袁除了ChatGPT的文本交互功能外袁 还能进行命名实体识别袁 根据用户的文本描述生成虚构图像设计袁 辅助设计行业进行图像设计遥Bard专注于人机对话应用袁旨在以无差别的自然语言与用户进行沟通交流袁 因此图6 LaMDA模型结构图Fig.6 LaMDA model structureDOI院10.13998/ki.issn1002-1248.23-0406研究论文322

23、023 年第 35 卷第 7 期目前仅限于进行人机对话领域袁 将来经过多轮迭代和微调袁 也可用于其他领域行业遥 由此可见袁 文心一言拥有更丰富的应用领域袁 更能满足高校图书馆多元化的服务需求袁 达到降本增效的目的遥3.2.4语言知识库ChatGPT以英文知识为主袁 因此更擅长处理英文任务袁 但拥有多语言知识库袁 也可处理多语言问答遥应用能够自动识别用户提问所使用的语言袁 并生成与用户语言一致的响应袁 也可以进行语言翻译袁 由于使用自然语言学习模型袁 翻译效果略好于机器翻译遥 文心一言运营在中国袁 更擅长处理中文任务袁 也支持英文袁 但效果差强人意袁 其他语言则不支持遥 但文心一言能够不断更新知

24、识库袁 在获得新语言知识的条件下袁支持多语言环境不是问题遥Bard目前处于公测阶段袁并不支持除英文以外的其他语言进行对话袁 且只有美英地区才能使用Bard袁 有较大的限制袁 但其英文对话处理能力和应答反馈效果很好遥 因此袁 文心一言更适合中国高校图书馆的应用环境袁 在新知识不断积累和沉淀下袁 服务质量会有更大提高遥3.2.5跨语言迁移能力跨语言迁移能力是衡量自然语言学习模型适用范围的重要指标遥ChatGPT拥有多语言知识库袁 在处理英文任务的基础上袁 能够实现多场景尧 多任务尧 多语言的统一迁移学习袁 表现出跨语言迁移能力遥 文心一言主要关注于中文处理任务袁 其多语言知识库较少袁跨语言迁移能力

25、受到限制遥Bard不接受除英文外的其他语言进行提问袁 但能进行语言翻译袁 目前未表现出跨语言迁移能力遥 可以看出袁ChatGPT更适合为高校留学生提供多语言学科服务袁 实现跨语言无缝交流袁吸纳更多服务对象袁 拓展学科服务范畴遥3.2.6可解释性与可靠性可解释性用于探究学习模型内部运作过程袁 可解释性越高袁 表明学习模型越透明袁 产生的结果越容易被人信任遥ChatGPT采用大型语言模型进行预训练袁训练参数多袁 训练数据量大袁 可解释性相对较差遥 文心一言使用知识图谱和持续学习对学习过程进行增强袁可解释性相对强些遥Bard训练参数少袁 训练数据量小袁且以对话数据为主袁 可解释性更高遥可靠性用于判定

26、自然语言学习模型是否值得信任遥从目前使用情况来看袁 无论ChatGPT尧 文心一言还是Bard都会在一定程度上对信息判断失误袁 容易产生错误的响应误导用户袁 因此高校图书馆在使用AIGC应用时要加强人工智能治理袁 监控响应内容变化袁 及时人工干预修正问题内容袁 增强知识的可靠性遥3.2.7模型可扩展性3个系统模型都采用自注意力机制袁 因此都具备良好的可扩展性遥ChatGPT未使用知识图谱袁 应用于新的领域需要提供海量的文本数据生成新知识遥 文心一言拥有知识图谱袁 只需建立结构化知识库融入学习模型中就可扩展到新的领域遥Bard在对话数据中增加了知识训练袁 目的是为了增强对话响应能力袁 使其更接近

27、人类语言袁 因此应用于新领域需要将新知识增加到模型中遥3个模型扩展的方式不同袁 而文心一言采用的结构化知识库更适合高校图书馆传统数据库管理方式袁减少管理成本袁 降低学习曲线遥3.2.8应用可行性生成式对话系统在各领域中都表现出较高的价值遥ChatGPT以优秀的自然语言理解和处理能力袁 较高的文本生成创作性能表现出广阔前景袁 目前可应用于智能客服尧 语言翻译尧 文本摘要尧 代码生成尧 文章创作等领域遥 文心一言有多模态预训练模型支持袁 能够进行虚拟图像设计袁 甚至达到以假乱真的效果袁 可应用于文学创作尧 商业文案尧 中文理解和多模态生成等领域遥Bard的量化评价机制能够产生更接近自然语言的对话袁

28、 最适合在智能客服领域中使用袁 将来也可拓展到其他领域遥 高校图书馆中袁ChatGPT更适合以文本数据为主的知识服务袁 文心一言更适合多模态内容生产为主的文化服务袁Bard更适合人机对话为主的智能问答服务袁 能够充分发挥其应用价值遥3.2.9应用局限性ChatGPT的训练数据为2021年9月以前的互联网历史数据袁 且不会更新袁 缺少实时数据袁 无法对2021年9月以后发生的事件产生正确响应遥 文心一言采用互联网实时数据进行训练袁 中文数据训练较为显著袁符荣鑫,杨小华AIGC 语言模型分析及其高校图书馆应用场景研究332023 年第 35 卷第 7 期英文语料数据较少袁 跨语言交互表现能力较弱遥

29、Bard训练数据较少袁 且以对话数据为主袁 目前不支持多语言对话袁 有时回答甚至会提供多个答案供用户选择遥3个系统对于文本生成的结果可能会具有一定偏见袁 主要原因在于数据集存在偏差或不完整袁 同时人工标引可能会带入标引者的个人情感袁 影响最终生成结果遥因此袁 文心一言尽管跨语言能力表现较弱袁 但高校图书馆可利用其实时数据训练能力袁 不断更新知识库袁 增加新模态数据袁 适应高校图书馆不断变化的业务需求遥4 AIGC 在高校图书馆应用场景分析高校图书馆智慧化建设离不开技术革新和服务创新遥 目前袁 高校图书馆面临人员老化尧 管理滞后尧 读者覆盖面不足尧 技术手段落后尧 服务创新不够等问题袁AIGC应

30、用于高校图书馆袁 能开启图书馆应用新范式转移袁 加快智慧图书馆建设进程袁 创新智慧服务模式袁增强图书馆的核心竞争力遥4.1 嵌入知识服务袁 提高知识管理效能知识服务需要提升知识解构和整合分析效能遥AIGC具有大数据并行处理和泛化迁移学习能力袁 能够通过学习训练和逻辑推理袁 智能实现知识解构和整合分析遥 采用ChatGPT更适合高校图书馆的知识服务场景袁 能提供智能化知识管理方式袁 提高知识管理的工作效能遥 对知识服务有以下3个方面的影响遥渊1冤 优化知识组织体系袁 增强知识应用价值遥 利用模型的学习推理能力袁 从中央知识库的海量信息数据中挖掘知识内在联系袁 演化新的知识内容袁 建立自我成长的知

31、识服务模式遥渊2冤 改进知识管理模式袁 提升知识管理效能遥 利用模型的自然语言理解与生成能力袁 简化复杂的知识管理路径袁 降低人力管理成本袁 精确识别用户检索意图袁 构建用户行为模式袁 用问答方式响应用户请求袁增加人工智能系统的亲和力遥渊3冤 完善知识甄选标准袁 提高知识资源质量遥 利用模型前馈网络及奖励机制在人工干预的条件下对知识进一步评价袁 通过对知识进行标注袁 加强知识的可靠性和可用性管理袁 科学判断信息的有效性袁 最大限度减少知识带来的偏见与歧视遥4.2 融合学科服务袁 赋能高校学科建设学科服务需要整合高校教学资源和学科知识来提高学科服务质量遥AIGC具有自然语言理解和预训练学习能力袁

32、 能够自行判别用户意图袁 智能生成自然语言响应遥 采用ChatGPT更适合高校图书馆的学科服务场景袁Bard则更适合参考咨询服务场景袁 能深度提升学科智慧化服务能力袁 创新学科服务模式袁 提高学科服务效率遥 包括以下4个方面的改进遥渊1冤 赋能高校学科建设袁 辅助学科热点研究遥 模型用中央知识库的海量数据追踪学科的发展动向袁 建立学科知识图谱袁 探求学科内和跨学科的研究关系袁利用 野思维链策略冶 进一步挖掘学科领域研究热点袁聚焦学科领域前沿袁 把握学科发展趋势袁 为高校 野双一流冶 建设提供有力支持遥渊2冤 嵌入参考咨询服务袁 提升读者服务体验遥 大语言模型拥有逻辑推理能力袁 在预训练的基础上

33、发掘知识的相关性袁 通过采集外部信息不断学习袁 扩充中央知识库袁 增强自身的自然语言理解和生成能力袁 响应咨询回复更为客观袁 有效减少人为主观意识对回复内容的影响遥 参考咨询由人工咨询方式向智能机器人咨询方式转变袁 可提供24小时不间断咨询服务袁 提升读者参考咨询服务体验遥渊3冤 融合学科分析服务平台袁 实现数据分析自动化遥 利用模型语言理解生成能力智能识别用户意图袁理解用户需求袁 在大数据基础上深入分析学科进展袁收集学科研究数据袁 自动生成学科分析报告袁 提高报告撰写效率遥渊4冤 助力信息素养教育袁 创新教育模式遥 在模型的知识基础上建立信息素养教育知识库袁 将原来平面的尧 抽象的知识具体化

34、尧 立体化袁 提供人工智能生成式对话工具袁 学生可定制个性化教学内容袁 通过自主提问方式查缺补漏遥 全新的智能教学工具袁 让每个学生得到个性化尧 智能化的信息素养教育遥DOI院10.13998/ki.issn1002-1248.23-0406研究论文342023 年第 35 卷第 7 期4.3 增强技术服务袁 构建图书馆新形象技术服务需要增加信息推理和预测方法来强化技术监查能力遥AIGC具有千亿级超参数训练和拓展知识库能力袁 能够通过现有知识库推理信息流动向袁 预测事件发展遥 采用文心一言更适合高校图书馆的技术服务场景袁 能改变技术服务模式袁 增强技术服务能力袁提升图书馆智慧服务水平遥 主要有

35、以下3个方面的新举措遥渊1冤 创建图书馆虚拟形象袁 营造沉浸式体验环境遥利用模型知识库中的多模态数据信息袁 借助视觉尧 语音尧 文本生成算法自动化生成图书馆3D虚拟形象袁 以亲切的形象拉近读者距离袁 塑造元宇宙时代图书馆新形象遥 加速图书馆线上演变袁 打造全新图书阅读场景遥渊2冤 构建数字孪生系统袁 创新图书馆服务价值遥通过采集图书馆全方位三维数据信息袁 在大量知识库的基础上袁 快速转换为实时参数化的3D建模数据袁 高效构建与现实世界一致的数字孪生图书馆袁 连通线上线下资源管理袁 读者在线上也能获得与线下图书馆一致的沉浸式服务体验袁 创造新的服务价值遥渊3冤 监测信息流安全状况袁 辅助信息安全

36、系统管理遥 利用大语言模型预训练识别的优势纳入信息流检测袁 运用代码生成技术生成监测脚本袁 能够更快尧 更准的提取关键词袁 检测信息流中的非法字符袁 降低关键词匹配算法导致的误识别率袁 提高错敏词的识别准确率袁 提升信息安全管理能力遥4.4 优化读者服务袁 打造 野采编流阅冶 一体化平台读者服务需要智能化管理平台提升读者访问体验遥AIGC具有多任务扩展和模型延展能力袁 能够根据 野采编流阅冶 需求扩展任务边界袁 优化服务流程遥 采用文心一言更适合高校图书馆的读者服务场景袁 能实现智能采选和个性化推荐袁 提升读者服务体验遥 可在以下两个方面改进服务质量院 第一袁 深度融合智能技术袁打造 野采编流

37、阅冶 一体化服务遥 利用模型强大的运算能力和海量的知识库袁 捕获并分析读者荐书信息袁 建立智能采选服务平台袁 实时推送信息流至 野流阅冶 服务袁 实现图书全流程智慧化管理遥 第二袁 刻画读者画像袁 精准推荐图书信息遥 实时跟踪用户信息请求流袁自动分析读者用书尧 荐书数据袁 根据读者行为刻画读者画像袁 利用深度学习算法和自然语言处理技术进行预测和个性化推荐袁 帮助读者更精准获取符合其需求的图书资源袁 提高借阅服务体验遥4.5 结合文化服务袁 丰富文化建设内涵文化服务需要自动生成内容辅助文化创作宣传遥AIGC具有多模态数据处理和内容自动生成能力袁 能够根据提示词判断用户需求袁 创作新内容遥 采用文

38、心一言更适合高校图书馆文化服务场景袁 能提升文化创作水平袁 拓展文化创作空间袁 为图书馆文化建设全面赋能遥 例如AI智能写作机器人在融入大语言模型的条件下袁 能够快速生成新闻报道袁 减少人工干预袁 提高采编效率遥 利用模型海量的多模态数据袁 智能合成虚拟场景袁 生成文化宣传设计袁 实现智能视频剪辑袁 提升设计内容价值袁 为新内容创作提供新思路袁 激发设计灵感袁 缩短设计周期袁 加强文化推广袁 促进图书馆文化建设向智慧化全面发展遥4.6 赋能行政管理袁 辅助图书馆智能决策行政管理需要文本理解和预测能力来辅助决策袁提高行政管理效率遥AIGC具有自然语言理解和生成能力袁 能够通过学习训练预测内容袁

39、并有良好的任务扩展性遥 采用ChatGPT更适合高校图书馆的行政管理场景袁 能建立决策优化预测模型袁 用自然语言理解能力提取决策关联内容袁 提升模型的可靠性袁 为智能决策提供更精准的信息支持遥 同时嵌入Office等办公软件袁帮助行政管理人员智能生成公文内容袁 根据行文自动生成文章摘要并提出建议及意见袁 辅助行政管理人员快速了解行文中心思想袁 提高行政管理效率遥5 面临风险及对策由于大语言模型的复杂性和不确定性袁 数据的隐符荣鑫,杨小华AIGC 语言模型分析及其高校图书馆应用场景研究352023 年第 35 卷第 7 期私安全和响应结果的中立性都成为新的风险袁 我们需要做好准备面临以下挑战遥5

40、.1 伦理风险AIGC应用都是在人工数据集上训练出来遥 一方面袁 海量的数据不可避免包含某些偏见和歧视的信息袁导致模型算法受到偏见和歧视的影响曰 另一方面袁 数据的不完整意味着不具有代表性袁 在训练过程中可能会产生偏见遥 这些都有可能误导社会舆论袁 造成信息传播混乱袁 严重的会引发潜在的道德冲突和社会分歧遥应对这一问题袁 可以深入检查训练数据袁 监测语言模型的偏差袁 建立去偏策略袁 增加多样化训练尧 标注和评估方式袁 制定更公平尧 透明的评价标准来减少偏见和歧视的影响遥5.2 隐私风险AIGC应用在使用过程中会收集大量数据进行演化袁 这些数据中可能包含用户的隐私信息遥 一方面袁人工智能程序无法

41、自动区别这些信息的隐私性袁 在生成文本结果时会自动公开这些信息袁 导致隐私信息泄露曰 另一方面袁 这些数据在共享过程中可能会遭到未经授权的使用者攻击袁 访问到相关的隐私数据遥 要解决这一问题袁 可以采用数据脱敏尧 匿名化尧 去标识化尧假名化尧 差分隐私尧 同态加密等大数据隐私计算技术保护数据隐私性袁 同时加强数据隐私监管袁 确保数据隐私得到充分保护遥5.3 数据安全性大语言模型面向公众开放袁 不可避免会受到网络攻击遥 目前袁 模型攻击尧 信息注入攻击尧 模型劫持攻击尧海绵样本攻击已成为AIGC大语言模型面临的重要安全问题遥 面对这些问题袁 可以加强数据安全管理袁 采取数据加密和访问权限控制技术

42、最大限度保障数据安全性袁并通过建立相应法律法规袁 确保数据安全性得到保护遥5.4 虚假知识泛滥由于大语言模型的复杂性和不确定性袁 以及训练数据集可能会存在一些虚假尧 过时的知识袁 导致生成文本会包括一些模型认为是正确但实际上是虚假的信息袁 可能会对用户产生误导遥 面对这一问题袁 可以加强虚假信息的审查和评估袁 对这些内容进行人工标注袁并通过增加多样化训练数据的手段减少虚假知识的影响遥6 结语高校图书馆采用AIGC大语言模型处理信息数据袁能够在系统架构层面拓展信息处理能力袁 提升信息处理效能遥ChatGPT具有更强的自然语言处理能力袁 适用于高校图书馆知识服务尧 学科服务和行政管理场景袁辅助资源

43、整合及智能决策遥 文心一言具有多模态内容生成和理解能力袁 适用于高校图书馆技术服务尧 读者服务和文化服务场景袁 辅助内容创作及信息预测分析遥Bard具有增强人机对话能力袁 适用于高校图书馆参考咨询服务场景袁 辅助24小时智能问答遥随着AIGC内容创作方式进一步发展袁 高校图书馆融合AIGC的自然语言理解生成能力袁 能拓展多元化应用场景袁 构建以内容创作和智慧服务为核心的图书馆生态体系袁 打造元宇宙沉浸式图书馆袁 创新多维服务模式袁 优化业务服务环境袁 辅助行政管理决策袁提升智慧化服务水平遥参考文献院1百度百科.ChatGPTEB/OL.2023-03-23.https:/ Baike.Chat

44、GPT EB/OL.2023-03-23.https:/ Baike.ERNIE bot EB/OL.2023-03-23.https:/ Baike.BardEB/OL.2023-03-23.https:/ 年第 35 卷第 7 期Bard/62648598.4卢卫红,杨新福.人工智能与人的主体性反思J.重庆邮电大学学报(社会科学版),2023,35(2):85-92.LU W H,YANG X F.Artificial intelligence and human subjectivityreflectionJ.Journal of Chongqing university of post

45、s and telecom-munications(social science edition),2023,35(2):85-92.5张智雄,曾建勋,夏翠娟,等.回应 AIGC 的信息资源管理学人思考J.农业图书情报学报,2023,35(1):4-25.ZHANG Z X,ZENG J X,XIA C J,et al.Information resourcemanagement researchersthinking about the opportunities and chall-enges of AIGC J.Journal of library and information sci

46、ence inagriculture,2023,35(1):4-25.6曹树金,曹茹烨.从 ChatGPT 看生成式 AI 对情报学研究与实践的影响J.现代情报,2023,43(4):3-10.CAO S J,CAO R Y.Influence of generative AI on the research andpractice of information science from the perspective of ChatGPTJ.Journal of modern information,2023,43(4):3-10.7张海,刘畅,王东波,等.ChatGPT 用户使用意愿影响因

47、素研究J.情报理论与实践,2023,46(4):15-22.ZHANG H,LIU C,WANG D,et al.Research on the influencingfactors of ChatGPT usersintentionJ.Information studies:Theory&application,2023,46(4):15-22.8赵瑞雪,黄永文,马玮璐,等.ChatGPT 对图书馆智能知识服务的启示与思考J.农业图书情报学报,2023,35(1):29-38.ZHAO R X,HUANG Y W,MA W L,et al.Insights and reflections o

48、fthe impact of ChatGPT on intelligent knowledge services in librariesJ.Journal of library and information science in agriculture,2023,35(1):29-38.9中国信息通信研究院.人工智能生成内容渊AIGC冤白皮书渊2022年冤EB/OL.2023-03-23.http:/ VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all youneedJ.arXiv:1706.03762,2017.11OpenAI.Int

49、roducing ChatGPTEB/OL.2023-03-23.https:/ope鄄 RADFORD A,NARASIMHAN K.Improving language understand鄄ing by generative pre-training EB/OL.2023-03-28.https:/ RADFORD A,WU J,CHILD R,et al.Language models are unsu鄄pervised multitask learnersJ.OpenAI blog,2019,1(8):9.14BROWN T B,MANN B,RYDER N,et al.Langua

50、ge models arefew-shot learnersJ.arXiv:2005.14165,2020.15 百度.文心一言EB/OL.https:/ botEB/OL.https:/ SUN Y,WANG S H,LI Y K,et al.ERNIE:Enhanced representa鄄tion through knowledge integrationJ.arXiv:1904.09223,2019.17 SUN Y,WANG S H,LI Y K,et al.ERNIE 2.0:A continual pre-training framework for language unde

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服