1、专题:AIGC 技术赋能下的出版业与人才培养13AIGC 技术赋能数字音频内容生产:应用场景、存在问题与应对策略1*李雅筝1,2,刘宇星11.安徽大学新闻传播学院,230601,合肥;2.安徽新华发行(集团)控股有限公司博士后科研工作站,230061,合肥摘要:在人工智能技术应用快速发展的今天,AIGC技术正在加速推动着数字音频内容生产模式的变革。在赋能产业实践提质增效的同时,智能语音技术也引发了一些问题与风险。基于案例分析发现,AIGC技术在有声读物等音频内容生产、数字音乐创作、新闻广播智能播报和多元需求的配音等多个应用场景具有较好的赋能潜力。基于实际应用中尚存的AI合成语音精度、用户声音权
2、和作品版权侵权、虚假信息及用户隐私数据泄露等问题的剖析,提出:应提升语音数据库的质量管理,注重隐私保护措施,确保用户数据的安全性和隐私性;通过添加音频数字水印,保护音频作品版权;尽快制定音频法律规范和行业准则,强化著作权授权许可,规范市场传播行为。关键词:AIGC;AI语音技术;数字音频内容;有声读物;应用场景;内容生产D O l:10.3969/j.issn.2097-1869.2023.03.0 03文献标识码:A本文著录格式:李雅筝,刘宇星.AIGC技术赋能数字音频内容生产:应用场景、存在问题与应对策略J.数字出版研究,2023,2(3):13-20.*基金项目:安徽省高等学校科学研究重
3、大项目“基于AIGC的新媒体内容生产:技术路径、实践策略与应用示范”。人工智能生成内容(Artificial Intelligence Generated Content,AIGC)技术是一种基于人工智能自动生成文本、图像、音频、视频等多模态内容的技术,被认为是驱动数字内容创新的新引擎。在数字音频内容生产领域,ChatGPT、Claude、讯飞星火等大语言模型(Large Language Model,LLM)具备强大的语言理解和生成能力,可以高效辅助有声读物、广播剧本等初稿内容文本的生成与优化。而基于从文本到语音(Text To Speech,TTS)技术,可以快速将文本内容转化为配音员风格
4、的有声读物或歌手风格的人声歌曲,从而显著提高数字音频内容生产效率,实现降本增效的目的。在AIGC技术应用不断迭代发展的背景下,本文主要探讨AIGC技术在数字音频内容生产中的几个潜在应用场景及需要关注的相关问题,以期通过全面理解人工智能介入下的数字音频内容生成实践,为相关研究和应用提供参考。1AIGC技术赋能数字音频内容生产的应用场景随着AIGC技术的发展,尤其是智能语音技术的广泛应用,传统的人工配音、真人朗读场景正在发生深刻变革。AIGC技术有望成为有声读物、有声剧、数字音乐、新闻广播智能播报等多元数字音频内容生产转型和升级的重要动力。1.1赋能有声读物、有声剧等多元化音频内容生产目前,TTS
5、技术可以根据不同的文本风格和应用场景,将文本内容转换为配音员风格的有声读物,该技术已逐步被应用到广告配音、社交媒体内容朗读、有声读物和有声剧等生产过程中。14数字出版研究2023 年第 3 期 在数字阅读融合出版领域,书旗小说、晋江小说阅读、七猫小说和掌阅等小说在线阅读平台中的语音朗读功能可以朗读整本书或指定章节。以番茄免费小说阅读平台为例,该平台的语音朗读功能不仅能根据不同题材的小说匹配相对应的音色,还可以在朗读过程中匹配合适的背景音乐以增强阅读的氛围感,同时提供多档语速调节功能和多角色对话功能1。这种基于TTS技术的数字出版融合应用,不仅优化了用户的阅读体验感,还可赋能在线阅读的多元化、多
6、场景发展。在新媒体内容有声化领域,一些网站文章、博客内容或公众号的长篇推送也可以通过语音合成直接转换为音频文件,供用户浏览时听取或下载以便离线听读。对于较长内容,还可以适当分割生成对应的音频文件,供用户逐段播放,帮助读者更好地理解和吸收内容。这种便捷且人性化的文字转语音功能打破了传统阅读的时间和空间限制,简化了用户学习和获取信息的方式,是数字音频内容生产领域的重要发展方向之一。在专业的有声读物内容生产领域,除利用TTS技术替代真人朗读制作有声读物、有声剧外,喜马拉雅平台已尝试进行头部主播的训练或者AI分身的运营。在此应用场景下,可以利用人工智能技术克隆还原任何人的声音,并基于训练好的声库模型进
7、行有声读物或有声剧的多元化智能创作。例如,喜马拉雅的“单田芳原音重现”项目使用人工智能技术模拟评书大师单田芳独特的嗓音。基于AIGC的能力,可生成单田芳未读完的作品或新的作品,如以单田芳嗓音朗读 明朝那些事儿。这种个性化的声音模拟和再应用的人工智能技术,可以提高有声内容主播的创作效率,赋予更多UGC创作者进行有声内容创作的能力,从而提高有声读物的内容生产力,为有声阅读市场提供更加丰富的多元和个性化内容。1.2赋能数字音乐的创作场景在数字音乐创作领域,人工智能技术已经渗透到音乐行业的各个方面。作为算法和艺术的交叉产物,人工智能音乐已为公众所熟知。从1957年计算机生成的 伊利亚克组曲 到2020
8、年网易发布的全流程人工智能歌曲醒来,人工智能介入音乐已成为必然发展趋势,智能语音技术在音乐创作中将占据越来越重要的地位。一方面,智能语音技术可用于音乐歌曲的快速生产,通过算法对海量音乐数据进行解构、分析和学习,形成相对确定的审美风格的AI音乐模型。然后根据用户要求在选定风格基础上生成内容:输入歌词或旋律,智能语音技术可以自动合成相应的人声或和弦。对专业音乐人来说,使用人工智能技术制作音乐demo比使用真人录制更快捷方便。AI声音克隆技术还可以收集歌手干声素材进行声线克隆,模仿歌手演唱风格。近期,网络上爆火的“AI孙燕姿”就是用AI技术完美复刻了孙燕姿的声音,并因在各大网络平台上翻唱一系列新老歌
9、星的成名曲而“出圈”登上热搜。QQ音乐数据显示,歌手孙燕姿自出道以来共发布435首作品,而在B站上“AI孙燕姿”翻唱的作品就超过了1 000首,可以看出AI技术惊人的工作效率。另一方面,这项技术也可以帮助已故音乐人重新发声:在邓丽君逝世27周年之际,酷狗音乐用人工智能技术延续她的真人之声,为“邓丽君”量身打造新曲 没有寄出的信,以她的声线和演唱风格重新创作歌曲,表达敬意和满足歌迷心愿。总之,智能语音技术赋能音乐领域,既降低音乐歌曲制作门槛,又能提高音乐歌曲准入门槛。作为创作工具和拓展工具,智能语音技术为音乐创作提供更加丰富多元的可能性。1.3赋能新闻广播智能播报场景语音合成技术不断优化的模型使
10、合成语音的表现力和个性化程度持续提高,为新闻广播电台等场景带来更真实自然的人声体验。在新闻和广播电台中,将新闻稿或热点资讯输入系统,智能语音技术可以自动为稿件合成配音并生成播报音频,直接用于电台新闻广播或数字音频广播电台制作。这不仅降低了人工播报成本,还实现了全天播报。例如,腾讯新闻通过语音合成技术生成每日新闻播报音频,同步在腾讯新闻App、微信公众号和各大音频分享平台,用户随时可以收听和获取新闻,实现新专题:AIGC 技术赋能下的出版业与人才培养15闻有声阅读。此外,智能语音技术还可以实现电台节目的语音填充。采用语音合成技术和人工录制相结合的方式,生成对话或解说来制作电台DJ采访和精选内容等
11、栏目。这既能满足一定的节目时长和效果要求,又降低了节目制作难度和成本。当下语音合成技术输出的语音内容除清晰流畅外,在语速、发音、停顿方面也无限接近真人语调和讲话节奏,输出的语音内容与人工播音的差距越来越小,因此被广泛运用在天气、路况、叙事等的新闻电台媒体播报中。而运用语音克隆技术还能将主持人的声音复刻出来,以进一步提升受众的可接受程度2。一些新闻媒体也在训练完全的人工智能虚拟动漫或仿真主持人形象。通过利用语音合成技术录制大量训练语音素材,实现主持人新闻播报和电台节目的全自动模拟,为听众带来全新的体验。例如,北京卫视的数字人主播“时间小妮”便是依据主持人春妮的发音特点和形象表情进行语言处理和影像
12、采集,通过情绪仿真引擎赋予其更加拟真的语音语调和情感表达,实现了97%的真人相似度。在2022年安徽春节联欢晚会上首次亮相的“二次元”甜妹小安是安徽广播电视台的一个虚拟AI主持人,其阳光的形象和乐天的性格为整台晚会注入了更多的科技元素和年轻气息,体现了AI系统生成虚拟主持人形象的巨大潜力。尽管虚拟主持人或AI主播在很多语音应用中还处于起步阶段,但这无疑是数字音频内容生产转型的一种重要方式。可以说,智能语音技术在一定程度上实现了新闻的多模态呈现和广播媒体播报的智能化,提升了新闻和广播电台媒体节目的制作效率。1.4赋能多元需求的后期配音场景智能语音技术在许多其他领域也具有广泛的应用潜力。随着智能语
13、音生成模式的简便化,作为互联网和资本市场内容传播的主流,短视频的制作门槛大大降低。声音是视频内容的附属品,人工智能配音自然就成为短视频内容创作的首选。使用AI配音为视频内容添加人物语音或画外音,能够为有声视频增添真实性和吸引力,在一定程度上赋能了UGC视频内容创作。例如,抖音中的“一键成片”和“人工智能创作”等功能简化了创作步骤,提高了用户创作效率,进一步促进了短视频用户资源的爆发3。一些影视作品和动画片也广泛使用人工智能配音进行内容创作。例如,纪录片 创新中国采用AI模拟人声对解说词进行改编,实现对重要画面信息的解释和补充。日本动画 魔法禁书目录的中文配音版本中,部分角色的台词配音全部由AI
14、完成。许多动画在制作过程中也通过AI技术生成群众的嘈杂声和画外音,以增添动画氛围感和代入感。在音频内容后期制作中,智能语音技术还可以自动识别不同内容用于剪辑和处理,包括添加背景内容、去噪和增强音频信号等。应用语音改编和定制技术可以对预先录制或生成的语音进行编辑和修饰,如阿里云的语音加速和变声技术通过改变语速、音高、音色或拼接不同语音片段生成新语音,减轻音频后期制作难度且提高输出质量。在一些游戏领域的后期配音中,与真人配音相比,智能语音技术可以实现真人和角色声音的分离,同时避免真人配音者由于个人原因影响整个项目推进。例如,米哈游旗下手游 未定事件簿 中,真人配音者由于个人原因无法完成后续语音收录
15、工作,公司使用逆熵人工智能技术为游戏角色“莫弈”生成人工智能配音,在一定程度上提高了项目的商业稳定性。总体而言,智能语音技术与各个领域的融合程度日益加深,使数字音频内容的生产和传播变得更加频繁,并不断向内容服务靠拢,为数字音频内容生产注入了源源不断的活力。2AIGC技术在数字音频内容生产中存在的问题尽管AIGC技术给数字音频内容生产带来诸多便利,但其应用中也存在不可忽视的问题。AI合成语音技术虽然水平不断提高,但输出语音的精度和情感表达仍有待改进;其给用户声音权和数字音频作品版权带来的威胁也值得关注;AI人声克隆技术可能造成虚假信息的泛滥;用户隐私也面临泄漏的风险。如何在16数字出版研究202
16、3 年第 3 期 发挥AIGC技术优势的同时,加强对信息安全、用户隐私和作品版权的保护,不仅是相关企业面临的挑战,也是需要社会共同关注和解决的问题。2.1AI合成语音的精度不高音频AIGC主要基于TTS技术,但在实际生产应用中,将文本直接转化为语音的过程往往会存在一些难以控制的问题。首先,输出的语音目前仍存在识别不准确和拼读断句错误等问题。就智能语音技术前端的文本处理而言,统一规范化处理文本格式和兼容文本编码标准是语音合成技术前端处理的一大难点。要输出准确连贯的语音,输入的文本应进行韵律的分词分段和语义分析。由于切分长度适中的句子并标注读音需要人工完成,因此这项工作难以避免标点错误或错别字等现
17、象。同时,要准确朗读文本中的日期、符号或缩略词等,语音合成系统的文本纠错和分析能力面临一定挑战。目前,在线阅读平台广泛采用语音合成技术进行语音朗读,但AI系统模型生成能力的差异导致合成语音质量参差不齐,最常见的问题是多音字错误、词句停顿不自然、语气词发音不准确、吞音漏音等。一些专业术语、人名和地名等较为生僻的词汇在输出过程中也很容易出现听读错误和不准确的问题。这些错误不仅降低了音频用户的听觉体验,导致其误解原内容,影响其对原文的理解,甚至还会误导儿童或老年人,传递错误知识,极大降低数字音频内容的输出质量和准确性4。其次,智能语音技术对上下文语境的理解和情感表达能力还有待提高。现实生活中面对不同
18、应用环境和语言,需要匹配不同口音、语速和音调等,所以多个语种、复杂音色和情感风格的还原对语音合成技术来说仍需改进。从合成语音的语调来看,目前的AI技术尚无法准确识别不同语气和情感状态,无法根据需要调整语调和音量。在合成表达强烈情感的语音时,输出的语音存在失真和僵硬等问题,难以将文字内容的情感充分演绎和表达,无法给用户提供很好的情感体验。因此,人工智能合成语音的精度和情感表现力仍需要提高,才能使合成的数字音频内容更加准确、生动和富有表现力。2.2用户声音权和作品版权侵权问题不易监管TTS技术具有大众化和自动化的特征,降低了数字音频内容的制作难度,甚至可以合成已经达到以假乱真程度的任何人的声音。一
19、旦一些不法分子利用语音合成技术来合成特定用户的声音,将很可能会侵犯该用户的声音权,对用户的人身及财产权益造成威胁。在AIGC赋能数字音频内容生产中,AI语音合成是侵犯用户声音权的主要方式。语音克隆等开源AI工具的易得性使得进行语音合成的成本较低,虚假语音信息增多,导致信息监管难度加大。虽然AI语音合成算法需要大量语音库来训练克隆人声,但互联网的普及使得用户的语音数据在互联网上随处可见,获取声源变得简单且难以监管,这给声音权的保护带来了巨大的威胁和挑战5。在将智能语音技术应用于数字音频内容创作时,用户声音权和数字音频作品版权侵权问题亟待各方关注和解决。尽管声音像人的肖像一样具有明显的识别度,但声
20、音本身并不受著作权法保护。将声音制作成作品,形成声音作品或音频作品,才能成为著作权法的保护对象。目前,我国对声音权的法律保护主要参照适用于肖像权保护的相关规定,将其作为自然人的权益进行法律保护。但针对人工智能相关技术的运用,我国暂未出台相关法律进行约束。利用AI技术生成的侵权音频的权责主体尚难以界定。有声读物内容生产者可以利用AI技术,训练识别性更强的声库模型,以丰富阅读资源。例如,喜马拉雅音频平台利用AI语音重新演绎评书大师单田芳的声音,让一代评书大师的声音再次响起;运用智能语音技术进行音色定制,生成了一系列基于中国著名经济学家管清友音色的AIGC专辑。尽管这些应用降低了数字音频内容的制作成
21、本,但涉及的内容版权的界限变得愈加模糊,且难以监管6。此外,一键生成式的AI配音使得短视频配音门槛不断降低,导致当前市场上的AI配音短视频背后的声音样本来源版权模糊不清。“AI孙燕姿”等音乐领域的AIGC作为一种由全新创作方式生成的产物,其版权界定引发了不少争议,法律上也尚未对AI音乐的性质做出规定。因此,创作者在事先未获得他人作品的使用授专题:AIGC 技术赋能下的出版业与人才培养17权和某一歌手声音授权的情况下,使用AI进行音乐创作和传播也一定会产生侵权行为。2.3AI克隆人声造成虚假信息泛滥智能语音技术的应用与发展使内容创作变得更加智能化,但同时也使普通人有机会成为虚假音频的制造者,从而
22、埋下了很多隐患。合成语音拟人度的不断优化,使虚假信息的表现形式从断章取义的文字和PS的图片发展到技术合成的虚假音频,增大了分辨真实信息的难度,易造成虚假信息和电信诈骗等非法活动的泛滥。如果伪造者运用人工智能语音合成技术模仿那些在社会上具有一定话语权和粉丝效应的人的声音,在公共社交媒体平台发布不正当言论、输出错误的价值观或恶意带动舆论导向,不仅会损害他人的名誉、丑化歪曲他人的形象、侵犯他人的名誉权,甚至会激化社会矛盾、扰乱社会秩序。此外,犯罪分子可通过非法搜集他人声源,伪造他人声音对其家人进行电信诈骗,或者制作虚假配音视频进行敲诈勒索,损害他人名誉权、财产权甚至生命权,不仅逾越了道德的准绳,更触
23、碰了法律的底线。因此,如果对AI克隆人声不加限制,互联网上的虚假信息将层出不穷,法律底线和公众的道德底线不断被试探,媒体机构的公信力也将在很大程度上被削减。2.4用户隐私数据存在泄露风险由于智能语音技术需要收集用户的声音数据进行语音识别和语音指令的处理,因此在使用过程中存在一定的声音数据泄露风险。为提升用户体验,相关技术服务企业可能通过不正规的渠道收集用户的语音数据资源,比如通过手机语音助手、智能手环、智能家居和手机App等设备窃听用户日常生活中的对话来构建和丰富大语料库,这些语音收集行为多数情况下都没有获得用户的许可。由于声音具有身份识别的作用,其中还隐藏了个人行为、喜好和身体状况等隐私信息
24、,因此在用户使用这些智能音频产品的过程中很容易造成个人隐私的泄漏7。尽管我国的网络安全保护法对个人信息保护提出了明确的要求,隐私数据的收集方应当秉持“谁收集、谁负责”的原则对用户隐私信息的安全承担起保障义务,但在实际操作中,无论是研发人工智能语音应用的公司还是传播数字音频作品的社交媒体平台都很难对收集到的声音等个人生物识别信息进行有效的保护。在有声阅读领域,在用户想要用声音复刻技术去定制个人声线进行作品朗读时,后台会对用户的声音进行捕捉分析和模仿,从而形成个人的语音数据库。但在平台传输过程中一旦出现系统漏洞或者遭遇黑客攻击,用户的声音等个人生物识别信息将很容易被泄漏,存在一定的安全隐患。同时,
25、一些科技公司会通过融资、并购等手段共享用户信息来达成扩充自己数据库的目的,个人信息的流转过程也加大了用户个人隐私数据泄漏风险,给用户的生命财产安全带来隐患。3AIGC技术介入数字音频内容生产的问题应对建议随着人工智能技术不断成熟,AIGC技术将深度介入数字音频内容生产,这是产业发展大势所趋。然而,在问题和风险尚未完全解决的当下,数字音频内容生产要实现高效和可持续的发展,还迫切需要相关技术的迭代与创新,更需要相关制度的进一步完善与监管,以及行业内的规范与自律。针对相关问题与风险,需要各方携手应对,不断推进法规立法、技术变革和市场培育,保护数字音频内容生产的秩序与权益,以推动AIGC与内容产业的高
26、效融合发展。3.1添加音频数字水印,保护音频作品版权数字音频作品主要通过声音进行内容输出,产出的作品既不是实体又无法用肉眼看见,因此和其他文字、图画或视频作品的版权保护方式有所不同,而声音权的保护对数字音频作品来说显得尤为重要。面对音频盗版侵权现象,首先要从技术层面加强对声音权和数字音频作品版权的保护。针对AI合成的虚拟语音无法与真实的声音区别开的问题,可以用添加数字水印的方法来解决,即在合成的语音18数字出版研究2023 年第 3 期 中添加数字印痕来区分真声与模拟,同时将音频作品附加的版权信息通过水印的方式嵌入。由于音频数字水印技术不会影响原始音频的音质,且无论音频作品被转化为何种格式,其
27、水印信息都不会消失。因此该技术不仅能够保护数字音频作品的版权,还能够明确版权所有方到底是谁,在一定程度上能约束数字音频非法复制行为8。此外,随着Web3.0时代的到来,在音频作品的版权保护方面,可以利用区块链技术进行音频作品的版权认证,以确保数字音频作品的唯一性和原创性。区块链技术能够提供一个分布式的、不可篡改的记账系统,通过将音频作品的版权信息与区块链上的唯一标识进行绑定,可以确保该作品的版权归属不会被篡改或抵赖。区块链技术还可以用于监督和追责合成语音的算法。通过在区块链上记录算法的训练数据、模型参数和生成的语音样本等信息,可以确保算法的透明性和可追溯性。这有助于监督算法的使用,防止滥用或侵
28、权行为的发生。3.2提升语音数据库质量,避免隐私泄漏风险在注重数字音频作品版权问题的同时,也要持续精进AI语音技术在数字音频领域的深入应用。面对现阶段合成语音精度方面存在的问题,智能语音开发公司应当优化语音合成的模型,采用深度学习和神经网络来进行语言合成模型的训练和预测;在音频制作过程中改进声音特征提取算法,提高语言合成模型对音频信息的理解和分析能力,以提升音频作品的准确性和自然度;及时进行数据集的扩充和优化,将更多高质量的语言数据集添加到语音合成模型中。就有声阅读领域来说,语音技术提供方应当尽可能完善语音数据资源包,设置实时更新的词库和多音字的发音规则等,调整正确的发音及词语断读的位置,以提
29、升智能语音的情感表现力。针对音频用户隐私数据泄露的风险,平台方和软件制作方也应当采用相关隐私保护技术对用户隐私进行保护。例如,运用模拟音频、模糊化等技术在音频生成之前将音频中的个人隐私进行模拟和模糊处理;或采用数据隔离手段,将智能语音设备记录的相关语音信息进行单项隔离,阻止数据传输至云端或其他设备上。同时使用数据安全监控技术,在数字音频作品生成和传输的过程中对音频数据进行实时监控和溯源,及时发现和处理隐私泄漏的问题,以保障用户的隐私信息不被盗用。由智能语音技术应用所产生的技术问题,理应用技术手段进行规避和处理,来提升智能语音技术在数字音频制作环节的应用能力,保障上游制作、中游传播和下游用户的合
30、法权益。如此,才能使数字音频产业在AIGC赋能下获得长足发展。3.3制定音频法律规范,强化著作权授权许可数字音频内容产业的健康高效发展,离不开智能语音技术的不断进步,同时也需要政府的宏观引导和相关法律法规的制定。由于音频作品与其他内容形式的作品有所不同,且涉及人工智能的特殊性和复杂性,因此现有的法律法规还无法完全涵盖所有权责范围。对此,政府相关部门应当出台相关法律法规,明确数字音频作品的版权归属问题,规定音频作品的侵权责任范围,以保护权益主体的合法权利。语音数据收集应受到权威性法规的约束。可要求采集主体获得授权,并确保后续的声音使用符合授权范围,以保证声音的合规使用。大型公司应在兼顾隐私、法律
31、和商业价值的基础上,公开透明地进行数据收集,并制定相关监督机制。法律应采用技术手段对数字音频信息的传播和使用进行监督和审查,建立完善的责任制度和侵权惩处制度。数字音频作品的创作与传播,应根据内容、创作者和声音进行授权分割,合理界定传播平台的著作权保护义务,避免中间环节出现侵权现象。对于已经完成的数字音频作品,应加强音频著作权的授权许可制度,分别强化著作权人、录音制作和传播平台等各个环节对著作权的授权管理。通过法律的形式对数字音频作品的制作和传播进行引导和规范,以保护数字音频著作权人的合法权益。3.4制定音频行业准则,规范市场传播行为应对智能语音技术在数字音频内容生产过程中存在的问题和风险,除制
32、定相关法律法规进行专题:AIGC 技术赋能下的出版业与人才培养19约束外,也应当制定相应的行业准则来规范市场行为。例如,建立完善的音频质量标准来规范数字音频作品运用智能语音技术进行生产的制作过程,加强对数字音频作品的监管力度,规范使用渠道,保障数字音频内容的合法性和可信性。数字音频内容分发传播的平台方应当对用户传播的音频内容承担起审核的义务,对一些由未授权的声音或用其他语音克隆技术和语音合成技术制作生成却没有标注AI标识的音频作品,从源头上阻断其传播。相关企业在提供智能语音服务之前应当向用户出示使用协议,明确语音适用的范围与权责归属等,同时将运用了AI语音技术的数字音频作品标注AI标识;选择与
33、自身技术优势相契合的内容侧重点进行生产,构建和打造具有特色的音频内容资源库和专业的音频内容生产能力,从而形成自己的音频内容资本,提升市场竞争力。从优化用户体验的角度,可建立专门的用户反馈和偏好收集渠道,收集用户对数字音频作品表现力的建议与期望,并根据用户反馈进行技术和算法的升级,同时实现个性化的数字音频内容生产,用技术创新和个性化的内容来推动音频内容产业发展,促进数字音频市场的良性循环。作者简介李雅筝,男,安徽大学新闻传播学院讲师、硕士生导师,安徽新华发行(集团)控股有限公司博士后科研工作站在站博士后。研究方向:数字出版、智能传播。刘宇星,女,安徽大学新闻传播学院硕士研究生。研究方向:数字出版
34、。参考文献1 高丁雪.智能语音合成技术应用于在线阅读APP的现状和进路研究D.青岛:青岛科技大学,2022.2 沈智婉.人工智能时代播音主持人的机遇与挑战J.传媒,2022(20):45-47.3 王珍,胡锐.声音景观建构视角下短视频AI配音滥用行为研究J.电声技术,2022,46(10):31-33,46.4 任子寒,姚瑶,余人.语音交互技术在有声读物中的应用风险与防范策略J.编辑学刊,2021(4):18-23.5 马瑞萍.AI语音合成技术的应用和风险与声音权的保护研究D.广州:暨南大学,2021.6 郝明英.人工智能语音合成有声书著作权保护研究J.中国出版,2023(1):55-59.7
35、 王懿.刍议智能语音技术的应用与风险防范J.法制与社会,2020(14):222-223.8 李海芳.面向数字化资源产权保护的数字音频水印技术研究D.沈阳:辽宁师范大学,2019.A IG C Te ch n o lo g y E m p o w e rs D ig ita l A u d io C o n te n t P ro d u c tio n :A p p lica tio n S ce n a rio s,E x istin g P ro b le m s a n d C o u n te rm e a su re sLI Yazheng1,2,LIU Yuxing11.Sch
36、o o lo fJo u rn alism an d C o m m u n icatio n,A n h u iU n ive rsity,230601,H e fe i,C h in a;2.Po std o c to ralPro g ram m e,A n h u iX in h u aD istrib u tio n(G ro u p)H o ld in g C o.,Ltd.,230061,H e fe i,C h in aA b s tra c t:W ith th e rap id d e ve lo p m e n t o f artific ial in te llig e
37、 n c e te c h n o lo g y ap p lic atio n,artific ial inte llig en ce g en erate d co ntent(A IG C)te ch n o lo g y is acce leratin g th e tran sfo rm atio n o f d ig ital au d io co n te n t p ro d u c tio n m o d e.W h ile e m p o w e rin g in d u strial p rac tice to im p ro ve q u ality an d e ff
38、icie n c y,inte llig ent sp e e ch te ch n o lo g y also trig g ers p ro b lem s an d risks.Base d o n case an alysis,it w as fo u n d 20数字出版研究2023 年第 3 期 th at A IG C te ch n o lo g y h ad p o tential to em p o w er several ap p licatio n scen ario s su ch as au d io co ntent p ro d u c tio n in cl
39、u d in g au d io b o o k s,d ig ital m u sic c re atio n,in te llig e n t n e w s b ro ad c asts,an d m u lti-d e m an d d u b b in g.B ase d o n an alysis o f th e e x istin g p ro b le m s in ac tu al ap p lic atio n,su c h as th e accu rac y o f A I syn th e tic sp e e ch,in frin g e m e n t o f
40、vo ice rig h t o f u se rs an d co p yrig h t o f w o rks,false info rm atio n an d leakag e o f u ser p rivac y d ata,it w as p ro p o se d that:th e q u ality m anag em ent o f vo ice d atab ase sh o u ld b e im p ro ve d an d p rivac y p ro te c tio n m easu res sh o u ld b e p aid attentio n to
41、ensu re th e se cu rity an d p rivac y o f u ser d ata;au d io d ig ital w aterm arks sh o u ld b e ad d e d to p ro te c t co p yrig ht o f au d io w o rks;au d io le g al n o rm s an d in d u stry g u id elin es sh o u ld b e fo rm u late d as so o n as p o ssib le to stren g th en co p yrig ht au
42、 th o rizatio n licensin g an d re g u late m arket co m m u nicatio n b ehavio r.K e y w o rd s:A IG C;A I sp e e ch te ch n o lo g y;D ig ital au d io co n te n t;A u d io b o o ks;A p p lic atio n sce n ario s;C o ntent p ro d u c tio n首届文化强国建设高峰论坛之数字出版前沿技术发展与应用分论坛 在深圳举办,张建春出席并作主旨演讲2023年6月8日,由中宣部
43、出版局主办,中国新闻出版研究院、深圳市委宣传部、北京大学出版学院承办,深圳出版集团有限公司执行的首届文化强国建设高峰论坛之数字出版前沿技术发展与应用分论坛在深圳举办。中宣部副部长张建春出席论坛并作主旨演讲。张建春指出,近日,习近平总书记先后考察中国国家版本馆和中国历史研究院,出席文化传承发展座谈会并发表重要讲话。昨日,习近平总书记向首届文化强国建设高峰论坛发来贺信。总书记的重要讲话和贺信、指示,为我们担当新时代新的文化使命、做好包括数字出版在内的文化出版工作指明了前进方向、提供了根本遵循。张建春表示,近年来,中宣部深入实施出版融合发展工程,设计了数字出版精品和优质平台的子计划,引领带动出版单位
44、加快技术应用探索,取得了一系列可喜成果。他强调,做好新时代数字出版工作,要坚持以习近平新时代中国特色社会主义思想为指引,沿着党的二十大绘就的宏伟蓝图,紧跟时代大势,牢牢抓住数字出版前沿技术发展新机遇,主动求变、积极作为,以出版工作的守正创新助力中国特色社会主义文化建设;要勇于探索实践,用好人工智能、5G、AR、VR、XR、区块链、云计算等技术,积极推进数字出版前沿技术转化应用;要积极开拓创新,牢牢掌握前沿技术赋能出版的主动权,加强数字出版前沿技术协作攻关,以优势技术成果突破行业发展瓶颈、赶超国际领先水平;要夯实工作基础,强化数字出版前沿技术支撑保障,以数字出版的高质量发展,更好地推进文化强国和
45、出版强国建设,更好地服务中华民族现代文明建设。本次论坛以“数字出版前沿技术发展与应用”为主题,出版业界、学界代表齐聚一堂,探讨出版深度融合发展,共议建设文化强国、出版强国之路。论坛现场气氛热烈,大家踊跃交流讨论。中国工信出版传媒集团总编辑、电子工业出版出版社党委书记、执行董事、总经理王传臣,南方出版传媒股份有限公司首席信息官孙波,人民教育出版社党委书记、社长黄强,腾讯集团副总裁、腾讯研究院院长司晓,华为云中国区副总裁张东生,百度副总裁王颖,中文在线集团董事长童之磊等嘉宾结合各自单位数字出版融合实践进行了现场分享。中宣部出版局有关负责人,有关地方党委宣传部、出版融合发展工程入选项目单位、数字出版企业、文化科技企业负责人,以及出版融合发展优秀人才、部分高校出版专业师生等参加本次论坛。(来源:“中国新闻出版广电报”微信公众号,记者:李婧璇、张君成,下载日期:2023-08-07)