ImageVerifierCode 换一换
格式:DOC , 页数:6 ,大小:30KB ,
资源ID:5616171      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/5616171.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(听话要听音— 情感语音处理技术.doc)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

听话要听音— 情感语音处理技术.doc

1、听话要听音— 情感语音处理技术   原作者: 陶建华 2005-02-04 11:49:31 同样一句话,往往会由于说话人的情感不同,其意思和给听者的印象就会不同,所谓“听话听音”就是这个道理。传统的语音处理系统多着眼于语音词汇传达的准确性,而忽略了包含在语音信号中的情感因素。   传统的语音处理系统只是反映了信息的一个方面,而忽略了与知识世界相对应且具有同等重要地位的感性科学世界,这其实也是信息处理的一个重要组成部分。近几年来,语音识别与合成技术在语音分析、自然语言处理、信号处理、随即过程处理等方法的推动下获得了很大的发展。但从语音信号中提取情感特征,分析人

2、的情感与语音信号的关联,只是国内外刚刚兴起的研究课题。   目前这一领域的研究主要还是集中在情感的声学特征分析上,有关情感建模以及结合情景、语言特征建立完整的情感控制模型还少有涉及。 声学特征判断情感因素   当说话人处于不同情感状态时,会在语速上表现出一定的变化,在激动状态时,语速较平常状态快。因此可以利用判断语音信号中的语速和发话持续时间等参数来判别情感中激动成分的程度。同语音信号中的时间特征相类似,信号的振幅特征和各种情感信息也具有较强的相关性。   由于人对语音的感知非常多样化,全面考虑情感的声学特征是一个非常困难的工作,考虑到计算机的处理能力,只能通过

3、部分参数从一定程度上对情感语音的声学特性进行概括。一般情况下,语音情感相关性的表示形式可以通过说话人模型或者声学模型来实现。由于汉语的韵律多以音节为处理单位,在这种有调音节的韵律分析中,音节的韵律特征起着非常重要的作用,为了便于在汉语中处理,通常将情感语音的声学特征直接分为三类:韵律类、音质类和清晰度类。 韵律类   韵律类主要用来表征不同情感状态下语气的变化,它包括如下韵律参数描述。   平均基频:整个语句的基频(F0)平均值,根据语音信号分析声带的共振频率。   基频范围:整个语句的基频范围,基频范围在很大程度上能够反映人的情绪状态。   重音的突变

4、特性:在情感语句中,重音多体现情感焦点特性,经常由情感关键词承载。   停顿的连贯性:用以表示语句的停顿是否连贯。人在情绪受到压抑或快速膨胀时,有时会出现由于概念表述不清而导致的语气断续特征。   语速:用以表征语气的缓急程度,人在焦急、恐惧时多出现语速加快的现象,有时欢快的语气也能带来类似效果。   重音频度:重音的频度在一定程度上能够体现情感状态的持续性。   音强:实验证明在情感语音中,音强的变化往往表现出与基频范围变化的一致性。但是相对基频变化来说,大部分音强变化并不明显。   音节基频高线倾斜程度:语句中音节基频高点连线的变化情况(上升、水平和

5、下降)。   音节基频低线倾斜程度:语句中音节基频低点连线的变化情况(上升、水平和下降)。   基频抖动:焦虑语音会出现“F0抖动” 现象,这一现象描述了基频从一个区域到另一个区域之间快速和反复的变化。在此情况下,有时音节会失去其固有调型。 音质类   音质类用来表征不同情感状态下语音音质发生的变化,它通过如下参数描述。   呼吸声:在语音流中,出现呼吸气等声音。当一个人处于紧张或欢快状态时会出现的快速呼吸停顿,或一个人由于恐惧而牙齿紧压会产生的回旋气流噪声。   明亮度:低频能量和高频能量的比值,用以反映语音的清亮特性。   喉化度:发

6、音时声门出现不连续的脉冲震动特性,经常出现在极度恐惧的情感状态中。 清晰度类   情感信息与人的声道同样具有一定的关联。清晰度可分为正常、焦急、模糊和准确。清晰度描述了元音质量的变化和清辅音是否变化为相应的浊辅音。比如:人在厌恶时,有时说话“嘟嘟囔囔”,表达不清。   情感表现的多样性和复杂性导致情感声学参数的数值分布多呈现较大的离散特性,表1针对五种基本情感状态列出了几种基本声学参数较为平均的体现。 从语音中抽取个性特征   通常情况下,语音理解是从一段语音中分析出文本,让系统“听懂”语音的内容。它的研究重点是分析语音中的共性特征。情感语音的研究则是从语

7、音中抽取个性特征,并加以参数化描述。充分的利用情感韵律特征,从中获取说话人意向及部分语义信息,可以从一定程度上提高理解的准确率。   由于一般情况下人们很少进行典型情绪的发音,说话的情感状态通常分布在一个连续的状态空间里,在Marc Schrder(2001)等人的工作中,采用了三个参数来对其进行描述,分别是激活度(Activation)、评价(Evaluation)和强度(Power),不同的情感可以对应到这三个参数的值上,下表2为Marc Schrder给出的一个经验对照表。     对于一个给定的情感三维坐标,其相应的声学特征具有一定的关联特性。这种三维坐标的形式,提供

8、了一种情感语音的特征相似性比较的途径。例如,生气和恐惧相比较可发现具有相似的声学特征和情感特征。声学上说它们在平均倾斜度、倾斜范围、语速和清晰度方面是相似的,不同点是害怕的倾斜度改变比中性要缓、语速要快、强度正常、声音不规则。在三维情感空间中这两个情绪在Activation和Evaluation很近,在Power则有所不同。因而使得情感的声学特征具有一定的可预测性。   当然该三维坐标并不能解决所有的情感特征,例如担心、热爱等情感则不能只通过三维空间的描述来说明,同时由于情感受不同的人感知,反映在语音的声学特征上亦会具有不同的表现形式,因此还需要在情感与认知模型上进行更深入的研究。

9、   尽管如此,仍然有一些情感信息处理方面的研究成果。这些研究的主要目的是把情感信息的研究从心理学角度向心理学、信息学这一交叉学科领域过渡。从这几年的成果看,有关情感信息的建模以及工学处理方法等方面的研究成果非常少,较多的是对情感信息韵律特征表现的观察和分析。这些特征的分析将从另一个侧面有助于语音的理解和产生更为生动的语音表达。 小资料   情感计算的主要应用形式   在人机交互方面的应用   情感计算更多地应用于人机交互方面,它将能有效地改变过去计算机呆板的交互服务,提高人机交互的亲切性和准确性。一个拥有情感能力的计算机能够对人类情感进行获取、分类、识别和

10、响应,进而帮助使用者获得高效而又亲切的感觉,并能有效减轻人们使用电脑的挫败感,甚至能帮助人们理解自己和他人的情感世界,这正是计算技术向人类社会全面渗透的重要手段。例如采用此类技术探测司机精力是否集中,并做出相对反应;还可以在汽车中用电脑测量驾车者感受到的压力水平,以帮助解决驾驶者的所谓“道路狂暴症”问题。   同时,情感计算及其相关研究还能给电子商务带来实惠。有研究显示,不同图像可以唤起人类不同的情感,例如蛇、蜘蛛、枪的图片能引起恐惧,而大量美元现金和金块的图片则可以使人产生强烈的积极反应,如果购物网站和股票交易网站在设计时考虑到这些因素,则能对客流量的上升产生积极影响。   

11、在信息家电和智能仪器中增加自动感知人们情绪状态的功能,可以提供更好的服务;在信息检索应用中,通过情感分析的概念解析功能,则可提高智能信息检索的精度和效率;在远程教育平台中,情感计算技术的应用能提升教学效果;利用多模式的情感交互技术,还可以构筑更贴近人们生活的智能空间或虚拟场景。此外,情感计算还能应用在机器人、智能玩具、游戏等相关产业中,以构筑更加拟人化的风格和更加逼真的场景。   在心理学方面的应用   从认知科学的角度看,情感反映了人的心理状态,是人类思维活动最生动的体现,所以对人类情感机理的研究与探索一直是科学研究的重要方向。情感计算理论通过计算机的分析和处理手段,将对情感

12、的研究从感性认知上升为可计算模型,对在认知科学上探索大脑对信息的分析和处理机理、进一步加深对大脑中情感概念的解析和理解将具有重要的科学意义。   在医学上的应用   现代医学研究表明,健康应该包含更多情绪方面的内容,可是现代人中患有抑郁症的比例却在逐年上升,所以医学界希望能够更早地向好的方面诱导,从而有效地帮助人们对不良情绪进行排解。   情感虽然是一种内部的主观体验,但总是伴随着某种外部表现。面部表情不仅是人们常用的较自然的情感表现方式,也是人们鉴别情感的主要标志。另外在医学研究中也已使用过很多生理指标,如皮质醇水平、心率、血压、呼吸、皮肤电活动、掌汗、瞳孔直径、事件相关电位、脑电EEG等,都是对人类情绪状态的客观度量。 作者单位为:中科院自动化所

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服