ImageVerifierCode 换一换
格式:PPT , 页数:43 ,大小:235KB ,
资源ID:13359916      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/13359916.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(说话人识别-王林海.ppt)为本站上传会员【pc****0】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

说话人识别-王林海.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,王林海 2003.7.17,说 话 人 识 别,说话人识别,一.概述,1.什么是说话人识别(,SR)?,2.,SR,的历史,3.,语音识别技术,4.语音识别的困难与对策,5 语音识别的应用,6.,语音识别的前景,1.什么是,SR?,说话人识别(,Speaker Recognition,SR),技术是以话音对说话人进行区分,从而进行身份鉴别与认证的技术。,2.,SR,的历史,60年代,计算机的应用推动了语音识别的发展。,70年代,语音识别领域取得了突破,80年代,语音识别研究进一步走向深入,进入90年代,随

2、着多媒体时代的来临,迫切要求语音识别系统从实验室走向实,用。,我国语音识别研究工作一直紧跟国际水平,国家也很重视,并把大词汇量语音识别的研究列入“863”计划,由中科院声学所、自动化所及北京大学等单位研究开发。,3.语音识别技术,语,音识别系统的分类方式及依据,根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统,根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。,根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。,不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统

3、的实现过程如图1所示。,特征提取,模式匹配,模型库,识别结果,语音输入,图,1 语音识别的实现,语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取,(1)语音识别单元的选取,选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。,(2)特征参数提取技术,语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。,(3)模式匹配及模型训练技术,模型训练是指按照一定

4、的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配,语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(,DTW)、,隐马尔可夫模型,(,HMM),和人工神经元网络(,ANN)。,3 语音识别的困难与对策,目前,研究工作进展缓慢,主要表现在理论上一直没有突破。虽然各种新的修正方法不断涌现,但其普遍适用性都值得商榷。,语音识别系统的适应性差,,高噪声环境下语音识别进展困难,语言学、生理学、心理学方面的研究成果,应用,我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚,语

5、音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,如果要使语音识别系统性能有大的提高,就要综合应用语言学、心理学、生理学以及信号处理等各门学科有关知识,只用其中一种是不行的,4 语音识别的应用,ATT,于1992年开发的,VRCP,系统,AT T 800,语音识别服务系统,NTT ANSER,语音识别银行服务系统,Northen Telecom,股票价格行情系统,collect call,受话人付费电话,命令字,col1ect,person-person-call,定人呼叫,命令字,person,third-party-billing-call,第三方付费电话,命令字,th

6、ird number,operator-assisted call,话务员协助呼叫,命令字,operator,credit card call,信用卡呼叫,命令字,calling card,6.,语音识别的前景,SR,技术发展至今,尽管已经取得了不错的进展,要寻找更加优良的研究方法仍然有相当艰巨的路要走。,二.语者识别的基本问题,(1)如何选取能够唯一表征人的有效 而可靠的参量,如何对它进行处理。,(2)如何规定相似性的测度使相似性的计算既简单又可靠。,(3)考虑到人的状况在不断变化,为使系统能够可靠工作,如何使它的参考量不断更新以适应使用者。,语音,分析,身份,声明,模型,产生,模型,存储,

7、特征,提取,距离,测量,识别,判决,三.表征说话人特点的基本特征,这些特征应该具有如下特点:,(1)能够有效地区分不同的说话人,但又能在同一说话人的语音发生变化时相对保持稳定。,(2)易于从语音信号中提取。,(3)不易被模仿。,四.说话人识别的几种方法,1.模板匹配法,模板匹配法的要点是:在训练过程中从每个说话人发出的训练语句中提取相应的特征矢量,这些特征矢量能充分描写各个说话人的行为。这些特征矢量称为各说话人的模板。它们可以从单词,数字串或句子中提取。在测试阶段,从说话人发出的语音信号中按同样的处理方法提取测试模板,并且与其相应的参考模板相比较。,2.概率模型法,利用子词单元构成的隐含马尔柯

8、夫模型,构成了一个说话人确认系统,每个子词单元用一个从左至右的,HMM,描写,每个模型包含2到3个状态。,提取特征矢量,初试分段,构造种子模型,读,入,一次发音的特征矢量,计数器初使化,Viterbi,算法重分段,“语法”约束,模型参数,根据新的语音分段边界,重估计各,HMM,状态的输出分布均值和方差,求方差的特征值,特征矢及每次转移的概率,收敛,结束,最后一次发音,(1)语音分析,(2)初使分段,(3)训练,(4)测试,特征提取,说话人1,说话人,N,说话人1,说话人,N,距离求和,说话人,3.一种基于矢量量化的且与文本无关的说话人识别系统,SR,的未来,虽取得一定进展,还有相当艰巨的路要走

9、SR,所面临的挑战,语音识别的研究工作大约开始于50年代,当时,AT&T Bell,实验室实现了第一个可识别十个英文数字的语音识别系统,Audry,系统。,60年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划(,DP),和线性预测分析技术(,LP),,其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响,说话人识别技术有着广阔的市场应用前景。通过,SR,技术,可以利用人本身的生物特性进行身份鉴别,例如为公安部门进行语音验证、为一般用户提供防盗门开启功能等等。在互联网应用及通信领域,,SR,技术可以应用于诸如声音拨号、电话银行、电话购物、数据库访

10、问、信息服务、语音,E-mail、,安全控制、计算机远程登录等领域。在呼叫中心应用上,,SR,技术同样可以提供更加个性化的人机交互界面。当顾客以电话方式对呼叫中心进行请求时,系统能够根据话音判断出来者的身份,从而提供更个性化、更贴心的服务。,SR,的未来,-,SR,技术发展至今,尽管已经取得了不错的进展,要寻找更加优良的研究方法仍然有相当艰巨的路要走。由于技术条件所限,目前所采用的抽样建模方法还存在着不足。对,SR,最有影响的因素是在不同实验中声音特性信号的变更,包括说话者生理上的变动性以及实验条件的不稳定性等,这些都对,SR,识别系统构成严峻的挑战。此外,,SR,技术还应解决提取声音长期稳定的特征参数的问题。在两个人进行交谈时,自动从中提取出每个人的声音特性并加以区分的技术也是值得研究的方向。,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服