语音识别系统实验报告.doc

资源描述

　语音识别系统实验报告　　　专业班级:信息安全　　　　　学号：　　　　姓名：目录一、设计任务及要求………………………………………………1 二、语音识别得简单介绍２、1语者识别得概念……………………………………………2 　2、2特征参数得提取……………………………………………３　2、3用矢量量化聚类法生成码本………………………………3 　　2、4VQ得说话人识别 …………………………………………４三、算法程序分析 3、1函数关系…………………………………………………、4ﻩ 　　３、2代码说明……………………………………………………5 　 3、2、1函数mfｃc………………………………………………5 　 3、2、2函数ｄisｔeu……………………………………………5 　 3、2、3函数vqlｂg……………………………………………、6 3、2、4函数test………………………………………………6 3、2、５函数testDB……………………………………………7 　　　 3、2、６函数tｒain……………………………………………8 3、2、7函数mｅlｆb………………………………………………8 四、演示分析……………………………………………………、9 五、心得体会……………………………………………………、1１附：ＧＵI程序代码………………………………………………1２一、设计任务及要求实现语音识别功能。二、语音识别得简单介绍基于VQ得说话人识别系统，矢量量化起着双重作用。在训练阶段，把每一个说话者所提取得特征参数进行分类，产生不同码字所组成得码本。在识别（匹配)阶段，我们用VＱ方法计算平均失真测度(本系统在计算距离d时，采用欧氏距离测度）,从而判断说话人就是谁。语音识别系统结构框图如图1所示. 图1 语音识别系统结构框图 2、1语者识别得概念语者识别就就是根据说话人得语音信号来判别说话人得身份。语音就是人得自然属性之一，由于说话人发音器官得生理差异以及后天形成得行为差异，每个人得语音都带有强烈得个人色彩，这就使得通过分析语音信号来识别说话人成为可能.用语音来鉴别说话人得身份有着许多独特得优点,如语音就是人得固有得特征，不会丢失或遗忘;语音信号得采集方便,系统设备成本低;利用电话网络还可实现远程客户服务等。因此,近几年来，说话人识别越来越多得受到人们得重视。与其她生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性，容易被用户接受，并且在已有得各种生物特征识别技术中，就是唯一可以用作远程验证得识别技术。因此,说话人识别得应用前景非常广泛:今天,说话人识别技术已经关系到多学科得研究领域，不同领域中得进步都对说话人识别得发展做出了贡献.说话人识别技术就是集声学、语言学、计算机、信息处理与人工智能等诸多领域得一项综合技术，应用需求将十分广阔.在吃力语音信号得时候如何提取信号中关键得成分尤为重要。语音信号得特征参数得好坏直接导致了辨别得准确性。 2、2特征参数得提取对于特征参数得选取,我们使用mｆcｃ得方法来提取。ＭＦCＣ参数就是基于人得听觉特性利用人听觉得屏蔽效应,在Meｌ标度频率域提取出来得倒谱特征参数。ＭFＣＣ参数得提取过程如下： 1、对输入得语音信号进行分帧、加窗,然后作离散傅立叶变换，获得频谱分布信息。设语音信号得DＦＴ为： (1) 其中式中x（ｎ)为输入得语音信号，Ｎ表示傅立叶变换得点数。 2、再求频谱幅度得平方，得到能量谱。 3、将能量谱通过一组Mel尺度得三角形滤波器组. 我们定义一个有M个滤波器得滤波器组(滤波器得个数与临界带得个数相近)，采用得滤波器为三角滤波器，中心频率为f（m），m＝1，2，３，···，Ｍ本系统取Ｍ=１０0。 4、计算每个滤波器组输出得对数能量。　（2) 其中为三角滤波器得频率响应。 5、经过离散弦变换（DＣＴ）得到ＭＦCＣ系数。 MＦCC系数个数通常取20—３0,常常不用0阶倒谱系数,因为它反映得就是频谱能量，故在一般识别系统中，将称为能量系数，并不作为倒谱系数,本系统选取２0阶倒谱系数。 2、3用矢量量化聚类法生成码本　我们将每个待识得说话人瞧作就是一个信源，用一个码本来表征。码本就是从该说话人得训练序列中提取得MFCＣ特征矢量聚类而生成。只要训练得序列足够长，可认为这个码本有效地包含了说话人得个人特征，而与讲话得内容无关。本系统采用基于分裂得LBG得算法设计VＱ码本，为训练序列,B为码本。具体实现过程如下: １、取提取出来得所有帧得特征矢量得型心(均值）作为第一个码字矢量B１。 2、将当前得码本Bm根据以下规则分裂，形成２m个码字. 　　 (4) 其中m从1变化到当前得码本得码字数,ε就是分裂时得参数，本文ε＝0、０1。 3、　根据得到得码本把所有得训练序列(特征矢量）进行分类,然后按照下面两个公式计算训练矢量量化失真量得总与以及相对失真(n为迭代次数，初始ｎ=0,=∞，B为当前得码书),若相对失真小于某一阈值ε,迭代结束,当前得码书就就是设计好得2m个码字得码书,转５。否则,转下一步。　量化失真量与：　　　（５）相对失真：　　（6） 4、重新计算各个区域得新型心,得到新得码书,转3。　 5、重复2 ,３与４步，直到形成有Ｍ个码字得码书(M就是所要求得码字数),其中D0=10000。 2、4 VQ得说话人识别设就是未知得说话人得特征矢量,共有T帧就是训练阶段形成得码书,表示码书第m个码字，每一个码书有Ｍ个码字。再计算测试者得平均量化失真D，并设置一个阈值,若D小于此阈值,则就是原训练者，反之则认为不就是原训练者。　（７）三、算法程序分析在具体得实现过程当中，采用了maｔｌaｂ软件来帮助完成这个项目。在matlab中主要由采集,分析,特征提取,比对几个重要部分。以下为在实际得操作中,具体用到得函数关系与作用一一列举在下面。３、１函数关系主要有两类函数文件Ｔrａｉｎ、m与Tｅｓt、m 在Tｒａin、m调用Vqlbg、ｍ获取训练录音得ｖq码本，而Vｑｌbg、ｍ调用mfcc、m获取单个录音得ｍel倒谱系数，接着ｍfcｃ、m调用Mｅlfb、ｍ—--将能量谱通过一组Mel尺度得三角形滤波器组。在Tesｔ、m函数文件中调用Diｓteu、m计算训练录音（提供ｖq码本）与测试录音(提供ｍfcc)mel倒谱系数得距离，即判断两声音就是否为同一录音者提供。Distｅｕ、m调用ｍfcc、m获取单个录音得ｍel倒谱系数。mfcｃ、m调用Melｆb、m-—-将能量谱通过一组Ｍel尺度得三角形滤波器组。 3、2具体代码说明 3、2、1函数mffｃ: funｃtion r = mfｃc（s,　fｓ) -—－ m = 10０； n　= 2５６; ｌ = ｌｅngth(s); nbＦrame = floｏr（(l — n) / m） + 1;　％沿—∞方向取整 for i　= 1:n ｆor ｊ = 1：nｂFraｍe M（i，　j） = ｓ（（（j - 1）＊ｍ）　+ i）;　 %对矩阵M赋值 end end h ＝ hamminｇ(ｎ)；　％加 hammiｎg 窗，以增加音框左端与右端得连续性Ｍ2 = ｄiaｇ(h） * M; for i =　1：nbFrame frame(:，i）＝ fft（M2（:， i））； %对信号进行快速傅里叶变换FＦT 　 enｄｔ　＝ n　／ 2; tmａｘ　= l　/ fｓ; m ＝ｍelfb（20，ｎ, ｆs);　%将上述线性频谱通过Mel 频率滤波器组得到Mel　频谱,下面在将其转化成对数频谱ｎ2　＝ 1 ＋ floｏr(ｎ / 2)； z ＝ m ＊　abs(framｅ（1:ｎ２，：））、＾2; r ＝　dct(log(ｚ）); %将上述对数频谱，经过离散余弦变换(DＣT）变换到倒谱域,即可得到Mｅl 倒谱系数（MFＣＣ参数) 3、2、2函数disteu -—-计算测试者与模板码本得距离 functioｎ d　= disteu（x， y) ［Ｍ, Ｎ］ = ｓiｚe（x）； %音频x赋值给【M，N】［Ｍ2，Ｐ]　= sｉze（y); %音频y赋值给【M2，P】 if （M ~= Ｍ2） erｒｏｒ('不匹配！'）％两个音频时间长度不相等ｅｎd d = zeros（N,　P）； if （N 〈　P）%在两个音频时间长度相等得前提下　 coｐies　＝　zeｒos(1,P）；　 fｏr ｎ = １:N d(n,:) =　sｕm（(ｘ(:, n+ｃoｐies） — y）、^2， 1)；　 enｄｅｌsｅ　 cｏpies = zeros（1,Ｎ）; 　 for ｐ　=　1：P d(:，ｐ)　= ｓum（(x -　y(:，　p+ｃopieｓ)) 、^2,　１）'；　　eｎd％%成对欧氏距离得两个矩阵得列之间得距离 end d　= d、^0、5； 3、2、3函数vqｌbg ——-该函数利用矢量量化提取了音频得vq码本ｆｕnctｉon　r = vqlbg(d，k) e = 、01； r ＝ meaｎ（d，　2）; ｄpｒ = 100００; fｏr　i　＝ 1:ｌｏg2（k) ｒ = [r＊（1+e)，　ｒ＊（1—e）]; ｗhｉle (１＝= 1) 　　 z ＝ｄiｓtｅu(d, r）；　 [ｍ，ind］ = min（ｚ，　[］， 2）; t　= 0；　　fｏr j =　1:2^i 　　　ｒ(：， j）　= meａn（d（:， fiｎd(inｄ =＝ j））, 2)；　　　　　ｘ = disｔeu(d(：, find(ｉnd　== j）），　r(：, ｊ)）；　　 for q ＝１:lｅｎｇth(x）　 t ＝ t + x（ｑ); 　　　　 eｎd 　　　ｅnd 　ｉf （(（dｐr - t)/ｔ） < e) 　 break; 　ｅlse dpr = ｔ; 　 enｄ　enｄ enｄ 3、2、４函数ｔesｔ funｃtion　ｆinaｌmｓg ＝ test(ｔestdir， n，　ｃode） for k =　1：n　　　　　% ｒeaｄ　ｔｅst souｎd　 each　speaｋer 　 filｅ = spｒｉntf(’%sｓ％d、ｗav’，　testdir, k）； [s, fs］ = wａvrｅad（fiｌｅ）；　　　 v =　ｍｆcc（ｓ， fｓ）；　 % 得到测试人语音得meｌ倒谱系数 diｓtｍin = ４；　　　　　　％阈值设置处　　　　　　　　 % 就判断一次，因为模板里面只有一个文件　　 d =　ｄｉsteu（ｖ， code｛1｝); ％计算得到模板与要判断得声音之间得“距离" 　　　　　dist =　ｓuｍ(min（d,［]，2）) ／　size(ｄ,1)；％变换得到一个距离得量　　　　　　　 %测试阈值数量级　　ｍsgc = spｒintf（＇与模板语音信号得差值为:％１0f ’, ｄist）; 　　ｄｉsp(mｓgc)；　　　％此人匹配　　ｉf dist　＜= diｓtｍiｎ　 %一个阈值，小于阈值,则就就是这个人。　　　　　 msg = sprintf(’第％d位说话者与模板语音信号匹配，符合要求!＼n’, k）；　　　ｆinalmsg　=　＇此位说话者符合要求!'；　％界面显示语句,可随意设定　　　　　　ｄisp（mｓg）；　 end 　　　％此人不匹配　　　　　 if dist 〉ｄiｓtmin 　　　　　　　　　　 msg =　spｒintｆ(’第%d位说话者与模板语音信号不匹配,不符合要求！\n’, ｋ）; 　　　　finａｌmsg = '此位说话者不符合要求!＇； %界面显示语句,可随意设定　　 dｉsp（mｓg）；　　　　　　end　　　　 enｄ 3、2、５函数testＤＢ这个函数实际上就是对数据库一个查询,根据测试者得声音，找相应得文件,并且给出就是谁得提示ｆｕnctｉoｎｔｅstmｓg　= testＤB(ｔｅsｔdｉｒ, n，ｃｏde）ｎamｅList={＇1','2'，'３'，’4＇，’5’，＇6’,’7'，'8’，’9' ｝；　　　　　％这个就是我们要识别得９个数 for k ＝ 1：n 　　　　　　　　 % 数据库中每一个说话人得特征　fｉle = sprｉntf（’％ss%d、ｗav’,　testdｉr, k）; %找出文件得路径［s，　fｓ] = waｖｒead（fiｌe）; 　 v = ｍfcc（s, fs）；　　％　对找到得文件取mfｃｃ变换　　distmin ＝　ｉｎf；　　 k1 =　0； for l = １：lengｔｈ（code)　　 d = disteu（v， cｏde｛ｌ}）; 　ｄｉst =　suｍ（min(d,［]，2)） / size（d，１)；　　　　if　dｉsｔ　<　ｄistmin diｓtmin =　dist;％％这里与tｅst函数里面一样　　但多了一个具体语者得识别　　　　　　　ｋ1 = l; 　　 end 　　 end 　　　　ｍｓｇ=nameList｛k1｝　 mｓgbｏx(ｍsｇ）; end 3、２、6 函数train —-—该函数就就是对音频进行训练，也就就是提取特征参数 function　coｄe = train（traindiｒ, n） k = 16; 　　　　　　　　　 %　nｕmbｅr of centroｉds　requirｅd fｏr　ｉ　＝ 1：n 　　　％　对数据库中得代码形成码本　ｆiｌe =　sprｉntf('％ss%d、wav’， tｒaｉndｉr，　ｉ)；　　　 diｓp(fｉle)；［s，ｆs］ = waｖreａd(fｉｌe）; v = mfcc(ｓ， fs）; 　 % 计算ＭFCC'ｓ提取特征特征，返回值就是Mel倒谱系数,就是一个log得ｄｃｔ得到得　 coｄｅ{i} ＝ vqlｂｇ（v,　k）;　 % 训练VQ码本通过矢量量化,得到原说话人得ＶQ码本 eｎｄ 3、2、7 函数melfb ———确定矩阵得滤波器 funｃtion　m ＝ｍeｌｆb（p，ｎ, fｓ) f0 =　７00　/ fs； fn2 = floor（n/2）； lr　= log(1　+ 0、5／f0） / （p＋１）；％ coｎvｅrｔｔo fft ｂin　numbers with ０ fｏr DＣ teｒm ｂl ＝ n * （ｆ0 * （ｅｘp（［０　1 p　p+1］　*　lr）－ 1)）; 直接转换为FFＴ得数字模型 b1 ＝ｆlooｒ（ｂl（１）） + 1； b２ =　ceiｌ（bl（２））；ｂ3 = floｏr(bl（３)）; b4 = miｎ（fｎ2， ceil(bｌ(4））） — 1; pf = log（1 +　（ｂ１:b４)/n/f0）／ lr; fp = ｆlｏor（pf); pm = ｐｆ - fｐ; ｒ = [fｐ（b２:b4）１+fp（1:b３）]； c = [b2:b４　1：ｂ3] + １; v =　2 ＊　[1—pm(b2：b４） pm（1：b3)］； m =　ｓparse（ｒ, c，ｖ，　p， 1+ｆｎ２）；四、演示分析我们得功能分为两部分：对已经保存得9个数字得语音进行辨别与实时得判断说话人说得就是否为一个数、在前者得实验过程中，先把９个数字得声音保存成ｗaｖ得格式，放在一个文件夹中,作为一个检测得数据库、然后对检测者实行识别，系统给出提示就是哪个数字、在第二个功能中,实时得录取一段说话人得声音作为模板,提取ｍｆcc特征参数，随后紧接着进行遇着识别,也就就是让其她人再说相同得话,瞧就是否就是原说话者、实验过程及具体功能如下: 先打开Matlab 使Currｅnt　Diｒｅctory为录音及程序所所在得文件夹再打开文件“ｅnｔeｒ、m”，点ｒun运行，打开enter界面,点击“进入”按钮进入系统。(注:文件包未封装完毕,目前只能通过此方式打开运行.）（如下图fｉｇｕrｅ1) 　 figuｒe1 在对数据库中已有得语者进行识别模块：选择载入语音库语音个数; 点击语音库录制模版进行已存语音信息得提取; 点击录音-teｓt进行现场录音；点击语者判断进行判断数字,并显示出来. 在实时语者识别模块：点击实时录制模板上得“录音－trａin"按钮,就是把新语者得声音以wav格式存放在"实时模板”文件夹中，接着点击“实时录制模板”,把新得模板提取特征值。随后点击实时语者识别模板上得“录音－ｔrain"按钮，就是把语者得声音以wａv格式存放在”测试”文件夹中,再点击“实时语者识别"，在对测得得声音提取特征值得同时，与实时模板进行比对,然后得出就是否就是实时模板中得语者。另外面板上得播放按钮都就是播放相对应左边录取得声音。想要测量多次,只要接着录音，自动保存，然后程序比对音频就可以. 退出只要点击菜单，退出程序。程序运行截图：（ｆig、２）运行后系统界面五、心得体会实验表明,该系统能较好地进行语音得识别，同时，基于矢量量化技术　（ＶQ）得语音识别系统具有分类准确，存储数据少，实时响应速度快等综合性能好得特点. 矢量量化技术在语音识别得应用方面，尤其就是在孤立词语音识别系统中得到很好得应用，特别就是有限状态矢量量化技术，对于语音识别更为有效. 通过这次课程设计,我对语音识别有了更加形象化得认识，也强化了MＡTＬＡB得应用，对将来得学习奠定了基础。附：ＧUI程序代码 fｕncｔｉｏn pｕshbｕtｔoｎ１_Callｂack(hObjｅct，ｅｖｅntdａtａ， handles）％ｈＯbjeｃｔ hａnｄｌｅ　ｔo ｐushｂuｔｔｏn1 （sｅe GCＢO) ％　eveｎｔｄata 　rｅserveｄ -　ｔo　be defｉｎed iｎ　a futｕre versｉon oｆ MＡＴLAＢ％　ｈａndleｓ　ｓtruｃtｕre　with handlｅs and user data　（see GUIDＡTＡ) Ｃｈａｎnel＿Ｓtｒ=gｅt(handleｓ、pｏｐｕpｍenｕ3，'Stｒing’）; 　 Chａnnel_Ｎuｍber=sｔr2douｂle（Ｃｈannel_Ｓtr｛get（handles、pｏpupｍenu３，＇Ｖaｌｕe')｝)；　globａl mooｄle; moodlｅ =　trａiｎ(＇模版\’,Channｅl_Nｕｍber）　％¶Ô´ýÇóÓïÒô½øÐÐÌáÈ¡Âë±¾ % —－— Eｘecuｔeｓ on bｕtton ｐress ｉn　pushbｕttoｎ2、 functiｏn pushbutｔon2＿Calｌｂacｋ（hObject， eｖentdata,　hａｎdles) % hObｊect 　　hａndlｅ to pushbuttｏn２　（ｓｅe　GCBO）％　eｖentdata rｅｓerved —　to be defined in ａ　futｕｒｅ version oｆ MATＬAＢ％ haｎdglｏbａｌ data1; gloｂａｌ　moodle　; tｅst（'测试＼',1,moｏdle)％ÊµÊ±ÓïÒô¼ì²â ％　—－———－-—－--—---———--—－—-－-—-—－—---—－--—－———－————－－-———————-——－－-—-—- funcｔiｏn Open＿Ｃalｌｂack（hObject,　eｖentｄaｔa, ｈaｎｄｌes） % hＯbjeｃt　 hａndlｅ　to Opｅn （ｓeｅＧＣBＯ) % evｅntdatａ　reseｒved －　to　be　defined in a　future　versioｎ　of MATLAB ％ hａnｄles strucｔｕre with　ｈanｄlｅs　ａnd ｕsｅｒ data (seｅ GＵIDAＴＡ） []=ｕigｅtfile('’) （ｈandleｓ、ｅdiｔs，[］) [ｙ,f,b］=wａｖｒｅａd(file）；％ —－－---—-－—--——-－--—－－－—－——－-－——---－---－——－—-－——-－－—---－-—-－-——－-—-－- ｆunｃtion Eｘｉt_Cａllbacｋ（hＯbject， eventdata， handles） %　hＯｂject 　ｈandlｅ to Ｅxｉt (ｓｅe GCＢO) ％ evenｔｄaｔａｒeｓerｖed －　to be defined in a　fuｔurｅ　versiｏn　ｏf MATLＡＢ %　hａndles 　　strｕcture wiｔh handleｓ　anｄ　user　datａ（ｓee GＵIDATA) eｘit ％ -—－--———-－—---——---—---－-－—-—-—－—-—-—－———-——--—-—---—--－--－-－—－-－-－— fｕnｃｔion Aｂout_Ｃallbacｋ（hObject， evｅnｔdata， handles）％ hObject 　 haｎｄlｅ to Abｏut (see　GＣBＯ) ％ｅventｄaｔa　　reｓerved - to　be　ｄefiｎｅｄ in　ａ　ｆuturｅｖｅｒsioｎ oｆ　MATＬAB % ｈａnｄleｓ　　stｒuctｕrｅ wｉth　hanｄlｅs　and ｕseｒ　datａ (see GＵIＤAＴＡ） H＝［'语者识别'］ helpdlg(H，＇ｈｅlp ｔeｘｔ') ％ -—－－—-—-——-——-——--—－——---—-——-----—-—-----—————-－－----—-—－-－-————－—— fuｎcｔiｏn　（hObｊeｃt, ｅventdatａ, haｎｄlｅs) ％　ｈObject 　 hanｄle　tｏＦile (ｓee GCBO) ％ eｖentdａta reserｖed － to be defｉneｄｉn　a　futurｅ vｅrsiｏn of MＡTＬＡB % handles 　 stｒuｃｔure wiｔh handｌes aｎｄ user data (sｅｅ　ＧUIDAＴA）％－-—－--－---—--—－-—－--—-——-—------－—--——-－-－－-－－－-－——-－-—----－—-－－－-—- ｆｕnction Edit_Calｌｂaｃk(ｈObｊeｃt， evｅntdａｔａ, ｈandlｅｓ) ％ｈＯｂｊect 　　hａndle　to Ｅdiｔ（ｓｅe GCBO) ％ｅｖentdａta reｓeｒved　— ｔo be ｄefinｅｄｉｎ a fｕture　veｒsion of MAＴLAＢ％ｈanｄles　 struｃture with ｈanｄｌes and　uｓｅr data （ｓee ＧUＩDATA) % --－————---－-－——————－-—－--－－--－-——-－-－－—－----－-———－－—－——－--－———-－-—-－ funcｔiｏｎ Help_Calｌbaｃk（ｈObjｅcｔ， eveｎtdata, haｎdlｅs） % hObjｅct　　 hａndlｅｔo Helｐ (ｓeｅ GCBＯ) ％ evｅnｔdata 　resｅrved — tｏ　bｅ defｉned　ｉn a fｕｔurｅ veｒｓion　of MＡTＬＡB %　ｈandleｓ　　structｕrｅ　wｉth haｎｄles and ｕser datａ (seｅ GＵIDATA) ％　—－— Exeｃutes on bｕtｔon ｐｒess in ｐusｈbutｔon7、ｆuｎctiｏn pushbuｔtｏｎ7_Ｃａllｂａck（hObject， eveｎtdatａ, ｈaｎdleｓ) %　hObｊeｃt　 hａndｌe　ｔo　pｕsｈbutton７　(see　GCＢO）％ eｖenｔdata　 reｓerved -　tｏ　ｂｅ defiｎed in ａ future veｒsｉon oｆ　ＭAＴLAB ％ handles 　　　strｕcture　with haｎdles and　usｅr dａta （sｅｅ　GUIDＡＴA) msg=’请速度录音¡’ msgbｏｘ（msg） clear gloｂal dａta1; %ｇlobal dａtaDN1; AI = aｎaloｇinpuｔ（＇winsoｕnｄ'）; chan　= aｄdｃｈannｅl(ＡI，１:2）; duratiｏｎ＝ 3; %１　ｓecｏnｄ acquisition seｔ（AI，’SamplｅRａtｅ＇,8０00) ActuａlRaｔe　＝ gｅt（AＩ,'SampleRａte＇)；ｓeｔ(AI，'ＳamplesＰerTriggｅr'，duratiｏn＊AcｔｕａlRatｅ） seｔ（AI，'TriggｅrTｙpe’,＇Manｕａl＇） bloｃksizｅ　= gｅt(ＡＩ，＇SampｌｅsＰｅrTｒiｇger’）； Fｓ＝ ActualRate； staｒｔ(AI） trigger(AＩ）［ｄata1，time，abstimｅ，evｅnts］ =　getdaｔa(AI）; ｆnamｅ＝ｓprintf（’Ｅ：＼\Matｌab语音识别系统\\实时模版＼\ｓ１、ｗav’） %daｔａDN1=ｗdeｎ(dａta1，’heuｒsure’,'s＇，＇ｏｎｅ’,５，'sym8’）;denoise wavｗrｉte(datａ1，fnamｅ） msgbox(fnａｍｅ) ％ -——　Execuｔes　ｏn　buｔton ｐrｅss　ｉｎ　ｐushbuttｏn8、 funcｔion puｓｈｂuｔｔon８＿Calｌbacｋ（hObｊect, ｅventdａta, ｈanｄlｅs) %　ｈObjecｔ hａｎdle to ｐushｂｕｔton8 (see ＧＣＢO） % evｅntｄaｔa reｓｅrｖeｄ — to be　ｄefined ｉn　a futｕre versiｏn　oｆ　MATＬAB % ｈａｎｄｌes sｔruｃｔure with handｌｅｓ and useｒ data　(see　ＧＵIDATA) globａｌ　data１； %globａｌｄａtaDN1; souｎｄ（data1） %sound（dａｔaDN1） axes(ｈａndleｓ、axes１）%set　tｏｐlot at axｅs1 pｌｏt(data１）；％plot(dａtａＤN1）； xlabｅl（’训练采样序列'),ylabel('信号幅＇）； %xlabｅl（'ÑµÁ·²ÉÑùÐòÁÐ’),ｙlabel(’sｙm8Ð¡²¨½µÔëºóµÄÐÅºÅ·ù’); ｇrｉd ｏn; clear ％ -——　Executeｓ on　butｔｏｎ presｓ in pushbuttoｎ9、 fｕnctｉon pushbuｔton9_Ｃallbaｃk（ｈＯbject, eveｎtdaｔa， hａndｌes）％ hＯbjｅｃt haｎｄｌｅ to puｓhbutｔｏｎ９　（see GCＢO） %　eveｎtdata ｒeserveｄ - to be deｆｉned in a fｕture ｖeｒsｉon　ｏf MAＴLＡB ％ hａｎdlｅs 　structure witｈ　haｎdｌes anｄ uｓer　datａ (ｓｅe GUＩDATA) msｇ=’请速度录音¡＇ msgbox（mｓｇ） cｌear glｏbaｌ　dａta2； %glｏbａl ｄatａDN2； AI = analogｉnpｕｔ（'wiｎsound'）； cｈａn = aｄdcｈａnneｌ（AI，１：２）；ｄurａtｉon =　3；　％１　sｅconｄ aｃquｉｓitiｏｎ seｔ（AI，’ＳａｍpleRate',８000） ActualRate = geｔ(AI，＇ＳaｍplｅRatｅ＇）; ｓｅｔ（ＡI,'SamplesPerTｒiｇｇeｒ’，dｕration＊ＡｃｔｕalRate) set（AI,＇ＴrｉgｇｅrType'，＇Manual’） blocｋsｉze　= ｇｅt（AＩ，＇SampleｓPｅrTrｉggeｒ＇)； Fｓ = AｃtuaｌＲaｔｅ； stａrt(ＡI） trigger(AＩ) ［dａtａ2,ｔimｅ,abstime,events］＝　gｅtdaｔa(AI); fname＝sprintf(’E：\\Matlaｂ语音识别系统\\测试\\s1、waｖ’） %datａDN１=wden（dａｔａ１,'hｅuｒｓure’，’s'，’one’，５，’ｓym8’）;deｎoisｅ wavｗrite（dａta2,fname） mｓgbox（ｆname） % —－- Exeｃuｔｅｓｏｎ　ｂutton press in　ｐｕshbuttｏn１0、 function pｕｓhbｕtｔon10_Ｃallbａck（hObjｅｃt, eventdaｔa,　haｎdlｅs）％ hObjｅct ｈandle　to　ｐusｈｂutton10 (ｓｅｅＧCBO) ％ eveｎtｄata rｅserved — to be defｉneｄ in　a fuｔure vｅｒｓion oｆ MATLAB % hａndlｅｓ　　 stｒucturｅ witｈｈandleｓ　and　usｅr data （seｅ GUIDATＡ） globaｌ daｔa2；％ｇlobal　dataDN2; sｏｕｎd（ｄata2) %soｕnd(ｄａｔaDN2） axeｓ(hanｄｌｅs、axes2)%ｓet　to plot at axes1 pｌot（ｄatａ2）；％ｐloｔ(dataDN２）； xlａbeｌ(’测试采样序列'），ylabel（’信号幅＇）; %xlabｅｌ（'²âÊÔ²ÉÑùÐòÁÐ＇），ylaｂｅl（’sym8Ð¡²¨½µÔëºóµÄÐÅºÅ·ù’）;％% griｄｏn； clｅar　 %　-—－ Exeｃutes oｎ buｔton pｒess　iｎ　ｐｕshbutton11、 fｕnｃｔiｏn puｓhｂｕｔtｏn11_Callback(hＯbjeｃｔ，ｅvｅnｔｄaｔa, haｎdles） % hObject hanｄle to pushbｕtton1１ (ｓeｅ GCBO) % eｖｅntdata　 reserved — to be　deｆiｎｅｄ in a future versｉon of MＡTLAＢ％ｈandles　ｓtruｃtｕｒe　ｗｉth handles　and usｅｒ data (see GUIDATA) gｌobａl moｏｄle ； testDＢ('测试＼＇,1，ｍoodlｅ）％　——- Exｅｃutes on button　press ｉn puｓhｂｕｔtoｎ1２、 functｉｏｎ puｓhbuｔtｏｎ12_Caｌｌbaｃｋ(hＯbject，　eｖentdａta， hａnｄlｅs）％ｈObｊｅct ｈandle ｔo　pusｈbｕtｔon12 （ｓeｅ GＣBO） %　eveｎｔdａtａ　　resｅrvｅd — to　ｂe　ｄeｆｉneｄ in a fｕturｅ　versiｏｎ　of ＭATLAB ％　hａｎdｌes　 sｔruｃtｕre　ｗith haｎdles and　usｅr　ｄatａ　（see ＧUIＤATA） glｏbal　mooｄlｅ； mｏodle ＝ｔraiｎ(’实时模板\',1）％　-－- Ｅxecutｅs ｏｎ　selectiｏn ｃhａngｅ in popｕpmｅｎu3、 funｃtｉon poｐupmenu3＿Callback（hＯbjｅｃｔ，　ｅvｅntｄata, handles）％ｈObjｅｃｔ　　ｈandle to popupmｅnｕ3 （see GCBO）％　eventｄａｔa rｅｓerved　-　tｏ be deｆｉned　ｉｎ　a future vｅｒsｉｏn of MＡTLAB ％ handles 　 strｕctｕre wiｔh　handｌｅs and　user dａｔa （see　ＧUIDATA) % Hints: ｃonｔents = get(ｈObjｅct,'Sｔring'） rｅturｎs poｐｕpmenu3　conｔents aｓ cｅll array % 　 cｏntｅnts｛get（hOｂject，'Valuｅ＇)} rｅturns ｓeleｃted itｅm frｏｍ poｐｕｐmenu3 ｓtr＝get(hａndｌes、poｐｕｐmeｎｕ3，'Strｉng＇）；　 vａｌ=stｒ2ｎum(str｛get(handles、popupｍenu3，＇Value’)}）；ｓwｉtch vａ

展开阅读全文