1、课程设计任务书 学生姓名: 何界先 专业班级: 通信0904 指导教师: 李政颖 工作单位: 信息工程学院 题 目: 信息处理课群综合训练与设计——语音信号的盲分离 初始条件: 根据盲信号分离原理,用matlab采集两路以上的语音信号,选择合适的混合矩阵生成若干混合信号。选取合适的盲信号分离算法(如独立成分分析ICA等)进行训练学习,求出分离矩阵和分离后的语音信 要求完成的主要任务: (1) 用matlab做出采样之后语音信号
2、的时域和频域波形图 (2) 选择合适的混合矩阵,得到混合信号,并做出其时域波形和频谱图 (3) 采用混合声音信号进行训练学习,求出分离矩阵,编写出相应的确matlab代码。 (4) 用求出的分离矩阵从混合信号中分离出原语音信号,并画出各分离信号的时域波形和频谱图。 (5)对结果进行对比分析。 时间安排: 理论设计: 2天 编程仿真: 2天 撰写报告: 2天 答辩: 1天 指导教师签名: 2012年 月 日 系主任(或责任教师)签名: 2012年 月
3、 日 目 录 摘 要 I Abstract II 1 绪论 1 1.1研究背景与意义 1 1.2盲源分离的国内外研究进展 1 1.2.1线性瞬时混合信号 1 1.2.2非线性瞬时混合信号 2 2 语音信号的分析 4 2.1语音信号时域分析 4 2.2语音信号频域分析 5 2.3语音信号的MATLAB应用程序 5 2.3.1输入语言的MATLBA时域和频谱图程序分析 5 3 盲分离的基本概念 14 3.1 盲分离的数学模型 14 3.2 盲源分离的基本方法 14 3.3 盲分离的目标准则 16 3.4 盲分离的研究领域 17 3.5 盲分离的研究内容 1
4、9 4 FastICA算法 20 4.1 数据的预处理 20 4.2 FastICA算法 21 4.3 分离后的信号的时域和频谱图 24 4.4对比分析 26 5 小结 27 参考文献 28 附件 整体程序 29 摘 要 语音信号的分离近年来成为信号处理领域的一个研究热点,它在电话会议、助听器及便携设备、机器的语音识别方面有很多的应用与影响。而盲信号处理的方法常被用于语音分离中去,“盲”是指没有关于源信号本身以及传输信道的知识,盲分离的理论基础是独立分量分析,其可以广泛的被应用于通信、图像、语音、生物医学、雷达、地震、声纳等多种类型信号的处理。盲分离技术可以用于消
5、除不需要的干扰以增加语音质量。 语音分离使得助听器有更强大的处理功能,使得接收信号分离出尽可能接近原始的语音。更适合于语音编码和基音检测。特别是在混合语音信号进行编码方面,传统的单通道方法处理起来十分困难,而混合语音可以看作多路语音信号的线性组合,其每一路语音信号都可视为独立分量,这正好与ICA 的假设相符。语音识别。机器的语音识别能力远不及人类,尤其是在有噪音和干扰的背景下。 这时作为语音识别的前端处理,盲语音分离可以很好的去除干扰,不论是加性噪声还是其他不感兴趣的语音,这就大大增强了机器的识别率。“人类最重要的特性之一就是我们能够去聆听另一个人的言语并且互相交流,而且这种交流通常是在不止
6、有一个人在场的情况下。我们每天都会经历到这一切,也认为这是理所当。 然的。目前为止没有人手造的任何一台机器能够做到这些,即从数个混在一起的语音中提取出感兴趣的某一个来。”本文所研究的语音信号分离算法可以认为是模仿人类的语音分离能力,因此具有较大的应用前景和现实意义。 关键词: 语音分离 盲算法 ICA Abstract Separation of speech signals in recent years become a hot research topic in the field of signal processing, in a conference ca
7、ll, hearing aids and portable devices, speech recognition machine has many applications and impact. Blind signal processing methods often used for speech separation "Blind" refers to no knowledge of the source signal and transmission channel, the theoretical basis of the blind source separation, ind
8、ependent component analysis, it can be applied to a wide range of communications, image, voice, biomedical, radar, seismic, sonara type of signal processing Blind source separation technique can be used to eliminate unwanted interference in order to increase the quality of voice. Speech s
9、eparation makes hearing aids more powerful processing capabilities, making the received signal separation as close as possible to the original voice. More suitable for speech coding and pitch detection. Especially in a mixed voice signal is encoded, the traditional single-channel approach is extreme
10、ly difficult, and mixed voice can be seen as a linear combination of multi-channel voice signal, and each of its way voice signal can be regarded as independent component, which coincided withICA assumptions match. Speech recognition capabilities of the machine far less than human, especially in the
11、 context of noise and interference. Then as the front end of the speech recognition processing, blind speech separation can be very good to remove interference, whether it is the additive noise is not interested in voice, which greatly enhanced recognition rate of the machine. Keyword:Speech Separa
12、tion Blind algorithm ICA 1 绪论 1.1研究背景与意义 盲信号处理(Blind Signal Processing, BSP)作为计算智能学的核心研究内容,是20世纪最后十年迅速发展起来的一个新研究领域,是人工神经网络与统计信号处理以及信息理论相结合的产物,已经成为一些领域研究与发展的重要课题,它具有可靠的理论基础和许多方面的应用潜力。事实上,盲信号处理已成为重要的研究课题,并在许多领域得到发展,特别是在生物医学工程、医疗成像、语音增强、遥感、雷达与通信系统、地震勘探、地球物理学、计量经济学、数据挖掘等方面均具有突出的作用。盲信号处理技术
13、原则上不利用任何训练数据,也没有关于卷积、滤波、混合系统参数的先验知识。而且随着盲信号处理技术的不断成熟,从传统的信号处理、神经元网络领域到通信、生物医学工程、地球物理、以及图像工程、控制工程等领域,盲信号处理技术正在得到越来越广泛的应用。因此,大力发展盲信号处理技术,不仅会积极地促进信号处理、神经网络的研究,而且也将会对多个领域新技术的发展起到一定的促进作用。 1.2盲源分离的国内外研究进展 1.2.1线性瞬时混合信号 较早进行盲源分离方法研究的是jutten和Herault, 1986年,他们提出了一种盲源分离方法,该方法基于反馈神经网络,通过选取奇次的非线性函数构成Hebb训练,从
14、而达到盲源分离的目的。但该方法不能完成多于两个源信号的分离,非线性函数的选取具有随意性,并且缺乏理论解释。 1991年,Juttcn, Herault以及Comon和Sorouchyari在杂志Signal Processing上发表了关于盲信号分离的三篇经典文章,标志着盲源分离问题研究的重大进展.他们不仅提出了盲源分离中著名的H-J学习算法,而且设计了专门的CMOS集成芯片来实现他们的算法。H-J方法后来由Jutten和Herault、Comon, Cichocki和Moszczynski以及其他研究者解释并发展。Tong和liu分析了盲源分离的可分离性和不确定,并给出了一类基于高阶统计量
15、的矩阵代数分方法。 1993年,Cardoso提出了基于高阶统计的联合对角化盲源分离方法,并应用 于波束形成。 1995年,Bell和Sejnowsk基于信息理论,通过最大化输出非线性节点的熵,得出一种最大信息(Informatian Maximization,简记Infomax)传输的准则函数,并由此导出一种自适应盲源分离和盲反卷积方法,当该方法中非线性函数的选取逼近源信号的概率分布时,可以较好地恢复出源信号。该算法虽有其局限性,但在分离线性混合的语音信号方面非常有效。 1997年,Hyvarinen等基于源信号非高斯性测度,给出一类定点训练算法(fixed-point),该类算法可
16、以提取单个具有正或负峰度的源信号。 1999年,Lee、 Girolami和Sejnowski将信息最大化原则的独立分量分析作了进一步的扩展,实现了超高斯源信号和亚高斯源信号的盲源分离,这个方法选取两个不同的非线性函数分别实现超高斯信号和亚高斯信号的盲源分离。但是这个方法只局限于实现标准的独立分量分析,不能解决当源信号维数大于混合信号维数时的盲源分离向题,也不能实现具有噪音的独立分量分析。 1.2.2非线性瞬时混合信号 最近,人们已经开始研究存在噪声的混合和非线性混合信号的盲源分离问题。非线性盲源分离比线性情况的分离难度更大,目前基本还处在最初的摸索阶段。较早涉及非线性混合信号盲源分离的
17、是Burel,1992年他用一个两层感知器和基于误差后向传输思想的无监督训练算法,得到一种盲源分离算法,可以用于非线性混合信号的盲源分离。 1994年,Krob和Benidir研究了利用高阶统计量解决多项式结构的非线性混合问题。 1995年,Deco和Brauer研究了一个基于Volume-Conserving结构的非线性变换的盲源分离。 1997年,Yang、Amari和Cichocki基于对于源信号各分量统计独立的假设,利用两层感知器网络结构得出基于最大熵( Minimum Entropy,简记ME)和最小互信息思想(Minimum Mutual information,简记MMI
18、)的代价函数,并提出了反向学习算法,当合理选择非线性函数时该算法可以分离出一些特定非线性混合的源信号。 1998年,Taleb、Jutten和Olympieff提出了一种非线性混合信号盲源分离算法,该算法基于熵,对于分离某些盲混合信号具有良好性能。 2001年,Valpola、Honkela和Karhunen提出了贝叶斯集合学习算法(Bayesian Ensemble Learning Algorithm ),该算法采用多层感知器神经元网络(MLP ),能够对非线性静态和动态过程实现盲源分离。Tan和Wang提出了基于遗传算法( Genetic Algorithm)的盲源分离方法,该算法利
19、用遗传算法使信号非线性混合度最小化,然后对去除非线性后的数据进行线性分离,从而实现盲源分离。与传统的梯度算法相比,基于遗传算法的盲源分离方法有着更快的收敛速度和稳定性,能够在全局范围内寻找最优解。Tan、Wang和Zurada提出了径向基网络算法(Radial Basis Function Network Algorithm),使用径向基函数神经网络来逼近非线性混合的逆映射实现盲源分离。 2 语音信号的分析 2.1语音信号时域分析 语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。
20、语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。这种分析方法的特点是:①表示语音信号比较直观、物理意义明确。②实现起来比较简单、运算且少。③可以得到语音的一些重要的参数。④只使用示波器等通用设备,使用较为简单等。 MATLAB数据采集箱中提供的函数命令进行图像分析的函数命令: wavrecord : wavrecord 利用Windows 音频输入设备记录声音,其调用形式为:wavrecord (n ,fs ,ch) 。利用Windows音频输入设备记
21、录n个音频采样, 频率为fs Hz ,通道数为ch。采样值返回到一个大小为n*ch 的矩阵中。缺省时,fs = 11025 ,ch = 1。 waveplay: waveplay 利用Windows音频输出设备播放声音,其调用形为:waveplay(y ,fs) 。以采样频率fs向Windows 音频设备发送向量信号。标准的音频采样率有:8000、11025、22050 和44100Hz。 wavread :wavread 用于读取Microsoft 的扩展名为“.wav”的声音文件。其调用形式为: y = wavread (file) 。其作用是从字符串file 所指的文件路
22、径读取wave 文件,将读取的采样数据送到y 中。Y的取值范围: [ -1 ,1 ] 。 sound:音频信号是以向量的形式表示声音采样的。sound 函数用于将向量转换为声音,其调用形式为:sound (y ,fs) ,作用是向扬声器送出向量y 中的音频信号(采样频率为fs) 。 通过Wavread和plot(x)函数即可显示图像的时域波形。 2.2语音信号频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。本文介绍的是
23、语音信号的傅里叶分析法。因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱 ”。 FFT即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。 在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。函数FFT用于序列快速傅立叶变换,其调用格式为y=fft(x),其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT且和x相同长度;若x为一矩阵
24、则y是对矩阵的每一列向量进行FFT。如果x长度是2的幂次方,函数fft执行高速基-2FFT算法,否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数FFT的另一种调用格式为y=fft(x,N),式中,x,y意义同前,N为正整数。函数执行N点的FFT,若x为向量且长度小于N,则函数将x补零至长度N;若向量x的长度大于N,则函数截短x使之长度为N;若x 为矩阵,按相同方法对x进行处理。 2.3语音信号的MATLAB应用程序 2.3.1输入语言的MATLBA时域和频谱图程序分析 fs=25600; %语音信号采样频率为256
25、00 man=wavread('man.wav'); y1=fft(man,4096); %对信号做2048点FFT变换 f=fs*(0:2047)/4096; figure(1) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(man);title('原始信号1波形') subplot(2,2,2),plot(magy1);title('原始信号1幅值') subplot(2,2,3),plot(angy1
26、);title('原始信号1相位') subplot(2,2,4), plot(f,abs(y1(1:2048))); title('原始语音信号1频谱') xlabel('Hz'); ylabel('fudu'); axis([0 100 0 50]) fs=25600; %语音信号采样频率为25600 dragen=wavread('dragen.wav'); y1=fft(dragen,4096); %对信号做
27、2048点FFT变换 f=fs*(0:2047)/4096; figure(2) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(dragen);title('原始信号2波形') subplot(2,2,2),plot(magy1);title('原始信号2幅值') subplot(2,2,3),plot(angy1);title('原始信号2相位') subplot(2,2,4), plot(f,abs(y1(1:2048)));
28、 title('原始语音信号2频谱') xlabel('Hz'); ylabel('fudu'); axis([0 1500 0 50]) fs=25600; %语音信号采样频率为25600 music=wavread('music.wav'); y1=fft(music,4096); %对信号做2048点FFT变换 f=fs*(0:2047)/4096; figure(3) magy1=abs(y1);
29、 angy1=angle(y1); subplot(2,2,1),plot(music);title('原始信号3波形') subplot(2,2,2),plot(magy1);title('原始信号3幅值') subplot(2,2,3),plot(angy1);title('原始信号3相位') subplot(2,2,4), plot(f,abs(y1(1:2048))); title('原始语音信号3频谱') xlabel('Hz'); ylabel('fudu'); ax
30、is([0 1500 0 150]) 图2-1 三路输入声音的时域图形 图2-2三路声音的频谱 2.3.2混合语音信号的MATLBA时域和频谱图程序分析 I1=wavread ('man.wav')'; I2=wavread ('dragen.wav')'; I3=wavread ('music.wav')'; S=[I1;I2;I3]; % 语音个数即为变量数
31、 Sweight=rand(size(S,1)); % 取一随机矩阵,作为信号混合的权矩阵 MixedS=Sweight*S; % 得到三个语音的混合信号矩阵 % 将混合矩阵重新排列并输出 x=MixedS(1,:); fs=25600; %语音信号采样频率为25600 y1=fft(x,4096); %对信号做2048点FFT变换 f=fs*(0:2047)/4096; figure(1)
32、 magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(x);title('混合信号1波形') subplot(2,2,2),plot(magy1);title('混合信号1幅值') subplot(2,2,3),plot(angy1);title('混合信号1相位') subplot(2,2,4), plot(f,abs(y1(1:2048))); title('混合语音信号1频谱') xlabel('Hz'); ylabe
33、l('fudu'); axis([0 1000 0 50]) % 将混合矩阵重新排列并输出 y=MixedS(2,:); fs=25600; %语音信号采样频率为25600 y1=fft(y,4096); %对信号做2048点FFT变换 f=fs*(0:2047)/4096; figure(2) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(y);title
34、'混合信号2波形') subplot(2,2,2),plot(magy1);title('混合信号2幅值') subplot(2,2,3),plot(angy1);title('混合信号2相位') subplot(2,2,4), plot(f,abs(y1(1:2048))); title('混合语音信号2频谱') xlabel('Hz'); ylabel('fudu'); axis([0 1000 0 100]) % 将混合矩阵重新排列并输出 z=MixedS(3
35、); fs=25600; %语音信号采样频率为25600 y1=fft(z,4096); %对信号做2048点FFT变换 f=fs*(0:2047)/4096; figure(3) magy1=abs(y1); angy1=angle(y1); subplot(2,2,1),plot(z);title('混合信号3波形') subplot(2,2,2),plot(magy1);title('混合信号3幅值') subplot(2,
36、2,3),plot(angy1);title('混合信号3相位') subplot(2,2,4), plot(f,abs(y1(1:2048))); title('混合语音信号3频谱') xlabel('Hz'); ylabel('fudu'); axis([0 1000 0 100]) 图2-3三种混合的时域图 图2-4混合声音的频谱 3 盲分离的基本概念 3.1 盲分离的数学模型 盲源分离原理可用如下图所示的数学模型来描述: s(t) 分离系统W y(t) x(
37、t) + 混合系统A n(t) 图3.1 盲源分离原理图 BBS的数学模型如图3-1所示,其中是n维未知源信号向量,A为未知混合系统, 是m维的观测信号矢量,它们均源信号矢量的组合,并受到噪声矢量的干扰. 盲源分离的目的就是在源信号s和混合系统A均未知的情况下,仅由观测数据向量x通过调整分离系统W,使得输出y是源信号s的估计,即: (3-1) 3.2 盲源分离的基本方法 盲源分离包含了线性瞬时混合和卷积混合两种盲源分离问题。解决盲源分离问题的重要方法一独
38、立分量分析(Independent ComponentAnalysis,ICA)通常以线性瞬时混合为模型,而盲解卷积则是一种更为实际的盲源分离问题,其混合模型是一种卷积混合,线性卷积混合模型比较接近实际,这是因为:(1)实际中每一个源信号不会同时到达所有的传感器,每一个传感器对不同的源延时不同,延时值的大小取决于传感器与源信号间的相对位置以及信号的传播速度;(2)源信号到达传感器是经过多途传播的,即多径效应。假设信号是线性组合的,则从传感器观测到的信号是源信号各种延时值的线性组合。解决此类问题的盲信号处理方法就是盲解卷积。特别地,ICA方法也可被用于盲解卷积或盲均衡。此外,盲信号处理还包括许多
39、重要内容,例如非线性BSS或非线性ICA问题、盲多用户检测以及盲波束形成等等。 相互独立、非高斯、ICA 时序结构、线性可预测 时频、谱和空间多样性 非稳态、时变方差 尽管有许多不同的盲源分离算法可用,但它们的原理却都可以归纳为以下四个方法如图3.2: 图3.2 盲源分离算法种类 (1)最普遍的方法就是使用代价函数来衡量信号独立性和非高斯性或者稀疏性。当假信号具有统计独立性,且没有时间结构时,高阶统计量方法是求解盲源分离问题的基段(间接或直接的),这种方法对多于一个高斯分布的源信号不适用。 (2)如果
40、源信号具有时序结构,则其有非零的时序相关数,从而可以降低对统计独立性的限制条件,用二阶统计量方法(SOS)就足以估计混合矩阵和源信号。这种(SOS)方法不允许分离功率谱形状相同或i.id(独立同分布)的源信号。 (3)第三种方法即采用非平稳性(Ns)和二阶统计量(SOS)。由于源信号主要随时间有不同的变化,就可以考虑利用二阶非平稳性。Matsuoka等人首先考虑了非平稳性,并证‘明在盲源分离中可以应用简单的解相关技术。与其他方法相比,基于非平稳性信息的方法能够分离具有相同功率谱形状的有色高斯源,然而,却不能够分离具有相同非平稳特性的源信号。 (4)第四种方法运用了信号的不同多样性,典型的是
41、时域多样性、频域多样性(谱或时间相干性”)或者时频域多样性,更一般的,即联合空间一时间一频率(STF)多样性。 自从BSS和ICA的概念产生以来,人们几乎是不加区分地使用这两个概念。但是,如果深入研究BSS和ICA的基本原理和作用对象,两者之间的区别和联系是显而易见的。 Comon对ICA给出了较严格的定义:对于观测信号矢量,存在一个线性变换,使得观测信号在线性变换下各分量的统计独立性最大化。这一过程称之为ICA过程。 与此对应,可以给出BSS的如下定义:对于观测信号矢量,存在线性变换w,使得全局矩阵G的各行及各列中只有一个非零元素(不妨称之为广义对角矩阵),即G=PD。其中P为置换阵;
42、D为对角阵,从而实现信号分离。 ICA的目的是通过线性变换使得观测信号的各个分量的统计独立性最大化。通常用输出信号的互信息、熵等作为统计独立性的量度,如基于信息论的Informax算法、Amari的自然梯度算法等。如果源信号之间具有统计独立性,那么可以通过ICA实现信号的分离。 BSS考察的是在什么条件下可以使全局矩阵实现广义对角化,而不去衡量输出信号的统计独立性是否达到最大化。因此BSS并不一定要求源信号是统计独立的。例如AMUSE、GED算法只要求源信号具有统计不相关性。如果源信号是统计独立的,那么BSS的输出信号也一定是统计独立的,这时BSS和ICA等价。 从作用对象看,ICA除了
43、可以用于多源信号的分离外,还可以用于其它多维数据的分析,例如图像的特征提取、经济数据分析等。而BSS不仅仅局限于瞬时混合信号的分离,还包括实际应用中更重要的卷积混合信号的分离。 可以说ICA是实现BSS的一种方法,而BSS是ICA的一个具体的应用。 3.3 盲分离的目标准则 根据源信号不同的特征,盲源分离的实现方法有很多,但它们的原理可以归纳为以下四种准则: (1)独立分量分析(Independent Component Analysis,ICA):当假设源信号各分量间彼此统计独立,且没有时间结构时,在某一分离准则下通过对神经网络权值的反馈调整,使得变换后信号的不同分量之间的相依性最小
44、也即输出达到尽可能的独立。这种方法对多于一个高斯分布的源信号不适用(因为高斯信号的线性叠加仍是高斯信号),这是近年来盲源分离的主要解决方法。 (2)主分量分析(Principal Component Analysis,PCA)的方法:在尽可能保持原始变量更多信息的前提下,导出一组零均值随机变量相对少的不相关线性组合(主分量),并由此恢复出对源信号的估计。 (3)二阶非平稳性:即采用非平稳性和二阶统计量。由于源信号随时间有不同的变化,所以可以考虑利用二阶非平稳性,应用简单的解相关技术实现盲源分离。与其他方法相比,它能够分离具有相同功率谱形状的有色高斯源,然而却不能分离具有相同非平稳特性的源
45、信号。 (4)运用信号的不同多样性,典型的是时域多样性、频域多样性或时频域多样性,更一般的,即联合空间-时间-频率多样性,如果源信号具有不同的时频域多样性,信号的时频域特征不完全重叠,那么可以通过屏蔽时频域的单个源信号或干扰信号,并从一个(或多个)传感器信号中提取源信号,然后再在时频域中合成,然而这些情况下,通常需要一些源信号的先验知识,所以这种分离只能是一种半盲分离。 3.4 盲分离的研究领域 在BSS问题的研究和发展过程中,基于其不同的应用环境,进行了不同角度的扩展,形成了不同的研究领域,可以对BSS的研究领域做如下的分类: 依据信号混合方式不同,盲信号的混合方式有瞬态线性混合、卷
46、积混合、非线性混合等方式,针对不同的混合方式需要采用不同的分离方法。在瞬态线性混合方式下,观测信号是原始信号在相同时刻的线性叠加,即不同信号到达各个传感器的时间差别可以忽略不计,此时混合矩阵是实矩阵,盲分离过程等价于寻找混合矩阵的逆矩阵过程。如果信道的传输延迟等对观测信号的影响较大,观测信号是原始信号在过去不同时刻的线性叠加,则属于卷积混合方式,此时的传递通道矩阵可以用有限长冲激响应滤波器模型来构造,盲解卷过程就需要利用相应的解卷滤波器实现。如果信号所处的环境是动态变化的且具有非线性特征,则需要利用非线性特征函数实现盲分离。 对信号的处理角度不同,BSS可在时域、频域或时频域进行研究。时域盲
47、分离比较直观,但不能利用信号的频谱特征,在瞬态线性混合情况下应用较多;频域盲分离可以将时域上的卷积运算转化为频域上的直接乘积形式,从而可以利用时域盲分离算法解决盲解卷/盲均衡问题,但频域上的尺度与交互不确定性问题以及较大的计算量是阻碍信号进行频域盲分离的主要障碍。利用信号的时频特性进行盲分离,可以充分利用时域和频域分析的优点,其主要困难在于时频点的合理选择。 信号本身的属性有平稳信号与非平稳信号之分、窄带信号与宽带信号的差别。平稳信号的盲分离,常需要利用信号的高阶统计量信息;而对于非平稳信号,如语音信号,则利用信号的二阶时间相关属性实现盲分离;宽带信号通常要先分解为多个窄带信号,逐个进行盲分
48、离。 根据源信号数目与观测信号数目的关系,可分为适定盲分离、超定盲分离、欠定盲分离。当前很多算法都是在适定条件下推导得到的,它是指源信号数目和观测信号数目相等的情况;当观测信号数目大于源信号数目时,称为超定盲分离,超定盲分离通常采用降低观测信号维数,进而进行适定条件下盲分离的方法;欠定盲分离,又称超完备盲分离,是近年来的研究热点和重点,它是源信号数目大于观测信号数目的情况,这相当于信源在经过混合信道后,发生了有损压缩,因此采用传统的ICA通过对混合系统求伪逆的过程已无法恢复出源信号,这些丢失的信息只能通过一些先验、假设或限制条件(如:独立性、稀疏性等)进行弥补。 根据对算法的性能要求,盲分
49、离可以分为离线批处理和自适应在线处理等方式。离线批处理方式可以利用信号的各阶统计量信息,通过特征值分解等运算获得盲信号的分离矩阵,其优点是可以充分利用观测信号的样本数据,能够获得较为精确的解,缺点是计算量大,分离时间长,且对信息的存储空间要求高;而自适应的在线处理方式是基于单次观测样本进行盲分离系统的更新迭代,计算量低,适用于实时性要求较高的场合,如在线故障诊断等。 3.5 盲分离的研究内容 盲源分离的基本框架是根据某种优化准则,先选出合适的目标函数,然后通过某种优化算法来搜索目标函数的极值点,其中优化准则保证了算法实现的可能性和实现途径;具体的目标函数决定了算法的统计性能,优化算法则决定
50、了算法的搜索性能。因此BSS的研究内容涉及优化准则及目标函数的确定、信源概率密度函数(Probability density function,pdf)的估计、各种优化算法、算法的性能评价指标等多个方面。 (1).优化准则 独立分量分析(ICA)是目前解决BSS问题的主要方法,而ICA的目的在于确定一非线性变换使得输出各分量间尽可能的相互独立,因此一般采用输出各分量间的最大化独立性作为算法的优化准则。信号分量间的独立性程度可以采用非高斯性、高阶统计量、熵、互信息、概率密度函数(pdf)以及两种pdf距离的Kullback-Leibler散度等函数进行度量。 (2).信源概率密度函数的估计






