资源描述
压缩采样介绍
一个与传统数据采集不同的传感、采样范例
Emmanuel J. Candès and Michael B. Wakin
IEEE信号处理杂志 2008年3月
对信号和图像采样的传统方法遵循著名的香农定理:采样速率必须至少是当前信号最大频率的两倍(也称奈奎斯特速率)。事实上,这个定理几乎是所有信号采集方式的基础,被大规模应用在消费性音频视频电子设备、医学成像设备、收音机等等。(对于某些信号,例如并非是原始的天然影像,采样率就不是由香农定理所规定,而是取决于需要的空间或时间分辨率。然而,这些系统经常在采样前使用反锯齿低通滤波器保持信号,使得香农定理扮演一个幕后的角色。)例如在数据转换领域,标准模数转换器(ADC)技术使用量化香农定理:信号一律以大于或等于奈奎斯特速率来采样。
这篇论文研究了压缩采样的理论,该理论亦被称为压缩传感或CS,是一项新颖的与传统数据采集不同的传感、采样技术。CS理论声称可以比传统方法使用更少的采样信号和测量来恢复特定信号和图形。为了实现这一点,CS依靠两个准则:稀疏性,不连贯性。
u 稀疏性,表示连续时间信号的信息率可能比由带宽决定的还要小,或者离散时间信号自由度远小于其有限的长度。更准确的说,CS方法发现许多自然信号是十分稀疏并可压缩的,当用适当的基础Ψ表述时,他们就能有简明的表达。
u 传感形式不连贯延续了时间和频率的二元性,并表明目标在Ψ有一个稀少的特征并一定会在他们已得的范围内扩展,正如时域里面的狄拉克或冲击信号在频域也可展开表示。另外,不连贯表明它与信号特征不同,采样、传感的波形在Ψ有一个非常密集的表示。
最重要的是我们可以设计有效的传感、采样规则,来获取有用的信息并将其嵌入到稀疏的信号中,加入到一小段数据中。这些规则仅十分简单的要求把信号同一些固定的波形相关联,这些波形也都没什么根据。关于这些采样规则,最不同寻常的是它们可以使用一个传感器,从稀疏的信号中高效的获取信息,并且也不需要分析这些信号。甚至它还能使用数字化最优方法,仅依靠一小段获得的数据来重建全部信号。换句话说,CS是一种非常简单并高效的数据获取方法,它采用信号独立方式,采样率低,依靠看起来不完整的一系列测量,经过计算来重建信号。
我们这篇论文意图概述[1]–[3]中出现的基本的CS理论,展现该理论所包含的关键数学思想,并调查该领域一些重要的结论。我们的目标是尽可能清楚的解释CS理论,因而这篇文章主要是指导性的。该理论最吸引人之处是它涉及了许多不同的学科分支,包括应用数学、概率论。在本文中,我们决定突出这一方面,特别是随意性可以导致有效的感觉机制。我们也会讨论重要的含义,解释为何CS是同步传感、压缩数据的明确规则(如题所言),通过回顾重要的应用来总结我们的探索。
传感问题
在本文中,我们将讨论一种传感机制,该机制由线性泛函获取记录信息的信号f(t). , k=1,……m. (1)
我们简单的将想要取得的目标同波形相联系。这是一个标准的方案。如果传感波形是狄拉克-德尔塔函数(尖形),例如,y是f在时域或空间域的一个矢量采样值。如果传感波形是像素的指标函数,那么y是由数码相机传感器收集的典型图像数据。如果传感波形是正弦曲线,那么y就是一个傅里叶系数的矢量;这是磁共振成像(MRI)使用的传感形式。还有很多其他的实例。
虽然人们可以对连续的时域或空间域信号发展一种CS理论,但是我们的注意力集中在离散信号。原因是两方面的:第一它在概念上较简单;第二,现有的离散CS理论还不成熟(但是显然为连续理论铺平了道路——也被视为“应用”)。说到这里,我们由此对正在采样的情形颇感兴趣,此时测量的数值m比信号f的度量n要小得多。由于多方面的原因,这类问题十分常见。例如,传感器的数量可能受到限制。或者由于特定成像过程需经过中子散射,使得测量过程极其昂贵。又或者传感过程十分缓慢,人们只能在IMR中对目标进行有限次测量。诸如此类。
这些情况蕴含重要的问题。是否只能在m<<n时才能精确重建?是否可能设计m<<n的传感波形来获取几乎全部的关于f的信息?人们如何能够由这些信息得到近似的f?诚然,这种情况看起来很让人畏缩,因为这样就需要求解线性待定方程组。用A表示m×n的传感矩阵,以矢量为一行(是a的复变换),当m<n时,从中恢复的过程一般是不稳定的:满足的信号有无穷多。但是我们或许能够依靠目标f存在的实际模型,来找出一种解决办法。香农定理告诉我们,,如果f(t)带宽实际上很低,那么少量的采样就能满足恢复的需要。下文我们就将看到,信号恢复实际上可以在更宽的信号模式上成功。
非连续及稀疏信号传感
本部分展示CS理论包含的两个基本前提:稀疏和间断性。
稀疏
当以适当的基础表达时,许多自然信号有着简明的表示。例如,在图1(a)中的图片和它在(b)中的小波变换。虽然几乎所有的图片像素都为非零值,波形系数提供了一个简明的摘要:大部分系数都很小,因而少数相对较大的系数就包含了大部分信息。
波形参数
图1:(a)一个原始百万像素图像,像素为[0,255],(b)它的波形参数变换(为增强清晰度而随机扩展)。相对来说少量波形参数获得了大部分信号能量;许多这类图像可以深度压缩。(c)对除了25000较大值的小波形扩展参数进行清零而完成重构后的图片(像素值为[0,255])。几乎看不出与原始图片有差别。正如我们在“采样过疏和稀疏信号重建”中描述的,图片可以仅依靠96,000个非连续测量实现完美的重建。
从数学上讲,我们有一个矢量(例如图1中的图像像素),可将其在规范正交基(例如小波基)Ψ=[]内扩展如下:
(2)
这里x是f的一项参数,。可以方便的将f表示为(Ψ是以为一列的n×n矩阵)。稀疏的含义现在清楚了:当信号扩展时,我们可以将较小的参数丢弃而不会有大的误差。一般认为,通过保持与式(2)中的最大值S的相应关系,可以得到。根据定义,,在此及下文,是参数的矢量,S的最大值设定为零。这个矢量严格的说是稀疏的,它的少数值为零;在S几乎为非零值时,将这些目标称为S-稀少。既然Ψ是标准正交基,我们有,如果x是稀疏或可压缩的衰减很快,那么x就由很好的近似,因此,的误差很小。简单说来,我们可以舍弃一大部分参数而没有较大误差。图1(c)展示了一个例子,舍弃了97.5%的参数而获得的近似图像,同原百万像素图片几乎分辨不出差别。
这个规则构成了现代有损编码标准,如JPEG2000以及其他标准,数据压缩的一个很简单的方法就可以从f计算出x,然后把重要参数S的位置、大小进行编码。这样一个过程需要知道参数x所有的n,重要信息的位置可能提前并不知道(它们依赖于信号);在我们的例子中,它们一般唯一图像的边缘。更普遍的是,稀疏是一个基本建模工具,它允许高效的基本信号变换;例如,准确的统计学估计和分类,高效数据压缩等等。本文是关于更加令人震惊而深远的影响,然而,稀疏在获得程序本身上有重要的支持作用。稀疏决定究竟多么高效地非自适应地获得信号。
间断性采样
假设我们有一对属于的正交的(、)。第一个用于传感式(1)中的目标f,第二个用于表示f。对这对正交基的限制并不是必须的,仅仅会简化我们的研究。
定义一
和之间的连系是:
式(3)
在通俗英语中,相关性度量和的任何元素之间关系;也可见[5]。如果和包含相关的元素,相关性就大。否则就小。不管多大多小,它都按照线性代数的规定。
压缩采样主要被认为是低相关的,我们这就给出这样的例子。在我们的第一个例子中,是标准基,而是傅里叶基,。由于是传感矩阵,对应在时域和空间域的经典采样方法。时间-频率遵守,因此,我们可以有最大化的间隔。还有,锥形和正弦曲线在多个方面达到最大化间隔,
我们的第二个例子用小波形、noiselets表示。这里,Noiselets和Harr小波之间的一致性为,Noiselets与Daubechies D4和 D8小波间的一致性分别为2.2,2.9。这也可以延伸到更高的维数。(Noiselets与Spikes,傅里叶基同样达到最大非一致性)。我们对Noiselets的兴趣来自以下事实(1)它们与提供图像数据和其他类型数据稀疏表达的系统有非一致性(2)它们来自快速算法;Noiselet变换运行时间为o(n)时间,正如傅里叶变换,Noiselets矩阵不必存储成向量应用。这对于CS有效的数值计算是至关重要的。
最后,随机矩阵与任何固定基间均有较大的非一致性。均匀随机的选择一个正交基,这可以通过独立均匀的在单位球面上采样n个正交化的向量得到。然后很大概率上,和间的一致性大约为。还有,具有独立同分布项(i.i.d.)的随机波形(),高斯或者二值项,将与任意固定表述之间具有较低的一致性。注意这里很奇怪的指示;如果非相干系统的传感很好,那么高效的机制应当取得与随机小波形的相互关系,例如白噪声!
采样过疏及稀疏信号重建
理想的,我们想测量f的所有n个系数,但是我们只能观测这些数据的子集,并获取数据 (4)
其中是m<n的子集。有了这样的信息,我们决定通过范数最小恢复信号;提出的重建为,其中是凸面最优规划的解( )
服从 (5)
这就是说,在所有与数据组成目标中,我们选择范数最小的系数序列。(众所周知,最小的服从线性方程约束,如同线性方程使得更多的有效运算法则达到应用一样,改进非常容易。)
使用范数作为稀疏促进方程可以追溯到几十年前。一个早期的应用是反射地震学,从数据组[7],[8]中寻找出稀疏反射函数(标志着地层中有意义的变化)。然而最小化范数不是恢复稀疏结果的唯一方法,其他方式比如贪婪算法[9]也已经提出了。
我们的第一个结果断言,当f足够稀疏时,经过范数最小的恢复是准确的。
原理1[10]
固定,假设在基下f的系数序列x是S稀疏的。在域均匀随机的选择m个测度。然后如果
(6)
对于正常量C,(5)的解在极大概率下是准确的。(如果,那么成功的可能性就会超过1-。)还有,结果只是保证几乎所有信号x序列有固定支点,详见[10]。
我们作三个注释:
(1)一致性的角色是非常显然的;一致性越小,需要的样本越小,因此我们的重点在前面部分的低一致性系统。
(2)我们可以无损的利用任意m个系数,这些系数可能远小于信号大小显然需要的。如果等于或者接近1,那么按足够样本Slogn顺序的代替n。
(3)通过最小化凸面函数,信号f可以从我们压缩的数据中准确恢复,这个函数没有假设关于非零坐标x的任何先验信息,他们的位置,或他们的幅度我们假设全部没有先验知识。我们只是运行算法,如果信号正好是足够稀疏的,那么精确恢复就可实现。
这个定理事实上表明了一个具体的获取协议:在非一致域中非自适应的采样,在采样后调用线性规划。按照这样的协议将获取到具有压缩形式的信号。我们需要的是一个解码器去解压数据,这是最小范数的角色。
事实上,这个非一致采样理论拓展了早期关于稀疏信号采样的结果[1],表明随机1)可以成为一个非常有效的传感机制,2)经得起严密论证的考验,因而这触发了很多我们见到的、现在仍然见证的CS发展者。假设我们对采样超宽带信号但是谱稀疏形式,t=0,…,n-1,感兴趣,其中n很大但是非零项的数量小于等于S(我们可以想的比较小)。我们不知道在哪些频率上是活跃的,而且不知道其幅度。因为活跃集合不一定是连续整数的子集,奈奎斯特/香农采样定理很可能没有用(因为无法在初始时限制带宽,可能导致所有的n时间采样都是需要的)。在这种特定情形下,原理1主张我们可以重建具有任意未知频率支撑集S的信号,利用Slogn时间采样顺序,见【1】。更多的是,这些采样是不必仔细选择的;几乎任何具有这样采样集合大小的采样都可以。图2显示了一个实例。对于这方面的其他类型使用完全不同的观点,见【11】【12】。
图2(a)一个稀疏真实取值信号(b)由最小60傅里叶系数(复值)重建后。重建是准确的。(c)通过用范数取代范数完成最小能量重建;和有许多不同答案。的解并不提供一个合理的原信号近似。
现在是讨论以上内容中概率角色的时候了。关键是为了得到有用而且有说服力的结果,我们需要诉诸于概率,因为我们不能希望所有大小为m的测量集合都有合适的结果。这就是原因。存在着位于域内,几乎处处消失的稀疏信号。换句话说,我们可以找到稀疏信号f和规模几乎为n(例如n-S)的大量子集,对于满足。感兴趣的读者可能想检查在【13】【11】中讨论的狄拉克梳子实例。一方面,给定这样的子集,我们看到一串0,没有算法可以重建信号。另一方面,理论保证集合的小部分精确恢复不发生的概率是可以忽略的(n的一个巨大负极能量)。这样,我们只需要忍受一个很小的失败概率。对于实际应用,假设采样数量足够大,那么失败的概率基本为0.
有趣地是,对于特定稀疏信号的研究表明我们至少需要阶采样。(我们的确知道,在时域存在着2S的子集,它们能在频域重建任意S稀疏信号。仅仅抽取2S连贯时间点,实例参见“什么是采样压缩”以及【11】【12】。但这不是我们所要表述的。我们想让大多数确定型号提供精确重建。)如果采样更少,信息损失的概率会很高,重建算法无论多么复杂,都是不可能完成的。总结来说,当一致性为1时,我们不需要多于采样,但是也不能更少。
我们采用一个非一致性采样的例子总结这一部分,考虑图1(c)所示的稀疏图像,我们发现它只有25000个非零小波系数。我们然后通过采取96000非一致测量(我们推荐读者到[10]中看测量细节)并且求解(5)获取图像。最小化重建十分成功;。这个实例表明大约4倍于稀疏系数的采样是足够的。很多研究人员都在实验中得出了相同结论。这就是著名的4-1实际规则,对于精确恢复,我们至少需要大约4倍的非一致采样。
完全压缩采样
我们已经展示可以利用少量的测量恢复稀疏信号,但是为了真正有说服力,CS需要能够处理近稀疏信号和具有噪声的信号。首先,感兴趣的普通物体都是近似稀疏而不是准确稀疏。这里的问题是,利用高度稀疏采样测量,能不能获得这些物体准确的重建。其次,在任何实际应用中,测量数据将总是至少受到少量噪声的干扰,因为感知设备不可能是无限精度的。因此CS需要对于这样的非理想情形具有完全适应能力。总结为一点,数据中的小扰动应该引起重建中的小扰动。
这部分同时调查这两件事情。在我们开始之前,然而,考虑恢复信号的抽象问题将会使研究简化 ,矢量来自数据 y=Ax+z, (7)
其中A为传感矩阵,给我们关于x的信息,z为随机或者确定性未知误差项。上一部分的设置利用这种形式表述,因为和 (R为M中提取中采样坐标的矩阵)。可以写为y=Ax,其中。因此,我们可以处理抽象模型(7),考虑着x是物体在合适基下的系数序列。
受限制的等距性
在这一部分,我们引入一个关键的表示,这个表示被证明是研究CS中一般鲁棒性的有效工具;所谓的受限制的等距特性(RIP)[15]。
定义2
对于每一个整数S=1,2…,定义矩阵A的等距常量为满足下式的最小数字,对于所有的s稀疏向量都满足。
(8)
我们将宽松地说矩阵A服从s阶的RIP如果不是非常接近1。当具有这个特性的时候,A矩阵近似保存了s稀疏信号的欧几里得长度,这意味着s稀疏向量不能在矩阵A的零空间中(这是有用的,否则无法重建这些向量)。一个等价的RIP描述是来自矩阵A的所有s列子集,事实上几乎正交。(因为矩阵的列比行多,矩阵A的列不会精确正交。)
为了看到RIP与CS之间的联系,设想我们用矩阵A获得S稀疏信号。首先假设远小于1。这表示所有两个S稀疏信号间的距离必须在测量空间很好的维持。这就是,
对所有的S稀疏信号矢量,。正如下文所说,这个促进性的事实保证了高效的,完全的,用于鉴别基于压缩测量S稀疏信号的算法。
从稀疏采样数据的一般信号恢复
如果满足RIP特性,那么通过求解下面的线性规划,得到的重建是准确的: 服从于 (9)
原理2([16])
假设,那么(9)的解满足
, 和
(10)
对于某个常数,其中是将向量x中除最大的S成分外,全部设置为0。(正如所言,这个结果是由于第一作者【17】和尚未出版的,参见【16】【18】。)
原理2的结论比原理1的结论强。如果向量x是S稀疏的,那么向量x=,因此,重建是准确的。但是这个新原理处理所有的信号。如果向量x不是S稀疏的,那么如果我们事先知道S最大值的位置x并且决定直接测量,(10)就可断言重建的信号的质量会很好。换句话说,重建就像预言般一样好,具有完善的关于x的信息,将为我们提取S最重要的信息。
另一项与之前结果不同的显著结果是它是确定性的;它不涉及概率。如果我们幸运的拥有一个满足原理假设条件的感知矩阵A,我们可以应用它,我们保证可以恢复所有S稀疏向量,当然是S最大向量,不存在失败的概率。
在这一点上,缺失的是S(可以有效恢复的分量数量)服从假设与观测数量m或者矩阵行数的关系。为了得到强大的结果,我们想寻找满足RIP具有S值接近m的矩阵。我们能设计这样的矩阵吗?在下面一部分,我们将证明这是可能的,但是首先我们将验证CS对数据污染的鲁棒性。
从噪声数据中鲁棒的恢复信号
我们给定(7)中描述的噪声数据,使用具有松弛约束的最小进行重建: 服从于 (11)
其中e限制了数据中噪声的强度。(也可以考虑诸如过滤选择器【19】,或由Haupt 和 Nowak [20]提出的组合最优化程序;当噪声为高斯有限变化时,这两种算法都能得出可靠结果。)问题(11)也可以在[21]后称为LASSO;见[22]。按照我们最好的理解,这是在[8]中首次引入的。这又是一个Convex问题,(一个二阶锥规划问题)存在很多有效的算法求解。
原理3([16])
假设,那么(11)的解,对于某个常量和满足
, (12)
(这个理论同样未被发表,他是【16】中结果的一个变形。)
这很难再简化。重建误差受到两项和的限制。第一项是没有噪声时发生的误差,第二项与噪声水平成正比。进一步,常数和一般较小。对于 的例子,和。图3显示了对于噪声干扰数据的重建。
原始信号重建
图3信号x(水平轴)通过【11】获取了它的恢复(垂直轴)。在这个例子中,n=512,m=256。信号是64稀疏的。在模型【17】,传感矩阵是i.i.d.N(0,1/m),z是调整后的高斯白噪声矢量,。这里 。
这个最后的结果将CS建立为实用而且有效的感知机制。它是鲁棒的。因为它不仅可以处理各类不一定稀疏的信号,而且很好的能够处理噪声信号。尚待完善的是设计有效的感知矩阵来满足RIP。这是下一部分讨论的内容。
随机感知
回到RIP的定义,我们想寻找具有任选列向量子集近似正交的感知矩阵。这些子集越大越好。
这里随机性再次进入画面。考虑一下感知矩阵:
1) 通过在空间的单位球上均匀随机采样n个列向量形成;
2) 通过从A采样具有零均值,方差为1/m的正态分布独立同分布形成;
3) 通过从A采样随机投影 P作为间断采样,并将其标准化为;
4) 通过采样对称二项分布(P)或者其他子高斯分布。
然后以压倒性优势的概率,所有这些矩阵服从RIP(例如我们定理的条件),满足 (13)
其中C是依赖于每一个情形的常数。1)2)3)使用概率论中相当标准化的结果;对于4)则更加精妙一些,参见[23][24]。所有这些实例中,采样到满足(13)而不满足RIP的矩阵的概率是m的指数次小。有意思的,无论如何给出定理2的结论并采用少于(13)左端的采样[2][3],也不存在测量矩阵和重建算法。这样,使用上面的传感矩阵以及最小,是一种近似最优感知策略。
我们可以采用第三部分中的正交基对,在“不连续传感稀疏信号”建立RIP。对于,R随机抽取m个坐标,可以得到
(14)
使得RIP很大概率上保证,见[25][2]。如果要求失败的概率不大于0(),对于某个>0,然后(14)已知的最好的指数是5而不是4([14]中只有logn)。这证明可以稳定而且精确的,从非一致域的未采样数据中重建几乎稀疏的信号。
最后,RIP仍然有感知矩阵,其中为任意正交基,是从适当分布中随机抽取的测量矩阵。如果固定基,利用1)-4)组装测度矩阵,那么很大概率上,矩阵服从RIP特性,并满足(13),其中C为依赖于每一情形的常数。这些随机观测矩阵,在某种意义下是通用的[23];即使设计观测系统的时候,稀疏基也不必已知。
什么是压缩采样?
典型的数据获取过程如下:搜集到大量的数据,在压缩阶段大部分数据被丢弃,这对于存储和传输目的是必须的。用本文的语言讲,我们获得一个高分辨率像素阵列f,计算传输系数的完整集合,编码最大的系数并除去其他系数,本质上以告终。这种大量获取数据,然后压缩的过程相当浪费(可以设想具有百万像素的数码相机,像素,最后编码图片之使用几百KB)。
CS操作则不同了,它是“如果能够直接获取感兴趣物体的重要信息”。通过采取0()随机投影如“随机传感”,我们拥有足够的信息重建信号,具有的精度和提供的一样;目标有最好的S近似,最好的压缩表示。换句话说,CS数据获取协议本质上,将模拟数据翻译为已压缩的数字信号形式,最起码在原理上,从少数传感器获取已压缩信号。在获取步骤后,需要的是解压观测的数据。
CS与编码理论中的观点有一些表面上的相似性,正似里-所罗门理论(RS)与实践[26]。简而言之在本文内容中,我们可以将编码理论中的观点改写过来:我们可以采用其前2S个傅里叶系数 ,k=0,1,2,…,2S-1,唯一的重建任意S稀疏信号,或者利用任意2S个连续频率(恢复问题的计算成本为求解一个 Toeplitz系统和取一个n点傅里叶变形)。这是否意味着我们可以利用这个技术感知可压缩信号呢?答案是否定的,主要的两个原因如下。首先,RS解码是一个算术技术,不能处理非稀疏信号(解码通过求解多项式求根);第二,寻找信号的支撑的问题-即使当信号准确稀疏时-从前2S个傅里叶系数是格外病态的(问题如同利用高度聚簇的少量数据外推一个高自由度的多项式)。这些系数的小扰动将给出完全不同的结果,这样对于有限精度数据,可信赖的支撑集估计实践上是不可能的。尽管完全代数方法忽略了信息操作符的条件作用,拥有良好条件矩阵,对于精确估计是必须的,这是CS中的核心考虑,正如RIP扮演的角色。
应用
事实上可压缩信号可以通过与其信息级成比例的,非一致性测量有效采集,这意味着大量可能的应用。
n 数据压缩。在某些情形下,稀疏基在解码端可能是未知的,或者对于数据压缩来说是难以实际执行的。正如我们在“随机传感”讨论的,然而,一个随机设计的可以被认为是一个通用的编码方案,因为它不需要根据的结构进行设计。(对于的知识和能力,只有载解码恢复的时候需要)。这种通用性对于像传感器网络[27]一类的分布式多信号编码十分有用。我们建议读者查阅Nowak和Goyal的文章中相关的讨论。
n 信道编码。正如[15]钟讨论的,CS原理(稀疏性,随机性,Convex最优化)可以转向并且应用于设计快速纠错码,以防止传输过程中出现的错误。
n 逆问题。在其他条件下,获取f的唯一方式是使用特定形态的观测系统。然而,假设信号f的稀疏基存在且与非一致,那么有效的感知是可能的。这样的应用包括MR血管造影术[1]和其他类型的MR设置[28],其中记录了傅里叶变换的子集,需要的图像f在时域或者小波域是稀疏的。Lustig等人更加深刻的讨论了这个问题。
n 数据获取。最后,在某些重要条件下,对于模拟信号完全采集n个离散时间样本是困难得(可能对于随后的压缩也是困难的)。这里,设计直接记录离散、低码率的非一致性观测是有益的。
最后这些应用表明,数学和计算方法可以在常规的硬件设计具有显著限制的领域,发挥重要的作用。例如,使用CCD或者CMOS的常规成像设备,被限制在感知可见光光谱。然而,一个CS相机使用数字微镜阵列采集非一致测量(只需要一个感光元器件而不是百万个),可以显著的拓展这些特性。(参见【29】)
沿着同样的思路,我们的部分研究注重在对于宽带信号进行“模拟---信息”转换得设备(见Healy等人的文章)。我们的目标是减轻对于常规ADC技术的压力,现在受限制到采样率为1GHZ。作为一个选项,我们提出了两种用于A/I的特定结构,在其中离散、低码率非一致测量序列从宽带模拟信号采集而来。在很大程度上近似,每一个测量值可以解释为入射模拟信号f与模拟测量波形的内积c。在离散CS框架下,我们的初步结果表明服,稀疏或者可压缩模型的模拟信号(在某个模拟字典)可以通过以与其信息级别,而不是奈奎斯特速率,成比例的采样率来获取。当然,我们必须提到,应用离散CS方法恢复稀疏模拟信号时面临的挑战。对于这些事情的彻底讨论超过了本文的范围,作为一个初步研究,我们可以简单的接受这样一个观点:在很多情况下,对于稀疏字典的离散化/采样有合适的恢复。我们的两个结构如下:
1)非均匀采样器(NUS):我们的第一个结构,简单的在随机时间点上对信号进行数字化。就是说,。有效的是,这些时间点是通过位于规则格子上的点低速采样而得到的。由于冲击函数与正弦函数之间的非一致性,这种结构可以用于采样稀疏频谱在奈奎斯特速率之下的信号。这样可以带来很大的好处,包括降低采样率,增加电路设置时间,降低噪声等级。
2)随机预先综合调整(RMPI)。我们的第二种结构适用于更为广泛的稀疏域,最值得注意的是,那些在时间-频率平面具有稀疏特性的信号。尽管不大可能用很高的速率数字化模拟信号,却非常有可能在很高的码率改变其极性。RMPI结构的想法(见图4(a))是将信号与1的伪随机序列相乘,在时间窗口上对积进行积分,数字化每一个时间段内的积分。这是一个并行结构,我们可以并行运行多个乘法器-积分器对,它们采用独特的或者几乎独立的伪随机信号序列。事实上,RMPI结构将信号与序列进行相关,其中的一个随机CS测量过程是通用的,因此RMPI测量将会同任何固定时间-频率字典——比如下文描述的加伯字典——都不连贯。
对于以上任何一种结构,我们已经在数字上(某些情况下物理上)确信,这样的系统对于受到热噪声、时钟误差、干涉和放大器非线性影响的非理想电路是具有鲁棒性的。
图4模拟-信息变换。(a)随机预先综合调整系统(RMPI)(b)原始双脉冲信号(蓝色)和从随机1测试经过1综合后的重建信号(红色)(c)经过1分析后重新测定的双脉冲信号及其恢复信号
A/I结构在实际获取场景中的应用,将要求CS算法和理论的继续发展,包括模信号的合适的稀疏表示集合。我们用一个离散实例进行总结,强调一些最近的有前景的方向。对于这个实例,我们选择一个长度n为512点包含2个调制脉冲的1维信号f(见图4(b)蓝色曲线)。从这个信号,我们采集m=30次测量,应用一个由独立同分布的1贝努力项组成的观测矩阵。这是不合理的少量数据,对应着为超过17的采样因子。对于重建,我们考虑一个时频加伯基,包含了大量受到高斯窗限制的正弦波形,具有不同的位置和尺度。全面地字典近似43超完成,并且不包含组成f的两个脉冲。图4(b)的红色曲线显示了最小化的结果。重建结果明显很差,我们看到。然而,我们可以通过对于恢复程序的两项改变来优化结果。首先我们代之以最小化,并服从(这项改变在为正交基时没有影响)。其次,在得到一个估计后,我们改变范数的权值并进行重建,低的惩罚施加于我们希望比较大的系数上。图4(c)的显示了四次变权值循环后的结果;我们看到。我们建议读者可以从[30]中获得更多的关于这些方向的信息。这里的一点是即使数据量相当小,我们仍然获得了信号中包含的大部分信息。总而言之,这就是CS对于现在和将来的应用具有广阔前景的原因。
展开阅读全文