1、个人收集整理 勿做商业用途第3章 DSP芯片的定点运算3.1 数 的 定 标在定点DSP芯片中,采用定点数进行数值运算,其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长,一般为16位或24位。显然,字长越长,所能表示的数的范围越大,精度也越高。如无特别说明,本书均以16位字长为例。DSP芯片的数以2的补码形式表示.每个16位数用一个符号位来表示数的正负,0表示数值为正,1则表示数值为负。其余15位表示数值的大小.因此二进制数0010000000000011b8195二进制数1111111111111100b-4对DSP芯片而言,参与数值运算的数就是16位的整型
2、数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,DSP芯片是如何处理小数的呢?应该说,DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢?当然不是.这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。从表3.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如:16进制数2000H8192,用Q0表示16进制数2000H0
3、.25,用Q15表示但对于DSP芯片来说,处理方法是完全相同的。从表3。1还可以看出,不同的Q所表示的数不仅范围不同,而且精度也不相同。Q越大,数值范围越小,但精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是32768到+32767,其精度为1,而Q15的数值范围为1到0。9999695,精度为 1/32768 = 0。00003051。因此,对定点数而言,数值范围与精度是一对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。在实际的定点算法中,为了达到最佳的性能,必须充分考虑到这一点。浮点数与定点数的转换关系
4、可表示为:浮点数(x)转换为定点数():定点数()转换为浮点数(x):例如,浮点数 x=0.5,定标 Q15,则定点数,式中表示下取整.反之,一个用 Q15 表示的定点数16384,其浮点数为163842-1516384/32768=0.5。表3。1 Q表示、S表示及数值范围Q表示S表示十进制数表示范围Q15S0.15-1X0.9999695Q14S1。14-2X1.9999390Q13S2.13-4X3.9998779Q12S3。12-8X7.9997559Q11S4。1116X15.9995117Q10S5。1032X31.9990234Q9S6.9-64X63。9980469Q8S7.8
5、-128X127.9960938Q7S8。7256X255。9921875Q6S9.6-512X511。9804375Q5S10.5-1024X1023.96875Q4S11。42048X2047。9375Q3S12。34096X4095.875Q2S13.28192X8191。75Q1S14.116384X16383.5Q0S15。0-32768X327673。2 高级语言:从浮点到定点在编写DSP模拟算法时,为了方便,一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数,又有浮点数。如例3。1程序中的变量i是整型数,而pi是浮点数,hamwindow则是浮点数组。
6、例3。1 256点汉明窗计算inti;floatpi=3。14159;floathamwindow256;for(i=0;i256;i+) hamwindowi=0。540.46*cos(2.0pi*i/255);如果要将上述程序用某种定点DSP芯片来实现,则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能,在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现方法。3.2.1 加法/减法运算的C语言定点模拟设浮点加法运算的表达式为:float x,y,z;z=x+y;将浮点加法/减法转化为定点
7、加法/减法时最重要的一点就是必须保证两个操作数的定标值一样.若两者不一样,则在做加法/减法运算前先进行小数点的调整。为保证运算精度,需使Q值小的数调整为与另一个数的Q值一样大。此外,在做加法/减法运算时,必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度。1结果不超过16位表示范围设x的Q值为Qx,y的Q值为Qy,且QxQy,加法/减法结果z的定标值为Qz,则zx+y = 所以定点加法可以描述为:int x,y,z;long temp;/*临时变量*/tempy(QxQz)), 若QxQzz(int)(temp(QzQx), 若Q
8、xQz例3.2 定点加法设x0.5,y3。1,则浮点运算结果为zx+y0.5+3.13.6;Qx15,Qy13,Qz13,则定点加法为:x16384;y25395;temp253952)29491;因为z的Q值为13,所以定点值z29491即为浮点值z29491/81923。6。例3.3 定点减法设x3.0,y3.1,则浮点运算结果为zxy3.03.1-0。1;Qx13,Qy13,Qz15,则定点减法为:x24576;y25295;temp25395;tempxtemp24576-25395-819;因为QxQz,故 z(int)(-819Qy,加法结果z的定标值为Qz,则定点加法为:int
9、x,y;long temp,z;tempy(QxQz),若QxQzztemp32767,因此Qx1,Qy0,Qz0,则定点加法为:x30000;y20000;temp20000 (Qx+QyQz);例3.5 定点乘法设x = 18。4,y = 36.8,则浮点运算值为z =18.436.8 = 677.12;根据上节,得Qx = 10,Qy = 9,Qz = 5,所以x = 18841;y = 18841;temp = 18841L;z = (18841L*18841)(10+95) = 354983281L14 = 21666;因为z的定标值为5,故定点 z = 21666即为浮点的 z =
10、 21666/32 = 677.08.3。2。3 除法运算的C语言定点模拟设浮点除法运算的表达式为:float x,y,z;z = x/y;假设经过统计后被除数x的定标值为Qx,除数y的定标值为Qy,商z的定标值为Qz,则z = x/y = 所以定点表示的除法为:int x,y,z;long temp;temp = (long)x;z = (temp(QzQx+Qy))/y;例3.6 定点除法设x = 18.4,y = 36。8,浮点运算值为z = x/y = 18。4/36。8 = 0。5;根据上节,得Qx = 10,Qy = 9,Qz = 15;所以有x = 18841, y = 1884
11、1;temp = (long)18841;z = (18841L(15-10+9)/18841 = 308690944L/18841 = 16384;因为商z的定标值为15,所以定点z = 16384即为浮点 z = 16384/215= 0.5.3.2。4 程序变量的Q值确定在前面几节介绍的例子中,由于x、y、z的值都是已知的,因此从浮点变为定点时Q值很好确定。在实际的DSP应用中,程序中参与运算的都是变量,那么如何确定浮点程序中变量的Q值呢?从前面的分析可以知道,确定变量的Q值实际上就是确定变量的动态范围,动态范围确定了,则Q值也就确定了。设变量的绝对值的最大值为,注意必须小于或等于327
12、67。取一个整数n,使它满足则有Q = 15-n例如,某变量的值在1至1之间,即1,因此n = 0,Q15n = 15。确定了变量的就可以确定其Q值,那么变量的又是如何确定的呢?一般来说,确定变量的有两种方法:一种是理论分析法,另一种是统计分析法。1理论分析法有些变量的动态范围通过理论分析是可以确定的.例如:(1) 三角函数,y = sin(x)或y = cos(x),由三角函数知识可知,y|1;(2) 汉明窗,y(n) = 0.540.46cos 2pn/(N-1) ,0nN1。因为-1cos 2pn/(N1)1,所以0。08y(n)1.0;(3) FIR卷积.y(n)=,设,且x(n)是模
13、拟信号12位量化值,即有 211,则211;(4) 理论已经证明,在自相关线性预测编码(LPC)的程序设计中,反射系数满足下列不等式:,i= 1,2,,p, p为LPC的阶数.2统计分析法对于理论上无法确定范围的变量,一般采用统计分析的方法来确定其动态范围。所谓统计分析,就是用足够多的输入信号样值来确定程序中变量的动态范围,这里输入信号一方面要有一定的数量,另一方面必须尽可能地涉及各种情况。例如,在语音信号分析中,统计分析时就必须采集足够多的语音信号样值,并且在所采集的语音样值中,应尽可能地包含各种情况,如音量的大小、声音的种类(男声、女声) 等。只有这样,统计出来的结果才能具有典型性。当然,
14、统计分析毕竟不可能涉及所有可能发生的情况,因此,对统计得出的结果在程序设计时可采取一些保护措施,如适当牺牲一些精度,Q值取比统计值稍大些,使用DSP芯片提供的溢出保护功能等。3。2。5 浮点至定点变换的C程序举例本节通过一个例子来说明C程序从浮点变换至定点的方法.这是一个对语音信号(0。3kHz3。4kHz)进行低通滤波的C语言程序,低通滤波的截止频率为800Hz,滤波器采用19点的有限冲击响应FIR滤波。语音信号的采样频率为8kHz,每个语音样值按16位整型数存放在insp。dat文件中。例3。7 语音信号800Hz 19点FIR低通滤波C语言浮点程序include stdio。hconst
15、 int length = 180/*语音帧长为180点22.5ms8kHz采样*/void filter(int xin ,int xout ,int n,float h ); /*滤波子程序说明/*19点滤波器系数*/static float h19=0。01218354,-0.009012882,-0。02881839,-0。04743239,-0。04584568,0。008692503,0。06446265,0。1544655,0.2289794,0。257883,0。2289794,0.1544655,0。06446265,-0。008692503,0。04584568,-0.04
16、743239,0。02881839,-0.009012882,0。01218354;static int x1length+20;/低通滤波浮点子程序*/void filter(int xin ,int xout ,int n,float h )int i,j;float sum;for(i=0;ilength;i+) x1n+i-1=xini;for (i=0;ilength;i+)sum=0。0;for(j=0;jn;j+) sum+=hj*x1i-j+n-1;xouti=(int)sum;for(i=0;i(n1);i+) x1ni-2=xinlength1i;/主程序*/void ma
17、in( )FILE *fp1,*fp2;int frame,indatalength,outdatalength;fp1=fopen(insp.dat,rb”);/*输入语音文件/fp2=fopen(outsp。dat,wb);/滤波后语音文件*/frame=0;while(feof(fp1)=0)frame+;printf(”frame=dn,frame);for(i=0;ilength;i+) indatai=getw(fp1); /取一帧语音数据/filter(indata,outdata,19,h);/调用低通滤波子程序/for(i=0;iconst int length=180;vo
18、id filter(int xin ,int xout ,int n,int h );static int h19=399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450, 7503,5061,2112,-285,1503,-1555,-945,-296,399; /*Q15*/static int x1length+20;/*低通滤波定点子程序*/void filter(int xin ,int xout ,int n,int h )int i,j;long sum;for(i=0;ilength;i+) x1n+i1=xini;for (i=0
19、;ilength;i+)sum=0;for(j=0;j15;for(i=0;i(n-1);i+) x1n-i-2=xinlength-i-1;主程序与浮点的完全一样。3.3 DSP定点算术运算定点DSP芯片的数值表示是基于2的补码表示形式。每个16位数用1个符号位、i个整数位和15-i个小数位来表示。因此数00000010.10100000表示的值为=2.625,这个数可用Q8格式(个小数位)来表示,它表示的数值范围为128+127.996,一个Q8定点数的小数精度为1/256=0.004。虽然特殊情况(如动态范围和精度要求)必须使用混合表示法,但是,更通常的是全部以Q15格式表示的小数或以Q
20、0格式表示的整数来工作.这一点对于主要是乘法和累加的信号处理算法特别现实,小数乘以小数得小数,整数乘以整数得整数.当然,乘积累加时可能会出现溢出现象,在这种情况下,程序员应当了解数学里面的物理过程以注意可能的溢出情况。下面讨论乘法、加法和除法的DSP定点运算,汇编程序以TMS320C25为例。3。3。1 定点乘法2个定点数相乘时可以分为下列3种情况:1小数乘小数Q15Q15Q30例3。9 0.50.5 = 0.250.100000000000000;Q150。100000000000000;Q1500.010000000000000000000000000000=0。25 ;Q302个Q15的
21、小数相乘后得到1个Q30的小数,即有2个符号位。一般情况下相乘后得到的满精度数不必全部保留,而只需保留16位单精度数.由于相乘后得到的高16位不满15位的小数精度,为了达到15位精度,可将乘积左移1位,下面是上述乘法的TMS320C25程序:LTOP1;OP1=4000H(0.5/Q15)MPYOP2 ;OP2=4000H(0.5/Q15)PACSACHANS,1;ANS=2000H(0。25/Q15)2整数乘整数Q0Q0 = Q0例3.10 17(5)=-850000000000010001=171111111111111011=-511111111111111111111111110101
22、011=-853混合表示法许多情况下,运算过程中为了既满足数值的动态范围又保证一定的精度,就必须采用Q0与Q15之间的表示法。比如,数值1.2345,显然Q15无法表示,而若用Q0表示,则最接近的数是1,精度无法保证。因此,数1。2345最佳的表示法是Q14。例3。11 1.50。75 = 1。12501。10000000000000 = 1.5 ;Q1400.11000000000000 = 0.75 ;Q140001.0010000000000000000000000000 = 1。125;Q28Q14的最大值不大于2,因此,2个Q14数相乘得到的乘积不大于4。一般的,若一个数的整数位为
23、i位,小数位为 j 位,另一个数的整数位为 m 位,小数位为 n 位,则这两个数的乘积为 ( i + m )位整数位和(j + n)位小数位.这个乘积的最高16位可能的精度为( i + m )整数位和(15 - i - m)小数位。但是,若事先了解数的动态范围,就可以增加数的精度。例如,程序员了解到上述乘积不会大于1。8,就可以用Q14数表示乘积,而不是理论上的最佳情况Q13。例3.11的TMS320C25程序如下:LTOP1;OP1 = 6000H(1。5/Q14)MPYOP2;OP2 = 3000H(0。75/Q14)PACSACHANS,1;ANS2400H(1.125/Q13)上述方法
24、为了保证精度均对乘的结果舍位,结果所产生的误差相当于减去1个LSB(最低位)。采用下面简单的舍入方法,可使误差减少二分之一.LTOP1MPYOP2PACADDONE,14(上舍入)SACHANS,1上述程序说明,不管ANS为正或负,所产生的误差是1/2 LSB,其中存储单元ONE的值为1。3.3。2 定点加法乘的过程中,程序员可不考虑溢出而只需调整运算中的小数点.而加法则是一个更加复杂的过程。首先,加法运算必须用相同的Q点表示;其次,程序员或者允许其结果有足够的高位以适应位的增长,或者必须准备解决溢出问题。如果操作数仅为16位长,其结果可用双精度数表示。下面举例说明16位数相加的两种途径。1保
25、留32位结果LACOP1;(Q15)ADDOP2;(Q15)SACHANSHI;(高16位结果)SACLANSLO;(低16位结果)2调整小数点保留16位结果LACOP1,15;(Q14数用ACCH表示)ADDOP2,15;(Q14数用ACCH表示)SACHANS;(Q14)加法运算最可能出现的问题是运算结果溢出。TMS320提供了检查溢出的专用指令BV,此外,使用溢出保护功能可使累加结果溢出时累加器饱和为最大的整数或负数。当然,即使如此,运算精度还是大大降低.因此,最好的方法是完全理解基本的物理过程并注意选择数的表达方式.3.3.3 定点除法在通用DSP芯片中,一般不提供单周期的除法指令,为
26、此必须采用除法子程序来实现.二进制除法是乘法的逆运算.乘法包括一系列的移位和加法,而除法可分解为一系列的减法和移位.下面来说明除法的实现过程。设累加器为8位,且除法运算为10除以3.除的过程就是除数逐步移位并与被除数比较的过程,在每一步进行减法运算,如果能减则将位插入商中。(1) 除数的最低有效位对齐被除数的最高有效位。000010100001100011110010(2) 由于减法结果为负,放弃减法结果,将被除数左移一位再减。000101000001100011111000(3) 结果仍为负,放弃减法结果,被除数左移一位再减。001010000001100000010000(4) 结果为正,
27、将减法结果左移一位后加,作最后一次减.001000010001100000001001(5) 结果为正,将结果左移一位加1得最后结果。高位代表余数,低4位表示商.00010011即商为0011=3,余数为0001=1。TMS320没有专门的除法指令,但使用条件减指令SUBC可以完成有效灵活的除法功能。使用这一指令的唯一限制是两个操作数必须为正。程序员必须事先了解其可能的运算数的特性,如其商是否可以用小数表示及商的精度是否可被计算出来。这里每一种考虑可影响如何使用SUBC指令的问题。下面给出两种不同情况下的TMS320C25除法程序。(1) 分子小于分母DIV_A:LTNUMERAMPYDENO
28、MPACSACHTEMSGN;取商的符号LACDENOMABSSACLDENOM;使分母为正ZALHNUMERA;使分子为正ABSRPTK14SUBCDENOM;除循环15次SACLQUOTLACTEMSGNBGEZA1;若符号为正,则完成ZACSUBQUOTSACLQUOT;若为负,则商为负A1:RET这个程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN为暂存单元。(2) 规定商的精度DIV_B:LTNUMERAMPYDENOMPACSACHTEMSGN;取商的符号LACDENOMABSSACLDENOM;使分母为正LACK15ADDFRACSACLFRAC;
29、计算循环计数器LACNUMERAABS;使分子为正RPTFRACSUBCDENOM;除循环16+FRAC次SACLQUOTLACTEMSGNBGEZB1;若符号为正,则完成ZACSUBQUOTSACLQUOT;若为负,则商为负B1:RET与DIV_A相同,这个程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN为暂存单元。FRAC中规定商的精度,如商的精度为Q13,则调用程序前FRAC单元中的值应为13.3。4 非线性运算的定点快速实现在数值运算中,除基本的加减乘除运算外,还有其他许多非线性运算,如对数运算、开方运算、指数运算、三角函数运算等,实现这些非线性运算的方
30、法一般有:(1)调用DSP编译系统的库函数;(2)查表法;(3)混合法。下面分别介绍这三种方法。1调用DSP编译系统的库函数TMS320C2X/C5X 的C编译器提供了比较丰富的运行支持库函数.在这些库函数中,包含了诸如对数、开方、三角函数、指数等常用的非线性函数。在C程序中(也可在汇编程序中)只要采用与库函数相同的变量定义,就可以直接调用。例如,在库函数中,定义了以10为底的常用对数log10( ):#include math。hdouble log10(double x);在C程序中按如下方式调用:float x,y;x = 10.0;y = log10(x);从上例可以看出,库函数中的常
31、用对数log10( )要求的输入值为浮点数,返回值也为浮点数,运算的精度完全可以保证。直接调用库函数非常方便,但由于运算量大,很难在实时DSP中得到应用。2查表法在实时DSP应用中实现非线性运算,一般都采取适当降低运算精度来提高程序的运算速度。查表法是快速实现非线性运算最常用的方法。采用这种方法必须根据自变量的范围和精度要求制作一张表格.显然输入的范围越大,精度要求越高,则所需的表格就越大,即存储量也越大.查表法求值所需的计算就是根据输入值确定表的地址,根据地址就可得到相应的值,因而运算量较小.查表法比较适合于非线性函数是周期函数或已知非线性函数输入值范围这两种情况,例3.12和例3。13分别
32、说明这两种情况。例3。12 已知正弦函数y=cos(x),制作一个512点表格,并说明查表方法.由于正弦函数是周期函数,函数值在1至1之间,用查表法比较合适。由于Q15的表示范围为1至32767/32768之间,原则上讲1至1的范围必须用Q14表示。但一般从方便和总体精度考虑,类似情况仍用Q15表示,此时1用32767来表示.(1) 产生512点值的C语言程序如下所示:define N 512define pi 3.14159int sin_tab512;void main( )int i;for(i=0;i15.式中,index就是查表用的地址。例如,已知输入x= 26869,则index=
33、6,因此y=-10549。3混合法(1) 提高查表法的精度上述方法查表所得结果的精度随表的大小而变化,表越大,则精度越高,但存储量也越大。当系统的存储量有限而精度要求也较高时,查表法就不太适合.那么能否在适当增加运算量的情况下提高非线性运算的精度呢?下面介绍一种查表结合少量运算来计算非线性函数的混合法,这种方法适用于在输入变量的范围内函数呈单调变化的情形。混合法是在查表的基础上采用计算的方法以提高当输入值处于表格两点之间时的精度。提高精度的一个简便方法是采用折线近似法,如图3.1所示.仍以求以2为底的对数为例(例3.13)。设输入值为x,则精确的对数值为y,在表格值的两点之间作一直线,用y作为
34、y的近似值,则有:yy0y图3.1 提高精度的折线近似法其中y0由查表求得.现在只需在查表求得y0的基础上增加y即可。y的计算方法如下:y=(x/x0)y=x(y0/x0)式中y0/x0对每一段来说是一个恒定值,可作一个表格直接查得。此外计算x时需用到每段横坐标的起始值,这个值也可作一个表格。这样共有三个大小均为10的表格,分别为存储每段起点对数值的表logtab0、存储每段y0/x0 值的表logtab1和存储每段输入起始值x0的表logtab2,表logtab1和表logtab2可用下列两个数组表示:int logtab110=22529,20567,18920,17517,16308,
35、15255,14330,13511,12780,12124; /*y0/x0 : Q13/int logtab210=16384,18022,19660,21299,22938, 24576,26214,27853,29491,31130; /* x0: Q15/综上所述,采用混合法计算对数值的方法可归纳为:根据输入值,计算查表地址:index=((x16384)20)15;查表得y0=logtab0index;计算x=x-logtab2index;计算y(xlogtab1index)13;计算得结果y=y0+y。例3。14 已知x=0。54,求log2(x).0.54的精确对数值为y=log
36、2(0。54)=0。889。混合法求对数值的过程为:定标Q15,定标值x=0.54*32768=17694;表地址index=((x16384)20)15=0;查表得y0=logtab00=-32768;计算x=x-logtab20=17694-16384=1310;计算y(xlogtab10)13=(1310*22529L)13=3602;计算结果y=y0+y=-32768+3602=29166。结果y为Q15定标,折算成浮点数为29166/32768=-0。89,可见精度较高.(2) 扩大自变量范围如上所述,查表法比较适用于周期函数或自变量的动态范围不是太大的情形。对于像对数这样的非线性函
37、数,输入值和函数值的变化范围都很大.如果输入值的变化范围很大,则作表就比较困难。那么能否比较好地解决这个问题,既不使表格太大,又能得到比较高的精度呢?下面讨论一种切实可行的方法。设x是一个大于0。5的数,则x可以表示为下列形式:x =式中,0.5m1.0,e为整数。则求 x 的对数可以表示为:log2(x) = log2() = log2(m) + log2() = e + log2(m)也就是说,求x的对数实际上只要求 m的对数就可以了,而由于m的数值在0.51.0之间,用上面介绍的方法是完全可以实现的。例如:log2(10000) = log2(0。61035) = log2(0。6103
38、5) + 14 = 13.2877可见,如果一个数可以用比较简便的方法表示为上面的形式,则求任意大小数的对数也是比较方便的。TMS320C2X/C5X指令集提供了一条用于对ACC中的数进行规格化的指令 NORM ,该指令的作用就是使累加器中的数左移,直至数的最高位被移至累加器的第30位。例如,对数值10000进行规格化的TMS320C25程序为:LAC#10000SACLTEMPZALHTEMPLARAR1,0FHRPT14NORM*上述程序执行后,AR1=0eH,ACCH=2000(10进制)。对一个16位整数 x 进行上述程序处理实际上就是做这样一个等效变换:x = 其中,寄存器AR1包含的值为15-Q,累加器ACC高16位包含的值为,其数值在1638432768之间.例3.15 实现以2为底的对数的C定点模拟程序int logtab010-32768,28262,-24149,-20365,16862, 13600,-10549,-7683,4981,2425; /*Q15/int logtab11022529,20567,18920,17517,16308, 15