数字图像处理：部分课后习题参考答案.doc

资源描述

1、数字图像处理：部分课后习题参考答案作者：日期：2 个人收集整理勿做商业用途第一章1.连续图像中，图像为一个二维平面,(x，y）图像中的任意一点，f(x,y）为图像于(x,y）于处的值.连续图像中，（x,y）的取值是连续的,f（x,y)也是连续的数字图像中,图像为一个由有限行有限列组成的二维平面,（i,j)为平面中的任意一点，g（i,j）则为图像在（i,j)处的灰度值,数字图像中，（i，j）的取值是不连续的，只能取整数，对应第i行j列，g（i,j）也是不连续的,表示图像i行j列处图像灰度值.联系:数字图像g(i,j)是对连续图像f（x,y)经过采样和量化这两个步骤得到的。其中 g(i，

2、j)=f（x，y)x=i,y=j2. 图像工程的内容可分为图像处理、图像分析和图像理解三个层次，这三个层次既有联系又有区别，如下图所示。图像处理的重点是图像之间进行的变换。尽管人们常用图像处理泛指各种图像技术，但比较狭义的图像处理主要是对图像进行各种加工，以改善图像的视觉效果并为自动识别奠定基础，或对图像进行压缩编码以减少所需存储空间图像分析主要是对图像中感兴趣的目标进行检测和测量，以获得它们的客观信息,从而建立对图像的描述。如果说图像处理是一个从图像到图像的过程，则图像分析是一个从图像到数据的过程。这里的数据可以是目标特征的测量结果,或是基于测量的符号表示，它们描述了目标的特点和性质。图像理

3、解的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系，并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。如果说图像分析主要以观察者为中心来研究客观世界，那么图像理解在一定程度上是以客观世界为中心，借助知识、经验等来把握整个客观世界（包括没有直接观察到的事物）的。联系：图像处理、图像分析和图像理解处在三个抽象程度和数据量各有特点的不同层次上。图像处理是比较低层的操作，它主要在图像像素级上进行处理，处理的数据量非常大。图像分析则进入了中层，分割和特征提取把原来以像素描述的图像转变成比较简洁的非图形式的描述。图像理解主要是高层操作，基本上是对从描述抽

4、象出来的符号进行运算,其处理过程和方法与人类的思维推理有许多类似之处.第二章:1.参见第一章：第1题 4. jpg(jpeg） JPEG:联合摄影专家组 JPEG 图片以 24 位颜色存储单个光栅图像。JPEG 是与平台无关的格式，支持最高级别的压缩,不过,这种压缩是有损耗的.渐近式 JPEG 文件支持交错。可以提高或降低 JPEG 文件压缩的级别。但是，文件大小是以图像质量为代价的。压缩比率可以高达 100:1。（JPEG 格式可在 10:1 到 20：1 的比率下轻松地压缩文件,而图片质量不会下降。）JPEG 压缩可以很好地处理写实摄影作品.但是，对于颜色较少、对比级别强烈、实心边框或纯色

5、区域大的较简单的作品，JPEG 压缩无法提供理想的结果。有时，压缩比率会低到 5：1，严重损失了图片完整性。这一损失产生的原因是，JPEG 压缩方案可以很好地压缩类似的色调，但是 JPEG 压缩方案不能很好地处理亮度的强烈差异或处理纯色区域。优点:摄影作品或写实作品支持高级压缩，利用可变的压缩比可以控制文件大小。支持交错（对于渐近式 JPEG 文件）。JPEG 广泛支持 Internet 标准。缺点:有损耗压缩会使原始图片数据质量下降。当您编辑和重新保存 JPEG 文件时,JPEG 会混合原始图片数据的质量下降。这种下降是累积性的。不适用于所含颜色很少、具有大块颜色相近的区域或亮度差异十分明显

6、的较简单的图片.是最常见的格式之一。BMP：Windows 位图 Windows 位图可以用任何颜色深度（从黑白到 24 位颜色)存储单个光栅图像。Windows 位图文件格式与其他 Microsoft Windows 程序兼容.它不支持文件压缩，也不适用于 Web 页。从总体上看，Windows 位图文件格式的缺点超过了它的优点。为了保证照片图像的质量，请使用 PNG 文件、JPEG 文件或 TIFF 文件。BMP 文件适用于 Windows 中的墙纸。优点：BMP 支持 1 位到 24 位颜色深度。BMP 格式与现有 Windows 程序(尤其是较旧的程序）广泛兼容。缺点:BMP 不支持压

7、缩，这会造成文件非常大,BMP 文件不受 Web 浏览器支持。GIF：图形交换格式;GIF 图片以 8 位颜色或 256 色存储单个光栅图像数据或多个光栅图像数据。GIF 图片支持透明度、压缩、交错和多图像图片(动画 GIF).PGIF 透明度不是 alpha 通道透明度，不能支持半透明效果。GIF 压缩是 LZW 压缩，压缩比大概为 3:1。GIF 文件规范的 GIF89a 版本中支持动画 GIF.优点：GIF 广泛支持 Internet 标准。支持无损耗压缩和透明度.动画 GIF 很流行,易于使用许多 GIF 动画程序创建。很多QQ表情都是GIF的缺点：GIF 只支持 256 色调色板，因

8、此,详细的图片和写实摄影图像会丢失颜色信息第四章1.如下表：pr（rk)、pz（zl)分别表示原直方图与规定直方图一、对原直方图进行均衡化处理，得到映射关系rksk(第四列)二、对规定直方图进行均衡化处理，得到映射关系zlvl（第五列）： rkpr（rk)pz（zl)sk=T（rk)vk=G（zl）rk=zl规定化后的直方图r00.14 00.14 1/70r0= z30r10。22 00.36 3/70r1= z40r20.26 00。62 4/70r2= z50r30。17 0.19 0.79 6/70.19r3= z60。14r40。09 0。25 0。88 6/70。44r4= z60

9、。22r50.06 0。21 0。94 7/70。65r5= z70.26r60.04 0.24 0。98 7/70。89r6= z70.26r70.02 0.11 1.00 7/71r7= z70.12三、对于每个sk，迭代计算出满足下式的最小vl,得到映射关系skvl，再由rksk得到rkvl，最后由zlvl的逆变换vlzl求出rkzl的变换:对k=0，l=3时,v3s0=0。190.14=0，开始满足上式，于是有r0=z3对k=1,l=3时,v4s1=0。440.36=0,开始满足上式,于是有r1=z4对k=2，l=3时，v5s2=0。65-0。62=0,开始满足上式，于是有r2=z5对

10、k=3，l=3时,v6-s3=0。890.79=0，开始满足上式,于是有r3=z6对k=4,l=3时,v6s4=0。890.88=0,开始满足上式，于是有r4=z6对k=5，l=3时,v7-s5=1。000。94=0，开始满足上式，于是有r5=z7对k=6,l=3时,v7-s6=1.000。98=0，开始满足上式，于是有r6=z7对k=6,l=3时，v7-s7=1。00-1.00=0,开始满足上式,于是有r7=z7直方图规定化结果如最后一列所示，规定化后的直方图与规定直方图基本一致。2。rknkpr（rk)sk=T（rk)rk=skps(sk)r05600。14 0.14 1/70=10r19

11、200.22 0。36 3/71=30.140。143r210460。26 0。62 4/72=40。286r37050。17 0。79 6/73=60。220。429r43560.09 0。88 6/74=60。260.571r52670。07 0。94 7/70。714r61700.04 0.99 7/75，6,770.260.857r7720。02 1.00 7/70.133。原图33领域平均法1111111111112255233325858302333255433359875932333325546331598860633452558333260628234678234678原图3*

12、3中值滤波111111111111225523332233333325543333333333325546334446334525583345782346782346784. 2m+15均值滤波：把每个像素都用周围的8个像素来做均值操作.可以平滑图像，速度快，算法简单。但是无法去掉噪声，这能微弱的减弱它。中值滤波:常用的非线性滤波方法 ,也是图像处理技术中最常用的预处理技术.它在平滑脉冲噪声方面非常有效,同时它可以保护图像尖锐的边缘。8。为什么一般情况下对离散图象的直方图均衡化并不能产生完全平坦的直方图？由于离散图象的直方图也是离散的，其灰度的累积分布函数是一个不减的阶梯函数.如果映射后的图

13、象仍能取到所有256级灰度，那一定是原图象没有任何改变，这种情况只可能发生在原图象的直方图已经是一条水平线的情况下。一般情况下映射后所得到的图象只能取到少于256级灰度，这样在变换后的直方图中会有某些灰度级空缺,当然这些空缺应该均匀分布在0到255之间。于是问题就变成了将原有的256个值，即各灰度的概率，按顺序分成n（n256)份，每份的概率总和应该相等。显然这个问题是不一定有解的，因此我们只能找到一个近似解.其结果就是最后得到一幅有空缺且不太平坦的直方图9.不会发生变化，因为再次均衡化，所用的变换函数是首次均衡化后得到的增强图像的累积直方图，不会改变其结果。10。相同点：都能减弱或消除傅立叶

14、空间的某些分量，而不影响或较少影响其他分量，从而达到了增强某些频率分量的效果。不同点：平滑滤波器减弱或消除了傅立叶空间的高频分量，所以达到了增强低频分量,平滑图像中细节的效果。锐化滤波器减弱或消除了傅立叶空间的低频分量，所以达到了增强高频分量，锐化图像中细节的效果。：两者效果相反，互为补充，从原始图像中减去平滑滤波器的结果得到锐化滤波器的效果，而从原始图像中减去锐化滤波器的结果则可得到平滑滤波器的结果。第五章：P1051.5.参见教材P83第六章P1412.一般地，按比例将原图像放大k倍时，如果按照最近邻域法则需要将一个像素值添在新图像的kk的子块，如果放大倍数太大,按照这种方法处理会出现马赛

15、克效应。为了提高几何变换后的图像质量，常采用线性插值法.该方法的原理是，当求出的分数地址与像素点不一致时，求出周围四个像素点的距离比，根据该比率，由四个邻域的像素灰度值进行线性插值4. 图像旋转之后,会出现许多的空洞点。对这些空洞点必须进行填充处理,否则画面效果不好。一般也称这种操作为插值处理。最简单的方法是行插值方法或列插值方法：列插值算法如下: 找出当前列的最小和最大的非白点的坐标，记作(k1,j）、（k2,j）。在(k1，k2)范围内进行插值，插值的方法是:空点的像素值等于上一点的像素值. 同样的操作重复到所有列。经如上的插值处理之后，图像效果就变得自然了5。变换矩阵：T= 0.

16、7070 0。7070 0 -0。7070 0。7070 0 0 0 1.0000 本题图像共有16个像素，变换前的316矩阵如下：P0= 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 41 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1变换后的316矩阵：P=T P0 1 2 3 4 2 3 4 4 3 4 4 5 4 4 5 6 0 1 1 -2 1 0 1 -1 1 1 0 1 2 1 1 01 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1变换结果如下图所示 X坐标Y坐标0123401

17、23456-2变换前的原点变换后的原点574,21602,-1583，-159,574,-1585，-10591,0593,0604,0566,01591，1602，1583,1574，1612,1623,159，614,1605，12611，2592，2593,2574,2空洞594，2像素合并3621，3592，3603，3584,34591，4622,4603,4564,4，旋转后进行“行插值”旋转后进行“列插值”2574，-2574,-2-1602，1583，-159,574,1585,1602，-1583，159,574，1585,10591,059593，0604，060566，0

18、591,060593，0604,058566，01612,1623，159,614,1605，1612,1623，159，614,1605，12594，2594,26.f（221,396）=18, f(221,397)=45， f（222，396)=52， f（222，397）=36，试分别用最邻近插值法和双线性插值法,分别计算f（221。3,396。7）的值. 解:设1. 已知点（221.3，396.7）的周围像素的灰度值，用最邻近插值法，求点(221.3，396。7)的灰度值，221.3221397396。7 ,即所求点离点(221.397）最近 f（221.3，396。7)=f（221,

19、397）=452. 双线性插值法,设x,y为所求点至点（221，396）的x,y坐标增量，如图所示:f（x,396)=f（221,396）+ x * ( f(222，396）-f(221，396）） =18+34x(221，396)(222，396)(222，397)(221，397)插值点(221.3，396.7)f(x,397)=f（221,397）+ x * （ f(222,397)f(221,397) ）=45 9*xf（ x， y )=f（x,396) + y （ f(x，397)f(x，396) )=18+34x + y(45 9x18-34*x）=18+34x+27y43xy

20、f(0。3,0。7）=387首先将原点平移到（100，260）即A= 1 0 100 0 1 -260 0 0 1 然后旋转 B= cos60 sin60 0 sin60 cos60 0 0 0 1 然后在平移回来 1 0 100 0 1 260 0 0 0 以上变换为复合变换矩阵TC*BA 注意是用的齐次坐标x，y，1TX0 Y0 1 第七章:1、图像的频域处理就是把图像从空间域变换到频域，分析图像的频谱特性，据此进行图像处理；它的理论基础是：“任何波形都可以用单纯的正弦波的加权和表示”2。常用变换:傅里叶变换：它是应用最广泛和最重要的变换。它的变换核是复指数函数,转换域图像是原空间域图

21、像的二维频谱,其“直流”项与原图像亮度的平均值成比例，高频项表征图像中边缘变化的强度和方向。为了提高运算速度，计算机中多采用傅里叶快速算法.沃尔什哈达玛变换：它是一种便于运算的变换。变换核是值+1或-1的有序序列。这种变换只需要作加法或减法运算,不需要象傅里叶变换那样作复数乘法运算，所以能提高计算机的运算速度，减少存储容量。其他还有余弦变换、正弦变换等也在图像处理中得到应用3、不管是连续傅立叶变换还是离散傅立叶变换,变换域均反映了被变换域的频谱.不同：1）连续傅立叶变换，信号量和自变量均是连续的,而离散傅立叶变换，自变量和信号量均是离散的。2）连续傅立叶变换，信号可以是无限长的,信号量也可以是

22、无穷大；而对于离散傅立叶变换，信号应该是有限长的，信号量也应该是有限值，才能用计算机进行处理。5、根据二维离散傅立叶变换的公式，有：利用W的周期性,得：W2= W0, W4= W0， W6= W0，和W的对称性，得：W= W, W= W0,则有：（写到上式就可以了）f=0 1 0 2 ;0 3 0 4 ； 0 5 0 6；0 7 0 8p=1 1 1 1；1 -j -1 j;1 -1 1 -1；1 j -1 j第八章11）膨胀的结果为半径为5r/4的圆（图略）2)膨胀的结果为边长为为3*r/2的正方形，在直角处用半径为r的内切圆弧连接（图略）3）为简化问题,设图像为等边三角形,则膨胀结果是边

23、长为3r/2和等边三角形，在夹角处以半径为r/4的圆弧连接（图略）4)a。腐蚀的结果为半径为3*r/4的圆（图略）b。腐蚀的结果为边长为为r/2的正方形（图略) c。为简化问题，设图像为等边三角形，则腐蚀结果是边长为0.134r的等边三角形（图略）第九章1、x=imread(baboon。bmp);m n k=size(x);y=uint8（zeros（m，n,k)；y(:,：,1）=x(：,：,1）；y（:，:，2）=x(:,：，3);y(:,：，3)=x（:，：，2）；figure，imshow（x)，title(原图像）;figure,imshow（y)，title(交换绿蓝通道）；z=

24、x;z（:，：，3)=2*x(:,：,3）for i=1：1：m for j=1：1:n if (z(i,j，3）255） z（i,j,3)=255 end endendfigure，imshow(z）,title（蓝色通道加倍）;2、依题意，R=200，G=50,B=150第十一章：1。现有8个待编码符号M0，M1，M7，它们的概率分别为0.40，0.25，0。11，0.09，0。06，0.04，0。03，0。01，试求这一组符号的信号熵，利用哈夫曼编码求出这一组符号的编码，画出哈夫曼树，并计算平均码长和编码效率.平均码长:R=10.39+20。25+4*0.11+50.05+50.06+4

25、*0.08+5*0。02+50。042.5图像的熵H为：编码效率:= H/R=2。43/2.5=97.2%2. 二分法香农-范诺编码方法.其步骤如下： 1）首先统计出每个符号出现的概率; 2) 从左到右对上述概率从大到小排序; 3）从这个概率集合中的某个位置将其分为两个子集合，并尽量使两个子集合的概率和近似相等，给前面一个子集合赋值为0，后面一个子集合赋值为1； 4）重复步骤3,直到各个子集合中只有一个元素为止; 5）将每个元素所属的子集合的值依次串起来，即可得到各个元素的香农范诺编码。码字符号出现概率0M40。390。39(0）100M70。250。61（1)0。36（0)0.2

26、5(0）101M00。110.11（1）1000M20。080。25（0)0.14（0)0。08(0)1001M60.060.06(1)1010M50.050。11(1）0。05(0）10110M30.040.06（1）0。04(0)10111M10.020.02（1)平均码长R=2。53图像熵H=2。43编码效率2.43/2。53=96.04参考答案二：符号出现概率-log2Pilog2Pi+1码字长度累加概率转为二进制M40.391.36 2.36 2000M70。252.00 3。00 20.3901M00.113.18 4。18 40。641010M20。083.64 4。64 40。751100M60。064.06 5.06 50.8311010M50.054。32 5.32 50。8911100M30.044.64 5.64 50。9411110M10.025。64 6。64 60。98111110平均码长R2.91熵2。43编码效率83。50515第 14 页（共 16 页）

展开阅读全文