资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/3/8 Monday,#,Institute of Robotics and Automatic Information System,Click to edit the title text format,机器人与信息自动化研究所,Institute of Robotics&Automatic Information System,Institute of Robotics and Automatic Information System,Click to edit the title text format,单击此处编辑母版标题样式,2021/3/8 Monday,#,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,/,机器视觉及应用,第三章数字图像处理基础,数字,图像的表示,主要内容,数字图像的分类,彩色图像,二值图像,灰度图像,索引图像,数字图像的格式,BMP,格式,JPEG,格式,PNG,格式,GIF,格式,TIFF,格式,数字图像处理的一般步骤和方法的,数字图像的性质,图像的通道,图像,的分辨率,图像的邻域,图像的连通域,像素之间的距离,图像的直方图,图像中的熵,其他统计特征,数字,图像经过,采样和量化,得到。在采样和量化过程中,,采样间隔的大小,,,量化的等级,决定了数字图像所保留的,信息数量,。采样和量化的过程也是得到离散的数字图像的过程。,数字图像可以定义为一个,离散二维,函数,。,图像的表示,二维数字图像,也可以采用,矩阵的方式进行表示,图像,也,可以直接用,像素坐标,的方式表示一幅图像,,如果,图像的行数,采用,h,表示,代表图像的高度,图像的列数,采用,w,表示,代表图像的宽度,一幅图像的大小也可以表示,为,wh,。,图像的表示,图像的像素表示,例,:,图像大小,1280960,,,表示图像的,宽度,w=1280,高,h=960,也表示图像的列,C=1280,行,R=960,,也称为图像的分辨率,也说明图像的像素数量为,1280960=1228800,数字,图像中,每一个像素采用量化的,具体数字进行表示,,,数字范围从,0,255,。,按照,图像每个像素在计算机中存储所占的,二进制位,数,分为,1,位,图像、,8,位,图像、,16,位,图像、,24,位,图像和,32,位,图像,。,1,位图像是单色,黑白图像,,,8,位图像是,灰度图像或索引,图像,。,其他,的都是彩色图像,只是颜色的数量不同,其中,32,位与,24,位图像的颜色数量一样,多的,8,位用来表示图像的透明度信息。按照图像的强度或颜色等级,分类,:,图像,可分为,彩色图像,、,二值图像,、,灰度图像,和,索引图像,。,数字,图像的分类,彩色图像,1,、,彩色,图像有多种彩色模式,常见的如,RGB,、,HSI,、,HSV,、,CMY,等,。,2,、,根据光的三基色原理,光谱上的大多数颜色都可以用,红、绿、蓝,三种单色加权混合,产生。,3,、,在数字图像中,彩色图像每个像素采用,三个数字矩阵,来表示。每个数字矩阵分别表示红、绿、蓝三种颜色,数字范围从,0,255,。,三种数字的不同组合表示不同的颜色,。,数字图像的,分类,彩色图像,4,、,16,位,图像每个,像素占,2,个,字节,。,最多,有,216,种颜色,。,RGB,每个颜色分量所占的位数为,5,位,有一位为空。,。,5,、,24,位和,32,位彩色图像的颜色数量一样,都是,224,种颜色,。每个,像素占,3,个,字节,。,每个,RGB,分量分别占,8,位,,数字范围从,0,255,。每幅图像用,RGB,三个数字矩阵表示,,,32,位图像多一个透明度分量,数字图像的,分类,彩色图像,数字图像的,分类,二值图像,1,、,二值图像中,图像的每个像素只能是,黑或白,。,2,、,每个像素在计算机中采用,1,位二进制,进行存储,。,3,、,二值图像也是单色图像。这种图像所占的计算机存储空间,最小,。,数字图像的,分类,二值图像,数字图像的,分类,灰度,图像,1,、,每个像素由,一个量化的灰度值来描述的图像,,它,不包含彩色信息,,其灰度值范围从,0,255,。,2,、,灰度图像,只有亮度信息,,每个像素值采用,8,位二进制,(一个字节)进行存储,亮度级有,256,种,其中,,0,表示黑色,,255,表示白色,,中间的值从从小到大是从黑色到白色的过渡。,数字图像的,分类,灰度,图像,数字图像的,分类,灰度,图像,3,、,灰度图像其实是,RGB,三个颜色分量数字的一种特殊形式,。,RGB,三,个分量的值相等,,图像就是灰度图像,4,、,每个像素只需要,8,位二进制进行存储,这样可以,节约图像的存储空间,。,5,、,灰度图像的,数据量,相对于彩色图像很,少,,可以加快图像处理算法的运行速度。因此,目前对于大多数,机器视觉,所处理的图像,都是以灰度图像为主,。,数字图像的,分类,灰度,图像,6,、,彩色,图像转换,成灰度,图像:,最大值法、平均值法和加权平均值法,。,(,1,)、,最大值,法,数字图像的,分类,灰度,图像,6,、,彩色,图像转换,成灰度,图像:,最大值法、平均值法和加权平均值法,。,(,2,)、,平均值法,数字图像的,分类,灰度,图像,6,、,彩色,图像转换,成灰度,图像:,最大值法、平均值法和加权平均值法,。,(,3,)、加权,平均值法,数字图像的,分类,索引,图像,1,、,一,种把像素值直接作为,RGB,调色板下标的图像。索引图像可把,像素值直接映射为调色板数值,。,2,、,一幅索引图包含一个,数据矩阵,和一个,调色板矩阵,。索引图像,和,灰度图像,较,类似,。它,可以是,彩色,最多,只能有,256,种颜色。,数字图像的,分类,数字图像格式指,图像存储文件,的格式,。,不同,格式的数字图像,其,压缩方式、存储容量及色彩,也有所差异,。,同,一幅图像可以用不同的格式存储,但不同格式所包含的,图像信息不完全相同,图像质量和文件大小也不相同。,数字图像,的,格式,BMP,格式,1,、,BMP,是一种,与硬件设备无关,的图像文件,格式,。,2,、,采用,位映射,存储,格式,除了图像深度可选以外,不采用其他任何压缩,因此文件所占用的,空间很大,。,3,、,bmp,是,Windows,及,OS,2,中的,标准图像文件格式,,己成为,PC,机,Windows,系统中事实上的工业标准。在,Windows,环境中运行的图形图像软件都支持,BMP,图像格式,。,4,、,BMP,图像格式被机器视觉广泛使用,。,数字图像,的,格式,JPEG,格式,1,、,面向连续色调静止图像的一种,压缩标准,,也是一种常见的图像文件,格式,。,2,、,它,是,有损压缩格式,能够将图像压缩在很小的储存空间,占用磁盘空间少,容易,造成图像数据的损伤,。,3,、,如果追求,高品质,图像,,不宜采用过高压缩比,。,数字图像,的,格式,PNG,格式,1,、,PNG,原名为,“,可移植性网络图像,”,是网上接受的最新图像文件格式,。,2,、,PNG,同时还支持真彩色和灰度级图像的,Alpha,通道透明度,。,3,、,支持,图像亮度的,Gamma,校准信息,。支持存储附加,文本信息,,以保留图像名称、作者、版权、创作时间、注释等信息。,数字图像,的,格式,GIF,格式,1,、,存储色彩最高只能达到,256,种,,仅支持,8,位图像文件,。,2,、,可以同时存储若干幅静止图像进而形成,连续的动画,。,公共领域,有大量的软件在使用,GIF,图像文件。,3,、,GIF,图像文件格式已经成为网络图像传输的通用格式,,速度,要比传输其他图像文件格式,快,得多,所以经常,用于,动画、透明图像,等。,4,、,只能,处理,256,种色彩,故,不能存储,真彩色的图像文件。,数字图像,的,格式,TIFF,格式,1,、,最早流行于,Macintosh,,现在,Windows,上主流的图像应用程序都支持该格式。,2,、,大多数,扫描仪都,可以输出,TIFF,格式的图像文件。该格式支持的色彩数最高可达,16M,种。,3,、,存储的,图像质量高,,占用,的,存储空间大,。表现,图像,细微,层次信息多,,有利于原稿阶调与色彩的复制,。,4,、,有,压缩和非压缩两种形式,,对,TIFF,文件,解压缩非常困难,。,TIFF,文件被用来存储一些,色彩绚丽、构思奇妙的贴图文件,。,数字图像,的,格式,数字,图像处理的一般步骤和方法,常用数字图像处理一般步骤,图像的通道,1,、,图像的通道数是指图像中,一个像素采用多少个数字进行表示,。,例,:,灰度图,每个,像素只采用一个数字来表示,因此,灰度图的的,通道数是,1,,称为,单通道,图像,;,RGB,图像,中每个像素采用,三个数字,进行表示,所以,RGB,图像是,三通道图像,。,数字图像,的,性质,图像的分辨率,图像的分辨率有几种表示,方式,。,1,、,图像,分辨率是指,每英寸上的像素点数量,,单位是,PPI,(,Pixels Per Inch,),主要针对,平面设计采用的分辨率,。,2,、,采用,水平和垂直方向的,像素数量表示分辨率,。,如,1280960,。,3,、,PPI,通常,与,打印效果,有关,,,数字,图像处理,常,采用,图像的大小,来表示,分辨率,。,数字图像,的,性质,图像的,邻域,图像的邻域包括两个,方面,。,1,、,与某一个像素相邻的像素,如,4,邻域、,8,邻域,。,4,邻域指与像素上下左右相邻的四个像素点,,8,邻域指与像素上下左右以及对角线上,4,个像素组成的邻域,。,2,、,以某一个像素为中心的一小块图像区域,。,数字图像,的,性质,4,邻域,8,邻域,图像的连通域,1,、,图像,的连通域通常体现在,二值图像,,这种图像只有,黑白两个灰度级,。,2,、,彼此,连通的像素点形成了一个区域,,,所有,的点彼此连通点构成的集合,称为一个连通区域,。图像的连通域是对图像进行一系列图像算法处理的结果。,数字图像,的,性质,像素之间的距离,1,、,图像,中的距离常用来衡量两幅,图像的相似度,。,2,、,像素,之间的距离是指,两个像素点之间的距离,。,3,、,图像,中距离的度量方式有很多种,如,欧几里得距离、曼哈顿距离、契比雪夫距离、汉明距离、马氏距离、闵可夫斯基距离,等,。,数字图像,的,性质,像素之间的距离,(,1,),欧几里得距离,欧几里得距离也称欧式距离,是两点之间的直线距离。图像上两点的欧氏距离就是,像素点的二维坐标点之间的直线距离,。,数字图像,的,性质,像素之间的距离,(,2,),曼哈顿,距离,曼哈顿距离也称为城市街区距离,。,假想在一个城市中,从一个路口走向另一个路口,街道都是直线,街道两旁都是建筑物,因此,只能,沿着街道从一个路口走向另一个路口,,走过,的距离,就称为曼哈顿距离。,数字图像,的,性质,像素之间的距离,(,3,),契比雪夫,距离,假设从一个像素点到其,8,邻域中的任意一个点的距离为,1,,契比雪夫距离即为按照这种方式计算的从一个像素点到另一个像素点的最短距离。,数字图像,的,性质,契比雪夫距离为,4,图像直方图,1,、,图像,直方图用于统计图像中,每个像素值出现的频率,。直方图,即每个灰度级像素值出现的频率,。,2,、,直方图,有,绝对直方图,和,相对直方图,两种,。,绝对,直方图,统计每个灰度级在图像中的,像素数量,,,相对直方图,统计每个灰度级的像素数量占图像总像素,数量的,百分比,。,数字图像,的,性质,图像直方图,数字图像,的,性质,图像直方图,3,、,如果是,多通道图像,,如,RGB,图像,直方图通常,分别统计,每个通道上的像素值出现的,频率。,4,、,绝对直方图可以表示为包含,256,个元素的一维向量,:,数字图像,的,性质,5,、,相对,直方图,表示,每个像素值的数量表示出现的,概率,图像直方图,直方图具有以下性质:,1,、直方图,只含,图像各灰度值像素出现的,概率,,而,无位置信息,;,2,、图像与直方图之间是,多对一的映射关系,;,3,、图像,各子区的直方图之和,就,等于,该图像全图的直方图。,数字图像,的,性质,图像中的熵,图像熵也是一种,特征统计形式,,它,反映,了图像中平均,信息量的多少,。图像的,一维熵,表示图像中,灰度分布的聚集特征,所包含的信息量。,数字图像,的,性质,定义灰度图像的一维灰度熵,图像中的熵,一个变量,,任意性越大,,它的,熵,就,越大,。,当,所有灰度值,等概率发生时,,,熵,达到,最,大,值,;,当,一个灰度值发生的概率为,1,,其它灰度值的,概率均为,0,时,熵达到最小值,0,。,数字图像,的,性质,两种不同的灰度分布示意,图像中的熵,图像,熵,反映了图像包含的,信息量,。,当,图像只包含,一个灰度值,,此时,熵最小且为,0,。说明,图像不包含任何目标,信息量为,0,,类似于一张空白图,。,当,图像包含,多个灰度,值,并且,每个灰度值的,数量均等,,此时,熵最大,,图像的,信息量最大,。,熵,越大,,像素,灰度越丰富,,分布,越均匀,,目标,越多,,信息量,越大,反之则反,。,一,维熵不能反映,图像灰度分布的,空间特征,。,可以,在一维熵的基础上,进一步,引入,能够反映灰度分布,空间特征的特征量,来组成图像的,二维熵,。,数字图像,的,性质,图像中的其他统计特征,图像,中还有其他,很多统计信息,,图像数据可以看着是一个二维矩阵。因此,,所有与矩阵相关的特征,以及计算方法都适用于图像处理,。,常用,的图像统计特征有,均值、方差、能量、倾斜度、自相关、协方差、惯性矩,等,。,通过,图像中的统计特征信息,实现对图像的另一种表达方式,,实现,对图像的,分类、缺陷检测,等任务。,数字图像,的,性质,
展开阅读全文