1、九江学院JIU JIANG UNIVERSITY 毕 业 论 文(设 计)题 目 图像阈值分割算法分析与实现 英文题目 The analysis and implementation of image threshold segmentation algorithms 院 系 电子工程学院 专 业 通信工程 姓 名 赖小春 年 级 2008级 指导教师 谭小容 二零一二年六月九江学院学士学位论文摘 要图像阈值分割算法分析与实现是图像处理领域的一个基本的、重要的研究课题。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内,表现出一致
2、性或相似性,而在不同区域间表现出明显的不同。 图像阈值分割法是一种最常用,同时也是最简单的图像分割方法,它特别适用于目标和背景占据不同灰度级范围的图像。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤。因此在很多情况下,是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰度级对像素集合进行一个划分,得到的每个子集形成一个与现实景物相对应的区域,各个区域内部具有一致的属性,而相邻区域布局有这种一致属性。这样的划分可以通过从灰度级出发选取一个或多个阈值来实现。本文首先介绍了图像分割发展现状,其次对图像分割的基础做了简单的介绍,最后重点对双峰法阈值分割、
3、分水岭阈值分割、0tsu阈值分割作了详细分析与研究,并且把这三种算法的分割效果进行了简单的比较,结果发现各阈值分割方法都有各自的优劣性,需要根据图像的实际情况选择适合的方法。分割结果的好坏或者正确与否,目前还没有一个统一的评价判断准则,分割的好坏必须从分割的效果和实际应用场景来判断。关键词:直方图;图像分割;阈值;算法The analysis and implementation of image threshold Segmentation algorithmAbstractThe analysis and implementation of image threshold segmenta
4、tion algorithm is a basic and important research topic. The so-called image threshold segmentation is mean to divide the grayscale, color, space, texture, geometry and other features into several disjoint areas, so that these characteristics in the same area, showing the consistency or similarity, w
5、hile showing different in different regions . The segmentation of image threshold method is one of the most commonly and simple image segmentation method, it is especially suitable for the target and background occupy different gray-scale range of the image. It not only can greatly compress the amou
6、nt of data, but also greatly simplifies the analysis and processing steps. In many cases, image analysis, feature extraction and pattern recognition are till the necessary image pre-processing process. The purpose of image threshold is to divide each subset of the formation of a region corresponding
7、 into the realistic scenery according to the gray level pixel, each region consistent with the properties of adjacent regional distribution of this a consistent attribute. This division can select one or more threshold starting from the gray level. This paper first introduces the development status
8、of image segmentation, followed by a brief introduction on the basis of image segmentation, and finally focus on the apex method threshold segmentation, watershed threshold segmentation and 0tsu threshold segmentation are analyzed and researched in detail, and made a simple comparison with the segme
9、ntation results of the three algorithms and found that each threshold segmentation method has its own advantages and disadvantages, you need to select the appropriate method according to the actual situation of the image. There are no single evaluation criterion about Segmentation result is good or
10、bad, right or wrong, , the segmentation good or bad are based on the segmentation results and determine on the actual scenarios .Keywords: histogram; image segmentation; threshold; algorithm目 录摘 要IAbstractII目录III第1章绪论11.1 数字图像及其处理技术的概述11.2 图像分割方法的发展和现状11.3 研究背景与意义21.4 本文的主要工作及内容安排3第2章 图像分割基础42.1 图像分
11、割概述42.2 图像分割作用42.3 图像分割的基本方法52.4 本章小结6第3章 基于MATLAB的图像阈值分割算法的研究与实现73.1 直方图双峰法阈值分割73.1.1 灰度级直方图的介绍73.1.2 根据灰度直方图选择阈值83.1.3 双峰法阈值分割93.2 分水岭阈值算法图像分割133.2.1 分水岭算法的原理133.2.2 分水岭算法的数学描述143.2.3 不准确标记符的分水岭分割153.2.4 准确标记的分水岭分割163.3 Otsu阈值选择法图像分割173.4 各种阈值算法比较和评价193.5 本章小结21第4章 总结与展望224.1 工作总结224.2 工作展望22致谢24参
12、考文献25附录A 源程序26III九江学院学士学位论文第1章绪论1.1数字图像及其处理技术的概述视觉是人类最重要的感知手段之一。视觉信息是人类从自然界获得信息的主要来源,约占人类由外界获得的信息总量的80%,“眼见为实”,视觉信息所提供的直观作用是文字和声音无法比拟的,因此图像信息非常重要的一类信息。从根本上来说,通常可将图像分成模拟图像和数字图像两大类。由于模拟图像自身的特点,它不能直接在计算机上进行处理,给图像处理带来了极大的限制。为了解决这一问题,我们需要将模拟图像转换成能在计算机上直接处理的图像,即数字图像。数字图像就是将连续的模拟图像经过数字化处理后,用一个矩阵表示的能被计算机识别的
13、图像。与模拟图像相比,数字图像具处理精度高、灵活性高、再现性能好等显著优点。数字图像处理 (DigitalImageProcessing)是指将图像信号转换成数字信号并利用计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的目的:(l)提高图像的视觉质量;(2)提取图像中的某些特征和信息,以便于计算机进行分析;(3)对图像数据进行变换、编码和压缩,以便于存储和传输图像和视频信息;(4)信息的可视化;(5)图像信息安全的需要。目前的图像处理技术已经在许多不同的应用领域中得到重视,并且取得了巨大的成就。根据应用领域的不同要求,可以将图像处理的主要任务分成图像数字化
14、、图像增强、图像复原、图像重建、图像分割、图像变换、图像编码压缩、图像隐藏。而本文结合实际图像的特点对数字图像的阈值分割算法进行分析与研究主要通过分析与研究图像的灰度级直方图,双峰法阈值分割、分水岭阈值分割,以及Otsu法阈值分割,并对各种阈值分割方法的效果图的进行比较。1.2 图像分割方法的发展和现状分割问题的困难在于图像数据的模糊和噪声的干扰。实际图像中景物情况各异,具体问题具体分析,需要根据实际情况选择适合的方法。分割结果的好坏或者正确与否,目前还没有一个统一的评价判断准则,分割的好坏必须从分割的效果和实际应用场景来判断。不过在人类研究图像的历史中,还是积累了许多经典的图像分割方法。虽然
15、这些分割方法不适合所有类型的图像分割,但是这些方法却是图像分割方法进一步发展的基础。事实上,现代一些分割算法恰恰是从经典的分割方法衍生出来的。早期的图像研究中,图像的分割方法主要可以分为两大类。一类是边界方法,这种方法的假设是图像分割结果的某个子区域在原来的图像中一定会有边缘存在;一类是区域方法,这种方法的假设是图像分割结果的子区域一定会有相同的性质,而不同区域的像素没有共同的性质。这两种方法都有缺点和优点,有的学者也试图把两者结合起来进行图像分割,随着计算机处理能力的提高,很多方法不断涌现,如基于彩色分量分割、纹理图像分割。所使用的教学工具和实验手段也是不断的扩展,从时域信号到频域信号处理,
16、近来小波变换也应用在图像分割当中。1.3 研究背景与意义在一幅图像中,人们往往只对其中的目标感兴趣,这些目标占据一定的区域,并且在某些特性(如灰度、轮廓、颜色、纹理等)上和周围的图像有差别。这些特性差别可能非常明显,也可能很细微,以致人眼觉察不出来。计算机图像处理技术的发展,使得人们可以通过计算机来获取与处理图像信息。现在,图像处理技术已成功地应用于许多领域,其中,纸币识别、车牌识别、文字识别、指纹识别等已为大家所熟悉在图像分析中,通常需要将关心的目标从图像中提取出来。数字图像目标分割与提取是数字图像处理和计算机视觉领域中一个备受关注的研究分支。因为在目标分割与提取过程中可以利用大量的数字图像
17、处理的方法,加上其在计算机视觉、模式识别等领域中的广泛应用,都吸引了众多研究者的注意。相信对这一问题的深入研究不仅会不断完善对这一问题的解决,而且必将推动模式识别、计算机视觉、人工智能等计算机科学分支的发展。图像分割和边缘检测的问题在近二十年中得到了广泛的关注和长足的发展,国内外很多研究人士提出了很多方法,在不同的领域取得了一定的成果。但是对于寻找一种能够普遍适用于各种复杂情况的准确率很高的分割和检测算法,还有很大的探索空间。边缘提取和分割是图像分析的经典研究课题之一,目前的理论和方法仍存在许多不足之处,仍在不断改进和发展。需要说明的是:边缘与物体间的边界并不等同,边缘指的是图像中像素的值有突
18、变的地方,而物体间的边界指的是现实场景中的存在与物体之间的边界。有可能有边缘的地方并非边界,也有可能边界的地方并无边缘,因为现实中的物体是三维的,而图像只具有二维信息,从三维到二维的投影成像不可避免的会丢失一部分信息;另外成像的过程中的光照和噪声也是不可避免的重要因素。正是因为这些原因,基于边缘的图像分割仍然是当前图像研究中的世界级难题,目前研究者们正在试图在边缘提取中加入高层的语义信息。由于图像的多义性和复杂性,许多分割的工作无法依靠计算机自动完成,而手工分割又存在工作量大,定位不准确的难题,因此,人们提出了一些人工交互和计算机自动定位相结合的方法,利用各自的优势,实现目标轮廓的快速定位。相
19、信这些交互式方法的应用,必将推动图像目标分割与提取这一既具有广阔的应用前景又具有重要的学术价值的课题的进一步研究,也必将成为一个更为独立和活跃的研究领域。1.4本文的主要工作及内容安排本文首先介绍了图像分割的研究背景和发展现状,其次介绍了图像分割的一些相关基础和图像分割的基本方法分类,最后对阈值分割算法中双峰法阈值分割算法、分水岭阈值分割算法、Otsu阈值选择分割算法作了详细的分析和研究,并对这三种算法进行了简单的比较,以及给出了相应的MATLAB程序源代码。本文共分4章:第1章绪论:对论文图像分割所需的有关背景知识、论文主要研究内容和结果作简要介绍第2章介绍图像分割的基础。图像分割是图像处理
20、技术的重要分支,其目的就在于改善图像的视觉质量。图像分割方法依照分割时所依据的图像特性不同,大致可以分为四大类。第一类是直方图阈值方法,这种方法是根据图像灰度值得分布特性确定某个阈值来进行图像分割的。第二类为边缘检测方法,这类方法是通过检测出封闭某个区域的边界来进行图像分割的。通俗地讲,这类方法实际上是沿着闭合的边缘线将其包围的区域剪切出来。第三类方法是区域提取方法,这类方法的特点是根据特定区域与其他背景区域特性上的不同来进行图像分割的。另外,还有一种基于形态学的分水岭的阈值算法。第3章介绍了三种重要的图像阈值分割算法。图像分割是图像处理这门学科中的基础难题,基于阈值的分割则又是图像分割的最基
21、本的难题之一,其难点在于阈值的选取。事实证明,阈值的选择的恰当与否对分割的效果起着决定性的作用。由于阈值选取对图像分割的基础性,本文主要对直方图双峰法、分水岭阈值法、Otsu阈值选择法这三种阈值选取算法做了探讨、实现和比较。 第4章对全文进行了工作总结与展望。重点对本论文设计进行总结,并进一步展望该课题的研究前景。第2章 图像分割基础随着科学技术的发展,人们对信息处理和信息交流的要求越来越高,所以图像分割显得愈来愈重要,图像分割是指将一副图像分解为若干互不交叠的、有意义的、具有相同性质的区域。总的来说,图像分割是图像识别和图像分析的基本前提步骤,图像分割的质量好坏直接影响后续图像处理的效果,甚
22、至决定成败。因此,图像分割在数字图像处理技术中占有非常重要的地位。图像分割的基本方法并不是唯一的,图像分割方法的种类多种多样,图像分割方法依照分割时所依据的图像特性不同,大致可以分为四大类,第一类是灰度直方图阈值方法,第二类为边缘检测方法,第三类方法是区域提取方法,第四类方法是一种基于形态学的分水岭阈值算法。2.1图像分割概述图像分割是指将一副图像分解为若干互不交叠的、有意义的、具有相同性质的区域。好的图像分割应具备以下特征: 分割出来的各个区域对某种特性(例如灰度和纹理)而言具有相似性,区域内部是连通的且没有过多小孔 相似区域对分割所依据的性质有明显的差异 区域边界是明确的图像分割更形式化的
23、定义如下:令表示图像,表示具有相同性质的谓词,图像分割把分解成个区域,其中,满足: , , , 条件表明分割区域要覆盖整个图像且各区域互不重叠,条件表明每一个区域都具有相同的性质,条件表明相邻的两个区域性质相异不能合并为一个区域。实际的图像处理和分析都是面向某种具体应用的,所以上述条件中的各种关系也要视具体情况而定。目前,还没有一种通用的方法可以很好的兼顾这些约束条件,也没有一种通用的方法可以完成不同的图像分割任务。原因在于实际的图像是千差万别的,还有一个重要原因在于图像数据质量的下降,包括图像在获取和传输过程引入的各种噪声以及光照不均与等因素。2.2 图像分割作用对于一幅图像,有的图像的背景
24、和目标很容易区分,有的却不怎么好分辨,比如指纹图像等,如果不经过相应的图像处理就很难识别,就更别说去理解了,为了方便图像理解,必须经过图像处理。如图2-1所示,图像处理的过程是先对图像进行预处理,然后对图像进行分割,把目标和背景区分开来,这样就可以很好地对图像进行识别和理解。由此可见,图像识别的基础是图像分割,其作用是把反映物体真实情况的、占据同区域的、具有不同特性的目标区分开来,并形成数字特征。图像分割是图像识别和图像理解的基本前提步骤,图像分割质量的好坏直接影响后续图像处理的效果,甚至决定其成败,因此,图像分割的作用是至关重要的。图像预处理图像识别图像理解图像图像分割图2.1 图像分割在整
25、个图像处理中的作用2.3 图像分割的基本方法图像分割方法的种类多种多样,图像分割方法依照分割时所依据的图像特性不同,大致可以分为四大类。第一类是灰度直方图阈值方法,这种方法是根据图像灰度值得分布特性确定某个阈值来进行图像分割的。在本文中主要是根据图像灰度直方图的峰谷特性,来选择图像分割的阈值,从而对图像进行阈值分割。第二类为边缘检测方法,这类方法是通过检测出封闭某个区域的边界来进行图像分割的。通俗地讲,这类方法实际上是沿着闭合的边缘线将其包围的区域剪切出来。边缘检测技术对于处理数字图像非常重要,因为边缘时所要提取目标和背景的边界线,提取出边缘才能将目标和背景区分出来。在图像中,边界表明一个特征
26、区域的始终和另一个特征区域的开始,边界所分开区域的内部特征或属性是一致的,而不同区域内部的特征或属性是不同的,边缘检测正是利用物体和背景在某种图像特性上的差异来实现的,这些差异包括灰度、颜色或纹理特征。边缘检测实际上就是检测图像特性发生变化的位置。最简单的边缘检测方法是边缘检测算子,它利用相邻区域的像素值不连续的性质,采用一阶或二阶导数来检测边缘点。近年来还提出了基于曲面拟合的方法,基于边界曲线拟合的方法。第三类方法是区域提取方法,这类方法的特点是根据特定区域与其他背景区域特性上的不同来进行图像分割的。该方法利用的是图像的空间性质,认为分割出来的属于同一区域的像素应具有相似的性质,其概念是相当
27、直观的。第四类方法是一种基于形态学的分水岭阈值算法。分水岭算法就是基于形态学的分割算法,是对图像的梯度分割。而图像分割的目的是将图像分割成不同的特体,即提取出物体的边缘。由于物体边缘的灰度变化比较强烈,而梯度图像正好描述了图像的灰度变化情况。因此 ,可先将原始图像通过梯度算子边缘检测得到梯度图像,再通过梯度图像的分水岭变换来进行图像分割。2.4 本章小结本章节主要是阐述了图像分割的一些基础知识,首先主要是讲述了图像分割的定义,以及对图像分割的定义进行了详细的说明,然后讲述了图像分割在数字图像处理中的作用和重要性;最后简单介绍了图像分割的方法分类。第3章 基于MATLAB的图像阈值分割算法的研究
28、与实现阈值分割法是一种简单的基于区域的分割技术,是一种广泛使用的图像分割技术,它利用图像中要提取的目标和背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域的组合,选取一个合适的阈值,以确定图像中每个像素点是属于目标还是属于背景。它不仅可以极大的压缩数据量,而且也大大简化了图像信息的分析和处理步骤。该方法确定一个最优阈值是分割的关键,同时也是阈值分割的一个难题。阈值分割实质上就是按照某个准则求出最佳阈值的过程。现有的大部分算法都是集中在阈值确定的研究上。目前已提出的阈值化方法很多,相应的分类也有很多种,阈值化分割方法根据图像本身的特点,可分为单阈值分割方法和多阈值分割方法;也可分为基于像
29、素值的阈值分割方法、基于区域性质的阈值分割方法和基于坐标位置的阈值分割方法。若根据分割算法所具有的特征或准则,还可以分为直方图峰谷法、Otsu法,分水岭阈值选择法、最大类空间方差法等阈值选取法。3.1直方图双峰法阈值分割3.1.1 灰度级直方图的介绍 1)灰度级直方图的定义在数字图像处理中,直方图是指灰度直方图,是一种简单而又十分重要的图像分析工具,它概括了一幅图像的灰度级内容。直方图(histogram)是统计图像中具有某种灰度的像素数目的函数,它表示图像中具有每种灰度级的像素的个数,反映图像中不同灰度级像素出现的相对频率。横坐标是灰度级,纵坐标是灰度级出现的频率。直方图是图像中各灰度级与其
30、出现的频数间的统计关系,可以说它给出了一幅图所有灰度值的整体描述。设变量代表图像中像素灰度级。在图像中,假设被归一化到区间上,且r=0表示黑色,r=1表示白色,且灰度级可视为区间的随机变量。假定是连续的随机变量,那么,就可以用概率密度函数来表示原始图像的灰度分布。如果用直角坐标系的横轴代表灰度级,用纵轴代表灰度级的概率密度函数,这样在这个坐标系中就可以做出一条曲线来,这条曲线在概率论中就是分布密度曲线。数字图像的直方图是离散函数。在离散形式下,用代表离散灰度级,用只代表,用概率密度函数来表示灰度级为发生的概率估计值,并且有下式成立: (3.1)其中变量代表图像中像素的第k级灰度。表示图像中像素
31、的总和,是灰度级为的像素个数,为图像中可能的灰度级总数。在直角坐标系中绘出与只的关系图形,这个图形称为直方图。通过图灰度级直方图能判断该图像的清晰度和黑白对比度。直方图的左边显示了图像的阴影信息,直方图的中间显示了图像的中间色调信息,直方图的右边显示了图像的高亮信息。灰度直方图描述了每个灰度级具有的像素的个数,只反映图像的灰度分布情况,而不反映图像像素的位置。3.1.2 根据灰度直方图选择阈值基于灰度阈值的分割方法是图像分割的经典方法,它是通过设置阈值,把像素点按灰度级分若干类,从而实现图像分割 。把一幅灰度图像转换成二值图像是阈值分割的最简单形式,把一幅灰度图转换为二值图像的基本思想和步骤:
32、按照一定的准则找到一个灰度值T作为阈值,把大于T的像素点的值置为1,小于T的值置为0。设原图像为,经过分割处理后的图像为,阈值运算后的图像为二值图像,如下式所示: (3.2)图像阈值化处理实质是一种图像灰度级的非线性运算,它的功能是由用户指定一个阈值,如果图像中某个像素的灰度值小于该阈值,则将该像素的灰度值置为0,否则将其灰度值置为1。其变换函数曲线如图3-1所示。图3-1 阈值变换曲线(3.2)式中全局阈值T的选择直接影响分割效果。通常可以通过分析灰度直方图来确定它的值,最常用的方法是利用灰度直方图求双峰或多峰,选择两峰之间谷底处的灰度值作为阈值。直方图如下图3-2所示:图3-2原图及其灰度
33、直方图显然,该图的灰度直方图具有明显的双峰特性,根据该灰度直方图的峰谷情况,可以很容易确定阈值T的取值T=140。3.1.3 双峰法阈值分割双峰法阈值分割法的依据是图像的直方图,通过对直方图进行各种分析来实现对图像的分割。图像的直方图可以看作是像素灰度值概率分布密度函数的一个近似,设一幅图像仅包含目标和背景,那么它的直方图所代表的像素灰度值概率密度分布函数实际上就是对应目标和背景的两个单峰分布密度函数的和。图像二值化过程就是在直方图上寻找两个峰、一个谷来对一个图像进行分割,也可以通过用两级函数来近似直方图。若灰度图像的直方图,其灰度级范围为,当灰度级为k时的像素数为 ,则一幅图像的总像素数N为
34、: (3.3)灰度级i出现的概率为: (3.4)当灰度图像中画面比较简单且对象物的灰度分布比较有规律时,背景和目标对象在图像的灰度直方图上各自形成一个波峰,由于每两个波峰间形成一个低谷,因而选择双峰间低谷处所对应的灰度值为阈值,可将两个区域分离把这种通过选取直方图阈值来分割目标和背景的方法称为直方图阈值双峰法。如图3-1所示,在灰度级和两处有明显的波峰,而在t处是一个谷点。图3-3 直方图的双峰与阈值具体实现的方法是先做出图像f(x,y) 的灰度直方图,若出现背景目标物两区域部分所对应的直方图呈双峰且有明显的谷底,则可以将谷底点所对应的灰度值作为阈值t,然后根据阈值进行分割就可以将目标从图像中
35、分割出来。这种方法适用于目标和背景的灰度差较大,直方图有明显谷底的情况。直方图双峰法阈值分割后的图像如下:(a) 原始图像(b) 图像直方图 (c) T=140时阈值分割后的图像(d) T=60时阈值分割后的图像 (e) T=200时阈值分割后的图像图3-4 不同阈值对阈值化结果的影响图像阈值化处理结果分析:(1)基于灰度阈值的分割方法,其关键是如何合理的选择阈值。在分析图像直方图的基础上,选择出合理的阈值,在图像的阈值化处理过程中,选用不同的阈值其处理结果差异很大。原始图像的直方图如图3-4所示(b)所示,分析该直方图可知,该直方图具有双峰特性,图像中的目标(字体等)分布在较暗的灰度级上形成
36、一个波峰,图像中的背景分布在较亮的灰度级上形成另一个波峰。根据直方图可以看出,峰谷点对应的像素值为140,此时,用其双峰之间的谷底处灰度值作为阈值T进行图像阈值化处理,便可很好的将目标和背景分割开来。即可以选取阈值T=140;当取T=140时阈值分割后的图像如图3-4(c)所示,分割效果非常的不错。(2)但是如果阈值T取值过大,如图3-4(e)图所示,取阈值T=200过大,使得阈值分割会提取多余的部分;而如图3-4(d)图所示选取T=60时,阈值过小,又会丢失所需的部分(注意:当背景为黑色,对象为白色时刚好相反)。因此,阈值的选取非常重要。双峰法比较简单,在可能情况下常常作为首选的阈值确定方法
37、,但是图像的灰度直方图的形状随着对象、图像输入系统,输入环境等因素的不同而千差万别,当出现波峰间的波谷平坦、各区域直方图的波形重叠等情况时,用直方图阈值难以确定阈值,必须寻求其他方法来选择适宜的阈值。如下例子所示,直方图的双峰特性并不明显:(a) 原始图像 (b) 图像直方图 (c) T=50时阈值分割后的图像 (d) T=120时阈值分割后的图像 (e) T=210时阈值分割后的图像图3-5 阈值分割后的图片将原始图像和阈值分割后的图像比较,可以发现有些前景图像和背景图像的灰度非常的接近,导致有些前景图像没有从背景中分离出来,图像失真了。当图像中的目标部分和背景之间亮度差较小,即灰度直方图的
38、双峰特性不明显时,直接用直方图就不太容易确定一个合适的阈值。此时,必须用其他方法来进行分割。总体来说,双峰法比较简单,仅仅适用于图像灰度直方图双峰特性很明显的图像,但是对于直方图没有明显双峰特性的图像,其阈值难以确定,分割的效果就很难把握。3.2 分水岭阈值算法图像分割分水岭阈值算法就是基于形态学的分割算法,是对图像的梯度分割 。而图像分割的目的是将图像分割成不同的特体,即提取出物体的边缘。由于物体边缘的灰度变化比较强烈,而梯度图像正好描述了图像的灰度变化情况。因此,可先将原始图像通过梯度算子边缘检测得到梯度图像 ,再通过梯度图像的分水岭变换来进行图像分割 。由于图像对使用梯度算子边缘检测的分
39、水岭算法无明显效果 , 因此采用基于数学形态学的分水岭算法 ,利用形态学处理函数 ,不仅能达到有效分割图像的目的 ,而且也能消除过分割现象 3.2.1分水岭算法的原理分水岭(watershed)算法是一种已经发展起来的数学形态学图像分割方法。这种方法之所以引起人们的重视,一是其计算速度较快,二是物体轮廓线的封闭性,三是定位的精确性。但分水岭算法对微弱边缘也具有良好的响应。它最初是由Digabel和Lantuejoul引入图像处理领域,用于分析简单的二值图像。为了得到更为通用的模型,Beucher、Vin2cent等人继续研究,使分水岭的理论得以建立,并大量用于灰度图像的分割。虽然其思想简单,但
40、是设计方法比较困难,早期的方法计算负担重、耗时较长。因此,采用分水岭算法进行图像分割时,通常会产生过度分割的现象和耗时较长。分水岭变换的思想来源于地形学,它将图像看作是地形学上被水覆盖的自然地貌,图像中的每一像素的灰度值表示该点的海拔高度,其每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则为分水岭,通常描述分水岭变换有两种方法:一种是“雨滴法”,即当一滴雨水分别从地形表面的不同位置开始下滑,其最终将流向不同的局部海拔高度最低的区域(称为极小区域) ,那些汇聚到同一个极小区域的雨滴轨迹就形成了一个连通区域,称为集水盆;另一种方法是模拟“溢流”的过程,即首先在各极小区域的表面打一个小孔,同
41、时让泉水从小孔中涌出,并慢慢淹没极小区域周围的区域,那么各极小区域波及的范围,即是相应的集水盆。无论是哪种方法,不同区域的水流相遇时的界限,就是期望得到的分水岭。应用到图像分割中,分水岭变换是指将原图像转换成一个标记图像,其中所有属于同一集水盆的点均被赋予同一个标记,并用一个特殊的标记来标识分水岭上的点3.2.2分水岭算法的数学描述令M1,M2,Mn为表述图像g(x,y)的局部最小值点的坐标集合,这是一幅典型的梯度图。令C(Mi)为一个点的坐标集合,这些点位于与局部最小值Mi(无论哪一个汇水盆地内的点都组成一个连通分量)相联系的汇水盆地内。符号min和max代表g(x,y)的最小值和最大值。最
42、后令Tn表示坐标(s,t)的集合其中g(s,t)n,即: (3.5)在几何上,Tn是g(x,y)中的点的坐标集合,集合中的点均位于平面g(x,y)=n的下方。随着水位以整数量从n=min+1到n=max+1不断增加,图像中的地形会被水漫过。在水位漫过地形的过程中的每一阶段,算法都需要知道处在水位之下的点的数目。从概念上来说,假设T(n)中的坐标处在g(x,y)=n 的平面之下,并被“标记”为黑色,所有其他的坐标被标记为白色。然后,当在水位以任意增量n增加的时候,从上向下观察x、y平面,会看到一副二值图像。在图像中黑色点对应于函数中低于平面g(x,y)=n的点。这种解释对于理解下面的讨论很有帮助
43、。令表示汇水盆地中点的坐标的集合。这个盆地与在第n阶段被淹没的最小值有关。参考前一段的讨论,也可以被看作由下式给出的二值图像: (3.6)换句话说,如果且,则在位置(x,y)有。否者,对于这个结果几何上的解释是很简单的。只需在水溢出的第n个阶段使用“与(AND)”算子将Tn中的二值图像分离出来即可。Tn是与局部最小值相联系的集合。下面令Cn表示在第n个阶段的汇水盆地被水淹没的部分的合集: (3.7)然后令Cmax+1为所有汇水盆地的合集: (3.8)可以看出处于和Tn中的元素在算法执行期间是不会被替换的,而且这两个集合中的元素数目与n保持同步增长。因此,Cn-1是Tn的子集。由此得到重要的结果
44、:Cn-1中的每个连通分量都恰好是Tn的一个连通分量。在找寻分水线时先设定Cmin+1=Tmin+1。然后算法进入递归调用,假设在第n步时,已经构造了Cn-1,根据Cn-1求得Cn的过程如下:令Q代表Tn中连通分量的集合。然后对于每个连通分量,有下列3种可能性:(1)为空。(2)包含中的一个连通分量。(3)包含中的多于一个的连通分量。当遇到一个新的最小时符合条件(1),则将q并入Cn-1构成Cn。当q位于某些局部最小值构成的汇水盆地中时,符合条件(2),此时将q并入Cn-1构成Cn。当遇到全部或部分分离2个或更多汇水盆地的山脊线时,符合条件(3)。进一步的汇水会导致不同盆地的水汇合在一起,从而
45、使水位趋于一致。因此。必须在q内建立一座水坝(如果涉及多个盆地就要建立多做水坝)以阻止盆地内的水溢出。3.2.3不准确标记符的分水岭分割 不准确标记符的分水岭分割,分水岭变换直接用于梯度图像时,噪声和梯度的其他局部不规则性常常会导致过分割,其导致的问题可能会非常严重,以至于产生不可用的结果。按照现在的思路,这将意味着具有大量的分割区域。分水岭算法对图像的变化高度敏感,图像含有噪声和其他因素( 如梯度局部不规则性) 常会导致过度分割,使希望得到的轮廓被大量不相关轮廓所淹没。图3-6 不准确标记分水岭算法导致过分割由图3-6(b)所示为从watershed算法得到的分水岭,对应于目标的边缘,由图3-6(c)可见该分割结果出现了比较严重的过分割现象。原因在于分水岭算法是以梯度图的局部极小点作为吸水盆地的标记点,由图3-6(d)可见,梯度图中有过多的局部极小值点。由此可见,不准确标记的分水岭分割容易导致过分割现象,一般不采用此方法。3.2.4 准确标记的分水岭分割在为分割使用分水岭变换之间,通常要使用梯度幅度来预处理图像。梯度幅度图像在沿对象的边沿处有较高的像素值,而在其他地方则有较低的像素值。理想情况下,分水岭变换会在沿对象边缘处产生分水岭脊线。一种有效的解决方案是采用标记的方法与分水岭算法相结合。标记符是一个属于一幅图像的连接