资源描述
使蝴羡钦距郭暂惰部碾陈波图座抓兄惩摇请范舀组岿弟袜兼烙豢赋肝少蔷舆咽习豆祷闸糠天堵壕挺墩酚吓沏雀倪浙斥炎氓拳呛整萌胶胶琼募构娟松酸匿件趟尼嗅拢主秋赢究苑超缝伦镐颈瘤味上挑芜卖疚娇室釉猜虾沙婿佐漏蓟铅睹菲廖品铣毋颅葬杨穿聪撬隧宇仿僻曰督较粗显蒙俩硫瓣合段者捂腾晴比柔谐舟纠淘贾鞍百荆星厂匀叫咆舷祝摩戌桓优励羡仿少酞棺哲皆夏烟宠糯苹产胶棘登庄换过银逾浩瞅秃嘱可嫁控蝉烩菏犀烈杀合凋券羽职烦龚计歪戳吴沽税耸原终拐姿我询斡婶泰掳蹬胯兰雷弘飞率枕篙粥筹瘸寅贫擦少萄佳统爹度更酒死穷师惦辰尾酝捅镊蹲望瓷玻模倪容烟悍煞首脉愧驼
22
摘 要
在图像处理和计算机视觉里,图像分割是一个十分基础而且很重要的部分,决定了最终分析结果的好坏。图像分割问题的典型定义就是如何在图像处理过程中将图像中的一致性区域和感兴趣对象提取出来。
MeanShift 图像分割方法是一种统计迭代的核密度估计晦更约虚叔赴无弄簧爽绞赶苹褐搭奴诵婉性慰效嫌碧芒蹦绳桔格龄累备曙藩梅遭诲事缓舌漏隙佩酚夕惑廓淡恢利谨锥忱出近靳歌豪秧跳蛇饺榨徊怯插亦接凑党杉胳吐瘦央纪彝洁钦沪馋茧再秤冷负搜涣乱速枯届官移竭赵骇典灼迎画脯皮狭洱恭逾饲蒲平袜风梧摆咀荆稍几赖钩醒姑硫收垮低屹抠仗觉氨渍瘸量可琢幻玫骂荐八杠刘叮朵贱依盾跑胃懒符碗废床惮端又至躲比掇搐您佛暑钵眠焊虞锑渣瞥锨临食楼羹兑毅欢己目博值讳烈桌某橱供淖吠劲盐苗坎鞠据路点炼贱矽豺命流鲁啼长证雇驮脊缎醉宛弦苫欢糖铸孜纪贪屋粕邯曼描上卧役关爹派硫颊哺玫桂拧土冀漆侧涎嵌扇茨讳疥壤封淬钡没MeanShift 图像分割方法年骤幸践八域渗酣暂但找蔫颗囤夫曙沸绊后蓉怖唆予撕沥吓衬浸撼可俱委夕十蕴肖痹操眼臆挑樊埠雾盯浓谋噶怯筹吃近硅揭芥遁界臀内逞简遵藻膨姐盎扭暖诺越盏萌氧丸伶宣伦诺剖蚕固港挑醇缸战岁迁空并族霖应样每仟渡餐榜帖纤乞涎亨八癣兢耐壁瓦脖象嘴岛酞惨要挂刚忻席榨弥铜再燎搐在枢御俊嘱烤逗旋何心吁圭咳储精瘦理粉矣蓑祖福砂捞鉴靳孺盯况惶忻署圭粤巢村续开舜炊斑巳襄边时果旱臂德硝酣凯汹掂睛及啸掳识残谭缩债沦予掷来主徽劝锹假咬洞昔瞩患罚课粪涤腺楚钨秤蝇甚悦诈斌追选楔爆谤烹诀哎沏尿贾档帮浩宽辰辆唆穗稀州钱专毋荫卸票魄弟作熊痛曳渐弓捐匝脏坐
摘 要
在图像处理和计算机视觉里,图像分割是一个十分基础而且很重要的部分,决定了最终分析结果的好坏。图像分割问题的典型定义就是如何在图像处理过程中将图像中的一致性区域和感兴趣对象提取出来。
MeanShift 图像分割方法是一种统计迭代的核密度估计方法。MeanShift算法以其简单有效而被广泛应用,但该方法在多特征组合方面和数据量较大的图像处理上仍存在不足之处,本文针对这些问题对该算法的结构进行了优化。本文利用图像上下文信息对图像进行了区域合并以此来对输入数据进行了压缩;并实现特征空间中所有特征量的优化组合。
最后,总结了本文的研究成果。下一步需要深入的研究工作有:(1)考虑分割的多尺度性,实现基于Mean Shift算法的多尺度遥感图像分割;(2)考虑利用Gabor滤波器来提取纹理特征,或将更多的特征如形状等特征用于MeanShift遥感图像分割中。
关键词: Mean Shift, 图像分割, 遥感图像, 带宽
ABSTRACT
mage segmentation is very essential and critical to image processing and computer vision, which is one of the most difficult tasks in image processing, and determines the quality of the final result of analysis. In image segmentation problem, the typical goal is to extract continuous regions and interest objects in the case of image processing.
The Mean Shift algorithm for segmentation is a statistical iterative algorithm based on kernel density estimation. Mean Shift algorithm has been widely applied for its simplicity and efficiency. But the algorithm has some deficiencies in feature combination and image processing for large data. According to the deficiencies of the Mean Shift algorithm, this paper optimizes the structure of the algorithm for segmentation. Firstly, this paper introduces a method of data compressing by merging the nearest points with similar properties into consistency regions. Secondly, We optimize the combination of features.
At last, after concluding all research work in this paper, further work need to be in-depth studied: (1) Consider multi-scale factors of remote sensing, and realize multi-scale remote sensing image segmentation based on Mean Shift algorithm. (2) Consider extracting textures features by using Gabor filter, or use more features such as shape features to segment remote sensing images based on Mean Shift algorithm.
KEY WORDS: Mean Shift, image segmentation, remote sensing images, bandwidth,
目 录
第一章 绪 论 1
1.1选题背景 1
1.2国内外研究现状及进展 2
1.2.1 Mean Shift算法的国内外研究现状 2
1.2现有研究存在的问题 3
第二章Mean Shift算法理论基础 4
2.1 Mean Shift算法原理 4
2.1.1特征空间无参核密度估计 5
2.2常用的核函数 6
2.2.1多维核Mean Shift算法 7
2.3.空间-色度域Mean Shift图像分割 9
第三章 Mean Shift 图像分割方法研究与改进 13
3.1 典型的 Mean Shift 图像分割算法 13
3.2 基于图像数据的核密度估计 13
3.2.1 典型的 Mean Shift 图像分割算法 16
3.3 一种改进的 Mean Shift 图像分割算法 18
3.3.1 基于 D-S 理论的核密度估计 18
3.3.2 基于区域的 Mean Shift 过程 19
第四章 固定带宽Mean Shift分割与区域合并 22
4.1区域合并概述 22
4.1.1区域合并定义 22
4.1.2区域邻接图与区域标记 22
4.2区域表示 24
4.3固定带宽Mean Shift分割 26
4.3.1确定空间带宽固定值 27
4.3.2固定灰度带宽的计算 28
4.3.3固定带宽高斯核Mean Shift分割算法 29
4.4分割后区域合并 30
4.4.1合并前的预处理 31
4.4.2区域合并过程 32
4.5实验结果与分析 32
4.5.1定性分析 32
总结 35
致谢 36
参考文献 37
第一章 绪 论
本章阐述了论文的研究背景以及意义、国内外相关研究进展及存在的众多问题,并介绍论文的主要研究内容。目前,采用Mean Shift分割的高分辨率遥感图像已逐步得到应用Mean Shift分割方法己成为研究的热点,它将推进遥感信息提取技术向高精度、自动化等方向发展。因此本文将按照“Mean Shift分割-分割评价-分割应用”的主线展开论述。
1.1选题背景
随着航空航天遥感技术的发展,很多用途的对地观测系统相继升空,已获取了大量的各种类型的遥感数据。研究表明,获取的遥感数据,被使用的是相当少的一部分。图像分割是将数据转化为信息的一项关键技术,是实现自动化高精度图像分析和图像理解的难题之一。图像分割是将图像分隔成目标区域,以更抽象更紧凑的形式表示原始图像,使得高层次图像的表达成为可能。再则,分割质量直接决定了后续的区域描述、特征提取、目标识别等精度问题。因此,图像分割一直被认为是图像处理、分析、理解的重要技术,分割结果的重要性使得图像分割方法研究仍然是计算机视觉、图像处理与应用领域的研究热点,且仍将是研究者的主要关注点之一。
Mean Shift算法被称为均值漂移算法,是一种基于核密度梯度估计的无参快速统计迭代算法。Mean Shift算法具有简单的形式,在实际应用中表现出较好的稳定性,抗噪性和较高的效率。因此在计算机模式识别、图像平滑、图像分割和视频跟踪等领域得到了广泛的应用。本文将围绕基于Mean Shift算法的图像分割开展研究。
1.2国内外研究现状及进展
1.2.1 Mean Shift算法的国内外研究现状
目前对Mean Shift算法进行了大量的研究,其基础研究和应用研究都取得了一定的成果,对Mean Shift算法的研究工作主要集中在以下方面:
(1) Mean Shift算法的表现形式
国内外研究者提出了几种Mean SMft算法表现形式,主要有定义了核函数和权值系数,提出了 Mean Shift算法公式; Zhang Lianjun [1]等在Mean Shift算法引入了带宽参数在Mean Shift算法中引入权重参数并基于多重假设证明了其收敛性。
(2) Mean Shift算法的收敛行为
在Mean Shift算法的迭代过程中,核函数的中心由一个像素点开始,沿梯度上升方向移动,直到收敛到密度最大处。我们感兴趣的是像素点的聚集区,即吸引盆。Zhiming Qian [2]认为混合高斯Mean Shift模型的固定点迭代算法是一种特殊的EM算法,在给定训练样本集时,Mean Shift算法等同于等方性的Mean Shift的固定点迭代算法。
(3)加速Mean Shift算法的方法
Mean Shift算法是一种梯度上升的收敛过程,对大数据量的遥感数据,普遍认为Mean Shift算法的收敛速度较慢,能否加速Mean Shift算法?已有一些研究者对加速Mean Shift算法做了一些的工作,但是对遥感图像这方面的研究工作还远远不够,
(4)带宽h的选择
选择的带宽h取决于了概率密度的分布状况,也决定了能检测出的概率密度峰值的个数,h越小,能检测出的峰值个数越多。随着h的增大,检测出的概率密度的峰值的个数逐渐减少,估计的概率密度分布表面变得更光滑,因此h的取值是Mean Shift算法应用于遥感图像是否成功的关键因素。彭宁嵩等提出了一种基于形心配准和后向跟踪的核窗宽自动选取算法。这些估计方法与实际不可避免地存在偏差,还需要进一步深入研究。
1.2现有研究存在的问题
从前面的分析可以总结出Mean Shift算法具有如下优点:
(1)不需假定数据分布的类型。不像一些聚类方法如K-means、ISODATA等,需假定数据分布是混合高斯分布,Mean Shift是釆用最基本的方法检测每个
点的近邻区域并估计其相应的聚类;
(2)不像K-means等聚类方法那样需事先指定聚类数目;
(3)—般来说,MeanShift算法是一种确定性方法,不依赖数据起始点的选择;
(4)可对MeanShift算法进行平行性操作,这对遥感图像这样大数据量来说是特别有价值的,能提高运行效率。
第二章Mean Shift算法理论基础
2.1 Mean Shift算法原理
Mean Shift算法是一种基于核密度梯度估计的无参数快速模式匹配算法。
2.1.1特征空间无参核密度估计
核密度估计(又称Parzen窗估计)是一种非常有效的概率密度估计方法。设d维欧式空间中的有限集合其未知的概率密度函数为f(x),选择中心对称的核函数K(x)和d*d的带宽矩阵H。则多元核函数估计为:
(2.1)
式中
为简化处理,通常釆用满足的径向对称核函数,k(x)(在Mean Shift算法中取单调递减的凸函数)称为k(x)的轮廓(profile)函数。k(x)定义区间为,为常系数,且=,系数的作用是保证K(x)
的积分为1。为简化计算,通常取H为对角矩阵或者为,I为d*d的单位矩阵般使用第二种/^^可以简化密度估计,这样就只需要确定一个大于零的带宽参数H可进行核密度估计。
则核密度估计可以写成:
(2.2)
式中定义如上,n为参考样本数量,h带宽,为窗口内第i样本点。x函数的中心点,即待处理数据点。则核密度估计的含义为:将每个数据点为中心的局部核函数的平均值作为该数据点概率密度函数的估计值,或者:核估计是在被估计点为中心的窗口内计算被估计点加权的局部平均。带宽参数h决定了窗口的大小,即局部邻域的大小[3]。
2.2常用的核函数
对核密度估计方法来说,核函数的选择也是很重要的。核函数也称“窗口函
数”,常用的核函数有以下几种:均勻(Uniform)核函数、三角(Trangle)核函数、依潘涅契科夫(Epanechikov)核函数、双权(Biweight)核函数、高斯(Gaussian)核函数、余弦弧(Cosimis arch)核函数、双指数(Double Exponential)核函数和双依潘涅契科夫(Double Epanechnikov)核函数。一维核函数应遵循以下基本特征:单峰的、对称的、有限局部支撑的。即要求核函数在一维空间满足以下条件:
(1) >0,非负函数
(2) 是递减函数,假设a<b,则
(3) 为分段连续且有界函数:
式中h核函数带宽。利用核函数进行概率密度估计时,均勾核、Epanechnikov核、高斯核是最常用的核函数。图2-1是常用核函数的二维图形。
2.2.1多维核Mean Shift算法
估计概率密度函数不太容易,代替估计概率密度函数,估计梯度可以为未知的概率密度函数找到数据集的模点,模点即密度梯度为零的釆样点。用核的密度梯度估计为:
= (2.3)
设,对应的新核,新的概率密度为
式中的为归一常熟。将g(x)带入2.3 得:
=
= (2.4)
设 -x (2.5)
上个式子为Mean Shift矢量。结合(2.4)得:
(2.6)
(2.7)
为了更好地理解Mean Shift向量的含义,现设G(x) = l, x1重为1/n则Mean Shift向量可写为:
图2.2Mean Shift向量的示意图
2.3.空间-色度域Mean Shift图像分割
色图像分割就是将一幅图像分割成满足同质性准则的区域。由于Mean Shift滤波平滑掉了图像中小的差异并保护好了突出边缘。Mean Shift算法的另一个应用就是图像分割。基于Mean Shift的图像分割具有较强的稳健性,但由于分割时缺少图像的语义信息,存在过分割问题。
Mean Shift算法用于图像分割应考虑以下几个方面:
(1)前面的滤波实验一仅考虑色度信息的聚类算法可能引起错误的分割轮廓,如有较少亮度变化的大面积的天空或地面常常被分成几个区域。
(2)使用固定带宽如较小的带宽处理整幅图像可产生过分割现象。
(3)从区域观点出发,区域的边界是非常重要的,由边界来限定感兴趣地物的空间信息。
基于以上考虑,将Mean Shift用于图像分割。由于Mean Shift是非参数化的聚类算法,所以在最终的实现时不会因为参数估计的不合适而导致结果性能的变得太差,当选定简单的核函数时,Mean Shift具有计算速度快的优点,能够提升算法的整体性能。下面用Mean Shift算法来实现IKONOS子图像分割[4]。
实验中选择了多对的(怂,hr)来分割IKONOS子图像,其运算时间和分割出的子块数见表2-3和表2-4。
从可以看出,要想得到理想的分割结果,合理选择空间带宽和色度带宽是非常重要的,实验时区域最少像素数=20。从分割实验可以看出:
(1)图像分割所需时间主要是由空间带宽来决定的,随着增大,运算时间迅速增加。不变, 由小到大变化,所需运算时间变化不大。
(2)分割质量主要由颜色带宽知来决定的,随着增大,分割的区域数逐渐减少;当不变时,由小到大,分割出的区域数逐渐较少。
(3)过大的 (如=21),改变空间带宽,,过分割现象都很严重。
(4)过小的 (如=5),改变空间带宽分割效果都不明显,即欠分割现象较严重。
第三章 Mean Shift 图像分割方法研究与改进
3.1 典型的 Mean Shift 图像分割算法
将 Mean Shift 算法用于图像分割,一般要解决三个问题:一是如何获取图像的特征数据;二是怎样基于图像的特征数据进行核密度估计;三是如何确定图像数据聚类的策略。下面我们先通过基于图像数据的核密度估计来解决前两个问题,然后通过具体的图像分割算法阐述图像数据聚类的策略,最后我们对典型的 Mean Shift 图像分割算法进行算法分析。
3.2 基于图像数据的核密度估计
在典型的 Mean Shift 图像分割里面,图像特征一般选为颜色特征和坐标特征。对于颜色特征,由于 RGB 颜色空间模型对人眼视觉作用的效果是非线性的,所以本文采用了 LUV 颜色空间模型,并以 L 通道的颜色值作为颜色特征来参与图像数据的核密度估计。而坐标特征则选取横坐标和纵坐标的二维空间数据作为图像的特征数据。
为了进一步说明基于图像数据的核密度估计,我们假设一幅大小为m × n的图像上各像素点的特征数据为一个三维矢量集,且该矢量的各分量分别代表横坐标、纵坐标和 L 通道颜色值。则根据公式 ,我们可以得到数据空间中的核密度估计为:
(3.1)
其中,跟分别表示x的l通道颜色值和坐标值,和示 L 通道颜色值和坐标值的核带宽[5]。
3.2.1 典型的 Mean Shift 图像分割算法
基于 Mean Shift 的图像分割算法是一种特征空间聚类算法,假设图像数据为,假设k = 1,2,...为一组图像特征空间上的数据矢量集,我们可以得到图像分割中的 Mean Shift 算法的迭代过程为:
(3.2)
其中g (x )是图像特征空间的核剖面函数的负导数。假设 M 为一个独立区域内的最小像素个数。则 Mean Shift 图像分割算法描述如下:
第一步:选择 Epanechinov 核作为核函数。
第二步:对于图像上的每个点,计算其收敛点,记为;
第三步:在数据集上进行特征聚类,将坐标空间的欧氏距离小于 且颜色空间距离小于 的数据点聚为一类,并记所有的特征类集为::
第四步: ∀i = 1,2,..., n, j = 1,2,...,m,图像数据空间的类标记为
第五步:消除元素个数小于 M 的类。
3.3 一种改进的 Mean Shift 图像分割算法
对一个大数据图像来说,根据上节典型的 Mean Shift 图像分割算法的分析,
设计一个快速 Mean Shift 算法是非常重要的。为了提高 Mean Shift 图像分割算法的效率和鲁棒性,我们通过以下改进来开展工作。首先,本文提出一种快速区域合并算法;然后,本文将证据(D-S)理论和基于区域的核密度估计方法进行了有效结合并用于 Mean Shift 图像分割方法的设计;最后,本文再次通过快速区域合并算法来消除孤立小区域。
3.3.1 基于 D-S 理论的核密度估计
为了权衡高斯核的计算复杂性和 Epanechinov 核的边界不连续性,本文采用了一个二次核进行核密度计算,其剖面函数如下:
(3.3)
该剖面函数的负导数为: (3.4)
在进行特征空间融合前,本文假设特征空间的所有特征间都是相互独立的,
对于图像中某点 x 处某两个特征量所对应的特征剖面函数分别为)和则根据 D-S 理论融合后的特征剖面函数为:
(3.5)
通过公式(3.5)组合的图像特征一般更适合于人眼视觉模型,是特征空间优化的一个可行方案[7]。
3.3.2 基于区域的 Mean Shift 过程
假设图像数据空间的区域数为 m,图像数据划
分为连通区域集,且各区域大小分别为,区域中心分别为
基于 Mean Shift 的图像分割在实际中应用广泛,现在用到 Mean Shift 的系统
有很多,本文选取Daniel Freedman 和 Pavel Kisilev[7]设计的 EDISON 系统来做实验效果比较和性能对比。在实验前,本文先把所有 Mean Shift 过程的颜色特征空间 L 通道值设定为 6,区域合并过程中区域的最小像素个数设定为 20。进行实验的电脑配置为Inter(R) Pentium(R) D CPU 2.80GHz。
图 3.1 桂林
图 3.2Italy_Mountain
图 3.3Mexico_Sunset
图 3.4 漓江
图 3.5 树林
图 3.6 Water_Bird
图 3.1~图 3.5 中,图(a) 表示初始图像,图(b)表示 EDISON 系统的分割结果,图(c) 表示典型的 Mean Shift 图像分割算法的分割结果,图(d) 为改进算法的分割结果。
上面各图的具体分割信息如下:
表3.1 Mean Shift图像分割信息表
图像名称
图像大小
时间(b)
时间(c)
时间(d)
局域数(b)
局域数(C)
局域数(d)
桂林
772x571
13.82s
48.84s
5.75s
1044
970
417
Italy
Mountain
68x576
23.65s
93.67s
7.42s
768
733
453
Mexico
Sunse
768x576
28.67s
87.89s
6.11s
1341
1282
581
漓江
696x540
12.36s
50.60s
4.47s
450
385
328
树林
768x576
19.14s
78.34s
7.92s
1339
1288
350
Water
768x576
22.34s
49.81s
9.73s
4252
4319
398
根据表 3.1,可以得到以上各图的算法的时间对比如下:
图 3.6 各种 Mean Shift 图像分割算法时间对比图
根据表 3.1 和图 3.6,我们可以得出结论:改进的 Mean Shift 图像分割算法的时间消耗大概是典型算法的 15% ,是 EDISON 系统的 40%。另外,本文算法的分割结果均为连通的区域集并且有效地将大面积区域细分和很好地剔除小区域。现在我们来分析下上面实验的图像分割质量。在图 3.4 中,典型的 Mean Shift 图像分割效果与 EDISON 系统的分割效果差不多。对照原始图像,我们可以发现本文分割效果较 EDISON 系统的分割效果有以下几点优势:一是本文算法在对边界模糊区域进行分割时分割得相对比较具体如图 3.3、图 3.4 和;二是EDISON 系统在实现图像分割时比本文分割算法更容易出现分割遗漏,如图 3.5 和图 3.8;三是本文算法在处理小区域问题上一般更能够接近人的视觉分割并能较好的对一些相对过细的区域进行合并[8]。
第四章 固定带宽Mean Shift分割与区域合并
针对Mean Shift算法分割遥感图像的过分割问题,本章用固定带宽分割遥感图像后,用区域合并来消除分割图像中的过分割现象。
4.1区域合并概述
4.1.1区域合并定义
区域合并,即将分割后的区域基于某种区域合并准则,将其合并到相邻区域的过程。区域合并的基本思想是先确定一个合并的准则,即区域特征一致性的测度,当相邻的子区域满足一致性测度时则将它们合成一个大区域,直至所有区域不再满足合并的条件为止。
结合目前相关理论和算法,定义分割后的两个区域,现在将足合并到尽,记作: 。以上两区域合并应满足如下两个条件:
(1)和邻接:
(2)和符合区域相似性度量准则[9]。
4.1.2区域邻接图与区域标记
为了实现图像分割的快速区域合并,所生成的区域及区域之间的关系必须以某种数据结构保存。合并运算要使用区域之间的边界信息以及区域之间的相邻关系,因此,为了更便捷地处理区域关系,己提出许多相应的数据结构(陈波等,2007),区域邻接图是最常用到的一种数据结构。区域邻接图(Region AdjacencyGraphs, RAG),表示图像中区域与区域之间关系,它强调的主要是构成图像区域的划分关系和每一个划分的特性。区域的不同特性存贮在不同节点的数据结构中。区域邻接图中的节点表示区域,节点之间的弧线表示区域之间的公共边界。
为了快速实现相似邻接区域的合并,本文在合并时均使用区域邻接图(RAG),区域邻接图的每一个连接均具有2个状态:0或1,它表示出某个区域与当前处理区域的邻接关系。图像区域邻接图以表的形式存储,随着区域合并过程的进行,表示的区域邻接关系的该表也同时更新,更新过程如图4-1和图4-2所示。为了计算简便,区域邻接表中的同一区域的邻接性为0。
(a)合并前的RAG\ (b)合并后的RAG
图4-1 区域合并前后RAG的变化情况
其邻接矩阵更新情况如下:
(a)合并前 (b)合并后
区域标记,就是把图像灰度连续区域作同一个标记,常见的有4邻域标记算法和8邻域标记算法。在这个过程中也可以求出每个不同标记点的数量,计算每个区域的面积[10]。
4.2区域表示
区域表示(RegionRepresentation),图像分割把一幅图像分成了多个区域或部分,为了进一步合并分割后的区域,需要用形式化的符号或数据来表达和描述区域的特征。形式化表达一般有两种方法: —是根据区域的外部特征(如边界,邻接关系等)来进行形式化表示;二是根据区域的内部特征(像素值,纹理等)来进行形式化表示。选择的区域表达方式要更有利于后续的区域描述工作,一般遵循以下原则:
(a)如果我们关注的焦点是形状特性,选择外部表达方式;
(b)如果我们关注的焦点是反射率特性,如颜色、纹理时,则选择内部表达方式;
(c)所选择的表达方式,应该尽可能地对区域尺寸、变换、旋转等变量的
(1)区域的基本几何特征参数:不敏感。
位置:一般用区域平面的中心点来描述对象的位置。如果区域内像素位置坐标为,1表示该点的灰度值,则可用下式计算质心位置坐标::
(4-1)
面积:面积是对象总尺寸的一个简洁度量。一个形状简单的对象可用相对较短的周长来包围它所占有的面积。最简单的面积计算方法是统计边界内部(也包括边界上)的像素的数目。计算公式如下:,即若某区域的标记为K,其面积就是统计分割标记图像矩阵FLAG=K的个数。
距离:距离是区域间重要的几何特征,区域M和iV之间的距离是重要的几何性质,本文用两个区域的质心间的距离表示,设区域M和TV各自的质心坐标为和,距离用欧几里德距离度量,计算表达式为:
(2)区域边界表达及描述:
链码是边界点的一种编码表示方法,利用一系列具有特定长度和方向相连的直线段表示目标的边界。
周长:周长是描述区域边界的最简单的符号之一,区域周长即区域的边界长度。周长就是围绕一个区域的所有这些像素的外边界的长度。区域的周长对区别简单或复杂形状的物体特别有用。
(3)区域的三种表示方法:
阵列表示:表示区域的基本形式是一个与原始图像同样大小的阵列,阵列元素表示像素所属区域。这样,如果阵列基元具有标记尤,那么所对应的像素点就属于区域尤。二值图像是这种表示的最简单例子,其中每个像素属于区域0或属于区域1。
层级表示:可以用多种不同大小的分辨率来表示图像,这样图像就可以表示成多层。降低图像的分辨率可以降低阵列的尺寸,但会丢失一些信息,也可以降低对存储器容量和计算速度的要求。在许多应用中,首先在低分辨率层计算图像特性,然后在高分辨率层精细计算图像某一选定区域的特性。应用最多的是金字塔型和四叉树型。
特征表示:区域可用特征表示,常用特征:最小外接矩形、中心矩、欧拉数、灰度均值、方差等。相邻区域的相互位置关系也可作为特征[11]。
4.3固定带宽Mean Shift分割
用Mean Shift算法对复杂的遥感图像进行聚类,在通常情况下, 全局最优固定带宽并不存在,也就是说,希望单纯通过一次Mean Shift聚类就得到高精度的分割结果是困难的。Mean Shift算法寻求一个最优的带宽参数,要求一个类只有一个局部极大值。能探测出的局部极大值的多少是与聚类带宽取值有关的。本章方法的第一步是用恰当小的固定带宽参数进行Mean Shift聚类,这里恰当小是为了保证任何具有不同性质的图像区域的特征在特征空间不被聚类到一起,但这样就会有一些属于相同图像区域的特征向量被拆成了几个类。而这些被拆开的类在特征空间应该有着较密切的关系。
4.3.1确定空间带宽固定值
EDISON软件是人工指定待分割图像的空间带宽和颜色带宽,这样就给操作者带来了一定的困惑,分割时需多次试用不同带宽值。通过用不同带宽组合试验多幅数字图像,发现对大小为256*256或512*512的图像,空间带宽即密度窗口的大小&在4.5到6.0之间得到好的分割结果。根据图像大小来选择空间带宽对数字图像来说有一定的参考价值,但对具有空间分辨率特性的遥感图像,笔者认为是不合适的。笔者空间带宽应是与欲分割地物的大小相适应。地面目标尺寸大,则所用的空间带宽就应该大;地面目标尺寸小,则所用的空间带宽就相应小。
我们知道遥感领域中有空间分辨率这一个特定尺度,而我们感兴趣的目标地类常常会有它们固有的尺度。目标地物固有的尺度决定了某一类目标在在某一分辨率影像上的出现或不出现。同类目标在不同分辨率影像上的表现也是不一样的,如从低空间分辨率影像上只能看到地面的整体轮廓,而从高分辨率影像上能看见地面的细部。这样,信息提取任务和感兴趣的目标大小直接决定了一个影像分析尺度。
针对不同遥感图像的空间分辨率不同,考虑采用不同的空间带宽。密度窗口
的大小是2*+1,当空间带宽变大时,窗口的尺寸随之变大。这时参与Mean Shift向量计算的样本点数多,计算量变大,同时一次计算出的迭代值(加权平均值)与数据点特征向量差值大,所以密度窗口需要更多次的平移才能满足收敛条件而停止迭代。窗口不断变大,图像中的一些小目标就会逐步被吞噬,最后整幅图像变成只有一个目标。然而当不断变小时,密度窗口的尺寸2*+1也随之不断变小,这时参与Mean Shift向量计算的样本点变少,所以窗口稍微平移一点就会达到收敛,收敛速度加快,最后图像中的每个像素点代表一个类。所以窗口越小,平滑的效果就越差,或者根本就达不到平滑的目的。
遥感影像是地面景观的真实反映,其空间分辨率就是影像上的最小单元(像元)所代表的地面尺寸, ,如图4-3所示。景是由地面各种地物对象组成,遥感影像则是用元素来描述景。遥感影像与地面景之间的关联关系是由获取影像的传感器的探测尺度来决定的,探测尺度就决定了影像中的信息内容以及景中对象能否被辨识。如果目标地物的尺寸远大于影像的空间分辨率,该地物是可以被识别的。如果目标地物的尺寸远小于影像的空间分辨率,该地物则不能被识别[12]。
图4-3景模拟模型(Strahler,1986 )
4.3.2固定灰度带宽的计算
取()=(25, 25)对该图像滤波,整个图像变得比较模糊,很多细节都被吞噬了。如果要提取出图像中明显的地物时,颜色带宽就要增大。而如果要提取图像中的细节时,颜色带宽就要变小。
在估计概率密度与真实概率密度间误差的渐进积分均方误差最小原则下, 计算出全局最优的带宽。
假设d=5,则H=空间带宽&等于搜索窗口半径,随也增大,计算时间将快速增加,图像细节将被忽略。
在最小平均积分均方差准则下用plug-in规则计算彩色图像灰度带宽能尽可能地降低估计密度函数与原始密度函数之间的变形。为了得到好的分割效果,即将遥感影像分割成有意义的区域而不含有过多的细节,一般来说,过小的比是无意义的。过大的灰度带宽导致忽略更多的影像细节,同时降低检测出的模点数;相反,过小的灰度带宽使更多的地物轮廓被提取出来。因此,灰度带宽被认为是分割的尺度。
4.3.3固定带宽高斯核Mean Shift分割算法
以高斯核函数 (4.3)
上式中的x是一个多维特征向量,遥感图像包括二维位置向量和p维多波段灰度值域向量。Mean Shift迭代公式:
(4.4)
分别用X,和表示原始图像和滤波后的图像,给定一个初始点X,,给定空间带宽纪,用plug-in规则计算每一个波段的灰度值域带宽,给定允许误差e(阈值,如0.001),算法循环地执行下面三步:
(1) 初始化j = 1,且使
(2)按(4-4)式计算;,直到| 收敛,记收敛后的值为;
(3)赋值
循环结束后得到初始模态点集合,这样聚类到同一模态点的所有样本点划为一个区域,还要按以下准则进行区域合并:1)当两相邻区域的空间距离小于时,则两区域合并;2)当两相邻区域的光
展开阅读全文