面向投资节能的图像颜色优化研究.doc

资源描述

浙江大学硕士学位论文摘要硕士学位论文面向节能的图像颜色优化研究摘要在目前的桌面电脑和移动设备当中，显示器所占用的电能功率消耗比例分别达38%和50%，因此节能显示技术的研究，特别是在延长移动设备电池持续供电时间等方面有着十分迫切的需求。从技术上讲，显示内容的节能显示主要可以从硬件和软件方面进行。在对显示器节能和图像处理相关方法进行了综述的基础上，本文从软件处理角度出发，围绕图像的节能显示优化设计的问题展开了研究，并提出了一种基于节能的图像自适应亮度优化方法。该方法首先用双边滤波对图像进行去噪，然后通过Sobel边界检测算子从图像中获取显著边界作为图像主要特征，随后构造特征重要性场，用于指导图像的特征增强，并实现自适应亮度优化。该方法在应用于图像亮度降低时，可以在保持特征分辨能力的同时获得节能显示的效果。继而，本文描述了一个实现上述图像处理方法的软件原型，并提供基本的图像处理操作，方便用户对方法的参数调节进行预览，并对处理结果进行分析比较。最后，本文将上述方法应用于一般图像进行了实例测试，并做了简单的用户研究，结果表明该方法能够在相同节能效率下更好地保持图像中的感知特征。关键词：节能，颜色优化，视觉感知，边界检测 i 浙江大学硕士学位论文 Abstract Abstract In the commodity desktop computers and mobile devices, the monitor consumes relatively 38%~50% electrical energy of the total consumption. Thus, designing an energy saving scheme is very essential, especially in extending power supply of the mobile device battery. Technically, energy saving display can be achieved by both hardware and software solutions. In this thesis, we conduct a study on image brightness optimization problems for energy saving display based on the survey on energy-saving schemes and image edge detection. In particular, we propose an adaptive dimming approach for display energy saving. In this approach, bilateral filtering is performed upon the original image firstly to smooth the noise while preserving evident features. Then we construct a saliency map by extracting edge features from the image using Sobel operator. The saliency map describes the region of interest which plays an important role in users’ understanding of an image. In the optimizing process, we perform a saliency guided feature enhancement by using the saliency map. With the proposed approach, we can generate a dimmed image which can be displayed with less energy consumption. Additionally, we describe a software prototype which implements our method and some elemental image operations. Users can preview the intermediate results while they are tuning the relevant parameters, as well as analysis and comparing of the results. We apply our approach on several applications, including map images and natual images. A pilot user study demonstrate that our approach achieve better performance in preserving perception-based features in the dimmed images than uniform dimming under the same energy consumption. Keywords：Energy saving, Color optimization, Visual perception, Edge detection ii 浙江大学硕士学位论文目录目录摘要 i Abstract ii 第1章绪论 1 1.1 课题背景 1 1.2 显示器节能显示相关方法 3 1.3 图像颜色与亮度优化 5 1.4 本章小结 6 1.5 内容安排 7 第2章研究中需要的工具综述 8 2.1 图像亮度优化 8 2.2 图像边界检测 10 2.2.1 边界检测的基本步骤 11 2.2.2 边界检测算法 11 2.2.3 边界检测算法比较 13 第3章基于节能的图像颜色优化算法研究 16 3.1 方法研究目标 16 3.2 方法技术细节 16 3.2.1 基于双边滤波的图像降噪处理 17 3.2.2 特征检测及特征重要性场构造 19 3.2.3 基于特征重要性场的图像优化 23 3.3 图像处理原型软件 26 3.3.1 需求分析 26 3.3.2 主界面和交互设计 26 3.3.3 基本处理功能的实现 28 3.3.4 图像自适应亮度优化的实现 31 3.4 本章小结 32 第4章实验结果与分析 34 4.1 实验结果 34 4.2 性能统计 40 4.3 用户研究 40 4.3.1 实验设计 41 4.3.2 实验过程 41 4.3.3 实验结果 41 4.3.4 讨论分析 42 4.4 本章小结 43 第5章总结与展望 44 5.1 本文工作总结 44 5.2 未来工作展望 44 参考文献 46 致谢 49 II 浙江大学硕士学位论文表目录图目录图 11 OLED显示屏 2 图 12 OLED显示器对于红、绿、蓝纯色的功率消耗曲线 4 图 21 图像亮度调节实例 10 图 22不同边缘检测算子的离散形式（图像卷积算子） 13 图 23不同边缘检测算子结果对比 14 图 31 图像自适应亮度优化算法的流程图（字母表示本章中所用符号） 17 图 32 双边滤波效果 19 图 33 本小节使用的示例输入图像 20 图 34 PBA算法得到示例图像的边界图像的距离场，像素亮度表示距离边界像素的欧式距离 21 图 35 示例图像的特征场示意图，及文中各参数的含义 22 图 36 示例图像的特征重要性场 22 图 37 一个实际图像的特征场构建过程 23 图 38 对示例图像进行自适应亮度优化的结果示意图，注意到图像中元素边界部分的对比度相比于原图像的变化 25 图 39 对图 37中实例图像进行自适应亮度优化的结果示意图 25 图 310原型软件的功能模块图 26 图 311 图像处理原型软件的主界面 27 图 312 图像处理原型软件的“自适应亮度优化”选项卡中的参数与命令 28 图 313 图像通道选择界面 29 图 314 图形亮度和对比度调节界面 31 图 315 图像自适应亮度优化操作界面 32 图 41 方法应用到普通图像的结果对比 35 图 42 方法应用到地图图像的结果对比 36 图 43 在游戏场景中使用深度图进行自适应亮度优化的结果对比 38 图 44 不同参数配置对结果的影响 39 图 45 可视搜索任务的平均完成时间和标准差 42 图 51 三菱OLED大屏显示系统 45 表目录表格 1处理不同分辨率图像时的性能统计（时间单位：毫秒） 40 II 浙江大学硕士学位论文第2章研究中需要的工具综述第1章绪论 1.1 课题背景液晶显示器，或称LCD（Liquid Crystal Display），是一种平面超薄的显示设备，它由一定数量的彩色或黑白像素组成，放置于光源或者反射面前方。液晶显示屏是用于数字型钟表和许多便携式计算机的一种显示器类型。它的主要原理是以电流刺激液晶分子产生点、线、面配合背部灯管构成画面。LCD显示使用了两片极化材料，在它们之间是液体水晶溶液。电流通过该液体时会使水晶重新排列，造成光线透过率的变化。液晶显示器（LCD）作为科技含量高的技术，正朝着轻、薄、短、小的目标发展。在便于携带与运输的前提下，传统的显示方式如CRT显像管显示器及LED显示板等，皆受制于体积过大或耗电量过大等因素，无法适应使用者的实际需求的提高。而液晶显示技术的发展正好切合目前信息产品的潮流，无论是直角显示、低耗电量、体积小、还是零辐射等液晶显示屏优点，都能让使用者享受最佳的视觉环境。在目前的桌面电脑和移动设备当中，显示器所占用的电能功率消耗比例分别达38%和50%[1,2]，因此节能显示技术的研究，特别是在延长移动设备电池持续供电时间等方面有着十分迫切的需求。TFT-LCD或LCD显示器是目前最流行的显示器，其主要技术是薄膜场效应晶体管，在给定一个白色背光光源的基础上，通过改变每个像素中颜色单元的透光率获得不同颜色的显示。当透光率为0时，屏幕会显示为黑色，然而由于工艺的问题，这类显示器产品通常会存在漏光的现象。TFT-LCD显示器的主要电能消耗用于维持背光光源的亮度，因此整体的功率消耗也主要由背光的亮度及其制造工艺决定。一般来说，通过合理地降低背光光源的亮度可以实现LCD显示器的节能显示。最近几年，一种新的基于有机发光二极管（organic lighting-emitting diode, OLED）的显示器（以下简称OLED显示器，见图1.1）则通过像素中的颜色单元自发光的形式显示颜色，因此就避免了使用背光光源[3]。当屏幕面板不显示任何内容时，像素不会被通电，因而不消耗电能。OLED显示器采用非常薄的有机材料涂层和玻璃基板，当电流通过时，有机材料就会发光。由于OLED显示器具的像素是自发光的，因此OLED显示器具有很多特点，其显示屏幕的可视角度几乎可以达到极限，屏幕黑色显示非常纯正，因此OLED显示器具备了许多传统LCD显示器不可比拟的优势。OLED 显示器通过调节每个像素中红、绿、蓝三种单色发光单元的亮度以显示不同的颜色，因此其功率的消耗实际上和每个像素的颜色相关，相当于不同的显示内容会产生不同的功率消耗。在图像处理与应用程序的颜色设计中，可以通过调节优化图像颜色成分或选取更节能的颜色模式的方式实现节能的显示。另外，OLED显示屏幕可以做得非常轻薄，甚至可以弯曲。图 11 OLED显示屏 OLED 显示屏的节能概念悄然掀起，成为它最为吸引消费者眼球的亮点，也是近年来火爆增长的原因。目前市场对显示屏节能技术需求较大，OLED显示屏的进一步节能成为了行业追逐的支撑点。通过降低图像亮度或者调节优化图像颜色成分的手段都可以降低显示器的功率消耗。本文根据显示器的特性，实现了一种面向节能的图像亮度优化方法，通过对图像内容的特征增强方法补偿亮度降低后信息传递和图像质量的损失，从而实现一般图像特别是地理信息图像的节能显示。为了便于用户对方法中的参数调节产生的效果进行直观的预览和比较，本文也描述了一个实现上述图像处理方法的原型软件，并提供基本的图像处理操作，方便用户对方法的参数调节进行预览，并对处理结果进行比较。 1.2 显示器节能显示相关方法在目前的桌面电脑和移动设备当中，显示器所占用的功率消耗比例分别高达38%和50% [1, 2]。因此节能显示技术的研究，特别是在延长移动设备电池持续供电时间等方面有着十分迫切的需求。如果一台电脑拥有省电功能，每小时待机耗电约35W，约比一个一般亮度的灯泡稍高，尽管这一浪费对个人影响不大，但若全球所有的电脑长时间待机，每小时浪费的电量就非常惊人[40]。考虑到显示器占用了整个系统较高的耗电比例，因此显示器的节能问题十分重要。举个例子，著名的搜索引擎的主页面一般都非常简单，比如Google的页面是纯白色背景上的一个搜索框和少量链接。在一个OLED显示器上长时间显示时，其几乎需要最大的功率消耗，一个暗色或黑色背景的页面则可以有效地节约电能消耗。网站则仅提供了一个黑色背景的页面，通过链接的方式返回Google搜索结果，其主页宣称节约电能已达3800千瓦时。虽然数据的真实性可能是基于访问其页面的用户都使用了OLED显示器进行计算得到的，但也正说明了基于OLED显示器进行节能设计的重要性。目前，显示器的主要技术是基于薄膜场效应晶体管的液晶显示器（Thin Film Transistor Liquid Crystal Display, TFT-LCD），通过改变每个像素中颜色单元的透光率获得不同颜色的显示，因此其一般需要一个背光光源。TFT-LCD显示器在当前和过去的十几年中一直比较流行，大部分使用了冷阴极荧光灯作为背光光源为显示器提供背光照明。对于这类LCD显示器，由于背光光源的电能消耗在整个显示器系统中占绝对的优势，因此也就决定了其功率消耗相对恒定，主要与背光光源的电流呈正比的关系。随着技术进步，背光光源可以通过发光二极管产生。由于发光二极管提供了更加均匀的白色光源，亮度输出效率也比较高，因此使显示器获得更好的对比度和更均匀的亮度，在获得相同显示效果的前提下降低了显示器的功率。针对TFT-LCD 的一般节能措施通常是通过材料、制造等技术的提高增加像素的透光率，从而可以降低显示器的背光光源而降低显示功率[4,5]。Harter等人则提出将屏幕区域进行分块，每个分块区域内使用一个背光光源，显示器内建一个分区功率管理模块，通过对显示内容的分析实现分区域的背光功率调节，从而实现LCD显示器的节能显示[6]，不过这种方法需要对显示的图像内容进行颜色成分的分析，市场上具有这一技术的显示器比较少。最近，一种基于有机发光二极管（Organic lighting-emitting diode，OLED）的显示器通过像素中的颜色单元自发光的形式显示颜色，因此避免了使用背光光源 [3]。OLED显示器的功率消耗模型与其显示内容的颜色成分相关，可以通过对图像颜色与亮度的优化设计，达到显示内容的节能显示。OLED显示器的每个像素均包含了R（Red）、G（Green）、B（Blue）色彩模型中三个原色的发光单元，通过不同的亮度调节形成不同的颜色变化。Dong等人在文献[8]中给出了OLED显示器的一般功率消耗模型如下：其中，函数f(x)，g(x)和h(x)分别表示单个像素中，红、绿、蓝发光单元在亮度为x时候的功率值，E0表示显示器的基础功率，而L则表示显示内容图像的像素总量。也就是说，除了一个基础功率E0，OLED显示器的功率是所有像素独立功率的和。一个经过实际测量的、典型的OLED显示器的功率消耗曲线图如图1.2所示，其中不同的色调（红色、绿色、蓝色）的功率消耗不同[8]。图 12 OLED显示器对于红、绿、蓝纯色的功率消耗曲线 OLED显示器的这个特性，使得针对其的节能显示方案的研究更加具有挑战和灵活性，因此Iyer等人直接通过降低用户交互界面中非活动窗口的亮度的方式，实现针对OLED显示器的节能显示 [9]。因为在一般的用户与系统进行界面交互的行为中，通常只对当前的活动窗口保持较高的注意力，而对其他非活动窗口几乎不关心，因此降低非活动窗口的亮度不会影响到用户交互行为。在硬件实现层次上，Shin等人受到传统背光功率管理模型的技术的启发，将其应用到了OLED 显示器中，并提出了动态电压调整（dynamic voltage scaling，DVS）的新技术，该技术允许在几乎不产生人眼感知差别的前提下，获得高达52.5% 的功率节约[10]。由于OLED显示器的显示功率和颜色直接相关，因此Dong 等人提出了一种基于贪婪算法的颜色映射的颜色设计方法，使得OLED显示器在显示用户交互界面的时候能获得电能消耗的最优化，并通过约束条件保证了用户交互效率，他们通过实验证明颜色映射方法在用户交互界面的应用中可以获得最高75%的功率节约[8]。另一方面，也有一些研究则根据用户的交互行为，采用了一些自适应的亮度调整方案。比如，Dalton等人提出了一种利用底层的人脸跟踪的方法，当用户离开显示器时自动降低其亮度或直接关闭显示器[7]。Moshnyaga等人则使用视频摄像头实现了类似的方法[1]。此外，线性地降低显示器亮度仍然被认为是一种节能显示的重要策略，然而这样可能会造成图像显示质量的下降，使得用户不容易分辨图像的重要内容，因此也需要从图像基础上解决这一问题。在这一领域一些学者提出了不少方法，比如通过增强自然图像的对比度的方法使得显示器亮度降低时图像质量的损失更少[11]。 1.3 图像颜色与亮度优化图像处理，是对图像进行分析、加工和处理，使其满足视觉、心理以及其他要求的技术[20,21,22]。图像处理是信号处理在图像域上的一个应用。目前大多数的图像是以数字形式存储，因而图像处理很多情况下指数字图像处理。此外，基于光学理论的处理方法依然占有重要的地位。图像处理是信号处理的子类，图像处理一般指数字图像处理[23,24]。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组，该数组的元素称为像素，其值为一整数，称为灰度值。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上，比如降噪、量化等。然而，图像属于二维信号，和一维信号相比，它有自己特殊的一面，处理的方式和角度也有所不同。图像处理技术的主要内容包括图像压缩，增强和复原，匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像处理一般指数字图像处理。近年来，随着科技的发展和人们生活水平的提高，数码产品尤其是数码相机得到了广泛应用。由于各种各样的原因，人们经常会拍摄到一些曝光不足、效果不好的照片，因此需要有一种方法，可以提高照片的质量以满足人们的需求。早期的一些亮度调整的算法过于简单，自动调整的效果并不是很理想，稍后也出现了一些较为复杂的算法，但其计算的复杂度相对较高，且需要一定的用户交互，使用不够方便。图像亮度调整算法经历了一个从简单到复杂、从整体到局部的过程。研究自动快速的图像增强算法，特别是自适应的亮度调整算法有非常重要的理论和现实意义。早期的亮度调整算法如直方图定制[14]、增益2偏差调整(Gain2offset)[15]等算子处理局部，这些算法大都使用一个类似于γ函数的全局色调映射函数非线性地拉伸图像亮度，使得图像整体对比度得到增强，从生理学角度讲，人类的感知能力与外界的刺激对数成比例，因此这些调整算法都是在亮度的对数域上进行操作。但该类算法一般需要相对复杂的参数设置[16] 或用户交互[17]，使用不够方便；另外由于图像不同区域之间存在一定的制约关系，采用全局映射函数往往需要牺牲高亮区域的对比度来增强欠曝区域的对比度，从而导致曝光充分区域的对比度有所降低，以致丢失原图中所具有的亮度层次感，这是全局映射算子的共有缺点。鉴于全局算子的上述缺点，近几年一些学者提出了基于梯度域的亮度调整算法。Fattal等人[19]在处理高动态范围图像时基于交互指定区域的亮度理想值构造调整后图像的梯度约束[18]，使得结果图像的梯度与给定约束尽可能一致，从而求得图像亮度. Perez等人[26]借助梯度域的处理方法，可以无缝地将一幅图像中的区域组合到另一幅图像中。 1.4 本章小结综上所述，目前在图像的节能显示处理方面，存在一些尚未解决的颜色设计与亮度优化问题。本文主要面向OLED显示器，对图像的基于节能的自适应亮度优化进行了相关研究，提出并实现图像的自适应亮度优化算法。基于节能的自适应亮度优化以图像作为输入，实时生成亮度优化的图像结果，该方法对一般图像在OLED显示器显示具有节能效果，此外该方法对于普通图像或地图在取得节能显示效果的同时，具有一定的感知特征增强效果。本文主要采用客观实验和用户测试的方法实现面向节能的图像颜色和亮度优化方法。本文所使用的实验数据包括一般图像和具有重要信息的二维地图图像。为了方便用户使用本文提出的算法进行图像处理，并对图像处理结果进行比较与保存操作，本文设计并实现了一个通用的图像处理原型软件，提供图像处理的基本操作，并集成本文提出的图像自适应亮度优化算法。该软件接受一般图像文件的读取，允许用户对图像进行基本的操作（如亮度/对比度的调整、图像结果保存等），并方便用户对图像处理过程中参数调节等操作进行实时的预览。 1.5 内容安排本文的主要内容安排如下：第2章综述了本文研究中用到的图像处理相关的工具；第3章详细描述了基于节能的图像亮度自适应优化方法，并描述了一个配合方法使用验证的图像处理软件原型的交互界面和技术实现；第4章介绍了本文的方法在一般图像上进行的实验并展示了实验结果和用户研究。最后，本文第5章进行了总结与展望。第2章研究中需要的工具综述本章对论文研究所需要的理论工具作一个综述，包括图像亮度优化、图像边界检测等核心图像处理算法[35]。 2.1 图像亮度优化图像的亮度调整，如欠曝光图像调整和高清晰图像(HDR)的处理有很大的相似之处，如果我们将HDR图像线性变化为普通低动态范围图像，得到的结果跟欠曝光的图像非常相似[36]。 Tumblin[27]等最早提出了色调映射的问题，即如何在动态范围比较小的设备上显示高动态范围的图像。他们根据人眼对亮度和对比度的敏感程度，提出了一个全局映射函数。接着Larson等[16]根据直方图，提出了一种改进的直方图定制方法，可以更充分地利用亮度的动态范围。同时避免普通直方图定制中产生的平坦区域被拉伸的问题[38]。Dargo等人[19]在03年欧洲图形学年会上提出了自适应的log映射方法，作为全局映射算子，可以方便有效地进行色调映射。Reinhard等人[18]根据摄影中的“dodge and burning”技术在02年Siggraph上提出了一种类似的色调映射方法。最近几年，梯度域上的处理方法变得非常流行。该方法并不是直接对像素的亮度值进行操作，而是间接地在梯度域上进行控制和约束。在给出梯度域上的约束后，反求图像，使得图像的梯度与给定的梯度约束尽可能一致[37]。该方法最早由Fattal等人[19]在高动态范围的图像处理中提出，先对图像的梯度进行多尺度变换，然后反求出亮度映射后的图像。Preze等人[26]借助梯度域的处理方法，可以无缝地将一个图像中的区域粘贴到另一个图像中去。Adobe公司的Healing Brush也用到了类似的技术。Agarwala等人[25]先后将梯度域处理应用到了图像和视频的合成(Panorama)中去。除了图像和视频的合成，梯度域处理方法还有很广泛的应用。例如本质图的恢复，阴影的去除，闪光照片瑕疵的去除，图像的色调迁移，alpha matting等。梯度域问题是在灰度图像上进行处理的，将每个像素的亮度值看作一个未知变量，整个图像就可以看作一个未知向量x。问题一般可以描述为：求解x，使得x的垂直梯度和水平梯度跟给定的▽Ix，▽Iy最吻合。▽Ix，▽Iy的给定根据不同的应用可以有不同的方法。例如，将图像A的一块区域复制到图像B，区域内部的梯度是来自复制的图像块，而边界上的颜色则固定为B中对应点的颜色。而在梯度域的HDR处理中，则是多尺度地改变原始的梯度，根据初始梯度的大小，相应地进行放缩。梯度域问题一般最后可以抽象为一个过约束问题（如泊松方程），假设X是n维向量，那么就有n个未知量(每个像素对应一个变量)，由于每个像素上有垂直和水平梯度的双重约束，分别对应两个线性方程，那么一共有2n个线性方程，可以表示为： A是2n*n维矩阵，很显然这是一个过约束问题，一般情况下，不存在满足上式的解。通常的方法是求一个近似解，使得(Ax-b)的绝对值最小化，该近似解满足下面的方程：由于ATA是稀疏的带状方阵，每行最多5个非零元素，可以证明这样的线性方程组是可以求解的。由于上述线性方程组中方程数较多，通常达到几百万，相应地系数矩阵ATA中元素的个数会达到万亿的数量级，要对这样的矩阵求逆是非常困难的，所以一般采用用迭代法求解。通常用的方法是共轭梯度法。由于在内部循环处理了ATAx的计算，而ATA相当于一个拉普拉斯算子，所以系数矩阵ATA不需要显式地存储下来，大大减小了算法对内存的需求。快速求解这一问题有非常重要的现实意义，有不少工作研究了其快速求解。Szeliski最近提出了一个基于预计算的共轭梯度法，可以很大程度上加快共轭梯度法的收敛速度，不过他们的算法对内存的需求比较大。Agawala[25]等在2007年Siggraph上提出了一种近似求解部分梯度域问题的方法，大大降低了内存需求与计算时间。但是该方法有一定的局限性，只能处理部分的梯度域问题，如泊松图像合成或Panorama等具有较好的初始解仅需在边界上进行优化的问题。图 21展示了亮度调节对图像质量的影响，直接降低图像的亮度会潜在地造成图像中信息的损失，如图 21(b)所示。 (a) 原始图像 (b) 亮度降低之后的结果图 21 图像亮度调节实例 2.2 图像边界检测边界检测是图像处理领域的重要内容之一，是进行模式识别和图像信息提取的基本手段[28]。一方面，图像的边界往往对应于生成图像的物理世界中对象的重要特征，也是图像分割所依赖的重要特征；另一方面，边界检测使图像处理的数据量大大减少，有利于后续的特征提取和模式识别，因此对边界检测算法的研究得到了广泛的关注。边界检测是图像分割、目标区域识别、区域形状提取等图像分析领域十分重要的基础, 是图像识别中提取图像特征的一个重要内容。图像理解和分析的第一步往往就是边界检测，目前它已成为机器视觉研究领域最活跃的课题之一，在工程应用中占有十分重要的地位。本文提出的图像自适应亮度优化方法的第一个步骤也是通过边界检测获得图像的重要特征区域。图像的边界是图像的基本特征。所谓边界是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。边界广泛地存在于物体与背景之间、物体与物体之间、基元与基元之间，它的存在是灰度不连续造成的。即使很简单的景物中也包含着大量的细节，在图像中表现为强度的非连续性。由于边界检测的重要性, 人们提出了许多适用于不同场合的边界检测算法[39]。然而，在实际图像处理中，精确检测边界具有相当的难度。对于自然图像，检测的主要困难在于这些变化发生在一个很宽的尺度范围内。如果分别地看每个图像的像素，就会发现像素之间的灰度级在变化。实际图像中的大多数边界是锐边，其灰度变化是由少量像素的陡变组成。还有一些边界是模糊的，其对应的灰度变化是大量的像素值缓慢改变引起的，这些不同类型的灰度变化在图像中是不可分的。 2.2.1 边界检测的基本步骤边界检测的基本步骤包括滤波、增强、检测和定位。1）边界检测算法主要是基于图像强度的一阶和二阶导数，但导数的计算对噪声敏感，因此必须使用滤波器来改善与噪声有关的边界检测器的性能；2）增强边界的基础是确定图像各点邻域强度的变化值，增强算法可以将邻域强度值有显著变化的点突出显示出来，边界增强一般是通过计算梯度模来完成的；3）在图像中有许多点的梯度模比较大，而这些点在特定的应用领域中并不是边界，所有应该用某种方法确定哪些点是边界，其中最简单的边界检测判断是梯度模阀值判断；4）如果某一应用场合要求确定边界位置，则边界的位置在子像素分辨率上来估计，边界的方位也可以被估计出来。 2.2.2 边界检测算法物体的边界是由灰度的不连续性所反映的。经典的边界检测方法是考察图像的每个像素的某个邻域内灰度的变化，利用边界邻近一阶或二阶导数变化规律，用简单的方法检测边界，这种方法称为边界检测局部算子法。两个具有不同灰度值的相邻区域之间总存在边界，边界是灰度值不连续的表现，其是原图像上灰度变化最剧烈的地方。传统的边界检测正是利用了这一点，对图像的各个像素进行一阶微分或二阶微分确定边界像素点。在图像处理中一般用小区域的模版卷积来近似图像梯度。通常是对二维图像的x方向y方向分别用不同的模板，这两个模板组合起来可以构成一个梯度算子。图像处理发展到今天人们已经提出了很多算子，其中一阶导数算子Roberts[29]、Prewitt[30]、Sobel[31]和二阶导数算子Laplacian[32]等4种是最为常用的图像边界检测算子。构造这些算子的基本思想是统一的，它们的区别主要是模板的大小和元素值的不同。 l Roberts算子 Roberts算子是最古老的算子之一，是一种交差差分算子。由于它只使用当前像素的2*2邻域，是最简单的梯度算子，所以计算非常简单。Roberts算子计算时利用的像素数一共有4个，可以用模板对应4个像素与模板相应的元素相乘相加得到。Roberts算子边界定位准，然而主要缺点是其对噪声的高度敏感性，原因在于仅使用了很少几个像素来近似梯度，适用于边界明显而且噪声较少的图像分割。 l Prewitt算子上述Roberts算子的模板是2*2的，比较常见的还有3*3的模板，例如Prewitt算子。对于3*3的卷积掩模，在8个可能方向估计梯度，具有最大梯度模的卷积给出梯度方向。近似图像函数一阶导数的算子由于具有确定梯度方向的能力，有时被称作罗盘算子。对于每个算子我们只给出前面三个3*3掩模，其他的可以通过简单旋转得到。Prewitt算子进行计算时要用到9个像素。对于每一个方向的梯度，可以用模板对应的9个像素与模板相应的元素相乘相加得到，其计算过程与Roberts算子相似。Prewitt算子对噪声有抑制作用，抑制噪声的原理是通过像素平均。但是像素平均相当于对图像的低通滤波，所以Prewitt算子对边界的定位不如Roberts算子。 l Sobel算子采用梯度微分锐化图像，同时会使噪声、条纹等得到增强，Sobel算子则在一定程度上克服了这个问题。Sobel算子不像普通梯度算子那样用两个像素的差值，这就使Sobel算子具备了两个优点：首先，由于引入了平均因素，因而对图像中的随机噪声有一定的平滑作用；其次，由于它是相隔两行或两列之差分，故边界两侧元素得到了增强，边界显得粗而亮。 Sobel算子的模板也是3*3的，只是它的模板元素与Prewitt算子有所不同。Sobel算子和Prewitt算子都是加权平均，但是Sobel算子认为，邻域的像素对当前像素产生的影响不是等价的，而在Prewitt算子中像素邻域对当前像素产生的影响是等价的。Sobel算子根据邻域像素与当前像素的距离有不同的权值，一般是距离越小，权值越大。Sobel算子通常用于水平和垂直边界的一个简单检测算子。 l Laplacian算子为了突出增强图像中的孤立点、孤立线或孤立端点，在某些实际用途中常采用Laplacian算子，这个算子是旋转不变算子。之前的这些算子都是一阶导数算子，在图像处理中经常使用的还有二阶导数算子，例如Laplacian算子就是二阶微分算子。可以认为二阶导数是一阶导数的导数，也就是差分的差分。Laplacian算子就利用了二阶导数信息。Laplacian算子是近似地只给出梯度模的二阶导数的流行方法，通常使用3*3的掩模，根据邻域不同可以分为4邻域和8邻域。Laplacian算子对于边界是敏感的。一般增强技术对于陡峭的边界和缓慢变化的边界很难确定其边界线的位置，此算子可以用二次微分正峰和负峰之间的过零点来确定。 Laplacian算子对噪声比较敏感，所以图像一般先经过平滑处理。因为平滑处理也是用模板进行的，所以，通常的分割算法都是把Laplacian算子和平滑算子结合起来生成一个新的模板。Laplace算子有一个缺点是它对图像中的某些边界产生双重响应。下图展示了四个算子的离散形式。在实际实现中，图像的每个像素与这些卷积核逐个进行卷积，生成图像边界检测的结果图像。 Roberts算子（x, y方向） Prewitt算子（x, y方向） Laplacian算子 Sobel算子（x, y方向）图 22不同边缘检测算子的离散形式（图像卷积算子） 2.2.3 边界检测算法比较从加法的角度来看，Roberts算子的运算速度较快，从乘法的角度看Laplacian算子的运算速度较快。 Roberts算子对边界定位比较准，所以分割结果的边界宽度比Prewitt分割的窄。但是Roberts算子由于不包括平滑，对噪声比较敏感，在图像噪声较少的情况下，分割的结果还是相当不错的。 Prewitt算子有一定的抗噪能力。但是这种抗噪能力是通过像素平均来实现的，相当于低通滤波，所以图像有一定模糊。 Sobel算子对噪声有抑制作用，因此不会出现很多孤立的边界像素点。不过Sobel算子对边界的定位不是很准确，图像的边界宽度往往不止一个像素，不适合对边界定位的准确性要求很高的应用。与Prewitt相似，Sobel算子也是通过像素平均来实现的，也有一定的抗噪能力，同时图像也产生了一定的模糊。由于Laplacian算子利用的是二阶导数信息，对噪声比较敏感，所以分割结果中在一些像素上出现了散碎的边界像素点。不过Laplacian算子对边界的定位还是比较准的。 (a) 原图 (b) Roberts算子检测结果 (c) Prewitt 算子检测结果 (d) Sobel算子检测结果 (e) Laplacian算子检测结果图 23不同边缘检测算子结果对比在图像处理中，边界检

展开阅读全文