1、武汉理工大学毕业设计(论文)基于视频人脸检测研究学院(系): 机电工程学院 专业班级: 学生姓名: 指引教师: 学位论文原创性声明本人郑重声明:所呈交论文是本人在导师指引下独立进行研究所获得研究成果。除了文中特别加以标注引用内容外,本论文不涉及任何其她个人或集体已经刊登或撰写成果作品。本人完全意识到本声明法律后果由本人承担。作者签名: 年 月 日学位论文版权使用授权书本学位论文作者完全理解学校关于保障、使用学位论文规定,批准学校保存并向关于学位论文管理部门或机构送交论文复印件和电子版,容许论文被查阅和借阅。本人授权省级先进学士论文评比机构将本学位论文所有或某些内容编入关于数据进行检索,可以采用
2、影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密囗,在 年解密后合用本授权书2、不保密囗 。(请在以上相应方框内打“”)作者签名: 年 月 日 导师签名: 年 月 日目录摘要IABSTRACTII1 绪论11.1 课题背景及研究意义11.2 国内外研究发呈现状21.3本文重要内容32 人脸检测技术简介421基于先验知识办法422基于特性办法523基于模板匹配办法624基于记录模型办法625本文算法方案提出93 算法设计与MATLAB实现1031常用颜色空间1032颜色空间地选取1433肤色模型建立143.4肤色提取153.5 人脸区域形态学解决1636人脸区域筛选与标记1
3、73.7误检分析224结论及展望24参照文献25道谢26摘要人脸辨认技术属于生物验证一种,在身份验证领域日益发挥重要作用,具备十分广泛应用前景。人脸检测和定位问题是人脸辨认技术一方面要解决问题。人脸检测算法是一种高效、自动人脸辨认系统中核心技术之一。如今人脸检测问题已成为一种热门研究领域,新算法不断被提出,但是由于人脸复杂性,当前尚不能找到一种完美算法。在不同应用环境下,有不同算法,本文针相应用于视频中人脸检测问题进行了研究,论文重要工作如下: 本文一方面对当下流行几种人脸检测算法进行分析并比较各自在视频人脸辨认中合用性。结合其实现难度,提出一种能适应视频人脸辨认在YCbCr色彩空间中基于肤色
4、人脸检测算法,由于肤色在YCbCr空间受亮度信息影响较小,本算法直接考虑YCbCr空间CbCr分量,映射为两维独立分布CbCr空间。在CbCr空间下,肤色类聚性好,运用人工阈值法将肤色与非肤色区域分开,形成二值图像。非肤色区域中依然有也许有某些区域颜色与肤色相近,因此阈值分割后图像依然存有某些假肤色区域,通过形态学解决和限制长宽比之后,可得到人脸区域。在拟定人脸区域后,咱们需要在原图上对人脸区域进行标记,这里可通过找到某些核心点,作出矩形框标记人脸区域。核心词:YCbCr色彩空间; 肤色分割; 人脸检测。AbstractFace recognition technology is a kind
5、 of biological validation,in authentication realm,play an increasingly important role ,with a very wide range of applications. Face detection is the first problem to be solved. Face detection algorithm is one of the keys technologies of an efficient,automated face recognition system . Today,face det
6、ection has become a hot research field,new algorithms continue to be made,but because of the complexity of the face,it is not yet found a perfect algorithm. In different application environment,there are different algorithms,this paper studied applies to human face detection video,the papers main wo
7、rk is as follows:This article analyze several current popular face detection algorithm first and then compare their applicability in the face recognition for video. Combined with its implementation difficulty,propose an adaptive face recognition for video in the YCbCr color space,color-based face de
8、tection algorithm,as in the YCbCr color space less affected by the brightness information,the proposed algorithm directly consider CbCr component YCbCr space,two-dimensional distribution map of CbCr space independent. In CbCr Space,color clustering is good,the use of artificial threshold method to s
9、eparate the skin and non-skin region,formed a binary image.In non-skin region,there are still some areas may have similar color and skin color,so after thresholding the image still exist some false color region,through morphological processing and constrain the aspect ratio,the obtained face region.
10、In determining the face region,we need to mark the face region on the original picture,By finding some key points the rectangle labeled human face region could be made.Key words:YCbCr color Space;skin color segmentation;human face detection.1 绪论1.1 课题背景及研究意义 1.1.1 课题背景自古以来,关于身份验证研究就始终没有停止过,古代重要通过印章来
11、验证身份,此法沿用至今,到当代,随着计算机和信息技术 发展,人类通过密码、ID卡、IC卡等来验证身份,当前,人们尚有通过人类生物特性来验证身份,例如说人们熟知指纹验证、精准度更高虹膜验证、掌纹验证、人脸辨认(face recognition)验证等,其中,人脸辨认验证是难度最大。近年来随着人工智能和电子商务迅速发展,人脸辨认技术成为最有潜力生物辨认技术和人类生物特性验证手段。运用计算机解决人脸图像,从中提取出有效面部信息并以此来辩识该人身份技术,便为人脸辨认技术。相对于其她身份辨认技术,人脸辨认技术具备和谐,使用以便,受限小等长处。人脸辨认技术可以被应用在各种不同需要身份验证领域,如金融、证券
12、、公安部门刑侦等领域。随着网络技术发展和其日益广泛应用,信息安全也成为非常重要一种方面,如果将人脸辨认应用到计算机登录上,那么相对于密码登录,能更加高效地保证计算机被使用时安全性。在人脸辨认系统中,对于人脸检测与定位是人脸能实既有效辨认先决条件和核心技术,在人脸辨认技术初期,都是以为人脸是已经得到并已实现定位假设下进行,但随着技术应用日益广泛,此项假设已经不能满足需求,这便提出了人脸检测(face detection)技术。对于人脸检测技术,重要涉及如下几种问题研究:人脸特性描述:即如何描述一张人脸典型特性,例如说相对固定几何外形,均有眼睛和嘴巴,对于同一人种,肤色人们都差不多,也就是肤色具备
13、类聚特性,对于不同特性描述方式,咱们就会提出不同检测办法,可以这样说,选取一种较好人脸特性描述方式,那咱们就会事半功倍,获得较好效果。尺度:对于不同人脸照片,人脸大小会有所不同,在同一张相片中,也也许有大小不一人脸,这对于在对人脸大小特性描述是一种比较大挑战。搜索方略:在描述了人脸特性之后,如何搜索到这些特性点便要用到适当搜索方略。速度和精度:任何一种实现判断功能系统,其精度和速度都是十分重要指标。人脸检测也不例外,在咱们选取特性描述和搜索方略时,要在满足精度和速度规定下进行1-2。人脸检测难点重要有一下几项:(1)如何判断图像中与否存在人脸,如何区别人脸和类似人脸非人脸图像,这是人脸检测不同
14、于人脸辨认地方。(2)人脸具备复杂细节变化,脸形、肤色等特性个体差别比较明显,虽然同一种人也会有不同表情和姿态等,当侧脸时有面部器官缺失,这些都使人脸变化复杂,增长了很大难度。(3)某些外部物品也许会遮挡人脸,如头发、眼镜、帽子等。(4)由于不同成像角度会导致人脸不同姿态,如平面内旋转、深度旋转以及上下旋转,其中深度旋转影响较大。(5)光照影响,如图像中亮度、对比度变化和阴影等。(6)图像成像条件,如摄像设备焦距、成像距离、图像获得途径。由此可见,人脸检测涉及问题十分广泛,它是一种复杂具备挑战性问题。解决此问题具备重要学术价值,可觉得其他类似复杂模式检测问题提供重要启示,因而人们对人脸检测进行
15、了大量研究工作。1.1.2课题研究意义 研究人脸辨认在理论和技术上均有重要意义:一是可以推动对人类视觉系统自身结识;二是可以满足人工智能应用需要。采用人脸辨认技术,建立自动人脸辨认系统,用计算机实现对人脸图像自动辨认有着辽阔应用领域和诱人应用前景。同步人脸辨认作为一种生物体征辨认与其他较成熟辨认办法(如指纹、虹膜、DAN检测等)3相比有如下几种长处:无侵犯性,人脸图像获取不需要被检测人发生身体接触,可以在不惊动被检测人状况下进行;低成本、易安装,人脸辨认系统只需要采用普通摄像头、数码摄像机或手机上嵌入式摄像头等被广泛使用摄像设备即可,对顾客来说也没有特别安装规定; 无人工参加,整个人脸辨认过程
16、不需要顾客或被检测人积极参加,计算机可以依照顾客预先设立自动进行。由于具备以上长处,近几年来,人脸辨认技术引起了越来越多科研人员关注。 人脸检测研究具备重要学术价值。人脸是一类具备相称复杂细节变化自然构造目的,此类目的检测问题挑战性在于:人脸由于外貌、表情、肤色等不同,具备模式可变性;普通也许存在眼镜、胡须等附属物; 作为三维物体人脸影像不可避免地受由光照产生阴影影响;因而,如果可以找到解决这些问题办法,成功构造出人脸检测与跟踪系统,将为解决其他类似复杂模式检测问题提供重要启示。1.2 国内外研究发呈现状 人脸检测问题是计算机视觉领域中重要问题,最初作为人脸自动辨认系统定位环节被提出,近年来由
17、于其在安全访问控制、视觉监测和新一代人机界面等领域应用价值,开始作为一种独立课题受到研究者注重。人脸检测问题在近十年中得到了进一步研究并获得了长足发展,国内外诸多学者提出了许多不同办法,在不同领域都获得了不同成果,但是要寻找一种精确率很高、能普遍合用于各种复杂状况人脸检测算法,尚有一定距离。国外重要研究单位有美国麻省理工媒体实验室(MIT Media lab) 、卡耐基梅隆大学人机交互学院(Human computer interface institute) 、微软研究院视觉技术研究组 (Vision Technology Group) 、英国剑桥大学工程系 (Department of E
18、ngineering)等,国内微软亚洲研究院、中科院自动化研究所、清华大学、北京工业大学等均有专业人员从事人脸检测有关研究4。并且,MPEG7原则组织已经建立了人脸辨认草案小组,人脸检测算法也是一项征集内容。此外,随着人脸检测研究进一步,国际上刊登关于论文数量也大幅度增长,如IEEEFG、ICIP、CVPR等重要国际会议上每年均有大量关于人脸检测论文,占关于人脸研究论文1/3之多细化。其中提出了许多当下流行算法,Yang和Huang提出了Mosaic办法5;Zabrodshky提出持续对称性检测办法,检测一种圆形区域对称性,从而拟定与否为人脸6;Riesfield提出广义对称变换办法检测局部对
19、称性强点来进行人脸器官定位7;卢春雨定义方向对称变换,分别在不同方向上考察对称性,不但能用来寻找强对称点,并且还可以描述强对称性物体形状信息,这样变换对人脸偏转、脸部表情变换、光照等因素都不敏感,使人脸器官定位更为有效8 。国内诸多研究机构、大学以及科技公司都对此区域进行了进一步研究。清华大学、北京工业大学、南京理工大学、四川大学、上海交通大学、中华人民共和国科学院计算技术研究所和中华人民共和国科学自动化研究所等均有人员从事人脸检测方面有关研究。为了增进这项技术发展,诸多知名国际会议、期刊都设立了人脸检测技术专项,其中涉及CVPR、ICPR、IEEE等,以便研究人员间技术交流与学习。只但是就当
20、前国内外对人脸检测研究现状来看,虽然针对人脸检测已经提出了各种算法,也获得了一定成果。整体来看,人脸检测研究涉及计算机视觉、数字图像解决、人工智能等各种学科领域,同步这项研究还满足了当代计算机网络和通信系统高速发展需求,无论从实用性还是从学术性来看,均具备很高研究价值。随着计算机网络普及,图像、视频等多媒体信息在计算机信息中比重加大,这一研究必然会得到更快、更长远发展。1.3本文重要内容 本文重要运用肤色聚类特性,实现了一种复杂背景下人脸检测,本文重要内容为第一章。:第一章简介了研究本课题课题背景、学术意义和应用意义,简要简介了人脸检测国内外研究和发呈现况,并对本文重要内容作了简要阐明。第二章
21、为人脸检测技术简介,通过比较当前比较惯用人脸检测办法,对它们优劣和实现难度等指标进行评估,提出适合在视频中应用人脸检测算法,也是本文重要研究算法-在YCbCr色彩空间中基于肤色人脸检测。第三章针对提出算法进行了算法实现,并在matlab平台上进行了计算机仿真,对某些仿真成果进行了分析,对算法应用场合和实用性进行评估。对误检成果进行了分析,并将其作为将来使用中参照。2 人脸检测技术简介人脸检测是指在输入图像中拟定所有人脸(如果存在)位置、大小、位姿过程。人脸检测作为人脸信息解决中一项核心技术,近年来成为模式辨认与计算机视觉领域内一项受到普遍注重、研究十分活跃课题。人脸检测问题来源于人脸辨认问题。
22、人脸检测是对给定图像,判断其中与否有人脸,若有,将所有人脸从背景中分割提取出来,并拟定每个人脸在图像中位置和大小。人脸检测技术可以应用于人脸辨认、视频会议、图像与视频检索、刑侦破案和证件验证等领域。 人脸检测是对于输入人脸图像或视频,一方面判断其中与否存在人脸,如果存在人脸,则进一步给出每个人脸位置、大小以及各个重要面部器官位置信息,并根据这些信息,进一步提取每个人脸中所蕴含特性,并将其与已知人脸库中人脸图像进行对比,从而得到辨认成果。由此可见,一种完整人脸辨认过程应涉及人脸检测与人脸辨认两大某些。人脸辨认由两某些工作构成:(l)人脸检测:在标点符号用中文输入图像或视频画面当中拟定存在人脸位置
23、、尺寸等过程,这是辨认工作基本课题,在减少算法复杂度等方面对辨认工作有核心性影响。(2)人脸辨认:通过与计算机相连摄像头动态捕获人面部信息,并把捕获到人脸与预先录入人脸数据库中存储人脸进行比较辨认。人脸检测基本思想是建立人脸模型,比较所有也许待检测区域与人脸模型匹配限度,从而得到也许存在人脸区域。本章重要对惯用人脸检测办法进行总结、分析,得出自己算法根据。近几年,人脸检测技术发展迅猛,研究人员提出诸多人脸检测办法,但是由于人脸检测问题复杂性,实现通用人脸检测办法还不实际,因而解决特定约束条件下或某种应用背景下人脸检测问题仍将是该领域研究重要课题。对人脸进行检测之前,需要对人脸特性进行适当描述,
24、人脸特性有许多,大体可分为生物特性和外形特性,生物特性有肤色,人类固有眼、鼻、口等。外形特性有相对固定长宽比,相对固定形状,以及面部器官几何关系等。针对不同人脸特性描述方式,就可以提出不同人脸检测方案。从当前来看,人脸检测办法大体可分为如下四类。21基于先验知识办法这种办法是运用对人脸先验知识给出检测规则来进行人脸检测。人脸局部特性分布总是存在着一定规则,如图像中浮现人脸普通会有几种位置和数量相对固定面部器官,如鼻子、眼睛、嘴巴等。在一幅人脸图像中,面部这些特性将一方面被提取出来,然后基于检测规则将候选脸部区域辨别出来。2.1.1器官分布法格式虽然人脸在外观上变化很大,但五官空间分布大体符合某
25、些普遍规律,器官分布法检测人脸即是检测图像中与否存在满足器官分布规则图像块。这种办法普通有两种思路:一种思路是“从上至下”,其中最为简朴有效是Mosaic办法,它给出了基于人脸区域灰度分布规则,根据这些规则对图像从粗辨别率到高辨别率进行筛选,以满足这些规则限度作为检测判据。这种办法吸引之处在于使用从粗到细方略减少了计算量。另一种思路则是“从下至上”,先直接检测几种器官也许分布位置,然后将这些位置点分别组合,运用器官分布几何关系准则进行筛选,找到也许存在人脸。2.1.2投影法这是一种运用图像投影迅速定位人脸边界和脸部特性办法。在解决一幅输入图像时,一方面获得其水平投影,然后通过检测其图像急剧变化
26、处得到两个局部最小值,这两个值相应头部左右轮廓线。类似地,通过检测垂直投影局部最小值,检测出人脸嘴唇、鼻尖和眼睛。这种办法缺陷在于无法有效检测出有多张人脸图像以及在复杂背景中人脸。2.1.3对称法人脸具备一定轴对称性,各个器官也具备很强点对称性。持续对称性检测办法,检测一种圆形区域对称性,从而拟定与否为人脸;广义对称变换办法检测局部对称性强点来进行人脸器官定位;卢春雨定义方向对称变换,分别在不同方向上考察对称性,不但能用来寻找强对称点,并且还可以描述强对称性物体形状信息,这样变换对人脸偏转、脸部表情变换、光照等因素都不敏感,使人脸器官定位更为有效8。该办法对图像规定很高,并且受姿态、表情、光照
27、等因素影响较大。其中器官分布法、对称法精确率较高,但运算量大;而投影法虽然精确率不高,但运算量小。22基于特性办法基于特性办法试图先找出人脸稳定特性,再运用其他信息进一步检测人脸。人脸稳定特性是指在外界环境有所变化时相对不变特性,例如人脸部特性、肤色、纹理以及它它们综合特性等。2.2.1脸部特性一方面咱们要提出某些可靠有效办法来检测脸部特性,然后推断与否有人脸存在。至于人脸部特性,往往使用边沿检测来获得,如眼睛、眉毛、嘴巴、鼻子等。基于这些特性,咱们可以建立起描述特性之间记录模型,然后去校验与否有人脸存在。固然,这种办法也存在缺陷,此种办法缺陷在于表情、光照、噪声等因素会导致脸部特性边界弱化,
28、这样就影响到人脸检测成果精确性。2.2.2纹理特性人脸纹理特性可以分为三类,即皮肤、毛发和其他类,这些人类特有纹理可以被用来区别其他物体。这种办法长处是在对于“不干净”人脸检测上,如有胡须、眼镜等附属物存在时,检测成果依然比较精确。2.2.3肤色特性研究表白,人类肤色在去除亮度色度空间(如YCbCr空间)具备聚类性,颜色信息在一定限度上可以将人脸同大某些背景区别开来,因而可以运用肤色模型有效地检测人脸。运用肤色信息检测人脸办法具备计算量小,办法相对简朴,易于实时性解决及适合复杂背景下人脸检测定位等特点。在设计了肤色模型表征人脸颜色之后,运用感光模型进行复杂背景下人脸及器官检测与分割。该办法对图
29、像规定较高,但运算量小。其最大长处在于受人脸姿态、表情、光照等因素影响小。23基于模板匹配办法基于模板匹配办法也可以用来检测人脸,一方面设定某些不同原则、描述人脸整体特性或局部特性模板,然后依照模板与图待检测图像相似度进行匹配检测。2.3.1预定模板匹配法依照人脸先验知识,咱们可以制作出描述人脸轮廓特性模板,通过计算图像区域和人脸轮廓模板有关性参数可检测出候选人脸区域,然后运用器官特性子模板筛选上一步检测出候选人脸区域。在初期研究人员使用了眼睛、鼻子、嘴巴、脸部轮廓子模板建立起人脸模型。Craw等人一方面使用一种Sobel滤波器来提取边沿,然后将这些边沿集合起来搜索基于几种约束条件人脸模板。9
30、2.3.2变形模板法其重要思想是定义一种具备参数可变模板和一种能量函数来描述人脸特性,通过一种非线性最优化办法求出各个模板相应能量函数。能使能量函数最小参数模板即被以为是所求特性描述。此办法充分考虑到人脸是变形体特点,稳定可靠,且与姿态和光照无关,但依然存在难以适应普通状况和计算量巨大问题。并且该办法必要是在待检测人脸附近,变形模板必要被初始化。2.3.3动态轮廓法又称Snakes模型法。Kass等人提出在不需要更多先验知识或高层解决成果指引状况下实现自追迹以得到目的闭合、光滑、持续轮廓线,该办法具备较强抗噪能力10。Snakes模型通过对一条初始给定持续闭合曲线计算初始能量函数,然后通过变分
31、办法求取能量函数最小化,以得到人脸轮廓曲线11。该办法对图像规定高,运算量大,并且受姿态、表情、光照等因素影响大,但其长处是精确率高。24基于记录模型办法由于人脸图像复杂性,普通地描述人脸特性具备一定困难,因而另一类办法,即基于记录模型办法越来越受到注重。此办法将人脸区域看作一类模式,即模板特性,使用大量“人脸”与“非人脸”样本训练、构造分类器,通过度类器对图像中所有也许区域进行“人脸”与“非人脸”划分。事实上此办法将人脸检测问题转化为记录模式辨认二分类问题,即判断区域与否为人脸。记录辨认办法可分为四大类:基于特性空间格式办法、基于人工神经网络办法、基于概率模型办法和基于支撑向量机办法。241
32、基于特性空间办法此类办法将人脸区域图像变换到某一特性空间,依照其在特性空间中分布规律划分为“人脸”与“非入脸”两类模式。特性脸办法是一种惯用办法。它依照图像记录特性进行正交变换(K-L变换),以消除原有向量各个分量问有关性。变换得到相应特性值依次递减特性向量。人脸在特性脸空间投影汇集比较紧密因而运用前若干张特性脸将人脸向量投影到主元子空间F和与其正交补空间F,相应距离度量分别称为DIFS(Distance In Feature Space)和DFFS(Distance From Feature Space)。对于人脸检测问题,由于没有考虑“非人脸”样本分布,需要同步使用DIFS和DFFS才干获
33、得较好效果。Sung等人将样本经预解决后按行列顺序展开为样本向量进行主分量分解。采用均值聚类办法在特性空间中建立6个“人脸”(CluSterS),同步建立包围“人脸”簇6个“非人脸”簇,以使“人脸”与“非人脸”模式边界更为清晰。并使用“自举”(bootstrap)办法加以解决了非人脸样本选区问题:一方面建立一种仅使用“人脸”簇初始分类器对一组图像进行检测,将所有错误报警(不是人脸而被错检为“人脸”成果)加入“非人脸”样本库,构造新使用“人脸”与“非人脸”簇分类器重新检测。以上过程不断迭代,直到收集了足够“非人脸”样本。属于特性空间办法尚有因子分解办法(Factor Analysis)和Fish
34、er准则办法。Yang等在混合线性子空间(mixtures oflinear subspaces)中对“人脸”和“非人脸”样本分布进行建模,分别使用基于EM算法扩展FA办法和基于自组织映射FLD办法构造检测器。242基于神经网络办法人工神经网(ANN)办法是把模式记录特性隐含在ANN构造和参数之中,对于人脸此类复杂、难以显式描述模式,基于ANN办法具备独特优势。CMURowley等使用了各种ANN检测多姿态人脸,算法显示了两类ANN:1个位姿检测器(poseestimator)用于预计输入窗口中人脸位姿、3个检测器(detector)分别检测正面(frontal)、半侧面(half-profi
35、le)和侧面(profile)人脸。使用通过对准和预解决“人脸”样本以及采用“自举”(bootstrap)办法收集分类器错分样本作为“非人脸”样本训练各个ANN,进一步修正分类器。检测时对输入图像中所有也许位置和尺度区域一方面使用位姿检测器预计人脸位姿,经校准和预解决后送入3个检测器中,最后对检测器分类成果进行仲裁。Rowley等对正面端正人脸和正面旋转人脸检测单独进行了研究。对于正面端正人脸,仅使用了正面入脸检测ANN,是一种三层前向网:输入层相应2020像素图像区域;隐层节点分为相应不同人脸区域若干组,与输入层某些连接;ANN输出1到1区间值表达这个区域与否为人脸。Rowley等使用相似“
36、人脸”样本和不同“自举”过程收集“非人脸”样本训练了各种正面人脸检测ANN,对它们检测成果进行仲裁,以进一步减少错误报警。对于正面旋转人脸检测使用了旋转角度检测器及正面人脸检测ANN,并使用相似多ANN仲裁办法减少错误报警。基于人工神经网办法尚有Jue等和Kouzani等提出基于人脸器官检测多级网络办法、Anifantis等提出双输出人工神经网检测算法等。神经网络办法在人脸检测与辨认上比其他类型办法有其独到优势,即它避免了复杂特性提取工作,可以通过学习过程获得其他办法难以实现关于人脸辨认规律和规则隐性表达。243基于支持向量机办法支持向量机法是在记录学习理论基本上发展出一种新模式辨认办法,它是
37、基于构造风险最小化原理办法,较之于基于经验风险最小化人工神经网络,某些难以逾越问题,如:模型选取和过学习问题、非线性和维数劫难问题、局部极小点问题等都得到了很大限度上解决。但是直接使用SVM办法进行人脸检测有两个方面困难:训练SVM需规定解二次规划问题,计算复杂度高,内存需求量巨大;在非人脸样本不受限制时,需要极大规模训练集合,得到支持矢量会诸多,使得分类器计算量过高。Platt提出SMO算法有效地解决了第一种问题。Osuna等人一方面将SVM办法用于人脸检测问题,在训练中使用了大量人脸样本,采用“自举”办法收集“非人脸”样本,并使用逼近优化办法减少支持矢量数量,在一定限度上解决了第二个问题;
38、梁路宏等采用模板匹配与SVM办法相结合人脸检测算法,在模板匹配限定子空间内采用自举办法收集“非人脸样本”,训练SVM,减少了训练难度和最后得到支持矢量规模,使得检测速度比单纯SVM检测器提高了20倍,得到了与CMU神经网络办法可比较成果。12Richman等提出用人脸中鼻子区域训练SVM,减少了训练数据,且不用考虑SVM对发型、眼镜等饰物敏感,采集图像时也不规定人脸必要定位。该办法为柯达公司设计出了针对顾客图像实用人脸检测系统。244基于概率模型办法基于概率模型一种思路是运用贝叶斯原理计算输入图像区域属于人脸区域后验概率。CMUSchneiderman等提出一种基于后验概率检侧办法。将难以预计
39、先验概率P(object)用一种比率参数入代替,作为调节检测器敏感度参量。在学习过程中得到“人脸”和“非人脸”两种模式概率分布。通过对敏感度调节,达到检测效果。另一种应用较多概率模型是用于描述信号记录特性隐马尔可夫模型(Hidden Markov Models,HMM),当前也被应用于人脸检测与辨认。Nefian依照正面人脸由上到下各个区域(头发、额头、双眼、鼻子、嘴)具备自然不变顺序这一事实,使用一种包括五个状态一维持续HMM加以表达。将头部图像按照这五个区域划分为互有重叠条块,对各块进行KL变换,选用前若干个变换系数作为观测向量训练HMM。11Nefian还提出了基于嵌入式HM 人脸检测办
40、法。该办法同步考虑到人脸由左到有各个特性自然顺序,使用了二维HMM,并且采用二维DCT变换系数作为观测向量。此外尚有Meng使用HMM描述人脸小波特性中不同级间有关性等办法。基于HMM办法普通只使用“人脸”样本进行训练,重要针对用于人脸辨认头肩部图像。该算法对图像规定较低,受姿态、表情、光照等因素影响较小,辨认率高,但运算量相称大。25本文算法方案提出在四类常用人脸检测算法中,使用场合各异,优势和劣势并存,在视频人脸检测中,没有完美算法,但是综合这几种算法,可以提出一种适合于视频应用算法。基于先验知识算法由于对人脸姿态和背景有规定,如器官分布法对背景有一定规定,且对非正脸检测效果不好,投影法对
41、背景规定较高,对称法运算量大,且对非正脸检测效果也不好。基于特性算法中重要分为基于肤色、基于脸部特性和基于纹理,基于肤色具备简朴,迅速长处,且对脸姿态规定不高,基于纹理算法规定图像能反映毛发等信息,对图像规定较高。基于脸部特性算法对脸姿态有规定。对于模板人脸检测办法,计算量大,速度比较慢。在视频应用中若计算机运算速度不够快话,实时性较差。对于记录模型人脸检测,长处在于将人脸检测问题化成了二分类问题,难点在于分类器构造,分类器优劣直接影响到了算法优劣,在视频中,图像块变化繁复,这对于构造一种高效高速分类器来说是一种不小挑战。总来说,基于肤色人脸检测由于其简朴迅速、适应性较广、对图像质量规定不高,
42、适合在视频中用于迅速人脸检测,并且在YCbCr空间中肤色类聚性较好,加强了其抗干扰能力,因而本文选取在YCbCr空间中基于肤色人脸检测。此算法一方面要将图像转换到YCbCr空间中,提取Cb和Cr分量之后,运用人工阈值法二值化,提取肤色,然后进行形态学解决;对候选区进行限定长宽比,筛选出人脸,最后在原图上画框标记人脸。3 算法设计与matlab实现对于复杂背景彩色图像,肤色是人体表面最为明显特性之一,是人脸重要信息,不依赖于面部细节特性,对于旋转、表情变化等状况都能合用,具备较高稳定性,并且计算机能将肤色与大多数背景物体颜色相区别。因而肤色特性在人脸检测中是最惯用一种特性。肤色特性重要由肤色模型
43、描述,基于肤色人脸检测办法普通分为颜色空间选取、肤色区域分割和人脸检测三大步。在拟定肤色模型之后,一方面可以进行肤色检测,在检测出肤色像素后,需要依照它们在色度空间内相似性和位置上有关性分割出也许人脸区域,同步运用区域几何特性或是灰度特性进行与否是人脸验证,以排除其他色彩类似肤色物体,区域分割与验证在诸多办法中是密切结合统一考虑。普通为了消除光照对人脸肤色影响,在肤色区域分割前会对图像进行光照校正,以消除色彩偏移。在提取肤色之前,对人脸图像预解决必不可少,这其中涉及图像噪声滤除,图片亮度平衡等;图像噪声解决可用图像平滑来实现。图像平滑是指用于突出图像宽敞区域、低频成分、主干某些或抑制图像噪声和
44、干扰高频成分,使图像亮度平缓渐变,减小突变梯度,改进图像质量图像解决办法。对于图像亮度,若要一张图像实现亮度平衡,可通过均衡RGB三个分量直方图来实现,但是,对于人脸检测,咱们可以抛开亮度信息,即将图像转化到YCbCr空间。 31常用颜色空间光在频谱分布中不同位置体现了各种颜色,颜色是人对光谱中可见光感知成果。依照光度学和色度学原理,所有颜色都可以用互相独立三种基本颜色混合得到,这三种颜色被称为三基色,由此就构成了色彩空间。知名格拉曼定律反映了视觉对颜色反映取决于红、绿、蓝三种颜色在输入量中代数和之一事实。格拉曼定律涉及如下四个方面内容:(1)所有颜色都可以用互相独立三基色混合而得到;(2)如
45、果三基色混合比相等,则色调和色饱和度也相等;(3)任意两种颜色相混合产生新颜色与采用三基色分别合成这两种颜色各自成分再混合起来得到成果相似;(4)混合色光亮度是本来各分量光亮度总和;这里色调、色饱和度、亮度是表达色觉限度。色调表达各种颜色,色饱和度表达颜色深浅。以三基色为基本格拉曼定律可以用式3-1来表达: (3-1)依照计算机色彩理论,对于同一种颜色而言,在计算机中有不同表达方式,这样就形成了各种不同色彩空间。每一种色彩空间均有其各自产生背景及应用领域。数字图像中一种象素点颜色可以有诸各种办法来表达,其中最直接表达办法是咱们所熟知由红、绿、蓝三基色构成色彩空间。下面咱们详细简介某些惯用于肤色
46、提取色彩空间,通过比较肤色在各颜色空间聚类效果好坏来选取适当颜色空间。3.1.1 RGB色彩空间RGB色彩空间也称为红、绿、蓝基色模型。为原则化起见,CEI(国际照明委员会)在年选取红色(波长i=700nm),绿色(波长z=546nm),蓝色(波长z=435nm)三种单色光作为表色系统得三基色,这就是色彩空间,它也是最常用色彩空间。由于彩色图像是多光谱图像一种特殊状况,相应于人类视觉三基色,即红、绿、蓝三个波段,是对人眼光谱量化性质近似 13。因而,运用R、G、B三基色这三个分量来表征颜色是很自然一种格式。并且多数图像采集设备都直接感知色彩三个分量,这也使得模型成为图像成像、显示、打印等设备基
47、本,具备十分重要作用。在色彩空间中,每一种数字图像中象素点颜色都可以用三维空间中第一象限中一种点来表达。如所示为彩色立方体。色彩空问原点表达在任何颜色分量上亮度都为零,因而它表达黑色。当三个分量亮度都达到最大时为白色。而当三个分量相等时产生就是灰度象素点。除了黑白两色位于立方体顶点外,立方体此外三个顶点相应于三基色红、绿、蓝,剩余则相应于黄、青以及紫色。如图3.1所示。图3.1 RGB色彩空间普通状况下,都是以色彩空间为基本来描述其他类型色彩空间,将其他色彩空间基色描述为三基色线性或非线性函数。但是,RGB存在某些局限性:(1)RGB空间用红、绿、蓝三原色混合比例定义不同色彩,因而不同色彩很难用精确数值来表达,即对色彩定量分析比较困难;(2)RGB彩色空间中,彩色通道之间有关性很高,合成图像存在饱和度偏低、色调变化较小、视觉效果较差等问题。(3)人眼只可以通过感知颜色色调、亮度以及饱和度来区别物体,不可以直接感觉红、绿、蓝三种颜色比例,并且色调、饱和度与红、绿、蓝是非线性关系,并且肤色在此空间中类聚特性不是较好,如图3.2所示。故RGB空间中对图像色彩信息进行分析与解决,难以控制其成果。图3.2 肤色在RGB空间中类聚特性312归一化色彩空间如果在色彩空间中有两个像素点R1,G1,Bl和R2,G2