ImageVerifierCode 换一换
格式:PPT , 页数:72 ,大小:1.80MB ,
资源ID:838645      下载积分:11 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/838645.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(非参数估计(完整).ppt)为本站上传会员【胜****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

非参数估计(完整).ppt

1、非参数估计非参数估计刘芳,戚玉涛刘芳,戚玉涛qi_qi_引言参数化估计:参数化估计:ML方法和方法和Bayesian估计。假设概率密估计。假设概率密度形式已知。度形式已知。实际中概率密度形式往往未知。实际中概率密度形式往往未知。实际中概率密度往往是多模的,即有多个局部极大实际中概率密度往往是多模的,即有多个局部极大值值 。实际中样本维数较高,且关于高维密度函数可以表实际中样本维数较高,且关于高维密度函数可以表示成一些低维密度函数乘积的假设通常也不成立。示成一些低维密度函数乘积的假设通常也不成立。本章介绍非参数密度估计方法:本章介绍非参数密度估计方法:能处理任意的概率能处理任意的概率分布,而不必

2、假设密度函数的形式已知。分布,而不必假设密度函数的形式已知。主要内容概率密度估计概率密度估计Parzen窗估计窗估计k-NN估计估计最近邻分类器(最近邻分类器(NN)k-近邻分类器(近邻分类器(k-NN)概率密度估计概率密度估计问题:概率密度估计问题:给定i.i.d.样本集:估计概率分布:概率密度估计直方图方法:直方图方法:非参数概率密度估计的最简单方法非参数概率密度估计的最简单方法 1.把把x的每个分量分成的每个分量分成k 个等间隔小窗,个等间隔小窗,(xEd,则形成,则形成kd 个小舱)个小舱)2.统计落入各个小舱内的样本数统计落入各个小舱内的样本数qi 3.相应小舱的概率密度为:相应小舱

3、的概率密度为:qi/(NV)(N:样本:样本 总数,总数,V:小舱体积):小舱体积)概率密度估计直方图的例子概率密度估计非参数概率密度估计的核心思路:一个向量x落在区域R中的概率P为:因此,可以通过统计概率P来估计概率密度函数p(x)概率密度估计假设假设N个样本的集合个样本的集合是根据概率密度函数为p(x)的分布独立抽取得到的。那么,有k个样本落在区域R中的概率服从二项式定理:k 的期望值为:对P的估计:当 时,估计是非常精确的概率密度估计假设假设p(x)是连续的,且是连续的,且R足够小使得足够小使得p(x)在在R内几乎内几乎没有变化。没有变化。令令R是包含样本点是包含样本点x的一个区域,其体

4、积为的一个区域,其体积为V,设有,设有N个训练样本,其中有个训练样本,其中有k落在区域落在区域R中,则可对概率中,则可对概率密度作出一个估计:密度作出一个估计:对p(x)在小区域内的平均值的估计概率密度估计当样本数量当样本数量N固定时,体积固定时,体积V的大小对估计的效果影响很的大小对估计的效果影响很大。大。过大则平滑过多,不够精确;过大则平滑过多,不够精确;过小则可能导致在此区域内无样本点,过小则可能导致在此区域内无样本点,k=0。此方法的有效性取决于样本数量的多少,以及区域体积此方法的有效性取决于样本数量的多少,以及区域体积选择的合适。选择的合适。概率密度估计收敛性问题:收敛性问题:样本数

5、量样本数量N无穷大是,估计的概率函数无穷大是,估计的概率函数是否收敛到真实值?是否收敛到真实值?实际中,越精确,要求:实际中,N是有限的:当时,绝大部分区间没有样本:如果侥幸存在一个样本,则:概率密度估计理论结果:理论结果:设有一系列包含x 的区域R1,R2,,Rn,,对R1采用1个样本进行估计,对R2用2 个,Rn包含kn个样本。Vn为Rn的体积。为p(x)的第n次估计概率密度估计如果要求如果要求能够收敛到p(x),那么必须满足:选择Vn选择kn概率密度估计两种选择方法:两种选择方法:主要内容概率密度估计概率密度估计Parzen窗估计窗估计k-NN估计估计最近邻分类器(最近邻分类器(NN)k

6、近邻分类器(近邻分类器(k-NN)Parzen窗估计定义窗函数:定义窗函数:假设假设Rn是一个是一个d维的超立方体。令维的超立方体。令hn为超立方体一条边的长度,则体积:为超立方体一条边的长度,则体积:立方体窗函数为:中心在原点的单位超立方体Parzen窗估计X处的密度估计为:处的密度估计为:落入以X为中心的立方体区域的样本数为:可以验证:窗函数的要求Parzen窗估计过程是一个内插过程,样本xi距离x越近,对概率密度估计的贡献越大,越远贡献越小。只要满足如下条件,就可以作为窗函数:窗函数的形式 方窗函数指数窗函数正态窗函数其中:窗口宽度的影响Parzen估计的性能与窗宽参数hn紧密相关当h

7、n较大时,x和中心xi距离大小的影响程度变弱,估计的p(x)较为平滑,分辨率较差。当hn较小时,x和中心xi距离大小的影响程度变强,估计的p(x)较为尖锐,分辨率较好。窗口宽度的影响窗函数密度估计值5个样本的Parzen窗估计:渐近收敛性Parzen窗密度估计的渐近收敛性:无偏性:一致性:当 时,0123456x6x5x3x1x2x4x 例:对于一个二类(1,2)识别问题,随机抽取1类的6个样本X=(x1,x2,.x6)1=(x1,x2,.x6)=(x1=3.2,x2=3.6,x3=3,x4=6,x5=2.5,x6=1.1)估计P(x|1)即PN(x)解:选正态窗函数 x是一维的上式用图形表示

8、是6个分别以3.2,3.6,3,6,2.5,1.1为中心的正态曲线,而PN(x)则是这些曲线之和。代入:由图看出,每个样本对估计的贡献与样本间的距离有关,样本越多,PN(x)越准确。例:设待估计的P(x)是个均值为0,方差为1的正态密度函数。若随机地抽取X样本中的1个、16个、256个作为学习样本xi,试用窗口法估计PN(x)。解:设窗口函数为正态的,1,0hN:窗长度,N为样本数,h1为选定可调节的参数。v用 窗法估计单一正态分布的实验N=N=256N=16N=1由图看出,PN(x)随N,h1的变化情况 当N1时,PN(x)是一个以第一个样本为中心的正态曲线,与窗函数差不多。当N16及N=2

9、56时 h10.25 曲线起伏很大,噪声大 h11 起伏减小 h14 曲线平坦 当N时,PN(x)收敛于一平滑的正态曲线,估计曲线较好。例:待估的密度函数为二项分布解:此为多峰情况的估计设窗函数为正态解:此为多峰情况的估计设窗函数为正态x-2.5-210.2502P(x)-2.5x-20 x2x为其它N=N=256N=16N=1v用 窗法估计两个均匀分布的实验当N=1、16、256、时的PN(x)估计如图所示 当N1时,PN(x)实际是窗函数。当N16及N=256时 h10.25 曲线起伏大 h11 曲线起伏减小 h14 曲线平坦 当N时,曲线较好。Parzen窗估计优点优点由前面的例子可以看

10、出,Parzen窗估计的优点是应用的普遍性。对规则分布,非规则分布,单锋或多峰分布都可用此法进行密度估计。可以获得较为光滑且分辨率较高的密度估计,实现了光滑性和分辨率之间的一个较好平衡。缺点缺点要求样本足够多,才能有较好的估计。因此使计算量,存储量增大。窗宽在整个样本空间固定不变,难以获得区域自适应的密度估计。识别方法1.保存每个类别所有的训练样本;2.选择窗函数的形式,根据训练样本数n选择窗函数的h宽度;3.识别时,利用每个类别的训练样本计算待识别样本x的类条件概率密度:4.采用Bayes判别准则进行分类。例子:基于Parzen估计的Bayesian分类器较小较大主要内容概率密度估计概率密度

11、估计Parzen窗估计窗估计Kn近邻估计近邻估计最近邻分类器(最近邻分类器(NN)k-近邻分类器(近邻分类器(k-NN)Kn近邻估计在在Parzen窗估计中,存在一个问题:对窗估计中,存在一个问题:对hn的选择。的选择。若若hn选选太太小小,则则大大部部分分体体积积将将是是空空的的(即即不不包包含含样样本本),从而使从而使Pn(x)估计不稳定。估计不稳定。若若hn选选太太大大,则则Pn(x)估估计计较较平平坦坦,反反映映不不出出总总体体分分布布的的变化变化Kn近近邻邻法法的的思思想想:固固定定样样本本数数量量Kn,调调整整区区域域体体积积大大小小Vn,直至有,直至有Kn个样本落入区域中个样本落

12、入区域中Kn近邻估计Kn近邻密度估计:近邻密度估计:固定样本数为,在附近选取与之最近的个样本,计算该个样本分布的最小体积在X处的概率密度估计值为:渐近收敛的条件渐近收敛的充要条件为:通常选择:Kn近邻估计例子:例子:Parzen windowsParzen windowskn-nearest-neighbor斜率不连续当n值为有限值时Kn近邻估计十分粗糙例子:Parzen windowsParzen windowskn-nearest-neighborKn近邻估计Kn近邻后验概率估计:近邻后验概率估计:给定i.i.d.样本集 ,共 类。把一个体积V放在x周围,能够包含进k个样本,其中有 ki个

13、样本属于第i类。那么联合概率密度的估计为:后验概率:后验概率:Kn近邻估计例子X属于第i类的后验概率就是体积中标记为第i类的样本个数与体积中全部样本点个数的比值。为了达到最小误差率,选择比值最大的那个类别作为判决结果。如果样本足够多、体积足够小,这样的方法得到的结果是比较准确的!主要内容概率密度估计概率密度估计Parzen窗估计窗估计k-NN估计估计最近邻分类器(最近邻分类器(NN)k-近邻分类器(近邻分类器(k-NN)最近邻分类器最近邻分类器(NN)v假设i.i.d.样本集v对于样本 ,NN采用如下的决策:v相当于采用 近邻方法估计后验概率,然后采用最大后验概率决策。v分类一个样本的计算复杂

14、度:(采用欧氏距离)最近邻分类器最近邻分类器样本样本 x=(0.10,0.25)的类别?的类别?Training ExamplesLabelsDistance(0.15,0.35)(0.10,0.28)(0.09,0.30)(0.12,0.20)1 2520.1180.0300.0510.054最近邻分类器最近邻分类器决策边界:决策边界:Voronoi网格网格NN分类规则将特征空间分成许多Voronoi网格(Voronoi网格:由一组由连接两邻点直线的垂直平分线组成的连续多边形组成)最近邻分类器最近邻分类器决策边界决策边界 在一个在一个Voronoi网格中,每一个点到该网格中,每一个点到该 V

15、oronoi网格网格原型的距离小于到其它所有训练样本点的距离。原型的距离小于到其它所有训练样本点的距离。NN分类器将该分类器将该Voronoi网格中的点标识为与该原型同网格中的点标识为与该原型同类。类。最近邻分类器最近邻分类器决策边界:决策边界:在在NN分类器中,分类边界分类器中,分类边界对于分类新样本是足够的。对于分类新样本是足够的。但是计算或者存储分类边但是计算或者存储分类边界是非常困难的界是非常困难的目前已经提出许多算法来目前已经提出许多算法来存储简化后的样本集,而存储简化后的样本集,而不是整个样本集,使得不是整个样本集,使得分分类边界不变。类边界不变。NN分类器的渐近误差界若是n个样本

16、时的误差率,并且:为最小Bayesian错误率,c为类别数。可以证明:NN分类器的渐近误差界假设能够得到无限多的训练样本和使用任意复杂的分量规则,我们至多只能使误差率降低一半。也就是说,分类信息中的一半信息是由最邻近点提供的!最近邻分类器最近邻分类器当样本有限的情况下,最近邻分类器的分类效果如何当样本有限的情况下,最近邻分类器的分类效果如何?不理想!不理想!随着样本数量的增加,分类器收敛到渐近值的速度如随着样本数量的增加,分类器收敛到渐近值的速度如何?何?可能会任意慢,而且误差未必会随着可能会任意慢,而且误差未必会随着n的增加单调递减的增加单调递减!k-近邻分类器(近邻分类器(k-NN)假设假

17、设i.i.d.样本集样本集对于样本对于样本 ,k-NN采用如下的决策:采用如下的决策:搜索与搜索与 最近的最近的 个近邻,如果个近邻,如果 个近邻中属个近邻中属于于 类的样本最多,则判决类的样本最多,则判决 属于属于 原理:原理:相当于采用相当于采用 近邻方法估计后验概率,近邻方法估计后验概率,然后采用最大后验概率决策。然后采用最大后验概率决策。分类一个样本的计算复杂度分类一个样本的计算复杂度:(采用欧氏(采用欧氏距离)距离)k-近邻分类器近邻分类器从测试样本x开始生长,不断扩大区域,直至包含进k个训练样本;把测试样本x的类别归为与之最近的k个训练样本中出现频率最大的类别。例:k=3(odd

18、value)and x=(0.10,0.25)tv选择 k-NN to x (0.10,0.28,2);(0.12,0.20,2);(0.09,0.30,5)vX属于 2。PrototypesLabels(0.15,0.35)(0.10,0.28)(0.09,0.30)(0.12,0.20)1252k-近邻分类器近邻分类器决策面:决策面:分段线性超平面分段线性超平面 每一个超平面对应着最近两点的中垂面。每一个超平面对应着最近两点的中垂面。k-近邻分类器近邻分类器k-NN分类器的误差率在样本数无穷大时趋向于分类器的误差率在样本数无穷大时趋向于Bayesian最小错误率!最小错误率!k-NN分类器

19、分类器 近邻分类器近邻分类器 假设假设i.i.d.样本集样本集 对于样本对于样本 ,-NN采用如下的决策:采用如下的决策:搜索与搜索与 最近的最近的 个近邻,如果个近邻,如果 个近邻中属于个近邻中属于 类的样本最多,为类的样本最多,为 个,则判决个,则判决 属于属于 ,否则拒识。否则拒识。k-NN分类器分类器k-NN分类器的优点:分类器的优点:原理和实现简单,特别适用于大类别问题。原理和实现简单,特别适用于大类别问题。当训练样本数较多时,误差界小于当训练样本数较多时,误差界小于2倍的倍的Bayesian最小错误率。最小错误率。k-NN分类器分类器k-NN分类器的缺点:分类器的缺点:由于训练样本

20、数有限,由于训练样本数有限,k-NN估计的后验估计的后验概率往往并不精确,从而导致分类错误率概率往往并不精确,从而导致分类错误率远远大于远远大于Bayesian最小错误率。最小错误率。搜索近邻需要遍历每一个样本,计算复杂搜索近邻需要遍历每一个样本,计算复杂度较大。度较大。需要存储所有样本。需要存储所有样本。受噪声和受噪声和距离测度距离测度的选择影响较大。的选择影响较大。距离度量距离度量距离度量应满足如下三个性质:距离度量应满足如下三个性质:1.非负性:非负性:2.自反性:自反性:当且仅当当且仅当3.对称性:对称性:4.三角不等式:三角不等式:距离测度的选取原则:需要精心选择类内变化平缓,类间变

21、化剧烈的距离测度!常用的距离函数常用的距离函数欧几里德距离:欧几里德距离:(Eucidean Distance)v曼哈顿距离:(Manhattan Distance)常用的距离函数常用的距离函数明氏距离:明氏距离:(Minkowski Distance)v马氏距离:(Mahalanobis Distance)常用的距离函数常用的距离函数角度相似函数:角度相似函数:(Angle Distance)v 海明距离:(Hamming Distance)x和y为2值特征矢量:D(x,y)定义为x,y中使得不等式 成立的i的个数。最近邻分类器的简化最近邻分类器的简化最近邻分类器的简化方法可以分为三种:最近

22、邻分类器的简化方法可以分为三种:1.1.部分距离法;部分距离法;2.2.预分类法;预分类法;3.3.需要存储所有样本问题:浓缩、剪枝。需要存储所有样本问题:浓缩、剪枝。部分距离法部分距离法定义:定义:Dr(x,y)是r的单调不减函数。令Dmin为当前搜索到的最近邻距离,当待识别样本x与某个训练样本xi的部分距离Dr(x,xi)大于 Dmin时,Dd(x,xi)一定要大于Dmin,所以xi一定不是最近邻,不需要继续计算Dd(x,xi)。预分类(搜索树)预分类(搜索树)预分类(搜索树)预分类(搜索树)在特征空间中首先找到在特征空间中首先找到m个有代表性的样本点,用这个有代表性的样本点,用这些点代表

23、一部分训练样本;些点代表一部分训练样本;待识别模式待识别模式x首先与这些代表点计算距离,找到一个最首先与这些代表点计算距离,找到一个最近邻,然后在这个最近邻代表的样本点中寻找实际的近邻,然后在这个最近邻代表的样本点中寻找实际的最近邻点。最近邻点。这种方法是一个次优的搜索算法。这种方法是一个次优的搜索算法。浓缩、剪枝浓缩、剪枝浓缩浓缩(Condensing):仅保留对决策边界有贡献的样本,仅保留对决策边界有贡献的样本,删除没有贡献的样本。删除没有贡献的样本。Original dataConsistent data浓缩、剪枝浓缩、剪枝浓缩浓缩(Condensing)最近邻剪辑算法:删除周围网格全为同类的最近邻剪辑算法:删除周围网格全为同类的Voronoi 原原型。型。浓缩、剪枝浓缩、剪枝剪枝剪枝(Pruning):删除噪声样本点,使决策边界变得删除噪声样本点,使决策边界变得更加光滑。更加光滑。Wilson pruning算法算法:删除那些类别与周围删除那些类别与周围k-NN多多数不一致的样本。数不一致的样本。Original dataWilson editing with k=7浓缩、剪枝浓缩、剪枝通常先进行剪枝然后进行浓缩通常先进行剪枝然后进行浓缩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服