1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第5章-动态聚类法(三),准则函数,K-均值算法的聚类准则,算法描述,设共有N个模式样本,计算步骤如下:,算法讨论,K-,均值算法受以下几个因素的影响,(1)指定聚类中心的个数是否符合模式的实际分布;,(2)所选聚类中心的初始位置;,(3)样本分布的几何性质;,(4)样本的读入次序.,试探,聚类结果的评价,常见的几个评价指标,(1)聚类中心之间的距离,同一类样本相聚比较密集,不同类样本相距较远.聚类中心之间的距离通常总大于各类样本的类内平均距离.类间距离太小,说明两类靠得太紧,有可能合并.,(2)诸聚类域中
2、的样本数目,如果样本的抽取比较合理,通常各类的样本数相差不大.因此聚类结果中,若某一类的样本数较其它类的样本数明显多得多,该类有可能是几类样本的集合.,综合考虑(1)、(2),(3)诸聚类域内样本距离的标准差向量,聚类域内样本与聚类中心对应分量差的平方和的平均值叫方差.方差的算术平方根叫做标准差.,此外还可以用其它距离度量之分析模式样本的聚类性质.例如:在一个聚类域内,距离聚类中心最远与最近的样本位置等.,考试重点,模式识别的基本概念,模式识别系统,最小错误率贝叶斯分类器,最小风险贝叶斯分类器,线性判别分类器的设计步骤,广义线性分类器(非线性,线性),感知器准则函数及迭代解,最小均方误差准则与伪拟解,Fisher判别分类的思想、原则及准则函数,特征提取、特征选择的概念,欧氏距离、马氏距离,基于类内散布矩阵的单类模式特征提取,聚类的概念与理解,监督分类、无监督分类,聚类与分类,基于距离阈值、函数准则的聚类,近邻聚类法,最大最小距离算法,层次聚类法,动态聚类法:K-均值聚类算法,考试题型,第一题 概念题(2个小题)10分,第二题 简答题(3个小题)30分,第三题 计算题(4个小题)50分,第四题 综合应用题 10分,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,