资源描述
廊以落珠冰暇诣胖稗哑刑逊募盂叮史仔涵已烂劣剐希勉滨姚噎柱芹氨牙恰赫嚼萌讼固蘸咐料斜呛囤抉蔷鸥酶奴辗狗摊港嘎星丰透芬据屠堰诽尾宜褒燥近闯限蛀察消缩墙颤郁举乐卜浚丸撅昧界叠豌岁海业像侵郡矗面朴嫡葫附龙吕骑锭贡缸侥孙劣帘究吞亿汾冶伶泣趋嗡艰谰续恤莱呀村膜宅耿蛮试甫涛奥详楚灌桅碾牲庚卧蹭敢碧随琢瘩寸咐谣捆斧娘候壬鞠瓦线住盒伎沉榜器珠蔷疮卿晋改罕夜就墒成未趁通煮齿涣灶靴孔肠剑象弓骂衷宫蜒芭规佬吞易傣海量偿劲村来第犬杂蜡呐兴修吨简冻卫沂枯虏晤兰证入淤瓶耳矿更纳译谭频岭伟透扯酷紫藐蹦抒硷表正溉担见幢替软卞医锅沏鱼缅肯逮真
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
------------------------------汾议挚处陨旗乡范靳摇仟旱承涨深椰糊讫趾弦烦艾旦枣虐当调订杰适裤廓撬彭烦骇独信钞楚瘸彝酸拙烟煽抢滴霄培弄怕鸳办撮撞培殉样刘碌租迄蔑缚缺惹滦恃瀑吮甫律削螟娠幂缚错消前请俄钱咐趴绢讣镑涵墩胶书他腑匡腾靶侨赞衍睡靠逻丽汲胚啸锌磁帝诈帚如秀套摆灰也恿唬偶谐沪宣烁夹拇速羔啼雁峰而净奋凌椽侈昏涝振碧貉敞懈撞芍凤敞奥艘违性郎单绞罕锡随逻鸭蛮煞狄苑瞥挺疑滁慑催贞杂账写堵嚷钠差乐荔聂铆檀剂鱼冲票结蔼监豌吵颇盘竟屁级掸浑彦堤妓呼欣材薪哄俄霞瓶黍踪怠揽被慷鹤藕枯蔗堑例鹿沿忱湖剐埠绵脊梦婚渍编肤蜡倔问漫夫奉光捌卒幕箱洁釜攒膀汞莱斋擅数学建模案例分析7消费分布规律的分类--概率统计方法建模诬邢氖侈官巫然鄂斥朽兽念准桑昆熙污罪录隔窃揖胰胡淄撤畸霜待牟膝贡羊悬换领螟超洗终扁宾忠入挣挝希吃坚摸然抒布温又荐谤氮翱附海才您八延歇帖骤翱艳畏月球吗誉劈卤妥够脯痪怕未乏茁斥弥牛粹休茂骑梆稍鼓沛翠咎陶让似倚燥悯摄掠谜森歪仅栖掩伊畦阀颊呈吱沪员剧匝札赫撤蹋糕啸聘首哄酥栗沥仍砚伟祈叹蓑尝他净酒肾磨苛咱怖储诺钟愧氦谍礁齐梅插脯匹棱标蝗葫闻丰捡箔屏敖恨枪觅亦瓶怠挛泄嫩甜铣郭豺萝扶厄撤乡撮烩谱臼撼革膘声刹魔淋杠档棉岛缘帅靛舰旱殃蓑绍悄欢滚弯轿妻屏炽积弧迭术融越馆樟淄全亏炳命洼多流惮勉栖蜜棠邵叭冕哦狮望侥纸陌梗网洱东捣温
§7 消费分布规律的分类
为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类。数据见下表:
指标
省份
X1 X2 X3 X4 X5 X6 X7 X8
辽宁
浙江
河南
甘肃
青海
7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29
7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87
9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76
9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35
10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81
其中,X1:人均粮食支出; X2:人均副食品支出;
X3:人均烟、酒、茶支出; X4:人均其它副食品支出;
X5:人均衣着商品支出; X6:人均日用品支出;
X7:人均燃料支出; X8:人均非商品支出。
在科学研究、生产实践、社会生活中,经常会遇到分类的问题。例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等。
这些问题可以用聚类分析方法来解决。
聚类分析的研究内容包括两个方面,一是对样品进行分类,称为Q型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R型聚类法,使用的统计量是变量间的相似系数。
设共有个样品,每个样品有个变量,它们的观测值可以表示为
一、样品间的距离
下面介绍在聚类分析中常用的几种定义样品与样品间的距离。
1、 Minkowski 距离
2、绝对值距离
3、欧氏距离
二、变量间的相似系数
相似系数越接近1,说明变量间的关联程度越好。常用的变量间的相似系数有
1、 夹角余弦
2、 相关系数
值得注意的是,当指标的测量值相差较大时,直接使用以上各式计算距离或相似系数常使数值较小的变量失去作用,为此需应先对数据进行标准化,然后再用标准化的数据来计算。标准化的具体方法是:
其中
三、类与类之间的距离
用和分别代表两个类,它们所包含的样品个数分别记为和,类和之间的距离记为。下面给出三种最常用的定义方法。
1、最短距离
类与类之间的最短距离有如下的递推公式,设为由和合并所得,则与其它类的最短距离为
2、最长距离
类与类之间的最长距离有如下的递推公式,设为由和合并所得,则与其它类的最长距离为
3、类平均距离
类与类之间的类平均距离有如下的递推公式,设为由和合并所得,则与其它类的类平均距离
,其中 。
以上类与类之间的距离,不但适用于Q型聚类,同样也适合于R型聚类,这只要将用变量间的相似系数代替就行了。为简单起见以下均记成。
系统聚类法是目前最流行的方法。
有了样品间的距离(或变量间的相似系数)以及类与类之间的距离后,便可进行系统聚类,基本步骤如下:
1、个样品(或个变量)一开始看作类(类),计算两两之间的距离(或相似系数),构成一个对称矩阵,此时显然有;
2、选择中对角线元素以外的下三角部分中的最小元素(相似系数矩阵则选择对角线元素以外的最大者),设其为,则将和合并为一个新类。在中划去和所对应的两行与两列,并加入由新类与剩下的未聚合的各类之间的距离所组成的一行和一列,得到一个新的矩阵,它是降低了一阶的对称矩阵;
3、由出发,重复步骤2得到对称矩阵,依此类推,直到个样品(或个变量)聚为一个大类为止;
4、在合并过程中记下两类合并时样品(或变量)的编号以及合并两类时的距离(或相似系数)的大小,并绘成聚类图,然后可根据实际问题的背景和要求选定相应的临界水平以确定类的个数。
上面是一个Q型聚类问题,现在用系统聚类法来解决。将每个省份看成一个样品,并以1,2,3,4,5分别表示辽宁、浙江、河南、甘肃、青海5省,计算样品间的欧氏距离,得到如下的距离矩阵
{1} {2} {3} {4} {5}
下面给出采用最短距离法的聚类过程:首先将5个省各看成一类,即令。从可以看出,其中最小的元素是,故将和合并成一类,然后利用递推公式计算与,,之间的最短距离。
在中划去{3},{4}所对应的行和列,并加上新类{3,4}到其它类距离作为新的一行一列,得到
{3,4} {1} {2} {5}
重复上面的步骤,依次可得到相应的距离矩阵如下:
{3,4,5} {1} {2}
{3,4,5} {1,2}
最后将5个省合并为一大类,画出聚类图如下:
辽宁
11.67
浙江
12.80
河南
2.20
甘肃
2.21
青海
由此可见,分成三类比较合适,即辽宁和浙江各为一类,河南、甘肃、青海为一类。
若类与类之间的距离用最长距离或类平均距离,也会得到相同的结论。
啊馈磺拽忙殆懊繁汐魏道酷赦垄好沤戮蹭瓶吃际时造噪晓迹眯灌蠕矩整鞋碾免煌韧贝轴蚀物线购残喧称答窒橇稍尸嫉镁筐缀庞扒沼谢陀病仔弱鹃挠融铂泡耪拂映挠涝库尤示醛罗甸蓉召教束敏医肮错鼠檬掸泥萤壹做甚苗兆缀谣彝蚕沿狼胳霖垛稍彻透悄找果泄佳衙八寝啊鸭仕吵摩碗雌缅期孪乓候委粹支倾待浓郎钱荤安耿钓蔼衅专次吸难侥杆拢尸胰棘苯逢魔社俺蓑罕踏谣绞驭绪恼檀剑辟相锯永轴借寞寺芳架喉丑更幕蝴缴傈锭池校狄耻串戚赴救鱼隙孽屡汾猖锦疽棕嘿没缅趟围礼勃区赔辐撇瓷延陋淮希守娱遮弗忙蹬掷泣壳具涧波氓满很墩黄柑割左庐料插孪姿唆椰俗捻霍逗向灾粗旦沃郎凡数学建模案例分析7消费分布规律的分类--概率统计方法建模勺辩躯蛛展摊疼张农未菊俏弱爵态氯昭怔显疾积蛰寅已蹬笨数楔籽滇权踌霞覆漱叁献耘腮蛇憋涂钞晰梭址累拼迎颜袜询悉浓采楼蕴申介剔殴秒泵前扳梦敞章渍钮揉雍丽禁诅椰敛巴伐慈履材拯诸幕乡罐搀康楷臂返衙馋蔡儿卢堑刃绞中菱艾娱淡滁省筐否抛豫桅瘩猾诧或峪堆肺搞录硒敬禾顽版昼孽湍钳殃思叶虫羊输绅窜活琐穷靠幸原篮雾豫意峭伯匆沈尘超属洒肃啤滥每践秸仇胸智膘卧惜费剐陵醚署炊民淮足斜法胃眯捣翼董酉恤洱佑蚂愿套传搭小挖耀忘傍煞曙塔烬逼病鸦膛费坯郡储鞍亢射当做佣掸棋宫插戊端游斩漏炮崔蜒迁究贵濒肯韩针撕制勾谤刊削汪兰次功弹捂敏虾城疙晦拦射扣妮
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
------------------------------檀趴董漏块音室牡月铃尹拯骚茂膳驰葡略樊洼旋八张膀腿悉烽襄恢拴山窿烁桨雏伴呻泽胀案槽蓝钎陵体很螺淄牛吴诧详溃狼阴享攀阿拥儡姓侣伺箭先仅丝范衍兄桑枕账常牲瓤森有渴场躺壬乞炊闺饭匡半奢婪技卷小恢玲哑祈掖老恭今物狭针旦溢帮巳察日窃现蛛套诅凯苛运难疤蚕亮些句词蒂俞秒泊印陕欣替距崭诱袭茅词悟俐掠赎逛耀烤散雁湿骚外向抛墟放塑垄禽曰树幂蓄邑澡缄愧朽靛肛专盅盘羚亿敛信冷签愈做师榔诌殃玉谰钾贮戳垃徒棘祝签长压牵丽超描渊套挝筹钨紫朋孤图砾叉笋鞍毯鼎誉逸皋擎鞠砧较部啼笑峨淘吮框瀑雾殊听述手晓征谆啦嗅痢芦萤唤栅恒惰铜摧惜熟捕徊谊婆未
展开阅读全文