1、1何晓群何晓群多元统计分析多元统计分析第三版(第三版(20122012)数据下载)数据下载 第第 2 2 章章 例例 2-1 1999 年财政部、国家经贸委、人事部和国家计委联合发布了国有资本金效绩评价规则。其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为 35 家上市公司 2008 年年报数据,这 35 家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进
2、行分析。表表 2-1行业行业公司简称股票代码净资产收益率总资产报酬率资产负债率总资产周转率流动资产周转率已获利息倍数销售增长率资本积累率深圳能源0000279.174.9253.45.391.573.562.7633.00深南电000037.611.2361.17.601.741.41-12.81-.01富龙热电000426-11.30-5.5648.89.13.76-.34-40.10-9.93穗恒运000531-7.70-1.5370.25.572.70.61-29.45-7.15粤电力000539.34-1.1554.84.482.42.5211.78-7.72韶能股份000601-2.
3、95-1.2961.79.272.52.5315.77-4.67ST 惠天 000692-1.86-.8163.34.401.09.438.08-1.82城投控股60064912.288.4639.92.25.5740.2029.21-2.19大连热电6007191.58.9660.53.32.701.31-3.44.75华电能源600726.43.3377.63.402.391.0812.66-6.04电力、煤气及水的生产和供应业国电电力6007951.26.2071.65.261.681.10-5.885.68长春经开600215.09.2129.10.05.081.239.07.09大龙
4、地产6001591.21.0961.63.04.051.84-57.90-.08金丰投资6006069.786.5146.07.20.316.22-51.99-8.40房地行业新黄浦6006386.815.9631.91.12.315.57-18.484.992浦东金桥6006399.026.1642.74.20.864.5140.624.75外高桥6006486.902.0978.11.702.477.0419.885.21中华企业60067514.316.8263.67.37.445.8933.9311.82渝开发0005146.535.1431.61.14.404.42-15.566.6
5、4莱茵置业00055821.227.9573.67.44.521.04-13.1528.42粤宏远000573-8.47-4.8444.12.14.24-3.90-26.72-7.81中国国贸6000078.406.2148.06.123.041.101.205.06万科 A00000212.655.7767.44.37.3910.6215.388.93三木集团0006321.961.0580.12.88.951.74-11.30-9.55国兴地产0008382.972.2144.34.17.1730.65-74.763.06中关村0009319.691.7280.11.47.572.03-7
6、.901.59中兴通讯00006311.655.0270.15.981.214.2827.3617.40长城电脑0000661.01.3953.931.353.571.22-6.99-30.87南天信息0009489.486.6145.431.061.414.6215.13110.72同方股份6001003.572.6353.32.78.002.79-4.7726.72永鼎股份6001052.541.6971.91.42.631.8727.492.63宏图高科60012210.715.4257.491.772.123.2133.0311.23新大陆0009974.543.7431.88.861
7、.097.4918.42-6.27方正科技6006014.423.1643.951.404.673.06-13.584.73信息技术业复旦复华6006244.443.6849.44.53.853.1913.572.60习题习题 3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等 9 个内陆边远省份。选取人均 GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占 15 岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。边远及少数民族聚居区的社会经济水平发展的指标数据:地区人均GD
8、P三产比重人均消费人口增长文盲半文盲3内蒙古506831.121418.2315,83广西407634.220409.0113.32贵州234229.8155114.2628.98云南435531.1205912.125.48西藏371643.5155115.957.97宁夏427037.3194713.0825.56新疆622935.4274512.8111.44甘肃345632.8161210.0428.65青海436740.9204714.4842.92数据来源:中国统计年鉴(1998)。5 项指标的全国平均水平0=(6212.01 32.87 2972 9.5 15.78)/第第 3
9、章章例例 3-13-1 若我们需要将下列 11 户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表 3-1。在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。表 3-1 某市 2001 年城镇居民户主个人收入数据X1 职工标准工资收入 X5 单位得到的其他收入X2 职工奖金收入 X6 其他收入X3 职工津贴收入 X7 性别X4 其他工资性收入 X8 就业身份X1X2X3X4X5X6X7X8540.000.00.00.00.06
10、.00男国有1137.00125.0096.000.0109.00812.00女集体1236.00300.00270.000.0102.00318.00女国有1008.000.096.000.086.0246.00男集体1723.00419.00400.000.0122.00312.00男国有1080.00569.00147.00156.00210.00318.00男集体1326.000.0300.000.0148.00312.00女国有1110.00110.0096.000.080.00193.00女集体1012.0088.00298.000.079.00278.00女国有1209.0010
11、2.00179.0067.00198.00514.00男集体1101.00215.00201.0039.00146.00477.00男集体例 3-3EnglishNorwegianDanishDutchGermanFrenchOneEneneeneinunTwoTototweezweideuxThreeTretredriedreitroisFourFirefireviervierquatreFiveFemfemvijffunfeinqSixSekssekszessechssixsevenSjusyvzevensiebcnsept4EightAteotteachtachthuitNineNini
12、negenneunneufTenTititienzehndixSpanishItalianPolishHungarianFinnishUnounojedenegyyksiDosduedwakettokaksiTrestretrzyharomkolmecuatroquattroczterynegyneuaCincocinquepiecotviisiSeixseiszeschatkuusiSietesettesiedemhetseitsemanOchoottoosiemnyolckahdeksaunuevenovedziewieckilencyhdeksanDiezdiecidziesiectiz
13、kymmenen例 3-4X1 食品支出(元/人)X5 交通和通讯支出(元/人)X2 衣着支出(元/人)X6 娱乐、教育和文化服务支出(元/人)X3 家庭设备、用品及服务支出(元/人)X7 居住支出(元/人)X4 医疗保健支出(元/人)X8 杂项商品和服务支出(元/人)X1X2X3X4X5X6X7X8辽宁1772.14568.25298.66352.20307.21490.83364.28202.50浙江2752.25569.95662.31541.06623.05917.23599.98354.39河南1386.76460.99312.97280.78246.24407.26547.1918
14、8.52甘肃1552.77517.16402.03272.44265.29563.10302.27251.41青海1711.03458.57334.91307.24297.72495.34274.48306.45例 3-5 x1 人均粮食支出 (元/人)x5 人均衣着支出 (元/人)x2 人均副食支出 (元/人)x6 人均日用杂品支出 (元/人)x3 人均烟、酒、饮料支出 (元/人)x7 人均水电燃料支出 (元/人)x4 人均其他副食支出 (元/人)x8 人均其他非商品支出 (元/人)x1x2x3x4x5x6x7x8 北 京21.30124.8935.4373.9893.0120.5843.9
15、7433.73 天 津21.50122.3929.0851.6455.0411.3054.88288.13 河 北18.2590.2124.4532.4462.487.4547.50178.84 山 西21.8466.3818.0531.3274.488.1934.97177.45 内蒙古21.3767.0820.2835.2781.0710.9439.46182.20 辽 宁22.74115.8828.2142.4458.079.6348.65194.85 吉 林20.2288.9418.5435.6365.728.8150.29186.52 黑龙江21.3375.5014.0029.566
16、9.298.2442.08165.90 上 海21.13168.6940.8170.1274.3215.4650.90422.745 江 苏18.61122.5127.0742.5063.4715.3836.14240.92 浙 江19.96142.2443.3350.74101.7712.9253.44394.55 安 徽19.61107.1332.8535.7761.347.5334.60142.23 福 建25.56171.6522.3040.5357.1312.6054.03225.08 江 西18.75104.6815.5535.6151.8011.1836.27142.72 山 东
17、18.2788.3419.0743.1972.9812.5942.16200.18 河 南19.0773.1818.0129.3864.518.9138.14155.45 湖 北18.76102.6721.8730.4764.3311.9942.14168.17 湖 南20.25104.4520.7238.1562.9812.6739.16213.56 广 东23.68173.3017.4343.5953.6616.8665.02385.94 广 西18.70131.3511.6932.0641.5410.8442.77178.51 海 南16.16139.9212.9823.5824.871
18、0.7632.35144.21 重 庆18.18120.3926.1837.9468.1611.6438.48246.37 四 川18.53109.9521.4933.0450.9810.8833.96183.85 贵 州18.3392.4325.3832.1956.3214.0038.57144.82 云 南22.3099.0833.3632.0152.067.0432.85190.04 西 藏29.67146.9064.5154.3686.1014.7732.19193.10 陕 西20.0370.7519.7534.9553.2910.5538.20189.41 甘 肃18.6872.7
19、423.7238.6962.419.6535.26170.12 青 海20.3375.6420.8833.8653.8110.0632.82171.32 宁 夏19.7570.2418.6736.7161.7510.0840.26165.22 新 疆21.0378.5514.3534.3364.989.8333.87161.67第第 4 章章例例 4-1 判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是 1936年 Fisher 的鸢尾花数据(Iris Data)。鸢尾花为法国的国花,Setosa、Versicolour、Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的
20、,和向上的花瓣不同,花萼是下垂的。这三种鸢尾花很像,人们试图建立模型,根据萼片和花瓣的四个度量来把鸢尾花分类。该数据给出 150 个鸢尾花的萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)、花瓣宽(petal width)以及这些花分别属于的种类(Species)等共五个变量。萼片和花瓣的长宽为四个定量变量,而种类为分类变量(取三个值 Setosa、Versicolour、Virginica)。这里三种鸢尾花各有 50 个观测值。数据格式如下图所示:6定义新的变量 y 为被解释变量,用“1”代表 Setosa 鸢尾花,用“2”代表 Ver
21、sicolour 鸢尾花,用“3”代表 Virginica 鸢尾花,将萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和花瓣宽(petal width)四个变量作为解释变量。使用 SPSS 软件中的 AnalyzeClassifyDiscriminant,就进入了判别分析的对话框。分组变量(Grouping Variable)选择 y,然后定义的区域,最小值是 1,最大值是 3。解释变y量(Independents)选择 sepal.length、sepal.width、petal.length 和 petal.width。统计量(Sta
22、tistics)选项中选择描述统计量 Means,Univariate ANOVAs 和 BoxM,函数选择 Fisher 和非标准化函数,矩阵选择 Within-groups correlation。分类(Classify)选项中7选择先验概率(所有组相等或根据组的大小计算概率),因为三个品种的都是 50 种,因此两种选择的效果一样,子选项显示(display)中选择每个个体的结果(Casewise results),综合表(Summery Table)和“留一个在外”(Leave-one-out classifation)的验证原则,协方差矩阵选择Within-groups,作图选择 Co
23、mbined-groups。保存(Save)选项中可以选择预测的分类、判别得分以及所属类别的概率。如果采用逐步判别法,我们还可以选择判别的方法(Method)。得到分析结果如下:输出结果输出结果 4-18DiscriminantA An na al ly ys si is s C Ca as se e P Pr ro oc ce es ss si in ng g S Su um mm ma ar ry y150100.00.00.00.00.0150100.0Unweighted CasesValidMissing or out-of-rangegroup codesAt least one
24、missingdiscriminating variableBoth missing orout-of-range groupcodes and at least onemissing discriminatingvariableTotalExcludedTotalNPercentG Gr ro ou up p S St ta at ti is st ti ic cs s5.006.35255050.0003.428.37915050.0001.462.17375050.000.246.10545050.0005.936.51625050.0002.770.31385050.0004.260.
25、46995050.0001.326.19785050.0006.588.63595050.0002.974.32255050.0005.552.55195050.0002.026.27475050.0005.843.8281150150.0003.057.4359150150.0003.7581.7653150150.0001.199.7622150150.000萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽萼长片萼片宽花瓣长花瓣宽品种setosaversicolorvirginicaTotalMeanStd.DeviationUnweightedWeightedVa
26、lid N(listwise)T Te es st ts s o of f E Eq qu ua al li it ty y o of f G Gr ro ou up p M Me ea an ns s.381119.2652147.000.59949.1602147.000.0591180.1612147.000.071960.0072147.000萼长片萼片宽花瓣长花瓣宽Wilks LambdaFdf1df2Sig.输出结果4-1分析的是各组的描述统计量和对各组均值是否相等的检验。第1张表反映的是有效样本量及变量缺失的情况。第2张表是各组变量的描述统计分析。第3张表是对各组均值是否相等的检
27、验。由第3张表可以看出,在0.01的显著性水平上我们拒绝变量萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和花瓣宽(petal width)在三组的均值相等的假设,即认为变量萼片长(sepal length)、萼片宽(sepal width)、花瓣长(petal length)和(1)(2)(3)9花瓣宽(petal width)在三组的均值是有显著性差异的。输出结果输出结果4-2Boxs Test of Equality of Covariance MatricesL Lo og g D De et te er rm mi in na
28、 an nt ts s4-13.0674-10.8744-8.9274-9.959品种setosaversicolorvirginicaPooled within-groupsRankLogDeterminantThe ranks and natural logarithms of determinantsprinted are those of the group covariance matrices.T Te es st t R Re es su ul lt ts s146.6637.0452077566.751.000Boxs MApprox.df1df2Sig.FTests null
29、 hypothesis of equalpopulation covariance matrices.输出结果4-2是对各组协方差矩阵是否相等的BoxM检验。第1张表反映协方差矩阵的秩和行列式的对数值。由行列式值可以看出协方差矩阵不是病态矩阵。第2张表是对各总体协方差阵是否相等的统计检验。由值及其显著水平,我们在0.05的显著性水平下拒绝原假设F(原假设假定各总体协方差阵相等)。因此,在分类(Classify)选项中的协方差矩阵选择可以考虑采用Separate-groups,以检验采用Within-groups和Separate-groups两种协方差所得出的结果是否存在显著差异。如果存在显著
30、差异就应该采用Separate-groups协方差矩阵,反之,就用Within-groups协方差矩阵。输出结果输出结果4-3Summary of Canonical Discriminant Functions E Ei ig ge en nv va al lu ue es s32.192a99.199.1.985.285a.9100.0.471Function12Eigenvalue%of VarianceCumulative%CanonicalCorrelationFirst 2 canonical discriminant functions were used in theanaly
31、sis.a.(1)(2)(1)10 W Wi il lk ks s L La am mb bd da a.023546.1158.000.77836.5303.000Test of Function(s)1 through 22Wilks LambdaChi-squaredfSig.输出结果4-3分析的是典型判别函数。第1张表反映判别函数的特征值、解释方差的比例和典型相关系数。第一判别函数解释了99.1的方差,第二判别函数解释了0.9%的方差,两个判别函数解释了全部方差。第2张表是对两个判别函数的显著性检验。由Wilks Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。输出
32、结果输出结果4-4 S St ta an nd da ar rd di iz ze ed d C Ca an no on ni ic ca al lD Di is sc cr ri im mi in na an nt t F Fu un nc ct ti io on n C Co oe ef ff fi ic ci ie en nt ts s-.427.012-.521.735.947-.401.575.581萼长片萼片宽花瓣长花瓣宽12Function S St tr ru uc ct tu ur re e M Ma at tr ri ix x.706*.168-.119.864*.633.
33、737*.223.311*花瓣长萼片宽花瓣宽萼长片12FunctionPooled within-groups correlations betweendiscriminating variables and standardizedcanonical discriminant functions Variables ordered by absolute size of correlationwithin function.Largest absolute correlation between eachvariable and any discriminant function*.C Ca
34、 an no on ni ic ca al l D Di is sc cr ri im mi in na an nt t F Fu un nc ct ti io on n C Co oe ef ff fi ic ci ie en nt ts s-.829.024-1.5342.1652.201-.9322.8102.839-2.105-6.661萼长片萼片宽花瓣长花瓣宽(Constant)12FunctionUnstandardized coefficients(2)(1)(2)(3)11 F Fu un nc ct ti io on ns s a at t G Gr ro ou up p C
35、 Ce en nt tr ro oi id ds s-7.608.2151.825-.7285.783.513品种setosaversicolorvirginica12FunctionUnstandardized canonical discriminantfunctions evaluated at group means输出结果4-4显示的是判别函数、判别载荷和各组的重心。第1张表是标准化的判别函数,表示为,*1*20.427.0.521.0.947.0.575.0.012.0.735.0.401.0.581.ySepal LengthSepalWidthPetal LengthPetal
36、WidthySepal LengthSepalWidthPetal LengthPetalWidth 这里 表示标准化变量,标准化变量的系数也就是前面讲的判别权重。第2张表是结构矩阵,*即判别载荷。由判别权重和判别载荷可以看出两个解释变量对判别函数的贡献较大。第3张表是非标准化的判别函数,表示为122.1050.829.1.534.2.201.2.810.6.661 0.024.2.165.0.932.2.839.ySepal LengthSepalWidthPetal LengthPetalWidthySepal LengthSepalWidthPetal LengthPetalWidth
37、我们可以根据这个判别函数计算每个观测的判别Z得分。第4张表是反映判别函数在各组的重心。根据结果,判别函数在这一组的重心为(-7.608,0.215),在这一组的1y 2y 重心为(1.825,-0.728),在这一组的重心为(5.783,0.513)。这样,我们就可以3y 根据每个观测的判别Z得分将观测进行分类。输出结果输出结果4-5Classification Statistics C Cl la as ss si if fi ic ca at ti io on n P Pr ro oc ce es ss si in ng g S Su um mm ma ar ry y15000150Pro
38、cessedMissing or out-of-rangegroup codesAt least one missingdiscriminating variableExcludedUsed in Output P Pr ri io or r P Pr ro ob ba ab bi il li it ti ie es s f fo or r G Gr ro ou up ps s.3335050.000.3335050.000.3335050.0001.000150150.000品种setosaversicolorvirginicaTotalPriorUnweightedWeightedCase
39、s Used in Analysis(4)(1)(2)12 C Cl la as ss si if fi ic ca at ti io on n F Fu un nc ct ti io on n C Co oe ef ff fi ic ci ie en nt ts s23.54415.69812.44623.5887.0733.685-16.4315.21112.767-17.3986.43421.079-86.308-72.853-104.368萼长片萼片宽花瓣长花瓣宽(Constant)setosaversicolorvirginica品种Fishers linear discrimina
40、nt functions C Cl la as ss si if fi ic ca at ti io on n R Re es su ul lt ts sb b,c c500050048250014950100.0.0.0100.0.096.04.0100.0.02.098.0100.0500050048250014950100.0.0.0100.0.096.04.0100.0.02.098.0100.0品种setosaversicolorvirginicasetosaversicolorvirginicasetosaversicolorvirginicasetosaversicolorvir
41、ginicaCount%Count%OriginalCross-validatedasetosaversicolorvirginicaPredicted Group MembershipTotalCross validation is done only for those cases in the analysis.In crossvalidation,each case is classified by the functions derived from all casesother than that case.a.98.0%of original grouped cases corr
42、ectly classified.b.98.0%of cross-validated grouped cases correctly classified.c.(3)(4)13输出结果4-5是分类的统计结果。第1张表概括了分类过程,说明150个观测都参与分类。第2张表说明各组的先验概率,我们在Classify选项中选择的是所有组的先验概率相等。第3张表是每组的分类函数(区别于判别函数),也称费歇线性判别函数,由表中的结果可以说明,这一组的分类函数是1y 186.30823.544.23.588.16.431.17.398.fSepal LengthSepalWidthPetal LengthP
43、etalWidth 这组的分类函数是2y 272.853 15.698.7.073.5.211.6.434.fSepal LengthSepalWidthPetal LengthPetalWidth 这组的分类函数是3y 3104.368 12.446.3.685.12.767.21.079.fSepal LengthSepalWidthPetal LengthPetalWidth。我们可以计算出每个观测在各组的分类函数值,然后将观测分类到较大的分类函数值中。第4张表是分类矩阵表。Predicted Group Membership表示预测的所属组关系,Original表示原始数据的所属组关系
44、,Cross-validated表示交叉验证的所属组关系,这里交叉验证是采用(5)14“留一个在外”的原则,即每个观测是通过除了这个观测以外的其他观测推导出来的判别函数来分类的。由第4张表可以看出,通过判别函数预测,有147个观测是分类正确的,其中,组50个观测全部被判对,组50个观测中有48个观测被判对,组50个观测1y 2y 3y 中有49个观测被判对,从而有147/150=98%的原始观测被判对。在交叉验证中,组501y 个观测全部被判对,组50个观测中有48个观测被判对,组50个观测中有49个观2y 3y 测被判对,从而交叉验证有147/150=98%的原始观测被判对。还可以通过分类结
45、果分析判对和判错的百分比。第(5)为分类结果图,从图中可以看到,Setosa鸢尾花与Versicolour鸢尾花和Virginica鸢尾花可以很清晰的区分开,而Versicolour鸢尾花和Virginica鸢尾花这两种之间存在重合区域,即存在误判。我们还可以通过保存(Save)选项选择预测的类别关系和判别得分等,对观测进行诊断。由前面分析我们发现,协方差矩阵不等,可以考虑采用Separate-groups协方差矩阵,选择Separate-groups协方差矩阵,其他选择同上,得分类结果表如下:输出结果输出结果4-6C Cl la as ss si if fi ic ca at ti io o
46、n n R Re es su ul lt ts sa a500050047350014950100.0.0.0100.0.094.06.0100.0.02.098.0100.0品种setosaversicolorvirginicasetosaversicolorvirginicaCount%OriginalsetosaversicolorvirginicaPredicted Group MembershipTotal97.3%of original grouped cases correctly classified.a.(1)15由第1张表可以看出,通过判别函数预测,有146个观测是分类正确
47、的,其中,组50个1y 观测全部被判对,组50个观测中有47个观测被判对,组50个观测中有49个观测2y 3y 被判对,从而有146/150=97.3%的原始观测被判对。第(2)为分类结果图,从图中可以看到,Setosa鸢尾花与Versicolour鸢尾花和Virginica鸢尾花可以很清晰的区分开,而Versicolour鸢尾花和Virginica鸢尾花这两种之间存在重合区域,即存在误判。由输出结果4-6可以看出,采用Separate-groups协方差矩阵与采用Within-groups协方差矩阵的预测效果没有明显的差别,因此,可以采用Within-groups协方差矩阵来进行判别。例例
48、4-2 距离判别案例。距离判别案例。为了研究 2008 年全国各地区城镇居民家庭人均消费支出情况,按人均收入、人均 GDP 以及消费支出将 29 个省、市、自治区(除天津和陕西以外)分为三种类型,设置 group 变量取值分别为 1、2、3。试建立判别函数,判定天津、陕西分别属于哪个消费水平类型。判别指标及原始数据见表 41。解:本例中组数 k=3,判别指标 p=8,各组中样本为:,待判样1235,13,11nnn品个数为 2。总体协差阵的逆矩阵:(2)1618.56 6.63 5.42-1.48-0.45-11.59-2.22-7.19 6.63 47.51 14.73 13.67-19.1
49、5-4.24-12.94-40.50 5.42 14.73 51.26-4.49-21.81-19.12-1.93-12.01-1.48 13.67-4.49 150.71-7.74 11.18-53.22-22.7)0-0.45-19.15-21.81-7.74 49.96 14.99-13.57 6.11-11.59-4.24-19.12 11.18 14.99 38.95-18.99-12.95-2.22-12.94-1.93-53.22-13.57-18.99 53.46-4.82-7.19-40.50-12.01-22.70 6.11-12.95-4.82610 198.48 表表
50、4-1 2008 年年 31 个省、市、自治区农村居民家庭平均每人生活消费支出个省、市、自治区农村居民家庭平均每人生活消费支出 x1 人均食品支出 (元/人)x5 人均交通和通信支出 (元/人)x2 人均衣着支出 (元/人)x6 人均文教娱乐用品及服务支出(元/人)x3 人均住房支出 (元/人)x7 人均医疗保健支出 (元/人)x4 人均家庭设备及服务支出 (元/人)x8 其他商品及服务支出 (元/人)序号地区x1x2x3x4x5x6x7x8Group1上 海 7108.62 1520.61 1646.19 1182.24 755.29 3373.19 2874.54 937.2112广 东