ImageVerifierCode 换一换
格式:PPT , 页数:153 ,大小:2.36MB ,
资源ID:12525004      下载积分:25 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/12525004.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(第2章-统计数据的描述.ppt)为本站上传会员【精***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

第2章-统计数据的描述.ppt

1、华南理工大学精品课程,*,华南理工大学精品课程,华南理工大学精品课程,第二章,统计数据的描述,京东苏宁价格大战,2012,年,8,月,京东商城,CEO,刘强东在微博称,京东所有大家电将在未来三年内保持零毛利,并将派员进驻苏宁国美店面。苏宁易购随后跟进表示,其所有产品价格将低于京东。如此京东苏宁价格大战拉开了序幕。,下面收集了,8,月,15,号当天,,46,款冰箱分别在苏宁和京东的价格。,引例:,华南理工大学精品课程,第二章,统计数据的描述,引例:,苏宁京东冰箱价格(单位:元),苏宁,1260 1404 6399 23.1 4854 699 1199 5999 2700 16322 1999

2、949,1449 4299 799 2482 2645 4230 5799 26625 2099 4499 5999 2599,2991 4299 3298 1199 2798 17998 17999 21799 26.2 2209 2438,1199 3592 7999 2888 2779 4599 5599 6398 1420 1149 6699,京东,1049 1699 4999 499 4599 699 1299 5699 6999 16999 1999 999,1599 3999 799 2199 2699 4490 5999 26626 2049 4499 6199 2499,27

3、99 4399 3199 1299 2750 18707 18707 22666 599 2219 2359 1399 3499 7999 2999 2699 4199 5599 5899 1399 1299 6199,数据来源于百度文库。,华南理工大学精品课程,第二章,统计数据的描述,有人就认为苏宁的平均冰箱价格比京东的低,因为苏宁的平均冰箱价格为,4987.88,元(这里是算术平均数),比京东的为,5088.83,元低;而有些人却不那么认为,两者价格没有显著差异,因此他们认为苏宁冰箱价格的中位数为,2843,元,众数为,1199,元,对应地与京东冰箱价格的中位数,2899,元和众数,129

4、9,元相差不大。那究竟哪个对呢?,引例:,华南理工大学精品课程,6,本章学习目标,了解统计数据的类型,了解统计数据的来源和数据的质量要求,掌握数值型数据的整理方法,掌握数据集中趋势和离散程度的测度方法,掌握茎叶图和箱线图的制作方法,了解非正态总体的分布偏态和峰度,掌握统计表和统计图的使用,华南理工大学精品课程,7,第一节 统计数据的描述,2.1,2.2,2.3,2.4,2.5,第二章具体章节结构,第二节,统计数据的来源,第三节,统计数据的质量,第四节,统计数据的整理,第五节,分布集中趋势的测度,华南理工大学精品课程,8,第六节 分布离散程度的测度,2.6,2.7,2.8,第七节,分布偏态与峰度

5、的测度,第八节,统计表与统计图,第二章具体章节结构,第一节 统计数据的描述,什么是统计数据?,统计数据是表示某一地理区域自然经济要素特征、规模、结构、水平等指标的数据,是定性、定位和定量统计分析的基础数据。,华南理工大学精品课程,9,第一节 统计数据的描述,华南理工大学精品课程,10,统计数据的分类:,统计数据的类型,按计量尺度,按时间状况,按收集方法,分类数据,顺序数据,等距型数据,等比型数据,观测数据,实验数据,截面数据,时间序列数据,图,1-3,统计数据的分类,一、按计量尺度划分,华南理工大学精品课程,11,分类数据,(categorical data),对事物进行分类的结果,数据表现为

6、类别,用文字表述或数值标识,如,人口按性别分为男、女两类,用,0,、,1,标识,顺序数据,(ordinal data),对事物类别顺序的测度,数据表现为类别,用文字来表述,如,产品分为一等品、二等品、三等品等,华南理工大学精品课程,一、按计量尺度划分,3.,等距型数据,(interval data),对事物间隔的精确测度,结果表现为具体的数值,如:,20,到,18,之差与,10,到,8,之差都相差,2,;,0,表示某一个数值,不表示“没有”或“无”,适合于“,+,,,-”,运算,4.,等比型数据(,ratio data,),对事物比值的精确测度,结果表现为具体的数值,如:,0,表示“没有”或“

7、无”,适合于“,+,,,-,,,,,”,运算,华南理工大学精品课程,13,四种计量尺度的比较,定类尺度,定序尺度,定距尺度,定比尺度,分类,(=,,,),排序,(),间距,(+,,,-),比值,(,,,),“,”,表示该尺度所具有的特性,表,2-1,四种计量尺度的比较,二、按收集方法划分,华南理工大学精品课程,14,观测数据,(observational data),通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据,实验数据,(experimental data),在实验中控制试验对象而收集到的数据,如,对一种新药疗效的试验,对一种

8、新的农作 物品种的试验等,医学、自然科学领域的数据大多都为实验数据,三、按时间状况划分,华南理工大学精品课程,15,截面数据,(cross-sectional data),在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,如,,2010,年中国各省自治区直辖市特别行政区的国民生产总值数据,时间序列数据,(time series data),在不同时间上收集到的数据,描述现象随时间变化的情况,如,,2005-2011,年中国各省自治区直辖市特别行政区的国民生产总值数据,华南理工大学精品课程,16,本节提问,数据的计量尺度分为哪几种?,Q1,Q2,Q3,不同计量尺度各有什么特点?

9、按收集方法可划分为哪几种类型?,按时间状况可划分为哪几种类型?,Q4,华南理工大学精品课程,第二节,统计,数据的来源,统计数据来源于直接组织的调,查、观察和科学试验,我们称之为第一手数据或直接的数据,;,或者来源于已有的数据,我们称之为第二手数据或间接的数据。,一、间接获取的数据,二、直接获取的数据,华南理工大学精品课程,18,间接取得的数据,统计部门和政府部门公布的有关资料,如各类统计年鉴,各类经济信息中心、信息咨询机构、专业调查机构等提供的数据,各类专业期刊、报纸、书籍所提供的资料,各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料,从互联网或图书馆查阅到的相关资料

10、中国统计年鉴,2001,中国人口统计年鉴,中国市场统计年鉴,世界发展报告,世界经济年检,工业普查数据,中国统计出版社,华南理工大学精品课程,19,提供统计数据的部分网站,表,2-3,提供统计数据的部分网站,中国政府及相关机构,网址,数据内容,国家统计局,统计年鉴、统计月报等,中国经济信息网,经济信息及各类网站,华通数据中心,国家统计局授权的数据中心,中国决策信息网,决策知识及案例,三农数据网,三农信息、论坛及相关网站,中国人口网,人口、市场指标,中国人民银行,国际储备、汇率及相关网站,财政部,中央政府预算及各类网站,华南理工大学精品课程,20,提供统计数据的部分网站,美国政府机构,网址,数据

11、内容,人口普查局,www.census.gov,人口和家庭等,联邦储备局,www.federalreserve.gov,货币供应、信誉、汇率等,预算编制办公室,www.whitehouse.gov/omb,财政收入、支出、债券等,商务部,www.doc.gov,商业、工业等,表,2-3,提供统计数据的部分网站(续表),提供统计数据的部分网站,华南理工大学精品课程,21,表,2-3,提供统计数据的部分网站(续表),国外数据统计网站,网址,数据内容,Monthly Bulletin of Statistics Online,unstats.un.org/unsd/mbs/app/DataSearc

12、hTable.aspx,各个国家统计局和组织的统计数据,World Development Indicators,data.worldbank.org/indicator,世界银行的数据,CIA world factbook,https:/www.cia.gov/library/publications/the-world-factbook/,中央情报局收集的数据,包括人口、社会、军事等,IPUMS,www.ipums.org/,普查数据集成网站,包括人口、地理、居民收入等,华南理工大学精品课程,22,普查,(census),为特定目的专门组织的非经常性全面调查,通常是一次性或周期性的,一般需

13、要规定统一的标准调查时间,数据的规范化程度较高,应用范围比较狭窄,总体,华南理工大学精品课程,23,抽样调查,(sampling survey),1.,从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法,2.,具有经济性、时效性强、,适应面广、准确性,高等特点,3.,根据样本抽取原则的不同,抽样方法有概率抽样和非概率抽样,总体,随机样本,统计报表(,statistical report forms,),统计报表是以国家有关法规为准则,按照统一的表式、统一的指标、统一的报送时间和报送程序,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。,

14、华南理工大学精品课程,24,华南理工大学精品课程,25,本节提问,简要说明统计数据的来源?,Q1,Q2,获取直接统计数据的渠道主要有哪些?,第三节,统计,数据的质量,质量评价标准,1,)精度,即最低的抽样误差或随机误差;,2,)准确性,即最小的非抽样误差或偏差;,3,)关联性,即满足用户决策、管理和研究的需要;,4,)及时性,即在最短的时间里取得并公布数据;,5,)一致性,即保持时间序列的可比性;,6,)最低成本,即在满足以上标准前提下以最经济的方式取得数据。,华南理工大学精品课程,26,华南理工大学精品课程,第三节,统计,数据的质量,统计数据的误差:,一、登记性误差,二、代表性误差,华南理工

15、大学精品课程,28,登记性误差,由于调查者或被调查者的人为因素所造成的误差,调查者所造成的登记性误差主要是由调查方案中有关的规定或解释不明确导致的填报错误、抄录错误、汇总错误等引起的。,被调查者造成的登记性误差主要是由故意虚报或瞒报引起的。,理论上讲,登记性误差是可以消除的。,华南理工大学精品课程,29,代表性误差,用样本推断总体时,样本单位不能完全反映总体的性质,它同总体的实际指标有一定的差异。,代表性误差按照产生的原因可分为随机误差和系统误差。,代表性误差即,抽样误差,的客观存在和不可避免性,并不意味着可以任其存在或对其无所作为,相反,对抽样误差的控制是十分必要的。,华南理工大学精品课程,

16、30,误差的控制,正确制定调查方案,力求调查的范围明确、调查项目解释清楚、方法科学适用;,加强调查人员培训,提高调查技术水平;,做好思想教育工作,坚持实事求是,加强法律观念;,严格要求调查人员认真细致,多加审查及时更正;,完善各种计量、测量工具;,调查过程进行控制,对调查结果进行检验、评估,现场调查人员进行奖惩的制度。,华南理工大学精品课程,31,本节提问,简要说明登记性误差和代表性误差?,Q1,Q2,误差的控制有哪些途径?,华南理工大学精品课程,第四节,统计,数据的整理,一、统计数据整理的概述,二、统计分组,三、分配数列,四、洛伦茨曲线,华南理工大学精品课程,33,统计数据整理的概述,统计数

17、据整理是根据统计研究任务的要求,对统计调查阶段所收集到的大量原始资料进行加工与汇总,使其系统化、条理化、科学化,最后形成能够反映现象总体综合特征的统计资料的统计工作过程。,统计数据整理的概述,统计数据整理的程序:,1,)统计资料的审核,2,)进行统计分组,3,)进行加工汇总,编制分配数列,4,)编制统计表和绘制统计图,5,)统计数据资料的积累、保管和公布,华南理工大学精品课程,34,统计分组,统计分组是根据统计研究的需要,按照某种标志将统计总体区分为若干性质不同而又有联系的几个部分的一种统计方法,。,统计分组的种类:,(,1,)按照分组标志的多少可分为简单分组和复合分组。,(,2,)按分组标志

18、的性质可分为品质分组和变量分组。,华南理工大学精品课程,35,统计分组,穷尽原则,总体中的每一个单位都有组可归,无一遗漏。,互斥原则,总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。,华南理工大学精品课程,36,统计分组,分组标志的注意问题,1,)根据统计研究的目的进行选择,2,)若干个标志中,要选择最能反映事物本质特征的标志作为分组标志,华南理工大学精品课程,37,统计分组,统计分组的方法,1,)品质分组的方法,2,)变量分组的方法,单项式分组与组距式分组。,等距分组与不等距分组。,组限与组中值。,华南理工大学精品课程,38,分配数列,分配数列也称次数分布或次数分配,是统计资料

19、经过对某一标志分组后按一定的分组顺序,列出各组的总体单位,形成一个反映总体单位在各组间分配情况的统计数列,分布在各组的总体单位数叫次数,又称频数;各组次数与总次数之比称为频率。,华南理工大学精品课程,39,文化程度,职工人数(人),占总人数的比重(,%),本科及以上,350,17.5,大专及以上,800,40.0,中专及高中,600,30.0,初中及以下,250,12.5,合计,20000,100.00,分配数列,按选用的分组标志性质不同可分为品质数列和变量数列。,变量数列的编制方法,第一步,将原始资料按数字大小依次进行排列。,第二步,确定定量的类型和分组的方法(如单项式或组距式分组)。,第三

20、步,确定组数和组距。,第四部,确定组限及其表示方法。,第五步,汇总各组的次数,并计算频率。,华南理工大学精品课程,40,华南理工大学精品课程,41,案例分析,次数分配表的编制,【,例,】,2011,年全国各省区人均,GDP,数如下(单位:万元),请编制各省区市人均,GDP,数列。,5.88 4.70 5.03 4.74 5.05 5.67 6.10 1.61 1.90 1.96 2.99 2.88 2.02 2.54 2.54 2.87 2.90 2.60 2.61 8.65,3.79 3.47 3.42 3.03 3.08 8.04 3.26 3.27 3.32 8.26 3.37,华南理工

21、大学精品课程,42,案例分析 次数分配表,人均,GDP分组,次,数,频率,%,1.5,3.0,万元,12,39,3.0,4.5,万元,9,29,4.5,6.0,万元,6,19,6.0,7.5,万元,1,3,7.5,9.0,万元,3,10,合计,31,100,表,2-6 2011,年全国,31,个省区市人均,GDP,统计表,华南理工大学精品课程,43,次数分配的类型,对称分布,右偏分布,左偏分布,正,J,型分布,反,J,型分布,U,型分布,图,2-2,几种常见的频数分布,华南理工大学精品课程,44,洛伦茨曲线,20,世纪初美国经济学家、统计学家洛伦茨,(M.E.Lorentz),根据意大利经济学

22、家巴雷特,(V.Pareto),提出的收入分配公式绘制而成,描述收入和财富分配性质,的曲线分析该国家或地区,分配的平均程度,A,B,累积的人口百分比,绝对公平线,累积的收入百分比,华南理工大学精品课程,45,基尼系数,20,世纪初意大利经济学家基尼,(G.Gini),根据洛伦茨曲线给出了衡收入分配平均程度的指标,A,表示实际收入曲线与绝对平均线之间的面积,B,表示实际收入曲线与绝对不平均线之间的面积,如果,A=0,,则基尼系数,=0,,表示收入绝对平均,华南理工大学精品课程,46,基尼系数,5.,如果,B=0,,则基尼系数,=1,,表示收入绝对不平均,6.,基尼系数在,0,和,1,之间取值,7

23、一般认为:,基尼系数若小于,0.2,,表明分配平均;,基尼系数在,0.2,至,0.4,之间是比较适当的,,即一个社会既有效率又没有造成极大的分配不公;,基尼系数在,0.4,被认为是收入分配不公平的警戒线,,超过了,0.4,应该采取措施缩小这一差距。,A,B,华南理工大学精品课程,47,本节提问,描述次数分配表的编制过程。,Q1,Q2,Q3,解释洛伦茨曲线及其用途。,说明基尼系数的含义和用途。,华南理工大学精品课程,第五节,分布集中趋势的测度,一、众数,二、中位数,三、算术平均数,四、调和平均数,五、几何平均数,六、众数、中位数和均值的比较,七、四分位数,八、切尾均值,华南理工大学精品课程,

24、49,众数,(,mode,),一组数据中出现次数最多的变量值,适合于数据量较多时使用,不受极端值的影响,一组数据可能没有众数或有几个众数,主要用于分类数据,也可用于顺序数据和数值型数据,华南理工大学精品课程,50,众数,(,不惟一性,),无众数,原始数据,:11 3 7 12 9 8,一个众数,原始数据,:7,4,6 13,4,4,多于一个众数,原始数据,:17,15,25,33,24,24,众数,组距分组数据的众数:,设众数组的频数为,f,,众数组前一组的频数为,f,-,,众数组后一组的频数为,f,+,,从众数组直方图的两个顶角向相邻两组直方图的两个顶角引直线,再由交叉点向横轴引垂线,与横轴

25、相交的点即为众数。,华南理工大学精品课程,51,众数,组距分组的众数,华南理工大学精品课程,52,华南理工大学精品课程,53,中位数,(,median,),1.,排序后处于中间位置上的值,2.,不受极端值的影响,3.,主要用于顺序数据,也可用数值型数据,但不能用于分类数据,4.,当次数分布偏态时,中位数的代表性会受到影响,5.,缺乏敏感性,M,e,50%,50%,华南理工大学精品课程,54,中位数,(,位置的确定,),对于未分组的原始资料:,由分组资料确定中位数,华南理工大学精品课程,55,中位数,(,位置的确定,),华南理工大学精品课程,56,案例分析,(9,个数据的算例,),【,例,】9,

26、个家庭的人均月收入数据,原始数据,:,1400 750 760 1050 870 950 2100 1450 1540,排 序,:,750 760 870 950,1050,1400 1450 1540 2100,位 置,:,1 2 3 4,5,6 7 8 9,中位数,=1050,华南理工大学精品课程,57,案例分析,(10,个数据的算例,),【,例,】10,个家庭的人均月收入数据,排 序,:,635,690 770 820,930 1078,1230 1450 1690 2150,位 置,:,1 2 3 4,5 6,7 8 9 10,案例分析,(,分组数据,),例:计算,50,名工人日加工零

27、件数的中位数。,华南理工大学精品课程,58,按零件数分组,(个),频数,(人),向上累计,(人),向下累计,(人),105110,3,3,50,110115,5,8,47,115120,8,16,42,120125,14,30,34,125130,10,40,20,130135,6,46,10,135140,4,50,4,根据中位数公式得:,华南理工大学精品课程,59,案例分析,(,分组数据,),华南理工大学精品课程,60,算术平均数,集中趋势的最常用测度值,一组数据的均衡点所在,体现了数据的必然性特征,易受极端值的影响,用于数值型数据,不能用于分类数据和顺序数据,华南理工大学精品课程,61,

28、简单均值,(simple mean),设一组数据为:,x,1,,,x,2,,,,,x,n,总体均值,样本均值,华南理工大学精品课程,62,加权均值,(weighted mean),设一组数据为:,x,1,,,x,2,,,,,x,n,相应的频数为:,f,1,,,f,2,,,,,f,k,总体均值,样本均值,华南理工大学精品课程,63,案例分析,【,例,】,某天某省全部电影院各自平均电影价格资料如表,2-11,。那么全省平均电影价格多少?,表,2-11,某企业班组工人日产量统计表,价格(元),电影院数(间),每组电影总价格(元),30,8,240,35,10,350,40,6,240,45,10,4

29、50,50,6,300,合计,40,1580,加权均值,组距数列计算加权算术平均数,用来计算平均数时,从理论上讲,应先计算各组的平均数,再以各组平均数乘以相应的权数,计算加权算术平均数。但实际工作中,很少计算组平均数,而是用各组的组中值近似代替各组平均数,再用式(,2-4,)来计算加权算术平均数。,华南理工大学精品课程,64,案例分析,【,例,】,某公司,100,名员工的月工资资料如表,2-13,。,表,2-13,某公司,100,名员工月工资资料,华南理工大学精品课程,65,月工资(元),员工数(人),组中值,各组月工资(元),1000以下,60,750,45000,10001500,20,1

30、250,25000,15002000,10,1750,17500,2000以上,10,2250,22500,合计,100,-,110000,华南理工大学精品课程,66,算术平均数,(,数学性质,),1.,各变量值与均值的离差之和等于零,2.,各变量值与均值的离差平方和最小,调和平均数,1,),调和平均数是指标志值倒数的算术平均数的倒数,所以又称倒数平均数。,2,)根据掌握的资料不同,在计算时可以分为简单调和平均数和加权调和平均数两种形式。,华南理工大学精品课程,67,简单调和平均数,华南理工大学精品课程,68,案例分析(简单调和平均数),例:市场上某种蔬菜的早市价格,1.0,元,/,斤,午市价

31、格,0.8,元,/,斤,晚市价格,0.5,元,/,斤,如果早、中、晚各买,1,元钱的蔬菜,则平均每斤的价格为:,华南理工大学精品课程,69,加权调和平均数,加权调和平均数适应于已分组的资料。,华南理工大学精品课程,70,例:假定有某公司员工的月加班费工资资料如表,214,。,表,214,某公司员工加班费情况表,华南理工大学精品课程,71,案例分析(加权调和平均数),月加班费,(,元,),加班费总额,(,元,),员工人数,(,人,),800,48000,60,1000,70000,70,1600,32000,20,合计,150000,150,加权调和平均数和加权算术平均数的关系,加权调和平均数实

32、际上只是加权算术平均数的一种变形,它只适应于处理适当类型的分组资料,。,华南理工大学精品课程,72,华南理工大学精品课程,73,几何均值,(,geometric mean,),n,个变量值乘积的,n,次方根,适用于对比率数据的平均,主要用于计算平均增长率,几何均值,简单几何平均数,华南理工大学精品课程,74,加权几何平均数,华南理工大学精品课程,75,案例分析(,简单几何平均数),【,例,】,一位投资者购持有一种股票,在,1997,年、,1998,年、,1999,年和,2000,年收益率分别为,4.5%,、,2.0%,、,3.5%,、,5.4%,。计算该投资者在这四年内的平均收益率,平均收益率

33、103.84%-1=3.84%,例,:,某工商银行某项投资年利率是按复利计算的。,20,年的利率分配如表,2-15,,计算,20,年的平均年利率。,表,2-15,投资年利率分组表,华南理工大学精品课程,76,案例分析(,加权几何平均数),年限,年利率(,%),本利率(,%),x,i,年数(个),f,i,第,1年,5,105,1,第,2年至第4年,8,108,3,第,5年至第15年,15,115,11,第,16年至第20年,18,118,5,合,计,-,-,20,几何均值,几何平均数特点:,1,)几何平均数受极端值的影响较算术平均数小。,2,)如果变量值有负值,计算出的几何平均数就会成为负数或

34、虚数。,3,)它仅适用于具有等比或近似等比关系的数据。,4,)几何平均数的对数是各变量值对数的算术平均数,华南理工大学精品课程,77,华南理工大学精品课程,78,众数、中位数和均值的关系,左偏分布,均值,中位数,众数,对称分布,均值,=,中位数,=,众数,右偏分布,众数,中位数,均值,图,2-4,众数、中位数和均值的关系,华南理工大学精品课程,79,众数、中位数、均值的,特点和应用,众数,-,不受极端值影响,-,具有不惟一性,-,数据分布偏斜程度较大时应用,中位数,-,不受极端值影响,-,数据分布偏斜程度较大时应用,均值,-,易受极端值影响,-,数学性质优良,-,数据对称分布或接近对称分布时应

35、用,小结,数据类型和所适用的集中趋势测度值,数据类型,定类数据,定序数据,定距数据,定比数据,适,用,的,测,度,值,众数,中位数,算术平均数,算术平均数,四分位数,众数,调和平均数,众数,中位数,几何平均数,四分位数,中位数,四分位数,众数,红色为该数据类型最适合用的测度值,华南理工大学精品课程,81,四分位数,(,quartile,),1.,排序后处于,25%,和,75%,位置上的值,2.,不受极端值的影响,3.,主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,Q,L,Q,M,Q,U,25%,25%,25%,25%,华南理工大学精品课程,82,四分位数,(,位置的确定,),原始数

36、据:,分组数据:,华南理工大学精品课程,83,案例分析,(,四分位数,7,个数据的算例,),原始数据,:23 21,30,32 28 25,26,排 序,:21,23,25 26 28,30,32,位 置,:1,2 3 4 5 6 7,7+,1,Q,L,位置,=,4,=,4,=2,Q,U,位置,=,3(,N+,1),4,3(7,+,1),4,=,=6,Q,L,=,23,Q,U,=,30,N+,1,华南理工大学精品课程,84,案例分析,(,四分位数,10,个数据的算例,),【,例,】10,个家庭的人均月收入数据,排 序,:500,650 760,780 940 1060 1350,1680 17

37、90,1900,位 置,:1,2 3,4 5 6 7,8 9,10,统计函数,QUARTILE,华南理工大学精品课程,85,切尾均值,(trimmed Mean),去掉大小两端的若干数值后计算中间数据的均值,在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用,计算公式为,:,n,表示观察值的个数;,表示切尾系数,,华南理工大学精品课程,86,案例分析 切尾均值,【,例,】,某次求职面试中共有,11,名评委,对某位求职者的给分分别是:,经整理得到顺序统计量值为,去掉一个最高分和一个最低分,取,1/11,华南理工大学精品课程,87,本节提问,一组数据的分布特征可以从哪几个方面进

38、行测度?,Q1,Q2,Q3,怎样理解均值在统计学中的地位?,对于比率数据的平均,为什么采用几何平均?,简述众数、中位数和均值的特点和应用场合。,Q4,华南理工大学精品课程,第六节,分布离散程度的测度,一、极差,二、内距,三、平均差,四、方差和标准差,五、变异系数,华南理工大学精品课程,89,极差,(,range,),一组数据的最大值与最小值之差,离散程度的最简单测度值,易受极端值影响,未考虑数据的分布,7,8,9,10,7,8,9,10,计算公式为,:,R,=max(,x,i,)-min(,x,i,),华南理工大学精品课程,90,内距,(Inter-Quartile Range,IQR),也称

39、四分位差,上四分位数与下四分位数之差,内 距,=,Q,3,Q,1,反映了中间,50%,数据的离散程度,不受极端值的影响,可用于衡量中位数的代表性,华南理工大学精品课程,91,案例分析 四分位差,【,例,】,根据表中的数据,计算甲城市家庭对住房满意状况评价的四分位差,回答类别,甲城市,户数,(,户,),累计频数,非常不满意,不满意,一般,满意,非常满意,24,108,93,45,30,24,132,225,270,300,合计,300,解:设非常不满意为,1,不满意为,2,一般为,3,满意为,4,非常满意为,5,已知,Q,L,=,不满意,=,2,Q,U,=,一般,=,3,四分位差:,Q,D,=,

40、Q,U,=,Q,L,=,32,=,1,表,2-6,甲城市家庭对住房状况评价的频数分布,平均差(,Mean Devia,t,ion,),华南理工大学精品课程,92,1.,是总体各单位标志对其算术平均数的离差绝对值的算术平均数。,2.,反映了总体各单位标志值的变动程度。,3.,平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。,4.,在资料未分组的情况下,平均差的计算公式为:,5.在资料已分组的情况下,要用加权平均差公式:,华南理工大学精品课程,93,方差和标准差,(,Variance,and,Standard deviation,),1.,离散程度的测度值之一,2.,最常用的测度值,3

41、反映了数据的分布,反映了各变量值与均值的平均差异,根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,4 6 8 10 12,x,=,8.3,华南理工大学精品课程,94,总体方差和标准差,(Population,variance,and,Standard deviation,),未分组数据,:,方差的计算公式,标准差的计算公式,未分组数据,:,组距分组数:,组距分组数:,华南理工大学精品课程,95,案例分析 总体标准差计算过程及结果,【,例,】,根据表中的数据,计算工人日加工零件数的标准差,表,2-7,某车间50名工人日加工零件标准差计算表,按零件数分组,组

42、中值,(,X,i,),频数,(,F,i,),(,X,i,-,X,),2,(,X,i,-,X,),2,F,i,105,110,110,115,115,120,120,125,125,130,130,135,135,140,107.5,112.5,117.5,122.5,127.5,132.5,137.5,3,5,8,14,10,6,4,246.49,114.49,32.49,0.49,18.49,86.49,204.49,739.47,572.45,259.92,6.86,184.90,518.94,817.96,合计,50,3100.5,华南理工大学精品课程,96,样本方差和标准差,(simp

43、le,variance,and,standard deviation,),方差的计算公式,注意:样本方差用自由度,n,-1,去除,!,标准差的计算公式,未分组数据:,未分组数据:,组距分组数据:,组距分组数据:,华南理工大学精品课程,97,样本方差 自由度,(degree of freedom),1.,一组数据中可以自由取值的数据的个数,2.,当样本数据的个数为,n,时,若样本均值,x,确定后,只有,n,-1,个数据可以自由取值,其中必有一个数据则不能自由取值,3.,例如,样本有,3,个数值,即,x,1,=2,,,x,2,=4,,,x,3,=9,,则,x,=5,。当,x,=5,确定后,,x,1

44、x,2,和,x,3,有两个数据可以自由取值,另一个则不能自由取值,比如,x,1,=6,,,x,2,=7,,那么,x,3,则必然取,2,,而不能取其他值,4.,样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差,2,时,它是,2,的无偏估计量,华南理工大学精品课程,98,案例分析 样本方差,样本方差与标准差,原始数据,:,10 5,9 13,6,8,华南理工大学精品课程,99,变异系数,(,coefficient of variation,),1.,标准差与其相应的均值之比,对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响,4

45、用于对不同组别数据离散程度的比较,5.,计算公式为,:,华南理工大学精品课程,100,案例分析 变异系数,【,例,】,某公司抽查了所属的,8,家超市,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,超市编号,产品销售额(万元),x,1,销售利润(万元),x,2,1,2,3,4,5,6,7,8,170,220,390,430,480,650,950,1000,8.1,12.5,18.0,22.0,26.5,40.0,64.0,69.0,表,2-8,某,公司,所属8家,超市,的产品销售数据,华南理工大学精品课程,101,案例分析 离散系数,v,1,=,536.25,309.19,=,

46、0.577,v,2,=,32.5215,23.09,=,0.710,结论:,计算结果表明,,v,10,时为正偏斜;当,0),(,0,时,表示频数分布比正态分布更集中,分布呈尖峰状态,,0,),(,=0),(,0,),图,2-8,峰度示意图,华南理工大学精品课程,第八节 统计表与统计图,统计表和统计图是显示统计数据的两种方式,统计表把杂乱的数据有条理地组织在一张简明的表格内;,统计图把数据形象地显示出来。,统计表,项,目,单位,2011,年,同比增加,列标题,一、调查户数,农村居民家庭,城镇居民家庭,二、农村居民收入,人均工资性收入,人均第一产业纯收入,人均财产性收入,三、农村人均纯收入中位数,

47、四、城镇居民收入,人均工资性收入,人均经营性收入,人均财产性收入,五、城镇可支配收入中位数,万户,万户,万户,元,元,元,元,元,元,元,元,元,元,14,7.4,6.6,6977,2963,2520,229,6194,23979,15412,2210,649,19118,1058,532,289,26,995,1700,496.8,128.5,2279,数,字 资 料,华南理工大学精品课程,115,资料来源:国家统计局网站,行标题,表,2-19 2011,年城乡居民家庭收入抽样调查资料,附加,表头,统计表的种类,1,)按主词加工方法不同分为简单表、分组表和复合表。,2,)按宾词指标设计的不同

48、分为:,(,1,)宾词不分组设计,(,2,)宾词简单分组设计,(,3,)宾词复合分组设计,华南理工大学精品课程,116,华南理工大学精品课程,117,统计表设计的一般要求,1,.,要合理安排统计表的结构,2.,总标题内容应满足,3W,要求,3.,数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明,4.,表中的上下两条横线一般用粗线,其他线用细线,5.,通常情况下,统计表的左右两边不封口,华南理工大学精品课程,118,6.,表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的为数应统一,7.,对于没有小数点的单元,一般用“,-”,表示,8.,必要时可在表的

49、下方加上注释,统计表设计的一般要求,华南理工大学精品课程,119,统计图,常见的统计图:,直方图、茎叶图和箱线图,折线图、条形图和圆形图、,环行图、雷达图等等,统计图的基本要素:,1,)图式,2,)图题,3,)图例,4,)标目,5,)文字说明,华南理工大学精品课程,120,定类数据的图示,条形图,(条形图的制作),条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。,条形图有单式、复式等形式。,在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率。,绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。,华南理工大学精品课程,121,定类数据的图示,-,条形

50、图,由,Excel,绘制的条形图,图,2-12,我国,2007,2011,年国内生产总值条形图,定类数据的图示,圆形图(圆形图的制作),华南理工大学精品课程,122,1.,也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形。,2.,主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。,3.,在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占,360,0,的相应比例确定的。,定类数据的图示,圆形图,华南理工大学精品课程,123,由,Excel,绘制的圆形图,图,2-13,我国,2007,2011,年国内生产总值,GDP,圆

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服