收藏 分销(赏)

北京大学课件统计学课件2.pptx

上传人:天**** 文档编号:2695366 上传时间:2024-06-04 格式:PPTX 页数:147 大小:879.51KB
下载 相关 举报
北京大学课件统计学课件2.pptx_第1页
第1页 / 共147页
北京大学课件统计学课件2.pptx_第2页
第2页 / 共147页
北京大学课件统计学课件2.pptx_第3页
第3页 / 共147页
北京大学课件统计学课件2.pptx_第4页
第4页 / 共147页
北京大学课件统计学课件2.pptx_第5页
第5页 / 共147页
点击查看更多>>
资源描述

1、北京大学课件统计学课件21统计的定义统计的定义 三种涵义,两重关系三种涵义,两重关系 统计工作:调查研究统计工作:调查研究统计资料:工作成果统计资料:工作成果统计学:研究如何搜集、整理、分析数据资料的方法论科学统计学:研究如何搜集、整理、分析数据资料的方法论科学 统统计计工工作作统统计计资资料料统统计计学学工作与工作成果关系工作与工作成果关系实践与理论关系实践与理论关系2统计学的分类统计学的分类重要术语重要术语总体与单位总体与单位标志与变量标志与变量指标与指标体系指标与指标体系描述统计学描述统计学描述统计学描述统计学推断统计学推断统计学推断统计学推断统计学 总体总体样本样本参数参数统计量统计量

2、 统计总体(总体)统计总体(总体)指根据一定统计研究目的所确定的研究对象的全体,它是由具有共同性质的许多单位组成的指根据一定统计研究目的所确定的研究对象的全体,它是由具有共同性质的许多单位组成的整体。整体。总体单位(单位):总体单位(单位):组成总体的各个单位(或元素)组成总体的各个单位(或元素)标志标志说明总体单位属性特征或数量特征的概念。说明总体单位属性特征或数量特征的概念。变量变量可以取不同数值的量,具体数值称为变量值可以取不同数值的量,具体数值称为变量值品质标志品质标志数量标志数量标志统计指标统计指标综合反映总体数量特征的概念和数值综合反映总体数量特征的概念和数值 标志与指标标志与指标

3、u标志是说明总体单位特征的标志是说明总体单位特征的指标是说统计总体数量特征的;指标是说统计总体数量特征的;u标志的具体表现,有的用数值有的用文字表示,标志的具体表现,有的用数值有的用文字表示,指标都是用数值表示的。指标都是用数值表示的。联联 系:系:u一些数量标志汇总可以得到指标的数值一些数量标志汇总可以得到指标的数值u数量标志与指标之间存在变换关系数量标志与指标之间存在变换关系 区区 别:别:第第2节节 数据的类型数据的类型数据的分类数据的分类数据的类型数据的类型基本原则:基本原则:1互斥原则互斥原则2穷尽原则穷尽原则数据的类型数据的类型定性数据定性数据定量数据定量数据离散型数据离散型数据连

4、续型数据连续型数据截面数据截面数据时间序列数据时间序列数据原始数据原始数据次级数据次级数据 定类数据定类数据定序数据定序数据定距数据定距数据定比数据定比数据数据的层次数据的层次数据的层次数据的层次1定类数据定类数据【定名数据定名数据】只对事物的某种属性和类别进行具体的定性描述。】只对事物的某种属性和类别进行具体的定性描述。2定序数据定序数据【序列数据序列数据】对事物所具有的属性顺序进行描述。】对事物所具有的属性顺序进行描述。数据的层次数据的层次3定距数据定距数据【间距数据间距数据】不仅能将事物区分不同类型进行排序,而且可以测定其间距大小,标明其强弱程度。】不仅能将事物区分不同类型进行排序,而且

5、可以测定其间距大小,标明其强弱程度。4定比数据定比数据【比率数据比率数据】有一个自然确定、非任意的零点。】有一个自然确定、非任意的零点。(可进行(可进行+-)(可进行(可进行+-)数据层次的对比数据层次的对比数据的层次数据的层次特征特征运算功能运算功能举例举例定类数据定类数据分类分类计数计数产业分类产业分类定序数据定序数据分类;排序分类;排序计数;排序计数;排序产品等级产品等级定距数据定距数据分类;排序;分类;排序;有基本测量单位有基本测量单位计数;排序;计数;排序;加减加减温度温度定比数据定比数据分类;排序;分类;排序;有基本测量单位;有基本测量单位;有绝对零点有绝对零点计数;排序;计数;排

6、序;加减;乘除加减;乘除商品销售额商品销售额第第3节节 统计调查的组织方式统计调查的组织方式3.1 数据的来源数据的来源3.2 数据调查的组织方式数据调查的组织方式3.1 数据的来源数据的来源从政府机构、各种行业组织、公司和企业所公布的数据中获取从政府机构、各种行业组织、公司和企业所公布的数据中获取设计一次试验以获取必要的数据设计一次试验以获取必要的数据从观察研究中获取从观察研究中获取进行一次进行一次 调查调查3.2 统计调查的组织方式统计调查的组织方式 统计报表制度统计报表制度普查普查重点调查重点调查典型调查典型调查抽样调查抽样调查制度化的制度化的经常性调查经常性调查统计报表制度统计报表制度

7、全面全面调查调查专门组织的专门组织的调查调查普查普查重点调查重点调查非全面调查非全面调查典型调查典型调查抽样调查抽样调查按一定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计调查方法。按一定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计调查方法。精心周密设计、高度统一、规范精心周密设计、高度统一、规范回收率高,内容相对稳定,便于资料积累、对比回收率高,内容相对稳定,便于资料积累、对比层层上报、逐级汇总,可以满足各级部门管理需要层层上报、逐级汇总,可以满足各级部门管理需要 突出优点:突出优点:1.统计报表制度统计报表制度 为了某种特定的目的而专门组织的、对总体全部单

8、位都进行的调查。为了某种特定的目的而专门组织的、对总体全部单位都进行的调查。2.普查普查 普查耗费大量的人、财、物力和时间,有时间间隔普查耗费大量的人、财、物力和时间,有时间间隔注意原则:注意原则:规定统一的标准时点规定统一的标准时点 规定统一的普查期限规定统一的普查期限 规定调查的项目和指标规定调查的项目和指标在总体中选择个别或部分重点单位进行调查在总体中选择个别或部分重点单位进行调查3.重点调查重点调查 重点单位:在总体中单位个数虽少,重点单位:在总体中单位个数虽少,但变量值在总体变量总值总中占有绝大比重但变量值在总体变量总值总中占有绝大比重 根据调查研究的目的和要求,在对总体进行全面分析

9、的基础上,有意识地选择其中有代表性的典型根据调查研究的目的和要求,在对总体进行全面分析的基础上,有意识地选择其中有代表性的典型单位进行深入细致的调查,借以认识事物的本质特征、因果关系和发展变化趋势单位进行深入细致的调查,借以认识事物的本质特征、因果关系和发展变化趋势1.“解剖麻雀解剖麻雀”法法2.“划类选典划类选典”法法3.“抓两头抓两头”法法选典方法:选典方法:4.典型调查典型调查按随机原则从总体中抽取样本;根据调查结果推断总体参数;抽样误差可事先控制。按随机原则从总体中抽取样本;根据调查结果推断总体参数;抽样误差可事先控制。5.抽样调查抽样调查 5.1 抽样调查的组织方式抽样调查的组织方式

10、简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样简单随机抽样简单随机抽样 【纯随机抽样】将总体单位编成抽样框,在抽样框中的每个单位都具有相同的被抽中的机会,纯随机抽样】将总体单位编成抽样框,在抽样框中的每个单位都具有相同的被抽中的机会,每个容量相同的样本被抽中的机会也相同的。每个容量相同的样本被抽中的机会也相同的。总体规模不大;总体内部差异小总体规模不大;总体内部差异小适用:适用:系统抽样系统抽样 【等距抽样、机械抽样】将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。【等距抽样、机械抽样】将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。1)利用原有的顺序

11、或编号)利用原有的顺序或编号 2)对所研究的总体已有所了解,则可用已知的相关变量对抽样框中的单位进行编号)对所研究的总体已有所了解,则可用已知的相关变量对抽样框中的单位进行编号排序依据:排序依据:分层抽样分层抽样 【类型抽样类型抽样】将总体全部单位分类,形成若干个类型组,从各类型中分别抽取样本单位,合成样本。】将总体全部单位分类,形成若干个类型组,从各类型中分别抽取样本单位,合成样本。总体总体N样本样本n等额等额等比例等比例最优最优EALHPD整群抽样整群抽样 首先把总体中的首先把总体中的N个单位划分成为若干个群,要求每个群对整个总体都具有代表性,然后对群进行简单随个单位划分成为若干个群,要求

12、每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位进行调查研究。机抽样,并对抽中群内的所有单位进行调查研究。BCDFGHIJKLMNOP5.2抽样方法抽样方法抽出样本单位登记后放回总体,再抽抽出样本单位登记后放回总体,再抽时总体不变时总体不变放回抽样放回抽样放回抽样放回抽样不放回抽样不放回抽样不放回抽样不放回抽样抽出样本单位登记后不放回总体,再抽抽出样本单位登记后不放回总体,再抽时总体渐次减少时总体渐次减少第第4节节 统计调查方案统计调查方案4.1 调查方案的主要内容调查方案的主要内容4.2 问卷调查问卷调查4.1 调查方案的主要内容调查方案的主要内容1.确定调查目

13、的确定调查目的2.确定调查对象和调查单位确定调查对象和调查单位3.拟订调查提纲拟订调查提纲4.确定调查时间、空间和方法确定调查时间、空间和方法5.编制调查的组织计划编制调查的组织计划【调查表调查表、问卷】、问卷】调查资料的所属时间调查资料的所属时间调查期限调查期限【4.2 问卷调查问卷调查用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反应、看法,它用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反应、看法,它不要求被调查者填写姓名不要求被调查者填写姓名问卷结构问卷结构 说明词说明词+主题词句主题词句+作业记录作业记录第第第第2 2章章章章

14、数据的整理和展示数据的整理和展示数据的整理和展示数据的整理和展示12统计数据的整理统计数据的整理统计数据的图表展示统计数据的图表展示第第1步:步:排序排序第第2步:统计分组步:统计分组第第3步:频数分布编制步:频数分布编制基本原则:基本原则:1定量数据按从大到小或从小到大的顺序排列定量数据按从大到小或从小到大的顺序排列2把定性数据按习惯的文字顺序排列把定性数据按习惯的文字顺序排列第第1节节 统计数据的整理统计数据的整理三、统计整理三、统计整理1.统计分组统计分组 分组标志的选择分组标志的选择T根据统计研究的目的选择分组标志根据统计研究的目的选择分组标志T选择最能反映事物本质特征的标志进行分组选

15、择最能反映事物本质特征的标志进行分组T要考虑到现象发展的历史条件和经济条件要考虑到现象发展的历史条件和经济条件分组形式分组形式品质标志分组品质标志分组数量标志分组数量标志分组 简单分组简单分组复合分组复合分组分组体系分组体系 统计分组的关键:统计分组的关键:正确选择分组标志和划分各组界限正确选择分组标志和划分各组界限 统计整理统计整理2.频数分布(分布数列)频数分布(分布数列)定定 义:义:形形 式:式:T次数(频数),分布在各组中的总体单位数次数(频数),分布在各组中的总体单位数T比率(频率),各组次数与总次数之比比率(频率),各组次数与总次数之比 构构 成:成:将总体中的所有单位按某个标志

16、分组后,所形成的总体单位数在各组之间的分将总体中的所有单位按某个标志分组后,所形成的总体单位数在各组之间的分布布 各组名称(或各组变量值)各组名称(或各组变量值)各组单位数(次数),也可以是比重各组单位数(次数),也可以是比重分分 类:类:T品质数列:以品质标志分组形成的次数分布数列品质数列:以品质标志分组形成的次数分布数列T变量数列:以数量标志分组形成的次数分布数列变量数列:以数量标志分组形成的次数分布数列统计整理统计整理3.变量数列的编制变量数列的编制编制步骤:编制步骤:将调查得到的原始资料按数值大小顺序排列,计算全距(极差)将调查得到的原始资料按数值大小顺序排列,计算全距(极差)R R=

17、Max-Min将变量进行将变量进行分组分组,即,对全距分段,即,对全距分段计算各组频数,频率,累计频数,累计频率等。计算各组频数,频率,累计频数,累计频率等。计算各组的组中值计算各组的组中值 根据变量的性质和数据的多少,分为根据变量的性质和数据的多少,分为单项数列:单项数列:即,一个变量值为一组即,一个变量值为一组 适用适用离散型变量,且变量取值不多,离散型变量,且变量取值不多,相互之间差异足以使每一个取值具有典型的意义。相互之间差异足以使每一个取值具有典型的意义。组距数列:组距数列:即,每一组为一个上限值和下限值规定的区间即,每一组为一个上限值和下限值规定的区间 组距组距=本组上限本组上限-

18、本组下限本组下限适用适用 a.离散型变量且取值多,不便一一列举离散型变量且取值多,不便一一列举 b.连续型变量(连续型变量(上组限不包含在内原则)上组限不包含在内原则)分分 组组 类类 型型开口组数列、闭口组数列开口组数列、闭口组数列开口组数列:开口组数列:第第1组只有上限而无下限,用组只有上限而无下限,用“以下以下”表示表示 最后一组只有下限而无上限,用最后一组只有下限而无上限,用“以上以上”表示表示闭口组数列:各组均有上下限闭口组数列:各组均有上下限等距数列、异距数列等距数列、异距数列3.变量数列的编制变量数列的编制例:根据下面资料编制变量数列例:根据下面资料编制变量数列.某单位某单位30

19、名职工的月工资额(元)为:名职工的月工资额(元)为:1060 840 1100 910 1090 910 1100 1070 990 940 1190 870 1180 970 1030 1060 850 1060 1010 1050 960 1050 1070 1210 1050 950 1060 1280 1100 1010 解:解:将原始资料按大小顺序排列将原始资料按大小顺序排列确定组数和组距确定组数和组距全距全距R=1280-840=440元元 组数组数n=440/100=4.45组组编制变量数列编制变量数列某单位职工月工资额情况统计表某单位职工月工资额情况统计表月工资额(元)月工资额

20、(元)职工人数(人)职工人数(人)比率比率%累计人数(人)累计人数(人)累计比率累计比率%组中值(元)组中值(元)8009003103108509001000723.31033.3950100011001343.32376.6105011001200516.72893.311501200130026.7301001250合计合计30100统计整理统计整理 4.统计表图统计表图统计表统计表构构 成成:T总表题总表题T横行标题横行标题(主词主词)T纵栏标题纵栏标题(宾词宾词)分分 类:类:T简单表简单表T分组表分组表T复合表复合表编制规则编制规则:各种标题力求简明、准确,能够准确反映资料的主要内容

21、及所属时间、地点各种标题力求简明、准确,能够准确反映资料的主要内容及所属时间、地点内容简明扼要内容简明扼要统计表栏数较多时,要加以编号,并可以说明其相互关系统计表栏数较多时,要加以编号,并可以说明其相互关系表中数字要填写整齐、位数对准、同栏数字的单位、小数位要一致表中数字要填写整齐、位数对准、同栏数字的单位、小数位要一致 相同数字应全部填写,不得写相同数字应全部填写,不得写“同上同上”没有数字的格内用没有数字的格内用“”表示表示 缺少资料的格内用缺少资料的格内用“”表示,不可漏填表示,不可漏填表中数字用一种计量单位时,可在表右上端注明表中数字用一种计量单位时,可在表右上端注明 非统一非统一 可

22、另设计计量单位栏或在标题旁用小字注明可另设计计量单位栏或在标题旁用小字注明统计表一般左右两端不封闭,上下两端画粗线或双线统计表一般左右两端不封闭,上下两端画粗线或双线统计图统计图直方图、折线图、直方图、折线图、曲线图、曲线图、饼图、茎叶图饼图、茎叶图 1234绝对数和相对数绝对数和相对数集中趋势的测定集中趋势的测定平均数平均数离散趋势的测定离散趋势的测定标志变异指标标志变异指标 数据的形态测定数据的形态测定 第第3 3章章 数据的描述性分析内容目录数据的描述性分析内容目录一、总量指标(绝对数指标)一、总量指标(绝对数指标)统计资料经过汇总整理后得到的反映总体总规模、总水平的总和指标统计资料经过

23、汇总整理后得到的反映总体总规模、总水平的总和指标表现形式表现形式具有计量单位的绝对数具有计量单位的绝对数 分分 类:类:总体标志总量总体标志总量 时期总量时期总量 实物量指标实物量指标 劳动量指标劳动量指标总体单位总数总体单位总数 时点总量时点总量 价值量指标价值量指标二、二、相对指标(相对数)相对指标(相对数)两个有联系指标对比的比值,反映事物数量特征和数量关系的综合指标两个有联系指标对比的比值,反映事物数量特征和数量关系的综合指标相对指标的作用相对指标的作用 (1)清楚地反映总体内在的结构特征和现象之间的数量联系程度;)清楚地反映总体内在的结构特征和现象之间的数量联系程度;(2)用于不同对

24、象的比较评价)用于不同对象的比较评价表现形式表现形式倍数、成数、百分数、千分数、复合单位倍数、成数、百分数、千分数、复合单位种种 类:类:计划完成相对数计划完成相对数结构相对数结构相对数比例相对数比例相对数比较相对数比较相对数强度相对数强度相对数动态相对数动态相对数总量指标的计划完成相对数总量指标的计划完成相对数正指标、逆指标正指标、逆指标 水平法水平法 累计法累计法 相对指标的计划完成相对数相对指标的计划完成相对数平均指标的计划完成相对数平均指标的计划完成相对数 相对指标相对指标 计划完成相对数计划完成相对数结构相对数结构相对数比较相对数比较相对数比例相对数比例相对数%、倍数、倍数 分数、倍

25、数分数、倍数 强度相对数强度相对数动态相对数动态相对数%、倍数、倍数 复名单位复名单位%二、二、相对指标(相对数)相对指标(相对数)计划完成相对数计划完成相对数 结构相对数结构相对数 比例相对数比例相对数 比较相对数比较相对数 强度相对数强度相对数 动态相对数动态相对数六种相对指标的比较六种相对指标的比较不同时期不同时期比比 较较同一时期比较同一时期比较不同现象比较不同现象比较同类现象比较同类现象比较动动 态态相对数相对数强强 度度相对数相对数不同总体不同总体比比 较较同一总体中同一总体中比比 较较相对数相对数部分与部分比部分与部分比 较较部分与总体比部分与总体比 较较实际与计划比实际与计划比

26、 较较比例相对数比例相对数结构相对数结构相对数计划完成相对计划完成相对数数 (1)正确选择对比的基数)正确选择对比的基数 (2)必须注意统计的可比性)必须注意统计的可比性 (3)相对指标要与总量指标相结合)相对指标要与总量指标相结合应用原则应用原则三、平均指标(平均数)三、平均指标(平均数)同类现象在一定时间、地点、条件下所达到的一般水平同类现象在一定时间、地点、条件下所达到的一般水平总体内各单位参差不齐的标志值的代表值总体内各单位参差不齐的标志值的代表值对变量分布集中趋势的测定对变量分布集中趋势的测定种种 类:类:算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数中位数中位数众数众

27、数平均数平均数算术平均数算术平均数简单算术平均数简单算术平均数(未分组的原始统计资料(未分组的原始统计资料 )加权算术平均数加权算术平均数(分组的原始统计资料(分组的原始统计资料 )组距数列,以各组的组中值作为该组的标志值,计算即可组距数列,以各组的组中值作为该组的标志值,计算即可 注意:注意:寻找寻找xiXifi有经济意义有经济意义 数学性质:数学性质:所有变量值与平均数的离差之和等于所有变量值与平均数的离差之和等于0 各个变量值与平均数的离差平方之和为最小值各个变量值与平均数的离差平方之和为最小值 优点:优点:容易理解,便于计算容易理解,便于计算灵敏度高灵敏度高稳定性好稳定性好缺点:缺点:

28、易受极值影响易受极值影响在偏斜分布和在偏斜分布和U形分布中形分布中,不具有代表性不具有代表性平均数平均数调和平均数调和平均数简单调和平均数简单调和平均数加权调和平均数加权调和平均数(已知各组变量值(已知各组变量值xi及各组标志值总和及各组标志值总和mi=xifi)适用:适用:由于数量未知,无法直接计算由于数量未知,无法直接计算 ,可以计算,可以计算 变量值倒数平均数的倒数变量值倒数平均数的倒数 优点:优点:缺点:缺点:不易理解,不易理解,易受极值影响易受极值影响有有“0”值时不能计算值时不能计算灵敏度高灵敏度高 在某种不能计算在某种不能计算 条件下,可以代替条件下,可以代替 平均数平均数调和平

29、均数调和平均数 例:某菜场有例:某菜场有1元蔬菜店,在早中晚分别购买,求一天中购买蔬菜的平均价格。元蔬菜店,在早中晚分别购买,求一天中购买蔬菜的平均价格。早上买了早上买了3斤,价格斤,价格0.33元元/斤斤 中午买了中午买了4斤,价格斤,价格0.25元元/斤斤 晚上买了晚上买了5斤,价格斤,价格0.2元元/斤斤 早上买了早上买了1元,价格元,价格0.33元元/斤斤 中午买了中午买了1元,价格元,价格0.25元元/斤斤 晚上买了晚上买了1元,价格元,价格0.2元元/斤斤 平均数平均数几何平均数几何平均数简单几何平均数简单几何平均数加权几何平均数加权几何平均数几个变量值连乘积的几次根几个变量值连乘

30、积的几次根 优点:优点:缺点:缺点:有有“0”或负值时不能计算或负值时不能计算偶数项数列只能用正根偶数项数列只能用正根 灵敏度高灵敏度高受极值影响小于受极值影响小于 和和适宜于各比率之积为总比率的变量求平均适宜于各比率之积为总比率的变量求平均同一资料,同一资料,平均数平均数位置平均数位置平均数中位数中位数Me 单项数列单项数列 中位数位次中位数位次f/2 从开始向下累计次数中包含从开始向下累计次数中包含f/2的组的组 Me=该组的变量值该组的变量值 组距数列组距数列L中位数组下限中位数组下限 U中位数组上限中位数组上限 fm中位数组次数中位数组次数 i中位数组组距中位数组组距Sm-1从开始向下

31、至中位数组上一组的累计次数从开始向下至中位数组上一组的累计次数Sm+1从最后向上至中位数组下一组的累计次数从最后向上至中位数组下一组的累计次数上限公式:上限公式:下限公式:下限公式:优点:优点:容易理解,容易理解,不受极值影响不受极值影响 适宜于开口组资料和某些不能用数字测定的事物适宜于开口组资料和某些不能用数字测定的事物 缺点:缺点:灵敏度和计算功能差灵敏度和计算功能差间断数列无间断数列无Me平均数平均数位置平均数位置平均数众数众数Mo单项数列单项数列 组距数列组距数列 L众数组下限众数组下限 U众数组上限众数组上限 f0众数组次数众数组次数 i众数组组距众数组组距f-1众数组前一组(比其小

32、)的次数众数组前一组(比其小)的次数f+1众数组后一组(比其大)的次数众数组后一组(比其大)的次数上限公式:上限公式:下限公式:下限公式:M0=次数最多组(众数组)的变量值次数最多组(众数组)的变量值d1=f0-f-1 d2=f0 f+1 优点:优点:容易理解,容易理解,不受极值影响不受极值影响 缺点:缺点:灵敏度和计算功能差灵敏度和计算功能差稳定性差稳定性差具有不唯一性具有不唯一性四、标志变异指标四、标志变异指标 反映统计数列中以平均数为中心,总体各单位标志值的差异大小范围或离差程度的指标。反映统计数列中以平均数为中心,总体各单位标志值的差异大小范围或离差程度的指标。平均指标平均指标集中趋势

33、集中趋势 标志变异指标标志变异指标离中趋势离中趋势作作 用用反映变量分布的离中趋势;反映变量分布的离中趋势;是对平均数的代表性程度的量度;是对平均数的代表性程度的量度;标志变异程度越大,该分布的平均数代表性小标志变异程度越大,该分布的平均数代表性小是对事物发展均衡性的量度是对事物发展均衡性的量度 1异众比率异众比率2极差极差3四分位差四分位差4平均差平均差5方差、标准差方差、标准差6离散系数离散系数种类种类指标越小,说明数据的离散程度越小,指标越小,说明数据的离散程度越小,集中程度越大集中程度越大,众数的代表性越强众数的代表性越强1异众比率异众比率=非众数组频率非众数组频率 标志变异指标标志变

34、异指标数列中最大值与最小值之差,即,全距数列中最大值与最小值之差,即,全距R未分组数列未分组数列分组数列分组数列R=最大值最大值-最小值最小值单项数列单项数列组距数列组距数列 R=最高组上限最高组上限 最低组下限最低组下限 优点:容易理解,计算方便优点:容易理解,计算方便缺点:仅仅说明标志值的变异范围,缺点:仅仅说明标志值的变异范围,不能反映全部数据差异分布状况不能反映全部数据差异分布状况R=最大值最大值-最小值最小值极差极差标志变异指标标志变异指标各标志值与均值离差绝对值的算术平均各标志值与均值离差绝对值的算术平均未分组数列未分组数列分组数列分组数列单项数列单项数列组距数列组距数列 Xi 以

35、各组的组中值代替以各组的组中值代替优点:反映全部数据分布状况优点:反映全部数据分布状况缺点:取绝对值,数字上不尽合理,不适用于代数计算缺点:取绝对值,数字上不尽合理,不适用于代数计算实质:实质:以均值为中心,以均值为中心,各指标值距均值各指标值距均值 的平均距离。的平均距离。AD 越小,越小,均值代表性越大均值代表性越大平均差平均差AD标志变异指标标志变异指标各标志值与均值离差平方的算术平均数的平方根各标志值与均值离差平方的算术平均数的平方根未分组数列未分组数列分组数列分组数列单项数列单项数列组距数列组距数列 Xi 以各组的组中值代替以各组的组中值代替优点:反映全部数据分布状况,数字上合理优点

36、:反映全部数据分布状况,数字上合理缺点:受计量单位和平均水平影响,不便于比较缺点:受计量单位和平均水平影响,不便于比较方差(方差(2)和标准差)和标准差()标志变异指标标志变异指标反映不同水平和不同性质的变量数列的变异程度反映不同水平和不同性质的变量数列的变异程度 V越小,说明均值的代表性越强越小,说明均值的代表性越强 标准差系数标准差系数 (V)例:设两企业某月上旬的供货资料如下:例:设两企业某月上旬的供货资料如下:供货日期供货日期1日日2日日3日日4日日5日日6日日7日日8日日9日日10日日甲(万吨)甲(万吨)乙(万台)乙(万台)261526152817281829193019301830

37、1623162617V甲甲 V乙乙,说明甲企业上旬供货比乙企业均衡,说明甲企业上旬供货比乙企业均衡大数定律大数定律贝努里大数定律贝努里大数定律 切比雪夫大数定律切比雪夫大数定律 当实验次数很多时,事件当实验次数很多时,事件A发生的频率与概率较大偏差的可能性很小发生的频率与概率较大偏差的可能性很小第第4章章 概率复习概率复习 实验次数无限增多,算术平均数与实验次数无限增多,算术平均数与有较大偏差的可能性很小有较大偏差的可能性很小中心极限定理中心极限定理 设随机变量设随机变量X1,X2,Xn相互独立,且服从同一分布,当相互独立,且服从同一分布,当n+,对任意,对任意X,有,有 近似服从标准正态分布

38、近似服从标准正态分布n充分大,随即变量充分大,随即变量近似服从标准正态分布近似服从标准正态分布第第第第5 5章章章章 参数估计和假设检验参数估计和假设检验参数估计和假设检验参数估计和假设检验内容目录内容目录内容目录内容目录123抽样分布抽样分布参数估计参数估计假设检验假设检验 3种参数估计种参数估计 2种样本容量估计种样本容量估计 3种假设检验种假设检验总体总体具有某些相同性质的全部单位的数据集合具有某些相同性质的全部单位的数据集合样本样本从总体中随机抽取部分单位所构成的数据集合体从总体中随机抽取部分单位所构成的数据集合体参数(总体指标)参数(总体指标)综合测量整个总体的某个数量特征。综合测量

39、整个总体的某个数量特征。统计量(样本指标)统计量(样本指标)根据样本数据计算的综合测量值,根据样本数据计算的综合测量值,用以反映或估计、推断总体的某个数量特征。用以反映或估计、推断总体的某个数量特征。参数与统计量参数与统计量总体参数总体参数 样本统计量样本统计量 总体单位数总体单位数=N 总体平均数总体平均数=总体成数总体成数=P 总体标准差总体标准差=总体方差总体方差=2 样本单位数样本单位数=n 样本平均数样本平均数=样本成数样本成数=p 样本标准差样本标准差=S 样本方差样本方差=S2 简单随机抽样分布简单随机抽样分布不放回不放回放放 回回放回放回不放不放 回回独立性和同一性独立性和同一

40、性同一性同一性当当n/N5%时,有限总时,有限总体不放回抽样等同于放体不放回抽样等同于放回抽样回抽样样本均值的抽样分布样本均值的抽样分布样本成数(即比例)的抽样分布样本成数(即比例)的抽样分布无限总体抽样无限总体抽样有限总体放回抽样有限总体放回抽样有限总体不放回抽样有限总体不放回抽样方方 差差数数 学学 期期 望望抽抽 样样 方方 法法当当P一定,一定,np和和nq大于大于5时时 就近似正态分布就近似正态分布 从一个正态总体中抽样所得到的样本方差的分布从一个正态总体中抽样所得到的样本方差的分布一个样本方差的抽样分布一个样本方差的抽样分布则则 当当 n30,趋向正态分布,趋向正态分布 依据所获得

41、的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。参数估计参数估计区间估计区间估计 设设是总体的未知参数,是总体的未知参数,是两个统计量,对于给定的是两个统计量,对于给定的(0 0 11),如果满足,如果满足 ,则称,则称 是是的置信度为的置信度为1-的置信区间。的置信区间。区间估计评价准则:区间估计评价准则:置信度置信度精确度精确度随机区间随机区间包含包含的概率的概率(即可靠程度)越大越好。(即可靠程度)越大越好。随机区间随机区间的平均长度的平均长度(误差范围)越小越好(误差范围)越小越好待估

42、参数待估参数置信区间置信区间未知时,用未知时,用S未知时,用未知时,用S有限总体,有限总体,n30(不放回抽样)(不放回抽样)非正态总体,非正态总体,n30正态总体,正态总体,2未知未知正态总体,正态总体,2已知已知总体均值总体均值()已知条件已知条件参数估计参数估计1 例例1:某厂成批生产某种金属棒,其长度服从正态分布,标准差为:某厂成批生产某种金属棒,其长度服从正态分布,标准差为0.06厘米,对一个由厘米,对一个由25根棒组成的随机样根棒组成的随机样本进行测量,平均长度为本进行测量,平均长度为7.48厘米,试求这批金属棒的平均长度的置信度为厘米,试求这批金属棒的平均长度的置信度为95%的置

43、信区间。的置信区间。解:解:=0.06cm n=25 =7.48cm 1-=0.95查表得:查表得:Z0.025=1.96则则的置信度为的置信度为95%的置信区间为:的置信区间为:即有即有95%的把握估计金属棒平均长度在的把握估计金属棒平均长度在7.456-7.504厘米之间厘米之间2待估参数待估参数正态总体正态总体总体方差总体方差2置信区间置信区间已知条件已知条件3置信区间置信区间待估参数待估参数无限总体,无限总体,np大于大于5 nq大于大于5 总体成数总体成数(p)已知条件已知条件有限总体,有限总体,np大于大于5 nq大于大于5 样本容量的确定样本容量的确定假定假定 服从正态分布服从正

44、态分布无限总体无限总体有限总体不放回有限总体不放回估计总体均值估计总体均值时时通过控制样本均值通过控制样本均值 的极限误差的极限误差 来估计总体均值来估计总体均值样本容量的确定样本容量的确定无限总体无限总体有限总体不放回有限总体不放回估计总体成数估计总体成数p时时通过控制样本成数通过控制样本成数 的极限误差的极限误差 来估计总体成数来估计总体成数p假定假定 服从正态分布服从正态分布 利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。假设检验假设检验 基本原理基本原理 如果对总体

45、的某种假设是如果对总体的某种假设是真实真实真实真实的,那么不利于或不能支持这一假设的事件的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试(小概率事件)在一次试验中几乎不可能发生的;要是验中几乎不可能发生的;要是在一次在一次在一次在一次试验试验中中中中A A竟然发生了竟然发生了竟然发生了竟然发生了,就有理由怀疑该假设的真实性,就有理由怀疑该假设的真实性,拒绝拒绝拒绝拒绝这一假设。这一假设。小概率原理小概率原理1假设的设置假设的设置 H0原假设,原假设,H1备择假设备择假设(1)原假设不会轻易被否定,否定必须有充分的理由原假设不会轻易被否定,否定必须有充分的理由(2)接受原假设,并不

46、意味着其绝对正确)接受原假设,并不意味着其绝对正确 只能说尚无充分的证据拒绝它只能说尚无充分的证据拒绝它假设检验的假设检验的实质实质:对原假设是否正确进行检验:对原假设是否正确进行检验2假设的主要形式假设的主要形式 H0原假设,原假设,H1备择假设备择假设 双尾检验:双尾检验:单尾检验:单尾检验:H0:=0,H1:0H0:=0,H1:0H0:=0,H1:03.检验规则检验规则检验过程是比较样本观察结果与总体假设的差异。检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝差异显著,超过了临界点,拒绝H0,接受,接受H1;差异不显著,接受差异不显著,接受H0,拒绝,拒绝H1拒绝

47、域拒绝域拒绝拒绝H04.检验决策与两类错误检验决策与两类错误奈曼、皮尔森原则:只控制奈曼、皮尔森原则:只控制 ,不考虑,不考虑H0实际状况实际状况H0为真为真H0非真非真检验决策检验决策拒绝拒绝H0类错误(类错误()正确正确接受接受H0正确正确类错误类错误()显著性水平显著性水平5几种常见的假设检验几种常见的假设检验5.1 总体均值的检验总体均值的检验5.2 总体成数的检验总体成数的检验5.3 一个正态总体方差的检验一个正态总体方差的检验(3)H0:=0 H1:0(2)H0:=0 H1:0(1)H0:=0 H1:0正态总体正态总体2已知已知拒绝拒绝H0H0、H1检验统计量检验统计量条条 件件1

48、总体均值的检验总体均值的检验-1例:例:P148 5-26 P170 23(3)H0:=0 H1:0(2)H0:=0 H1:0(1)H0:=0 H1:0正态总体正态总体2未知未知(n30)拒绝拒绝H0H0、H1检验统计量检验统计量条条 件件2总体均值的检验总体均值的检验-2例:例:P148 5-27 P171 243总体均值的检验总体均值的检验-3(3)H0:0 H1:0(2)H0:0 H1:0(1)H0:=0 H1:0非正态总体非正态总体n302已知已知或未知或未知拒绝拒绝H0H0、H1检验统计量检验统计量条条 件件4总体成数的检验总体成数的检验(3)H0:p=p0 H1:pp0(2)H0:

49、p=p0 H1:pp0(1)H0:p=p0 H1:pp0np5nq5拒绝拒绝H0H0、H1检验统计量检验统计量条条 件件例:例:P153 5-31 P174 275一个正态总体方差的检验一个正态总体方差的检验(3)H0:2=02 H1:2 02(2)H0:2=02 H1:2 02(1)H0:2=02 H1:2 02拒绝拒绝H0H0、H1检验统计量检验统计量例:例:P155 5-33 P176 29 相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进

50、行结构分析、政策评价、预测和控制的形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。重要工具。第第6章章 相关与回归相关与回归 本章内容目录本章内容目录本章内容目录本章内容目录123相关概述相关概述简单线性相关简单线性相关回归与一元线性回归模型回归与一元线性回归模型一、相关的概念一、相关的概念随机性依存关系随机性依存关系随机性依存关系随机性依存关系变量之间关系变量之间关系相关关系相关关系函数关系函数关系确定性依存关系确定性依存关系因果关系因果关系互为因果关系互为因果关系共变关系共变关系相关关系的类型相关关系的类型一元相关一元相关多元相关多元相关负负 相相

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 教育专区 > 大学其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服