收藏 分销(赏)

应用统计学电子教案.ppt

上传人:精**** 文档编号:8897122 上传时间:2025-03-07 格式:PPT 页数:516 大小:9.38MB
下载 相关 举报
应用统计学电子教案.ppt_第1页
第1页 / 共516页
应用统计学电子教案.ppt_第2页
第2页 / 共516页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,上一页,下一,页,返回本章首页,第一章 绪论,刘思峰等编著,第一章 绪 论,第一节 统计的产生与发展,第二节 统计研究的特点、方法和作用,本章小节,主要内容,第一节 统计的产生与发展,一、统计与统计学,统计学是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。从字面上直观理解,“统计”是指对大量事物进行汇总计数,因此可以简单地说统计就是总起来计量,即统而计之。例如计算全国的总人口数、国内生产总值,计算某个企业的职工人数、产品产量,甚至是计算某个家庭每月的收入和支出等等都是统计。,一、统计与统计学,统计活动一般按照统计设计、统计调查、统计整理、统计分析和统计资料的开发利用这几个阶段依次进行。如图,1.1.1,所示。,二、统计的产生与发展,统计产生,原始社会后期:统计萌芽于计数活动;,奴隶制国家产生:使统计日显重要;,封建社会时期:统计已具规模;,资本主义的兴起:统计扩展到社会经济各方面。,统计学作为一门系统的科学,距今已有,300,多年的历史。,二、统计的产生与发展,统计发展,按照统计学的发展历程,我们可以把统计学划分为古典统计学、近代统计学和现代统计学三个时期,如图,1.1.2,所示。,(一)统计学学派,1,德国的记述学派(国势学派,康令 (,1606,1681,),阿痕瓦尔(,1719,1772,:,1764,年首创统计学一词),他们在大学中开设,“,国势学”,采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。,三、统计学学派与统计学学科体系,(二)统计学的近代期(,18,世纪末,19,世纪末),2,政治算术学派,代表人物:,英国的威廉,配第、约翰,格朗特等,。,威廉,配第的代表著,政治算术,对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。,三、统计学学派与统计学学科体系,三、统计学学派与统计学学科体系,数理统计学派,代表人物:法国的拉普拉斯,比利时的凯特勒。拉普拉斯把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。,凯特勒,把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“统计学之父”之称。,4,社会统计学派,代表人物:德国的克尼斯、恩格尔、梅尔等。,他们强调统计学是研究社会现象的科学,包括统计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系。,三、统计学学派与统计学学科体系,三、统计学学派与统计学学科体系,(二)统计学学科体系,理论统计学,指统计学的数学原理,它根植于纯数学的一个领域,概率论。,应用统计学,将统计学的基本原理应用于各个领域就形成各种各样的应用统计学。它包括一整套统计分析方法,有的是适用于各个领域的一般性的统计方法,如数据收集与整理、参数估计、假设检验、方差分析、相关与回归等。有的则是某一专业领域中特有的分析方法,例如经济统计学中的指数分析法、统计决策及产品质量统计管理等。,理论统计学,数理统计学,数理统计学是应用数学的一个分支,在这里作为统计学的一个分支,它以概率论等数学理论为基础,研究随机现象的数量规律,是一门纯方法论的科学,为其它学科提供数学分析和推断的方法与技术。,统计学原理,统计学原理是在统计实践的基础上,对统计理论方法的最一般概括,内容包括统计的对象和任务,统计的理论基础和方法论基础,以及关于统计活动各个环节的理论和方法。统计学原理中结合了数学、概率论和数理统计学的知识,又是统计实践经验的高度总结,是指导统计实践活动的科学依据。一般所说的统计学就是指统计学原理。,社会经济统计学,社会经济统计学是将理论统计学应用于社会经济领域,以社会、经济、人口、科技和文化等人类自身及其活动为对象的统计方法论,为对社会经济现象数量特征进行的调查研究提供原理、原则和方式方法。,自然统计学,自然统计学是将理论统计学应用于自然现象领域,是探索地理、地质、气候、天文、生物等非人类现象的数量关系和数量规律的统计方法论。其中较为重要的分支有生物统计学、气象统计学、天文统计学等。,应用统计学,(三)统计学与其他学科的关系,统计学和数学的关系,统计学中具有方法论性质的数理统计学是应用数学的一个分支,因此统计学与数学的关系十分密切,且与其他的应用数学有一定的共性。如和数学中的有关定理一样,统计中的一些分布也是客观现象数量特征的一种抽象。,统计学与其他的数学分支相比又有其特殊性。,(1),处理的数据不同。,(2),处理的方法不同。,(三)统计学与其他学科的关系,统计学与其他专门学科的关系,统计方法一般的数据分析方法适用于其他任何科学中的偶然现象,因此它与很多专门学科都有关系。,但是统计方法只是从事物的外在数量表现去推断该事物可能的规律性,,它本身不能说明何以会有这个规律性,这是各专门学科的任务。,第二节 统计研究的特点、方法和作用,统计研究的特点,第二节 统计研究的特点、方法和作用,数量性,“数字是统计的语言”,数量性是统计研究的基本特点,统计研究系统如图,1.2.1,所示,.,统计研究的特点,总体性,统计研究就是总的、综合的数量研究。一般理解的总体是指统计总体,是由同类个体组成的集合体,如人口总体、企业总体、商品总体等等,这时统计研究的目的不是计量个体的特征表现,而是对个体的特征表现进行统计整理和统计分析,得到总体的综合的数量特征。,具体性,具体性即客观性。统计对象是具体的,是客观存在的事物或现象。统计数据包括原始数据和计算结果,都是客观现象在一定时间、地点、条件下的数量表现,是具体的数据。,统计研究的特点,统计研究的方法,按照统计工作的不同阶段和作用列出的常用统计方法如图,1.2.2,所示。,大量观测法,所谓大量观测法就是对所研究的客观现象总体中的全部或者足够多的个体进行观测以达到正确认识总体的目的。大量观测法不是一种具体的应用方法,而是研究客观现象总体数量特征的重要思想方法和原则,是统计研究的指导原则。,统计实验法和统计调查法,统计实验法是按照一个设定的实验程序,观测现象开始实验以后的数量特征,根据实验收集的资料进行整理、分析,得到对现象总的认识。,统计调查法指主要依靠调查人员,通过各种途径收集所研究现象的数据资料,包括历史资料和现实资料。,统计研究的方法,统计描述法和统计推断法,统计描述法,是综合描述的方法,是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法。根据所描述问题的特点,可以具体使用综合指标法和数学模型法。,统计推断法,是在对已知事物进行描述的基础上,对未知事物进行推断的方法。根据推断的内容不同可分为抽样估计法以及假设检验法等。,统计研究的方法,统计具有以下三个方面的作用:,提供信息服务,提供统计信息是统计的信息职能,是统计的首要职能。,提供咨询服务,提供咨询服务是统计的咨询职能。统计工作的任务不仅要完成提供信息的基本任务,还要进一步利用已经掌握的各种统计信息资料,为政府、企业以及个人等提供各种咨询建议和对策方案。,提供监督服务,提供监督服务是统计的监督职能。监督职能是指根据长期的大量的统计信息,按照标准监督客观现象发展变化状况,确定其是否正常,有无警情。,统计研究的作用,例,1.1,边际消费倾向,(,Marginal Propensity to Consume,),例,1.2,投资乘数(,Investment Multiplier,),应用实例,例,1.3.3,增长率问题,(Growth Rate),本章小节,统计,是对变量观测值产生的变异性的研究;,统计学,(statistics),是收集、描述和解释数据的科学,是科学的一种普遍性语言。,统计方法,包括:收集资料方法;整理资料方法;统计分析方法等。,统计分析方法,是统计方法的核心,统计分析方法可以分为两部分:,描述性统计和推断性统计。,描述性统计,是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法;,推断性统计,阐明如何利用样本数据来推断被抽样总体的性质,并按规定的置信度来实现这种推断。,统计过程,的一个非常重要的部分是研究统计的结果和给出恰当的结论,这些结论必须正确地被表达,不能随意添加,除非还有其他的信息。,第三章 抽样分布,第一节,随机样本,第二节,抽样分布,本章小节,主要内容,第一节 随机样本,在统计学中,我们研究的问题一般集中在,研究对象的某一数量指标,。比如某型号的电子元器件的寿命、一批某种产品的合格率等。因而,需要考虑通过与这一数量指标相联系的随机试验,来对这一数量指标进行试验或观测。,我们将试验的,全部可能的观测值,称为,总体,,,每一个观测值,称为,个体,,,总体,中所包含的,个体数,称为,总体的容量,。容量为有限的称为,有限总体,,否则称为,无限总体,。,3.1,关于抽样的基本概念,为什么要抽样,?,为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。,抽,样,原因,元素多,搜集数据费,时、费用大,不及时而,使所得的数据无意义,总体庞大,难以对总体的全部元素进行研究,检查具有破坏性,炮弹、灯管、砖等,第一节 随机样本,简单随机抽样(,x1,x2,xn,),:,简单随机抽样是指从总体中抽取样本容量为,n,的样本时,,x,1,x,2,x,n,这,n,个随机变量必须具备以下两个条件:,这,n,个随机变量与总体,X,具有,相同的概率分布,;,它们之间,相互独立,。,第一节 随机样本,甲乙丙丁四个生产商,其产品质量如下表所示:,如果仅从,AB,两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从,CD,两个生产商的产品中进行抽样,抽样质量就偏低;,因此采用简单随机抽样保证,随机样本,与,总体,具有相同的概率分布。,A,B,C,D,质量,高,高,低,低,样本统计量与抽样分布,:,在简单随机抽样中,样本具有随机性,样本的参数,s,2,等也会随着样本不同而不同,故它们是样本的函数,记为,g,(,x,1,x,2,x,n,),称为样本统计量。,统计量的概率分布称为抽样分布(,Sample,distribution,),3.1,关于抽样的基本概念,第一节 随机样本,3.1,关于抽样的基本概念,第二节,抽样分布,一、,统计量,定义,不含有任何未知参数的样本的函数,称为统计量 。显然,统计量为随机变量。,几个常用统计量,样本矩(样本均值;样本方差;原点矩,中心矩等),几个常用统计量,二、几个常用的抽样分布,抽样分布的定义,统计量的分布称为抽样分布。,来自正态总体的几个常用统计量的分布,已有一些重要的结果(人们已经获得这些统计量的具体的分布密度函数)。下面介绍来自正态总体的几个常用统计量的分布。,第二节,抽样分布,几,种,概,率,分,布,正态分布,分布,F,分布,t,分布,几种与正态分布有关的概率分布,若随机变量,X,的概率密度函数,记为,1.,正态分布,图,4-1,一般正态分布,1.,正态分布,标准正态分布,:,当 时,,记为,UN,(,0,,,1,),图,3-1,标准正态分布,1.,正态分布,非标准正态分布向标准正态分布的转化,若,标准化因子,则,UN,(,0,,,1,),1.,正态分布,查表,当,u,大于零时,可查正态分布表,但如果,u0,时,则可由式,(,-u,),=1-,(u),求出,1.,正态分布,线性性质:,如果,且相互独立。对于常数 ,有下式成立:,1.,正态分布,2.,分布,设 是来自总体 的样本,则称统计量,为,服从自由度为 的 分布,记为,的一个重要性质:可加性,图,3-2,2,分布图,2.,分布,查表:,对于给定的,,,00.1,时则,称式 为有限总体的修正系数。,4.3,样本平均数的抽样分布,5.,基于正态总体样本的均值与方差的分布,从总体中抽取样本容量为,n,的简单随机样本,当样本容量,n 30,时,样本均值 的抽样分布可用,正态概率分布近似。,中心极限定理,5.,基于正态总体样本的均值与方差的分布,(四)基于正态总体样本的均值与方差的分布,设 来自正态总体 的样本,,分别为样本的均值和方差。则,设 为来自正态总体 的样本,,为来自正态总体 的样本,,分别为两个样本的均值和方差。则,当 时,则,三、,样本比例的抽样分布,(一)重复抽样下样本比例的抽样分布,可以证明,,(二)不重复抽样下样本比例的抽样分布,可以证明,,本章,小结,统计量是统计推断的基本变量。统计量是,不含有任何未知参数的样本的函数,。,统计量的分布称为抽样分布。,对于正态总体,我们给出了几个常用的统计量的分布。,对于实际应用中的比率问题,给出了大样本下的抽样分布。,思考题,思考题,思考题,案例讨论题,在,1936,年的美国总统选举中有两位候选人,即民主党候选人罗斯福(,F.D.Roosevelt,)和共和党候选人兰登(,G.A.London,)。有一家文摘杂志通过从电话号码簿和一些俱乐部成员的名单中选取,1000,万人,以发出询问信的方式进行民意调查,共有,240,万人作出了回答。据此资料,此文摘杂志预测兰登将以获得,57%,的选票获胜,而罗斯福的得票率将是,43%,。而选举结果罗斯福的得票率则是,62%,,兰登仅得到,38%,的选票。为此,这家杂志社很快就倒闭了。,自,1916,年以来,此家杂志每次所作的预测都是正确的,因而影响很大。这次它的预测基于巨大数字的,240,万的答卷作出的,却预测错误。,当时有电话的家庭有,1100,万户,失业者有,900,万人。,有一个叫乔治,.,盖洛普(,George Gallup,)的人建立的一个调查组织从,1000,万人中随机选取了,3000,人,就提前知道了文摘将要得出的结论:兰登将以,56%,的选票获胜,这与文摘公布结果的仅差,1%,,而这个结论来自于,3000,人而非,204,万人。盖洛普从更大的范围内随机选取了,5000,人,据此预测罗斯福将以,56%,得票率获胜,而兰登的得票率为,44%,。与实际结果差,6%,。,讨论题:,(,1,)此文摘杂志社此次预测错误的根本原因?,(,2,)为什么盖洛普预测成功?,(,3,)预测的误差是否随着抽样数量的增加而减少?,(,4,)从这个案例分析中得到什么启发?,第四章 统计推断,第一节,参数估计,第二节,假设检验,第三,节,假设检验中的两个问题,本章小节,主要内容,第一节 参数估计,一、,点估计,设总体 的分布函数的形式已知,但它含有一个或多个未知参数,借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。,常用的构造估计量的方法:矩估计法和最大似然估计法。,(一)矩估计法,英国统计学家,K.Pearson,提出的矩估计法,其主要思想是:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的函数的估计。,这里,表示总体的矩,它是总体分布参数的函数,而 是样本的函数。由上述 个方程组成的方程组,可以解出总体分布中的 个未知参数。,例,1,设总体的均值及方差 (不为零)都存在,且均未知。,又设 是来自总体,的一个样本,试求 的矩估计量。,解 由,,得,再以 代替 ,即得 的矩估计量分别为,(二)最大似然估计法,由,R.A.Fisher,引进的最大似然估计法,无论从理论上还是从应用上,至今仍然是一种重要且普遍适用的方法。,估计过程:,由所谓的似然函数(它是参数和样本的函数),若,则称,为参数 的最大似然估计值,为 的似然估计量。,一般情况下,可由方程,求得。,求最大似然估计量的步骤为,:,(,1),对给定的总体,X,,,写出似然函数,(2),列出似然方程,(3),求解上述方程,得关于,的解即为,的最大似然估计量,。,含多个参数,令,似然方程,或,最大似然解,点估计的常用方法,例,2,(,一,),无偏性,设 为参数 的点估计量,若,则称 为参数 的无偏估计量。,二、估计量的评选标准,(,二,),有效性,设 和 是 的无偏估计量,若对于 的变化范围内的任意一个值,都有,且至少有一个 使得不等号成立,则称 较,有效。,(,三,),相合性,无偏性与有效性都是基于样本容量,n,固定的前提下提出的,我们希望随着样本容量的增大,一个估计量的值趋向于待估参数的真值。,设 为参数 的一个估计量,若对于其变化范围内的任意一个 ,当 时,依概率收敛于 ,,则称 为 的相合估计量,。,如果对任意小的正数,有,则称,是,的一致估计量,称,具有,相合性,,可以证明,均具有,相合性,。,(,三,),相合性(,consistency,),注,:,具有无偏性。,,,对于,,,具有无偏性,二、估计量的评选标准,三、,区间估计,定义,设总体 的分布函数 中含有未知参数,对于给定的 ,有两个样本统计量 ,使得,则称随机区间 是 的置信度为 的置信区间,分别称为置信度为 的双侧置信区间的置信下限和置信上限。,区间估计的概念,的样本,使得,置信度,1-,三、区间估计,置信度,1,下,的置信区间:,1-,是置信度,置信度也称为置信概率,称为显著性水平,则称,三、区间估计,三、,区间估计,例 题,例 题,确定未知参数置信区间的一般步骤,(,1,),构造一个样本的函数,它包含待估未知参数,而不含其它未知参数,并且,的分布已知且不依赖于任何未知参数;,(,2,)对于给定的置信度 ,定出两个常数,a,,,b,,,使得,(,3,)若能由上式得到等价的不等式 ,,其中,都是统计量,那么 就是 的一个置信度为 的置信区间,正态,总体参数的置信区间,1.,单个正态总体 的情况,(,1,)的置信区间,已知时,,未知时,,(,2,),方差 的置信区间(仅以 未知为例),例,3,现从某天生产的洗衣粉中随机地取,16,袋,称得重量(以克计)如下表所示。,设洗衣粉的重量近似地服从正态分布,试求总体均值的置信度为,0.95,的置信区间,。,解 这里,总体的方差未知,故总体均值 的置信区间为:,而,经过计算得,又查表得,,故所求的置信区间为,(,500.4,507.1,),。,506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496,2,两个正态总体的情况,实际中存在这样的问题:已知产品的某一指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素的影响,而引起总体均值、方差的改变。,我们要考察这些变化的大小,这就涉及两个正态总体均值差或方差比的估计问题。,设有两个正态总体,,样本均值和方差分别为,(,1,)两个总体均值差的置信区间,均已知,的置信区间,未知但相等,的置信区间,(,2,)两个总体方差比的置信区间,这里仅讨论 未知的情形,对于给定的置信度 ,的置信区间为,四、大样本下总体均值、比率的区间估计,(一)总体均值 的区间估计,这里的大样本,是指样本的容量不小于,30,1.,总体方差 已知时总体均值 的置信区间,2.,总体方差 未知时总体均值 的置信区间,两个正态总体参数的比较,1,2,2,2,且两样本容,量均,30,由,S,1,2,和,S,2,2,分别估计,1,2,和,2,2,,,即可,例,5,某保险公司有,36,个投保人的年龄资料如表表所示所示。,试求投保人平均年龄的置信度为,95%,的置信区间。,23,36,42,34,39,34,35,42,53,28,49,39,39,46,45,39,38,45,27,43,54,36,34,38,36,31,47,44,48,45,44,33,24,40,50,32,解,这里总体的方差未知,但为大样本情形。查标准正态分布表得 ,再由上表数据,得 ,由此,可以得到投保人平均年龄 的置信度为,95%,的置信区间为,,即,(,39.96,42.04,),(二)总体比率的区间估计,由样本比率的抽样分布可以知,当样本容量 足够大时,(一般指不小于,30,,,且 都大于,5,),,样本比率 的抽样分布近似正态分布。设总体比率为 ,则有,对于置信度 ,,P,的置信区间为,例,6,某公司要估计某天生产的某型号的全部产品的合格率。,为此随机抽取了,100,件产品,经检验其中有,94,件为合格品。,对于置信度,95%,,试求该天此型号产品合格率的区间估计。,解,由题意,易得样本合格率 ,从而得全部产品合格率置信度为,95%,的置信区间为,即,(89.35%,98.65%),(三)两个总体均值差的区间估计,对于给定的置信度 ,的置信区间,这里,为来自与两个总体的样本均值;,为样本的方差。,例,7,为了评估甲乙两种方法包装某产品所需要的时间,在不同的方法下独立地抽取两个随机样本,经整理计算得到下列资料。试在置信度,95%,下,给出这两种方法下包装某产品平均时间之差的置信区间。,解,由公式,得到这两种方法下包装某产品平均时间之差的置信度为,95%,的置信区间为,(,3.86,,,10.14,),甲方法,乙,方法,样本容量,n,与总体方差、允许误差、置信度有以下关系:,1,在给定的置信水平下,允许误差越大,样本容量就可以越小。,2.,样本容量,n,与置信度成正比。,例,一家广告公司想估计某类商店去年所花的平均广告费有多少。经验表明,总体方差约为,1 800 000,。如置信度取,95%,,并要使估计值处在总体平均值附近,500,元的范围内,这家广告公司应取多大的样本?,估计总体均值时,样本容量的确定,解:已知,这家广告公司应抽选,28,个商店作样本(注意抽取样本数总是整数,所以,n,应圆整成整数)。,估计总体均值时,样本容量的确定,第二节,假设检验,一、,参数假设检验,在总体的分布函数已知,但参数未知时,如对总体分布中的未知参数提出假设,则,如何利用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。,这类统计问题我们称之为参数的假设检验问题。,参数估计和参数检验是利用样本对总体的统计特性提供的信息,建立样本的函数,即估计量或检验统计量,,是从不同角度处理总体未知参数的两种统计方法。,假设检验的一般流程,假设检验 是推断性统计学中的一项重要内容,它是先对研究总体的参数作出某种假设,然后通过样本的观察来决定假设是否成立,参,数,假,设,样,本,观,察,假,设,检,验,具,体,的,统,计,方,法,(一),假设检验的基本思想,设,总体为 ,建立假设,这里 表示原假设,表示备择假设。,假设检验问题,就是要建立一个合理的法则,根据这一法则,利用已知样本作出接受原假设(即拒绝备择假设),还是拒绝原假设(即接受备择假设)的决策。,(一),假设检验的基本思想,假设基本形式,H,0,:,原假设,,H,1,:,备择假设,假设检验:运用统计理论对上述假设进行检验,在原假设与备择假设中选择其一。,假设检验基本原理,小概率事件在一次试验中几乎不可能发生。,假设检验的基本依据,小概率原理,:,假设检验基本原理,承认,原假设,小概率,事件发生,大概率,事件发生,拒绝,原假设,接受,原假设,进行一次实验,(二),判断,“,假设,”,的依据,实际推断原理:概率很小的事件在一次试验中几乎是不会发生的。,如果原假设为真,则由一次抽样计算而得的样本观测值,满足不等式,此事件几乎是不会发生的。,现在在一次观测中竟然出现了满足上述不等式的样本均值,则我们有理由怀疑原来的假设的正确性,因而拒绝原假设。,若出现的观测值不满足上述不等式,此时没有足够的理由拒绝,因此只能接受原假设。,第一类错误:弃真(显著水平,),第二类错误:取伪,显著,水平,与,两类,错误,(三)两类错误,对于一定的样本容量,n,,不能同时做到两类错误的概率都很小。如果,减小,错误,就会增大犯,错误的机会,;若减小,错误,也会增大犯,错误的机会。,两类,错误,关系,(三)两类错误,如何使使,、,同时变小,?,一个完整的假设检验过程,通常包括以下四个步骤:,提出原假设(,Null hypothesis,),与备择假设(,Alternative hypothesis,),作出统计判断,参数假设检验问题的步骤,确定适当的检验统计量,,并计算检验统计量的值,给定显著性水平,正态总体参数假设检验的步骤,第一步:建立原假设,H,0,和备择假设,H,1,常用的假设形式,第二步:选择检验用的统计量,u,检验,t,检验,F,检验,常用,统计量,正态总体参数假设检验的步骤,第四步:确定显著水平,的值,查相应的分布表得其临界值以及拒绝域。,第五步:作出拒绝还是接受原假设的统计判断。,正态总体参数假设检验的步骤,第三步:根据样本观测值计算检验统计量的具体值;,(四)单个总体参数的假设检验,1,单个正态总体 下参数 的假设检验,(,1,),单个正态总体均值的检验,已知,关于 的检验(,Z,检验),检验统计量:,可以根据假设检验的不同类型,确定检验问题的拒绝域。,例,8,某厂生产某种型号的内胎,从长期的生产经验知道其扯断强力服从均值,=1380,(,N/,),,标准差,=50,(,N/,),的正态分布。该厂为提高产品的质量,改变了原来的配方进行现场生产试验。设新配方生产的内胎其扯断强力仍服从正态分布。由于在试验中除配方外,其他条件都保持不变,因此可以认为新配方未改变此型号内胎扯断强力的方差。采用新配方的,5,次试验,测得内胎扯断强力为(单位:,N/,):,1450,,,1460,,,1360,,,1430,,,1420,,,试问采用新配方,是否能提高内胎的扯断强力?,解,对这个假设检验问题,需要检验假设,形如,这样的,假设检验,称为右边检验(类似也有左边检验)。,此检验问题的拒绝域的形式为,查表得 ,而经计算得,从而有,,即 ,据此,拒绝原假设。,未知,关于 的检验(,t,检验),检验统计量:,可以根据假设检验的不同类型,确定此检验问题的拒绝域,例,8,某种元件,按照标准其使用寿命不低于,1000,(小时),现从生产出的一批元件中随机抽取,25,件,测得其平均寿命为,950,(小时),样本标准差为,100,(小时)。,假设该种元件寿命服从正态分布,对于置信度,95%,试问这批元件是否可以认为合格?,解 此问题即要检验,拒绝域的形式为,而由已知可得,,又 ,即 。故拒绝原假设,认为这批元件不合格。,(,2,),单个正态总体 的方差检验,设 未知,建立假设,:;:,检验统计量:,拒绝域:或,(,2,),单个正态总体 的方差检验,2,非正态总体参数的假设检验,这里讨论的是在,大样本(样本容量),情形下,总体均值和总体比率,的假设检验。,总体均值 和总体比率 的假设检验,这里利用中心极限定理,在样本容量充分大时,样本均值近似服从正态分布,从而可以构造相应的检验统计量和确定出检验问题的拒绝域。,对于总体比率的检验,在样本容量充分大时,样本比率近似服从正态分布,,也可以类似构造检验统计量及确定出拒绝域。,2,非正态总体参数的假设检验,(,1,)总体的均值的假设检验,例,9,一个市场分析员认为某市居民每户每周平均在食品上的支出少于,140,元。一个由,100,个家庭组成的随机样本资料所给出的平均值为,138,元,标准差为,10,元,在显著性水平,0.05,下,这些数据能否支持此分析员的看法?,(,1,)总体的均值的假设检验,(,1,)总体的均值的假设检验,(,2,)总体比率的假设检验,(,2,)总体比率的假设检验,单个总体比率的假设检验,如果样本容量,n,与原总体比率,时,用,u,检验法。,(五)两个正态总体下参数的假设检验,1.,有关平均值的假设检验,设 分别表示来自两个具有相同方差的正态总体的样本均值,则对于两个总体均值的假设检验问题,可以通过构造检验统计量,来确定拒绝域的形式。,(五)两个正态总体下参数的假设检验,例,11,2.,方差的假设检验,设 分别表示来自两个具有不同方差的正态总体的样本方差,则对于两个总体方差的假设检验问题,可以通过构造检验统计量(在原假设 为真的情形下),根据备择假设的不同类型可以确定出检验问题的拒绝域。,例,例,表,4.2.2,正态总体参数的假设检验(显著性水平为,),二、,非参数假设检验,(,Nonparametric Tests,),前一节所讨论的假设检验问题,只是对,服从正态分布的总体中的某些未知参数进行假设检验。,但在实际问题中,,总体的分布函数的形式往往未知;或者知道的很少,甚至只知道是离散型或连续型。,本节讨论总体分布函数的拟合问题,即研究检验总体分布函数的非参数假设检验问题。,(一)符号检验法,这里只介绍检验,两个总体分布函数是否相同,的符号检验法,设有两个总体 ,要检验假设,设有来自两个总体的样本,将它们所对应的样本观察值进行比较,可以得到对应值差的符号,以 记正、负号的个数,则它们为随机变量。构造检验统计量,就可以确定出检验问题的拒绝域。,符号检验法步骤:,比较样本数据,求出,n:n=n+n-,在显著水平,下,根据,n,值查符号检验表得其,临界值,S,(n),判别显著性,ai,bi,记为,“,+,”,“,+,”,的个数记为,n+,ai,bi,记为,“,-,”,,,“,-,”,的个数记为,n-,ai,=bi,记为,“,0,”,,,“,0,”,的个数记为,n,0,若,S,0,=minn+,n-S(n),,则接受,H,0,,认为,f,1,(x),与,f,2,(x),无显著差异。,例,9,甲、乙两分析人员分析同一物体中的某成分含量,测得数据如下表(单位:,%,)。,问两人的分析结果有无显著差异,(对于显著性水平,0.1),甲,14.9,14.8,15.1,14.8,15.5,14.6,14.8,14.8,15.1,14.5,乙,14.3,14.9,15.2,14.7,15.2,14.7,14.7,14.6,15.2,14.5,符号,+,+,+,+,+,0,甲,15.0,14.9,14.7,15.0,15.1,14.9,15.2,14.7,15.4,15.3,乙,14.9,14.7,14.8,15.3,14.9,14.6,14.8,14.9,15.2,15.0,符号,+,+,+,+,+,+,+,解,:,由上表,可以得到数据间比较的符号,若对比的数据相等,符号以,0,表示,结果见上表。,再根据数据计算得,=12,,,=7,,所以,=19,,且,=7,。由显著性水平,=0.10,及,=19,,由附表查得 。,因,=75,,于是接受原假设 ,即认为两人的分析结果无显著差异。,由上面的分析可以看到,,符号检验法简单、直观,且无须知道被检验量的分布形式,但其精度较差,而且要求数据成对出现。,(二),秩和检验法,设从总体 中分别抽取容量为 的独立样本。,要检验假设,为讨论方便,设 。把两个样本的观测数据合在一起按从小到大的次序排列,,定义每个数据在排列中所对应的序号为该数的秩,,对于相同的数据则利用他们序数的平均值来做秩。,将容量较少的样本的各观测值的秩之和记为,,以 作为检验统计量。然后确定出相应的拒绝域。,(二)秩和检验法,例,10,某厂用两种材料制造灯泡,现有分别随机抽取若干个进行寿命试验的数据如下:,问两种材料对灯泡寿命的影响有无显著的差,异(取,=0.20,)。,甲,1598,1698,1680,1650,1740,1790,1720,乙,1698,1640,1576,1640,1590,秩,1,2,3,4,5,6,7,8.5,10,11,12,甲,1598,1650,1680,1698,1720,1740,1790,乙,1576,1590,1640,1640,1698,甲,1598,1698,1680,1650,1740,1790,1720,乙,1698,1640,1576,1640,1590,解:,将全部数据按从小到大的次序排列,结果如下表所示,。,解:,将全部数据按从小到大的次序排列,结果如下表所示,。,将数据少的乙组的数据个数用 表示,另一组用 表示。由此算得 ,即,=1+2+4+5+8.5=20.5,因,=5,,,=7,,,=0.20,由附表查得,=22,,,=43,。,由于 ,故认为两种材料对灯泡寿命的影响有显著差异。,秩,1,2,3,4,5,6,7,8.5,10,11,12,甲,1598,1650,1680,1698,1720,1740,1790,乙,1576,1590,1640,1640,1698,(三),拟合优度检验法,实际上,有时连总体服从什么类型的分布都不知道,这就需要根据样本来检验总体分布的假设。,设 是未知的总体分布函数;又设 是类型已知的分布函数,但其中可能有未知的参数。要检验假设:,构造统计量,由此确定出相应检验问题的拒绝域。,例,11,一颗骰子掷了,120,次,得到下列结果,试在,=0.05,下检验这颗骰子是否均匀、对称。,解,:,掷一颗骰子出现的点数是一个离散型的随机变量,X,。,这里要检验假设,由于已知的分布中不含未知参数,又,=20,,则由,而 ,故接受原假设 。,出现点数,1,2,3,4,5,6,出现次数,23,26,21,20,15,15,第三节 假设检验中的两个问题,一、置信区间与假设检验的关系,第三节,假设检验中的两个问题,二、假设检验中的 值,一般也称 值为实测显著性水平,。,值是当原假设成立时,得到所观测数据的概率,是我们判断原假设不真的有力依据。,二、假设检验中的,P,值,p-,值的应用,例题:,某商品标签上标明其重量至少为,3,公斤以上,现抽取,36,瓶该产品组成的一个简单随机样本,得其样本均值,2.92,公斤,已知总体标准差为,0.18,时,在显著性水平,0.01,的情况下检验其商品标签所标内容是否真实?,求解过程:,(,1,)原假设,H,0,:,3,,备择假设,H,1,:,3,(,2,)检验统计量为:,代入数据得:,p-,值的应用,求解过程(续):,(,3,),U=,2.67,所对应的,p,值为,0.0038,(,4,),0.0038,0.01,,所以拒绝,H,0,。,p-,值的应用,统计推断中的两个基本问题,估计问题,假设检验问题,点估计,区间估计,参数假设检验,统计量的构建,拒绝域的确定,符号检验,秩和检验,拟合优度检验,本章小结,矩估计法,区间估计,非参数假设检验,第五章 方差分析,第一节,单因素试验的方差分析,第二节,双因素试验的方差分析,本章小结,主要内容,例,5.1.3,某灯泡厂用,4,种不同配料方案制成的灯丝生产了,4,批灯炮,在每批灯泡中随机抽取若干只进行寿命试验。我们关心的问题是这,4,种灯丝生产的灯泡其使用寿命有无显著差异?,这里要分析的因素是配料方案。,第一节 单因素试验的方差分析,例,5.1.1,设有,m,台机器生产同一种产品,记录每台的日产量。可以看到,不但不同机器的日产量可能各不相同,就是同一台机器在不同的生产日中其产量也未必相同。我们关心的是,,这种日产量的差异是,由于不同机器造成的,,还是由于随机波动造成的。这里考虑的因素是不同机器的生产能力。,第一节 单因素试验的方差分析,我们把要考察的指标称为试验指标。如果在一个问题中有几项试验指标,我们将分别对每一项试验指标进行分析。,影响试验指标的条件称为因素,,一般用大写字母等表示。如果一项试验中只有一个因素在改变我们就称为单因素试验;,因素所处的状态称为水平。,第一节 单因素试验的方差分析,例,5.1.4,采用四种不同产地的原料萘,按同样的工艺条件合成,萘酚,测定所得产品的熔点如表,5.1.1,所示,问原料萘的产地是否显著影响产品的熔点?,设因素,A,有,t,个水平,在第,i,个水平下进行了,n,i,次相互独立的试验,结果如下:,第一节 单因素试验的方差分析,方差分析的基本任务就是要检验假设,(,1,),(,2,)参数 的检验,方差分析的基本思想:,构造一个适当的统计量,来描述数据的波动程度。将这个统计量分解为两部分,,一部分是纯随机误差造成的影响,,另一部分是除随机误差的影响外来自于因素效应的影响。,然后将这两部分进行比较,如果后者明显比前者大,就说明因素的效应是显著的。,单因素试验方差分析表,方差来源,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服