1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本
2、样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单
3、击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第一节 抽样推断的基本问题,一、抽样推断的基本概念,(一)抽样推断的概念,抽样推断是根据抽样调查所取得的数据资 料,对研究对象全体的数量特征作出具有一定 可靠性估计和判断,以达到对现象总体的认识。,一、抽样推断的基本概念,(一)抽样推断的概念,(二)总体与样本,总体。通常用,N,代表总体单位数。,样本,是按随机原则从总体抽取
4、的一部分单位组 成的集合体,它是总体的一个子集。样本单位数成为 样本容量,用,n,代表样本单位数。,一、抽样推断的基本概念 ,(一)抽样推断的概念,(二)总体与样本,(三)参数与统计量,参数是根据总体各单位标志值计算的,反映总体数量特征的综合指标。参数主要包括:总体平均数和总体标准差。,三、抽样推断的作用,(一)有些现象无法进行全面调查,(二)没有必要或很难进行全面调查,(三)可以用抽样推断的结果对全面调查的结果进行检查和修正。,(四)可以对某些总体的假设进行检验,以决定行动的取舍。,四、抽样调查的方法,(一)简单随机抽样,纯随机抽样,按照随机原则直接从总体,N个单位 中抽,取,n,个单位作样
5、本,使每个总体单位都有同等机 会被抽中。,(二)类型抽样 类型抽样,也叫分层抽样。就是将总体 单位按其属性特征分成若干类型或层,然后 在类型或层中随机抽取样本单位。,(三)机械抽样,机械抽样也称为等距抽样或系统抽样,它是首先 将总体中各单位按一定顺序排列,根据样本容量要求 确定抽选间隔,然后随机确定起点,每隔一定的间隔 抽取一个单位的一种抽样方式。,(四)整群抽样,整群抽样又称聚类抽样。是将总体中各单位归并 成若干个互不交叉、互不重复的集合,称之为群;然 后以群为抽样单位抽取样本的一种抽样方式。,第二节 抽样分布与抽样误差,一、抽样分布,(一)抽样分布的含义,抽样分布就是从总体中抽出相同容量的
6、全 部样本,并计算出统计量值,然后以统计量的 值为标志编制的频数分布表。通常把这种样本 指标的频数分布叫抽样分布。,具体见教材(,P71,,例,3.1,),重要结论,(二)样本均值的抽样分布,1.,单样本均值抽样分布 (,1,)(,n30),进一步可得统计量,1.,单样本均值抽样分布,在总体均值的区间估计和假设检验时,,由于总体方差 是未知的,一般用修正的样本方差替代。即,(,2,)(,n,30),这时统计量不服从标准正态分布,而是服从自 由度为,n-1,的,t,分布:,(,3,)二项分布。样本容量(,n30),且都能 满足,np,和,nq,都大于,5,的条件,样本成数的分 布近似地服从期望为
7、p,方差为,p,(,1-p,),/n,的 正态分布,记为:,转化为,标准正态分步骤:,2.,两样本均值差的抽样分布,(,1,)两总体皆为正态总体,且,已知,则分别来自这两个总体的样本均值差服从均值为 方差为 的正态分布。记为:,(,2,)两总体皆为正态总体,且,未知,但,=,则,,其中,,(三)样本方差的抽样分布,1.,单样本方差抽样分布,(,1,)总体均值 已知时,样本方差,则有,(,2,)总体均值未知时,样本方差,则统计量服从自由度为,n-1,的 分布,2.,两样本方差比的抽样分布,(,1,),已知,,(,2,),x,未知,,二、抽样误差,(一)抽样误差的概念,1.,抽样误差的一般概念
8、抽样误差是指样本统计量与被它估计的未知 的总体参数(总体特征值)之差。,2.,抽样误差的种类,登记性误差,代表性误差,违反随机原则,偶然的代表性误差(无法消除),3.,影响抽样误差的因素,总体方差或总体标准差,样本容量,n,抽样的组织形式,(二)抽样平均误差,1.,抽样平均误差的概念,首先,要知道抽样误差的概念。抽样 误差是样本指标与总体参数之间的绝对离差。,通常用 抽样平均数的标准差作为衡量抽样误 差一般水平的尺度,称为抽样平均误差,2.,抽样平均误差的计算,(,1,),通常,总体标准差是不知道的,一般用样 本标准差代替总体标准差。,(,2,)成数的抽样平均误差计算公式,通常,总体成数是不知
9、道的,一般用样本 成数代替总体成数。,(三)抽样极限误差,1.,抽样极限误差的意义,以样本指标来估计总体参数时,要确定一个允许的误差范围,这个允许的误差范围称为抽样极限误差。它大于等于样本指标与总体指标之差的绝对值,记作:,上式整理,2.,置信度与置信区间的意义,置信度是指总体指标落在某个区间的概率保证程,度,用,F(t),表示。,用抽样极限误差除以相应的抽样平均误差得到相 对数称为概率度。表示极限误差范围为抽样平均误 差的若干倍,用,t,表示,公式为:,第三节 抽样推断的方法,一、抽样推断的特点,1.,它在逻辑上运用归纳推理,而不是演绎推理,2.,它在方法上运用不确定的概率估计法,而不是运
10、用确定的数学分析法。,3.,推断的结论存在一定的抽样误差,并且抽样误差 总是和抽样估计的可靠程度联系在一起。,二、抽样推断的方法,(一)点估计,(二)区间估计,1.,总体平均数的区间估计,(,1,)总体为正态总体,方差已知,例,3.3(,教材,P81,),(,2,)总体为正态总体,方差未知,大样本情况下,例,3.4,(教材,P82,),(,3,)总体为正态总体,方差未知,小样本情况下,统计量服从自由度为,n-1,的,t,分布,例,3.5,(教材,P83,),2.,总体成数的区间估计,一般第,在,np,5,和,n(1-p),5,成立的大样本条件 下,样本成数的抽样分布近似服从正态分布。在小样 本
11、条件下,近似地服从自由度,n-1,的,t,分布,三、样本容量的确定,(一)影响样本容量的因素,1.,总体各单位之间标志变异程度,2.,抽样极限误差,3.,概率度,4.,抽样方法,5.,抽样组织方式,(二)样本容量的确定,1.,抽样平均数的抽样单位数目计算,2.,抽样成数的抽样单位数目计算,第四节 假设检验,一、假设检验的基本步骤,(,1,)提出原假设,H0,和备选假设,H1,;,(,2,)选择适当的检验统计量,指出在,H0,成立时该统计量所服从的分布;,(,3,)根据给定的显著性水平,,查分布表求出临界值,;,(,4,)根据样本计算统计量的值;,(,5,)将检验统计量的值与临界值比较,若统计量
12、的值,临界值,则拒绝,H0,接受,H1,;否则接受,H0,。,例,1,某化妆品生产公司研制出一种新型爽肤,水。爽肤水的颜色共有四种,分别为橘黄色、粉色、,绿色和无色透明。现随机从五家专卖市场上收集了前,一期该种爽肤水的销售量,如表,1,所示。,问爽肤水的颜色是否对销售量产生影响。,某爽肤水在五家专卖市场的销售情况,专卖市场,无色,粉色,橘黄色,绿色,1,26.5,31.2,27.9,30.8,2,28.7,28.3,25.1,29.6,3,25.1,30.8,28.5,32.4,4,29.1,27.9,24.2,31.7,5,27.2,29.6,26.5,32.8,这是一个方差分析问题,即对四
13、种不同颜色的爽肤,水的销售量均值是否相等进行检验。,把四种不同颜色的爽肤水的销售量均值分别记为,由题意知,要检验假设,不全相等,如果检验结果为不全相等,则表明爽肤水颜色对销,售量产生影响。反之,如果检验结果为不存在显著影,响,则可以认为爽肤水颜色对销售量没有影响,他们来,自于相同的总体。,取 ,要检验的假设:,颜色对销售量没有影响,颜色对销售量有影响,解:由题设知:,r=4,。,根据表中的观测数据得,从而计算统计量,F,得观测值为:,当取 时,查表知:,由于 ,故拒绝原假设。说明爽肤水的颜色对销售量有显著影响。,可以将计算结果列成方差分析表:,方差来源,平方和,自由度,F,值,F,的临界值,组 间,3,组 内,39.084,16,总 和,19,单因素方差分析表,F,分布表,






