1、1数理统计学数理统计学2 通过抽取总体中的部分通过抽取总体中的部分(样本样本)进行观察获得数进行观察获得数据(抽样),并通过这些数据对总体进行推断。据(抽样),并通过这些数据对总体进行推断。一、数理统计研究的问题一、数理统计研究的问题(1)(1)怎样设计试验,决定观察的数目;怎样设计试验,决定观察的数目;(2)(2)怎样利用试验观察的结果作出一个怎样利用试验观察的结果作出一个“好好”的的推断等。推断等。第一个问题是怎样进行抽样,使抽得的样本更合理第一个问题是怎样进行抽样,使抽得的样本更合理,并并有更好的代表性?这是有更好的代表性?这是抽样方法和试验设计抽样方法和试验设计问题问题.第二个问题是怎
2、样从取得的样本去推断总体?这种推第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?这是断具有多大的可靠性?这是统计推断统计推断问题问题.3统计方法具有统计方法具有“部分推断整体部分推断整体”的特征的特征 .因为从一小部分样本观察值去推断全体对象(总体)因为从一小部分样本观察值去推断全体对象(总体),即由部分推断全体。这里使用了,即由部分推断全体。这里使用了“归纳推理归纳推理”的方法,的方法,它它不同于数学中的不同于数学中的“演绎推理演绎推理”。归纳推理归纳推理-根据观察到的大量个别情况,归纳推断总体。根据观察到的大量个别情况,归纳推断总体。演绎推理演绎推理-从一些假设、命题、已
3、知的事实等出发,按一从一些假设、命题、已知的事实等出发,按一定的逻辑推理得出结果。定的逻辑推理得出结果。二、数理统计方法的特点二、数理统计方法的特点4 例如,在几何学中要证明例如,在几何学中要证明“等腰三角形底角相等等腰三角形底角相等”,只须从只须从“等腰等腰”这个前提出发,运用几何公理,一步一这个前提出发,运用几何公理,一步一步推出这个结论步推出这个结论.这是演绎推理。这是演绎推理。而一个习惯于统计思想的人,可能这样推理:而一个习惯于统计思想的人,可能这样推理:做很多大小形状不一的等腰三角形,实地测量做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得资料看看可否作其底角,看
4、差距如何,根据所得资料看看可否作出出“底角相等底角相等”的结论的结论.这样做就是归纳式的方这样做就是归纳式的方法法.5 问题问题:用局部观察对总体下结论:用局部观察对总体下结论,有没有片面性有没有片面性?结论是否可靠?结论是否可靠?显然这不仅显然这不仅依赖于进行局部观察的依赖于进行局部观察的“样本样本”是否具有是否具有总体的代表性总体的代表性,也,也依赖于对从这些样本得到数据的合理加依赖于对从这些样本得到数据的合理加工、分析工、分析并得出论断并得出论断.事实上,如果一切都建立在可靠的科学基础上,事实上,如果一切都建立在可靠的科学基础上,则对总体下结论是可能的,也是可靠的则对总体下结论是可能的,
5、也是可靠的.但也应记住但也应记住,毕竟是由毕竟是由“局部局部”推断推断“整体整体”,因而仍可能犯错误,因而仍可能犯错误,结论往往是在某个结论往往是在某个“可靠可靠性水平性水平”之下得出的之下得出的.6 概率论是数理统计的基础,而数理统计是概率论的重概率论是数理统计的基础,而数理统计是概率论的重要应用要应用.但它们是并列的两个数学学科,并无从属关系。但它们是并列的两个数学学科,并无从属关系。学习数理统计无须把过多时间化在计算上,学习数理统计无须把过多时间化在计算上,可以更有效地可以更有效地把时间用在基本概念、方法原理及把时间用在基本概念、方法原理及方法适用对象的正确理解上方法适用对象的正确理解上
6、.国内外著名的统计软件包:国内外著名的统计软件包:SASSAS,SPSSSPSS,STATSTAT等,都等,都可以让你快速、简便地进行数据处理和分析可以让你快速、简便地进行数据处理和分析.7第四章第四章 随机抽样和抽样分布随机抽样和抽样分布 4.1 4.1 抽样的基本概念和方法抽样的基本概念和方法8一、总体一、总体(Population)与个体与个体(Sample)一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象.研究某批灯泡的质量研究某批灯泡的质量总体总体-研究对象的全体(或集合)。研究对象的全体(或集合)。总体总体个体个体-总体中每个对象(或元素)。总体中每个对象(或元素)
7、。每个个体具有的数量指标的全体就是总体每个个体具有的数量指标的全体就是总体.总体通常以一总体通常以一个概率分布描述。个概率分布描述。9实例实例 研究某地区研究某地区1212岁儿童生长发育情岁儿童生长发育情况况,总体和个体应为什么?总体和个体应为什么?显然,总体为该地区的全体儿童显然,总体为该地区的全体儿童 个体为每一个儿童。个体为每一个儿童。当然,衡量儿童生长发育情况要通过诸如身当然,衡量儿童生长发育情况要通过诸如身高、体重等数量指标进行,所以对总体的研究实高、体重等数量指标进行,所以对总体的研究实际上是对该地区的全体儿童的这些指标值概率分际上是对该地区的全体儿童的这些指标值概率分布进行研究。
8、布进行研究。10 根据研究指标的多少,总体分为根据研究指标的多少,总体分为一维总体一维总体-研究一项描述指标,常用随机变量研究一项描述指标,常用随机变量X X表示;表示;多维总体多维总体-研究多项描述指标,常用随机向量表示,研究多项描述指标,常用随机向量表示,如二维总体(如二维总体(X,YX,Y)。)。根据含个体数量多少,总体分为根据含个体数量多少,总体分为有限总体有限总体和和无限总体无限总体。11二、简单随机样本二、简单随机样本(simple random samplesample)研究总体通常有两种方法:一是全面地观察研究总体通常有两种方法:一是全面地观察统计统计(普查普查),二是从总体中
9、抽取一部分个体观察,二是从总体中抽取一部分个体观察统计统计(抽样抽样)。抽样抽样(samplingsampling)从总体中抽取部分个体的过程。从总体中抽取部分个体的过程。从国产轿车中抽从国产轿车中抽5 5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5样本样本(samplesample)在一维总体中在一维总体中,抽取得到的抽取得到的n n个体。个体。样本容量样本容量(sample Sizesample Size)样本中所含个体的样本中所含个体的数量数量。12注意注意:(:(1 1)一维总体的每个个体的描述指标)一维总体的每个个体的描述指标常用一个随机变量表达,所以容量为常用一个随机变量
10、表达,所以容量为n n的样本的样本一般用一般用n n个随机变量个随机变量X X1 1,X,X2 2,X,Xn n 表达。表达。(2 2)一维总体)一维总体X X的取值,是每个个体对应的指的取值,是每个个体对应的指标数据标数据x x;而样本而样本X X1 1,X,X2 2,X,Xn n的取值,是指每抽取一的取值,是指每抽取一次样本所对应次样本所对应n n个个体的指标数据,称为个个体的指标数据,称为样本观样本观察值察值(简称(简称样本值样本值),记作),记作x x1 1,x,x2 2,x,xn n。13总体、样本、样本值的关系:总体、样本、样本值的关系:总体总体(理论分布)(理论分布)?样本样本
11、样本值样本值样本是联系二者的桥梁样本是联系二者的桥梁14简单随机样本简单随机样本在随机抽样中,在随机抽样中,与总体与总体X X有相同有相同概率分布,且相互独立的样本概率分布,且相互独立的样本X X1 1,X,X2 2,X,Xn n 。简单随机样本的性质简单随机样本的性质:1 1、随机性随机性 X Xi i的取每个个体的的取每个个体的概率相等概率相等。2 2、独立性独立性 X X1 1,X,X2 2,X,Xn n的的相互独立相互独立,其样本,其样本观察值互不影响。观察值互不影响。3 3、代表性代表性 X X1 1,X,X2 2,X,Xn n与总体与总体X X有有相同概率分布相同概率分布。后面提到
12、的样本如不说明,都是指简单随机样本。后面提到的样本如不说明,都是指简单随机样本。15 一般地一般地,对有限总体,应采用有放回抽样,对有限总体,应采用有放回抽样,对无限总体(或数量较多),可采用无放回抽对无限总体(或数量较多),可采用无放回抽样(近似看作有放回),否则违背独立性。样(近似看作有放回),否则违背独立性。简单随机抽样具体实施的方法:简单随机抽样具体实施的方法:抽签法抽签法随机数法随机数法16三、统计量三、统计量(Statistic)样本是对总体的代表和反映,抽样的目的是利用样本值样本是对总体的代表和反映,抽样的目的是利用样本值对总体进行统计推断。对总体进行统计推断。而对总体进行统计推
13、断,常根据需要的不同,利用样本而对总体进行统计推断,常根据需要的不同,利用样本构造一些包含所需要的多种信息的量,就是关于构造一些包含所需要的多种信息的量,就是关于样本样本X X1 1,X,X2 2,X,Xn n的一些函数,这些函数统称为统计量。的一些函数,这些函数统称为统计量。统计量实际上表示统计量实际上表示样本的数字特征样本的数字特征。若若X X1 1,X,Xn n为总体为总体X X的一个样本,的一个样本,g(Xg(X1 1,X,X2 2,X,Xn n)是一个是一个不包含任何未知参数不包含任何未知参数的函数,则的函数,则g(Xg(X1 1,X,Xn n)称)称为一个统计量。为一个统计量。统计
14、量定义统计量定义:17统计量的特点:统计量的特点:(1)(1)统计量是样本中统计量是样本中n n个随机变量个随机变量X X1 1,X,X2 2,X,Xn n的的函数,它是完全由样本决定的量,函数,它是完全由样本决定的量,仍是一个随机仍是一个随机变量变量。(2)(2)统计量统计量不包含任何未知参数不包含任何未知参数。18几种常用统计量:几种常用统计量:用于反映总体均值的信息用于反映总体均值的信息注意与总体数学期望的区别和联系。注意与总体数学期望的区别和联系。用于反映总体方差的信息用于反映总体方差的信息 注意与总体方差的区别和联系。注意与总体方差的区别和联系。分母为分母为n-1n-1的原因的原因:
15、1920SD与与SE的区别的区别:SD是描述个体观察值变异程度的大小,样本标准差越是描述个体观察值变异程度的大小,样本标准差越小,样本均数对一组样本观察值的小,样本均数对一组样本观察值的代表性代表性就越好;就越好;SE是描述样本均数变异程度和是描述样本均数变异程度和抽样误差抽样误差的大小,样本标的大小,样本标准误越小,用样本均数估计总体均数的准误越小,用样本均数估计总体均数的可靠性可靠性就越高。就越高。在实际中,一般在实际中,一般用样本标准差与样本均数结合用样本标准差与样本均数结合,用于,用于描述样本观察值的分布范围;描述样本观察值的分布范围;样本标准误与样本均数结合,样本标准误与样本均数结合
16、,用于估计总体均数可能出现的范围。用于估计总体均数可能出现的范围。五、变异系数五、变异系数 见课本见课本P49P49案例4-121四、常用抽样方法四、常用抽样方法抽样方法就是获取样本的方法。抽样方法就是获取样本的方法。1、单纯随机抽样、单纯随机抽样 是一种是一种等概率抽样等概率抽样,即总体中每个个体都,即总体中每个个体都有相等的机会被抽取。有相等的机会被抽取。对有限总体,应采用对有限总体,应采用有放回有放回抽样,对无限总抽样,对无限总体(或数量较多),可采用无放回抽样(近似看体(或数量较多),可采用无放回抽样(近似看作有放回)。作有放回)。22 例例:从某年级:从某年级10001000名学生抽
17、查名学生抽查100100名调查上网情况名调查上网情况 该法是其他抽样方法的基础该法是其他抽样方法的基础。优点是均数及。优点是均数及标准差(误)计算简单,且抽得的样本是简单随标准差(误)计算简单,且抽得的样本是简单随机样本;缺点是总体量较大时,编号及随机抽取机样本;缺点是总体量较大时,编号及随机抽取工作量大。工作量大。把学号后把学号后4位作为编号,做成签,充分混合后,从中摸出位作为编号,做成签,充分混合后,从中摸出100个,则把这个,则把这100位同学作为样本。或用微机随机产生。位同学作为样本。或用微机随机产生。常用实施方法:抽签法和随机数法。常用实施方法:抽签法和随机数法。232、系统抽样(机
18、械抽样)、系统抽样(机械抽样)按按一定顺序和间隔一定顺序和间隔从总体中抽取样本的方法。从总体中抽取样本的方法。步骤:编号 分段 确定起始编号 获取样本 例例:从某年级:从某年级10001000名学生抽查名学生抽查100100名调查上网情况名调查上网情况 该法优点是简单易行,样本观察值在总体中分该法优点是简单易行,样本观察值在总体中分布均匀;缺点是样本观察值总按一定周期趋势得到,布均匀;缺点是样本观察值总按一定周期趋势得到,易产生偏性。易产生偏性。可把学号的后可把学号的后4位作为编号,把个位数位作为编号,把个位数0-9做成签,充分做成签,充分混合后,从中摸混合后,从中摸1个数(如摸得个数(如摸得
19、6),则把这),则把这1000位同学中位同学中个位数字为个位数字为6的的100位同学作为样本。位同学作为样本。243、分层抽样、分层抽样 按某种特征将总体分成若干互不重叠组别、按某种特征将总体分成若干互不重叠组别、类型或区域等(称为分层),再从各层中随机类型或区域等(称为分层),再从各层中随机抽样组成样本。抽样组成样本。例例:调查某校同学上网情况:调查某校同学上网情况 该法要求该法要求各层间差异尽可能大各层间差异尽可能大,才能得到有,才能得到有较好代表性的样本,并便于各层间分析比较。较好代表性的样本,并便于各层间分析比较。可采用以年级分层抽样的方法,但上面例子则不可采用以年级分层抽样的方法,但
20、上面例子则不适用,因差异较小。适用,因差异较小。254、整群抽样、整群抽样 先将总体分成若干互不重叠部分(称为群),先将总体分成若干互不重叠部分(称为群),再从各群中随机抽取某群或几群作为样本。再从各群中随机抽取某群或几群作为样本。例例:调查某年级学生上网情况:调查某年级学生上网情况 该法适用于大规模调查,易于组织,节省该法适用于大规模调查,易于组织,节省人力物力,但误差较大,适于人力物力,但误差较大,适于群体差异较小群体差异较小的的调查对象。调查对象。可把每班作为一群,从中随机抽取一班或几班作可把每班作为一群,从中随机抽取一班或几班作为样本。为样本。265、多阶段抽样、多阶段抽样 先将总体分
21、成若干互不重叠组,再将各先将总体分成若干互不重叠组,再将各组分成几个亚组,各亚组再分成几个小组等,组分成几个亚组,各亚组再分成几个小组等,每一分组看成一个阶段,然后在各阶段进行每一分组看成一个阶段,然后在各阶段进行随机抽样。随机抽样。实际中常采用二阶段抽样。实际中常采用二阶段抽样。注意:上述各种抽样方法中,注意:上述各种抽样方法中,只有只有单纯随机抽单纯随机抽样抽得的样本是简单随机样本。样抽得的样本是简单随机样本。而利用简单和非简单随机样本来推断总体而利用简单和非简单随机样本来推断总体的统计方法是不同的。的统计方法是不同的。27小小 结结1 1、基本概念基本概念:总体、个体、抽样、样本、样本总体、个体、抽样、样本、样本 容量、样本值、简单随机样本、统计量。容量、样本值、简单随机样本、统计量。2 2、常用、常用抽样方法抽样方法及特点。及特点。3 3、几种、几种常见统计量常见统计量.
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100