资源描述
1数理统计学数理统计学第一页,共二十八页。2 通过抽取总体中的部分通过抽取总体中的部分(样本样本)进行观察获得数据进行观察获得数据(抽样(抽样(chu yn)(chu yn)),并通过这些数据对总体进行推断。),并通过这些数据对总体进行推断。一、数理统计研究一、数理统计研究(ynji)(ynji)的问题的问题(1)(1)怎样设计试验,决定观察怎样设计试验,决定观察(gunch)(gunch)的数目;的数目;(2)(2)怎样利用试验观察的结果作出一个怎样利用试验观察的结果作出一个“好好”的推断等。的推断等。第一个问题是怎样进行抽样,使抽得的样本更合理第一个问题是怎样进行抽样,使抽得的样本更合理,并有并有更好的代表性?这是更好的代表性?这是抽样方法和试验设计抽样方法和试验设计问题问题.第二个问题是怎样从取得的样本去推断总体?这种推断具有多第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?这是大的可靠性?这是统计推断统计推断问题问题.第二页,共二十八页。3统计方法具有统计方法具有“部分部分(b fen)(b fen)推断整体推断整体”的特征的特征 .因为从一小部分样本观察值去推断全体对象(总体),即因为从一小部分样本观察值去推断全体对象(总体),即由部分推断全体。这里由部分推断全体。这里(zhl)(zhl)使用了使用了“归纳推理归纳推理”的方法,它的方法,它不不同于数学中的同于数学中的“演绎推理演绎推理”。归纳推理归纳推理(u n tu l)-根据观察到的大量个别情况,归纳推断总体。根据观察到的大量个别情况,归纳推断总体。演绎推理演绎推理-从一些假设、命题、已知的事实等出发,按一定的逻辑从一些假设、命题、已知的事实等出发,按一定的逻辑推理得出结果。推理得出结果。二、数理统计方法的特点二、数理统计方法的特点第三页,共二十八页。4 例如,在几何学中要证明例如,在几何学中要证明(zhngmng)(zhngmng)“等腰三角形底角相等等腰三角形底角相等”,只须从只须从“等腰等腰”这个前提出发,运用几何公理,一步一步推出这个前提出发,运用几何公理,一步一步推出这个结论这个结论.这是演绎推理。这是演绎推理。而一个习惯于统计思想的人,可能这样推理:而一个习惯于统计思想的人,可能这样推理:做很多大小形状不一的等腰三角形,实地测量其底角,做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得看差距如何,根据所得(su d)(su d)资料看看可否作出资料看看可否作出“底角相底角相等等”的结论的结论.这样做就是归纳式的方法这样做就是归纳式的方法.第四页,共二十八页。5 问题问题:用局部观察对总体下结论:用局部观察对总体下结论,有没有片面性?有没有片面性?结论结论(jiln)(jiln)是否可靠?是否可靠?显然这不仅显然这不仅依赖于进行局部观察的依赖于进行局部观察的“样本样本”是否具有总体是否具有总体的代表性的代表性,也,也依赖于对从这些样本得到数据的合理依赖于对从这些样本得到数据的合理(hl)(hl)加工、加工、分析分析并得出论断并得出论断.事实上,如果一切都建立在可靠的科学基础事实上,如果一切都建立在可靠的科学基础(jch)(jch)上,则上,则对总体下结论是可能的,也是可靠的对总体下结论是可能的,也是可靠的.但也应记住但也应记住,毕竟是由毕竟是由“局部局部”推断推断“整体整体”,因,因而仍可能犯错误,而仍可能犯错误,结论往往是在某个结论往往是在某个“可靠性水平可靠性水平”之下得出的之下得出的.第五页,共二十八页。6 概率论是数理统计的基础,而数理统计是概率论的重要应用概率论是数理统计的基础,而数理统计是概率论的重要应用(yngyng)(yngyng).但它们是并列的两个数学学科,并无从属关系。但它们是并列的两个数学学科,并无从属关系。学习数理统计学习数理统计(sh l tn j)(sh l tn j)无须把过多时间化在计算无须把过多时间化在计算上,可以更有效地上,可以更有效地把时间用在基本概念、方法原理及把时间用在基本概念、方法原理及方法适用对象的正确理解上方法适用对象的正确理解上.国内外著名的统计软件包:国内外著名的统计软件包:SASSAS,SPSSSPSS,STATSTAT等,都可以等,都可以(ky)(ky)让你快速、简便地进行数据处理和分析让你快速、简便地进行数据处理和分析.第六页,共二十八页。7第四章第四章 随机抽样随机抽样(chu yn)(chu yn)和抽样和抽样(chu(chu yn)yn)分布分布 4.1 4.1 抽样抽样(chu yn)(chu yn)的基本概念和方法的基本概念和方法第七页,共二十八页。8一、总体一、总体(zngt)(Population)与个体与个体(Sample)一个统计一个统计(tngj)(tngj)问题总有它明确的研究对象问题总有它明确的研究对象.研究某批灯泡的质量研究某批灯泡的质量总体总体(zngt)(zngt)-研究对象的全体(或集合)。研究对象的全体(或集合)。总体总体个体个体-总体中每个对象(或元素)。总体中每个对象(或元素)。每个个体具有的数量指标的全体就是总体每个个体具有的数量指标的全体就是总体.总体通常以一个总体通常以一个概率分布描述。概率分布描述。第八页,共二十八页。9实例实例 研究某地区研究某地区1212岁儿童生长发育情况岁儿童生长发育情况(qngkung)(qngkung),总体和个体应为什么?总体和个体应为什么?显然,总体为该地区的全体儿童显然,总体为该地区的全体儿童(r tng)(r tng)个体为每一个儿童。个体为每一个儿童。当然,衡量儿童生长发育情况要通过诸如身高、当然,衡量儿童生长发育情况要通过诸如身高、体重等数量指标进行体重等数量指标进行(jnxng)(jnxng),所以对总体的研究实际,所以对总体的研究实际上是对该地区的全体儿童的这些指标值概率分布进上是对该地区的全体儿童的这些指标值概率分布进行行(jnxng)(jnxng)研究。研究。第九页,共二十八页。10 根据研究根据研究(ynji)(ynji)指标的多少,总体分为指标的多少,总体分为一维总体一维总体-研究一项描述指标,常用随机变量研究一项描述指标,常用随机变量X X表示;表示;多维总体多维总体-研究多项描述指标,常用随机向量表示,研究多项描述指标,常用随机向量表示,如二维总体(如二维总体(X,YX,Y)。)。根据含个体数量根据含个体数量(shling)(shling)多少,总体分为多少,总体分为有限总体有限总体和和无限总体无限总体。第十页,共二十八页。11二、简单二、简单(jindn)随机样本随机样本(simple random samplesample)研究研究(ynji)(ynji)总体通常有两种方法:一是全面地总体通常有两种方法:一是全面地观察统计观察统计(普查普查),二是从总体中抽取一部分个体观,二是从总体中抽取一部分个体观察统计察统计(抽样抽样)。抽样抽样(samplingsampling)从总体从总体(zngt)(zngt)中抽取部分个体的过程。中抽取部分个体的过程。从国产轿车中抽从国产轿车中抽5 5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5样本样本(samplesample)在一维总体中在一维总体中,抽取得到的抽取得到的n n个体。个体。样本容量样本容量(sample Sizesample Size)样本中所含个体的样本中所含个体的数量数量。第十一页,共二十八页。12注意注意:(:(1 1)一维总体)一维总体(zngt)(zngt)的每个个体的描述指标的每个个体的描述指标常用一个随机变量表达,所以容量为常用一个随机变量表达,所以容量为n n的样本一般的样本一般用用n n个随机变量个随机变量X X1 1,X,X2 2,X,Xn n 表达。表达。(2 2)一维总体)一维总体X X的取值,是每个个体对应的指标数的取值,是每个个体对应的指标数据据x x;而样本而样本X X1 1,X,X2 2,X,Xn n的取值,是指每抽取一次样的取值,是指每抽取一次样本所对应本所对应n n个个体的指标数据,称为个个体的指标数据,称为样本观察样本观察(gunch)(gunch)值值(简称(简称样本值样本值),记作),记作x x1 1,x,x2 2,x,xn n。第十二页,共二十八页。13总体总体(zngt)、样本、样本值的关系:、样本、样本值的关系:总体总体(理论分布)(理论分布)?样本样本 样本值样本值样本是联系样本是联系(linx)(linx)二者的桥梁二者的桥梁第十三页,共二十八页。14简单随机样本简单随机样本在随机抽样中,在随机抽样中,与总体与总体(zngt)(zngt)X X有相同概有相同概率分布,且相互独立的样本率分布,且相互独立的样本X X1 1,X,X2 2,X,Xn n 。简单简单(jindn)(jindn)随机样本的性质随机样本的性质:1 1、随机性随机性 X Xi i的取每个个体的取每个个体(gt)(gt)的的概率相等概率相等。2 2、独立性独立性 X X1 1,X,X2 2,X,Xn n的的相互独立相互独立,其样本观察,其样本观察值互不影响。值互不影响。3 3、代表性代表性 X X1 1,X,X2 2,X,Xn n与总体与总体X X有有相同概率分布相同概率分布。后面提到的样本如不说明,都是指简单随机样本。后面提到的样本如不说明,都是指简单随机样本。第十四页,共二十八页。15 一般地一般地,对有限总体,应采用有放回抽样,对无对有限总体,应采用有放回抽样,对无限限(wxin)(wxin)总体(或数量较多),可采用无放回抽样总体(或数量较多),可采用无放回抽样(近似看作有放回),否则违背独立性。(近似看作有放回),否则违背独立性。简单简单(jindn)(jindn)随机抽样具体实施的方法:随机抽样具体实施的方法:抽签法抽签法随机数法随机数法第十五页,共二十八页。16三、统计三、统计(tngj)量量(Statistic)样本是对总体的代表和反映,抽样的目的是利用样本值对样本是对总体的代表和反映,抽样的目的是利用样本值对总体进行统计推断。总体进行统计推断。而对总体进行统计推断,常根据需要的不同,利用样本构造而对总体进行统计推断,常根据需要的不同,利用样本构造一些包含所需要的多种信息一些包含所需要的多种信息(xnx)(xnx)的量,就是关于的量,就是关于样本样本X X1 1,X,X2 2,X,Xn n的一些函数,这些函数统称为统计量。的一些函数,这些函数统称为统计量。统计量实际上表示统计量实际上表示样本的数字特征样本的数字特征。若若X X1 1,X,Xn n为总体为总体X X的一个样本,的一个样本,g(Xg(X1 1,X,X2 2,X,Xn n)是一个是一个不包含任何未知参数不包含任何未知参数的函数的函数(hnsh)(hnsh),则,则g(Xg(X1 1,X,Xn n)称)称为一个统计量。为一个统计量。统计量定义统计量定义:第十六页,共二十八页。17统计统计(tngj)(tngj)量的特点:量的特点:(1)(1)统计量是样本统计量是样本(yngbn)(yngbn)中中n n个随机变量个随机变量X X1 1,X,X2 2,X,Xn n的函数,它是完全由样本决定的量,的函数,它是完全由样本决定的量,仍是一个随机仍是一个随机变量变量。(2)(2)统计量统计量不包含不包含(bohn)(bohn)任何未知参数任何未知参数。第十七页,共二十八页。18几种几种(j zhn)(j zhn)常用统计量:常用统计量:用于反映总体均值用于反映总体均值(jn zh)的信息的信息注意与总体数学注意与总体数学(shxu)(shxu)期望的区别和联系。期望的区别和联系。用于反映总体方差的信息用于反映总体方差的信息 注意与总体方差的区别和联系。注意与总体方差的区别和联系。分母为分母为n-1n-1的原因的原因:第十八页,共二十八页。19第十九页,共二十八页。20SD与与SE的区别的区别(qbi):SD是描述个体观察值变异程度的大小,样本标准差越小,样本是描述个体观察值变异程度的大小,样本标准差越小,样本均数对一组样本观察值的均数对一组样本观察值的代表性代表性就越好;就越好;SE是描述样本均数变异程度和是描述样本均数变异程度和抽样误差抽样误差的大小,样本标准误的大小,样本标准误越小,用样本均数估计总体均数的越小,用样本均数估计总体均数的可靠性可靠性就越高。就越高。在实际中,一般在实际中,一般用样本标准差与样本均数结合用样本标准差与样本均数结合,用于描述样,用于描述样本观察值的分布范围;本观察值的分布范围;样本标准误与样本均数结合,样本标准误与样本均数结合,用于估计总用于估计总体均数可能出现的范围。体均数可能出现的范围。五、变异系数五、变异系数 见课本见课本(kbn)P49P49案例(n l)4-1第二十页,共二十八页。21四、常用四、常用(chn yn)抽样方抽样方法法抽样方法就是获取抽样方法就是获取(huq)(huq)样本的方法。样本的方法。1、单纯、单纯(dnchn)随机抽样随机抽样 是一种是一种等概率抽样等概率抽样,即总体中每个个体都有,即总体中每个个体都有相等的机会被抽取。相等的机会被抽取。对有限总体,应采用对有限总体,应采用有放回有放回抽样,对无限总体抽样,对无限总体(或数量较多),可采用无放回抽样(近似看作有(或数量较多),可采用无放回抽样(近似看作有放回)。放回)。第二十一页,共二十八页。22 例例:从某年级:从某年级10001000名学生抽查名学生抽查(chuch)(chuch)100100名调查上网情况名调查上网情况 该法是其他抽样方法的基础该法是其他抽样方法的基础。优点是均数及标准。优点是均数及标准差(误)计算简单,且抽得的样本是简单随机样本;差(误)计算简单,且抽得的样本是简单随机样本;缺点是总体缺点是总体(zngt)(zngt)量较大时,编号及随机抽取工作量量较大时,编号及随机抽取工作量大。大。把学号后把学号后4位作为编号,做成签,充分混合后,从中摸出位作为编号,做成签,充分混合后,从中摸出100个,则把这个,则把这100位同学位同学(tng xu)作为样本。或用微机随机产生。作为样本。或用微机随机产生。常用实施方法:抽签法和随机数法。常用实施方法:抽签法和随机数法。第二十二页,共二十八页。232、系统抽样(机械、系统抽样(机械(jxi)抽样)抽样)按按一定顺序和间隔一定顺序和间隔从总体从总体(zngt)(zngt)中抽取样本的方法。中抽取样本的方法。步骤:编号 分段 确定起始编号 获取样本 例例:从某年级:从某年级10001000名学生抽查名学生抽查(chuch)(chuch)100100名调查上网情况名调查上网情况 该法优点是简单易行,样本观察值在总体中分布均该法优点是简单易行,样本观察值在总体中分布均匀;缺点是样本观察值总按一定周期趋势得到,易产生匀;缺点是样本观察值总按一定周期趋势得到,易产生偏性。偏性。可把学号的后可把学号的后4位作为编号,把个位数位作为编号,把个位数0-9做成签,充分混合做成签,充分混合后,从中摸后,从中摸1个数(如摸得个数(如摸得6),则把这),则把这1000位同学中个位数字位同学中个位数字为为6的的100位同学作为样本。位同学作为样本。第二十三页,共二十八页。243、分层抽样、分层抽样 按某种特征将总体分成若干互不重叠按某种特征将总体分成若干互不重叠(chngdi)(chngdi)组组别、类型或区域等(称为分层),再从各层中随机别、类型或区域等(称为分层),再从各层中随机抽样组成样本。抽样组成样本。例例:调查:调查(dio ch)(dio ch)某校同学上网情况某校同学上网情况 该法要求该法要求各层间差异尽可能大各层间差异尽可能大,才能得到有较好代,才能得到有较好代表性的样本表性的样本(yngbn)(yngbn),并便于各层间分析比较。,并便于各层间分析比较。可采用以年级分层抽样的方法,但上面例子则不适用,因可采用以年级分层抽样的方法,但上面例子则不适用,因差异较小。差异较小。第二十四页,共二十八页。254、整群抽样、整群抽样(chu yn)先将总体先将总体(zngt)(zngt)分成若干互不重叠部分(称为群),分成若干互不重叠部分(称为群),再从各群中随机抽取某群或几群作为样本。再从各群中随机抽取某群或几群作为样本。例例:调查某年级学生上网:调查某年级学生上网(shn wn)(shn wn)情况情况 该法适用于大规模调查,易于组织,节省人该法适用于大规模调查,易于组织,节省人力物力,但误差较大,适于力物力,但误差较大,适于群体差异较小群体差异较小的调查对的调查对象。象。可把每班作为一群,从中随机抽取一班或几班作为样本。可把每班作为一群,从中随机抽取一班或几班作为样本。第二十五页,共二十八页。265、多阶段、多阶段(jidun)抽样抽样 先将总体分成若干先将总体分成若干(rugn)(rugn)互不重叠组,再将各互不重叠组,再将各组分成几个亚组,各亚组再分成几个小组等,每组分成几个亚组,各亚组再分成几个小组等,每一分组看成一个阶段,然后在各阶段进行随机抽一分组看成一个阶段,然后在各阶段进行随机抽样。样。实际中常实际中常(zhngchng)(zhngchng)采用二阶段抽样。采用二阶段抽样。注意:上述各种抽样方法中,注意:上述各种抽样方法中,只有只有单纯随机抽样单纯随机抽样抽得的样本是简单随机样本。抽得的样本是简单随机样本。而利用简单和非简单随机样本来推断总体的统而利用简单和非简单随机样本来推断总体的统计方法是不同的。计方法是不同的。第二十六页,共二十八页。27小小 结结1 1、基本概念基本概念:总体、个体、抽样、样本、样本总体、个体、抽样、样本、样本 容量、样本值、简单随机样本、统计量。容量、样本值、简单随机样本、统计量。2 2、常用、常用(chn yn)(chn yn)抽样方法抽样方法及特点。及特点。3 3、几种、几种常见统计量常见统计量.第二十七页,共二十八页。内容(nirng)总结数理统计学。(2)怎样利用试验观察的结果作出一个“好”的推断等。第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好的代表性。(2)一维总体X的取值,是每个个体对应的指标数据x。,Xn的一些函数,这些函数统称为统计量。例:从某年级1000名学生抽查100名调查上网情况。常用(chn yn)实施方法:抽签法和随机数法。3、几种常见统计量.第二十八页,共二十八页。
展开阅读全文