1、 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 193 页页 题目 与 课时题目 与 课时 第一节 总体与随机样本 第二节 统计量与经验分布函数 课时:1 教学目的 教学目的(1)理解总体、个体,样本和统计量、经验分布函数概念;(2)了解直方图的作法;(3)理解样本均值、样本方差的概念;理解样本均值、样本方差的概念;(4)掌握根据数据计算样本均值、样本方差的方法;掌握根据数据计算样本均值、样本方差的方法;(5)了解经验分布函数的概念和性质,会
2、根据样本值求经验分布函数.内容 内容 样本与简单随机样本,常用的统计量.教学重点 教学重点 解决办法 解决办法 对于简单随机样本、常用的统计量的定义要讲解清晰透彻,配备一定的例题与相关的习题.内容 内容 统计量,经验分布函数的定义.教学难点 教学难点 解决办法 解决办法 加大难点知识的分析,加大例题讲解力度.教学辅助 教学辅助 利用多媒体课件,板书配合分析.习题布置 习题布置 P147:1、2、4;P151:1、2.参考文献 参考文献 1 郑一,王玉敏,冯宝成.概率论与数理统计.大连理工大学出版社,2015 年 8 月.2 郑一,戚云松,王玉敏.概率论与数理统计学习指导书.大连理工大 学出版社
3、,2015 年 8 月.3 郑一,戚云松,陈倩华,陈健.光盘:概率论与数理统计教案 作业册 与试卷考题及答案、数学实验视频.大连理工大学出版社,2015 年 8 月.4 王玉敏,郑一,林强.概率论与数理统计教学实验教材.中国科学技术 出版社,2007 年 7 月.联系方式: 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 194 页页 教 学 内 容 教学笔记 教 学 内 容 教学笔记 内容简介内容简介 本次课,我们给出了数理统计中的一些最基本
4、的概念总体、个体、简单随机样本、样本均值、样本方差以及经验分布函数、直方图等.预备知识 预备知识 随机变量独立性及其充要条件,随机变量,算术平均,数学期望,方差,依概率收敛,分段函数等.第六章 数理统计的基本概念第六章 数理统计的基本概念 第一节 总体与样本 第一节 总体与样本 教师教学建议:(1)介绍实际情况的调查方法和抽样方法.(2)教学问题引入:1)如何科学合理地获取总体的有效信息?2)简单随机样本的分布是什么样的?一、总体 一、总体 在实际问题中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标).为此,我们进行一系列的随机试验,对这一数量指标进行检验或观察.我们把研究对象
5、的全体所构成的集合称为总体(总体(population),总体中的每个对象称为个体个体(individual).总体中所包含的个体的个数称为总体的容量总体的容量.容量有限的总体称为有限总体(有限总体(finite population),容量无限的总体称为无限总体(无限总体(infinite population).例如,考察5000只灯泡的质量,每只灯泡的寿命看作一个个体,所有5000只灯泡的寿命构成一个有限总体.在实际问题中,我们关心的并不是总体或个体本身,而是它们的某项数量指标 X(或某几项数量指标).每个个体所取的值一般是不相同的,但从整体来看,个体的取值却有一定的概率分布,因此数量指
6、标 X 是一个随机变量.这样,一个总体对应于一个随机变量 X.我们对总体的研究就是对一个随机变量 X 的研究,X 的分布函数和数字特征就称为总体的分布函数总体的分布函数和数字特征数字特征.我们对于总体与其对应的随机变量不加区分,统称为总体总体 X(population).也就是说,总体可以用一个随机变量 X 或其分布函数来描述.例如,研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,总体就可用描述灯泡寿命的随机变量 X 或用其分布函数 F(x)来表示.二、样本 二、样本 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案
7、第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 195 页页 我们给出以下的定义:定义 设定义 设 X 是具有分布函数是具有分布函数 F 的随机变量的随机变量.若若(1)12,nXXX与与 X 具有同一分布函数具有同一分布函数 F;(2);(2)12,nXXX相互独立,则称相互独立,则称12,nXXX为服从分布函数为服从分布函数 F(或来自总体(或来自总体 X)的简单随机样本)的简单随机样本,简称样,简称样本本(sample),),n 称为样本容量称为样本容量(sample size),它们的观察值),它们的观察值nxxx,21称为样本值称为样本值,又称为,又称为
8、 X 的的 n 个独立的观察值或实现值个独立的观察值或实现值.也可以将样本看成是一个 n 维随机向量维随机向量,写成(12,nXXX).称样本12,nXXX中的随机变量 Xk为第 k 个样本分量样本分量.例 如,样 本112,nXXX与212,nY YY独 立 就 是 指 随 机 向 量(112,nXXX)与(212,nY YY)独立.这样处理,就可以把多维随机变量概率分布的理论引用到数理统计学科.样本(12,nXXX)对应的样本值相应地写成 12(,).nx xx 若(nxxx,21)与12(,)ny yy都是对应于样本(12,nXXX)的样本值,一般来说它们是不相同的.讲评讲评 (1)简单
9、随机样本具有以下三个特征:1)随机性随机性 从总体中随机地抽取每一个个体,不能有选择性地抽取;2)同分布性同分布性 每个 Xi(i=1,2,n)与总体 X 有相同的分布;3)独立性独立性 每次抽样应独立进行,其结果相互不受影响.(2)简单随机样本的获得:1)在实际应用中,对于有限总体,采用放回抽样就能得到样本;2)当个体的总数 N 比要得到的样本的容量 n 大得多时,在实际中可将不放回抽样近似地当作放回抽样来处理,从而得到样本;3)至于无限总体,因抽取一个个体不影响它的分布,所以总是用不放回抽样得到样本.三、样本概率分布 三、样本概率分布 由 定 义 得 到:若12,nXXX是 从 总 体 F
10、 得 到 的 一 个 样 本,则12,nXXX相互独立,且它们的分布函数都是 F,因此得到:概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 196 页页 (1)样本样本12,nXXX的联合分布函数为的联合分布函数为 121(,)()nniiF x xxF x.(1.1)根据独立性的充要条件(第三章第三节定理 1),得到:(2)若若 X 是连续型总体且具有概率密度是连续型总体且具有概率密度 f(x),则 则nXXX,21的联合概率密度为 的联合概
11、率密度为 121(,)()nniif x xxf x.(1.2)(3)若若X是 离 散 型 总 体 且 具 有 分 布 律是 离 散 型 总 体 且 具 有 分 布 律()P Xxp x,则则nXXX,21的联合分布律为 的联合分布律为 11221,()nnniiP Xx XxXxp x.(1.3)讲评 讲评 (1.2)式和(1.3)式描述了来自连续型总体和离散型总体的样本的概率密度和分布律,以后经常会遇到,提示读者重视。例例6.1.1 设X1,X2,Xn是来自参数为14的指数分布总体X的简单随机样本,求 X1,X2,Xn的联合概率密度.解 解 已知总体 X 的概率密度为 41e,0,()40
12、,0.xxf xx 所以样本 X1,X2,Xn的联合概率密度为 124121()e,0,1,2,(,)40,nxxxninxinf x xx+,其它.讲评 讲评(1)通过这个例题,我们要学会样本联合分布函数(分布律或概率密度)的求法,实际上在求联合分布函数(分布律或概率密度)时就是充分利用了样本的相互独立性和同分布的充要条件.(2)注意:样本是由相互独立的同分布的随机变量组成的随机向量.思考题思考题 1.简单随机样本具有哪三条特性?2.样本和样本值的关系有哪些?写法上有什么区别?解题参考解题参考 1.简单随机样本的三条特性是:与总体同分布性,样本分量间相互独立性,抽取样本的随机性.概率论与数理
13、统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 197 页页 2.样本和样本值的关系有:样本是随机变量,是变化的;样本值是某个样本的实现值或观察值,是不变化的;写法上,样本用大写字母表示,样本值用小写字母表示.第二节 统计量、经验分布函数 第二节 统计量、经验分布函数 教师教学建议:(1)要求学生记住样本均值、样本方差和样本矩的定义公式,理解其实际意义或作用.(2)教学问题引入:1)通过样本构造哪些统计量?2)经验分布函数与总体理论分布的关系是怎样的?3)
14、怎样直观的观察数据的分布态势呢?一、统计量 一、统计量 定义定义 1 设 设12,nXXX是来自总体是来自总体X的一组样本,的一组样本,g g(12,nXXX)是)是12,nXXX的函数.若的函数.若g g中不含未知参数,则称中不含未知参数,则称g g(12,nXXX)是一个统)是一个统计量计量(statistics).因为12,nXXX都是随机变量,而统计量 g(12,nXXX)是随机变量的函数,因此统计量也是一个随机变量.设nxxx,21是相应于样本12,nXXX的样本值,则称12(,)ng x xx是12(,)ng XXX的观察值观察值.讲评讲评 统计量包含三个关键词:一是样本的函数,二
15、是不包含未知参数,三是是随机变量.下面给出几个常用的统计量,它们在以后的学习中经常被用到.定义定义 2 设 设12,nXXX是来自总体是来自总体 X 的一组样本,的一组样本,nxxx,21是这一样本的观察值.样本均值是这一样本的观察值.样本均值(sample mean)为 为 11niiXXn,(2.1)其观察值为 niixnx11;样本方差样本方差(sample variance)为为 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 198
16、页页 22221111()()11nniiiiSXXXnXnn,(2.2)其观察值为其观察值为 22221111()()11nniiiisxxxnxnn;样本标准差样本标准差为 为 2211()1niiSSXXn,(2.3)其观察值为其观察值为 niixxnss122)(11;样本样本k k阶(原点)矩阶(原点)矩为 为 11,1,2,nkkiiAXkn,(2.4)其观察值为 其观察值为 nikikxna11,2,1k;样本样本k k阶中心矩阶中心矩为为 11(),2,3,nkkiiBXXkn,(2.5)其观察值为其观察值为 nikikxxnb1)(1,2,3,k.讲评讲评 (1)上述统计量我
17、们在以后学习中会经常使用,读者应该熟练掌握计算公式.(2)关于样本中的上述概念要和总体的相应概念联系并对比学习,这样,才能理解透彻,掌握它们之间的关系,见下述定理 1.关于样本均值与样本方差的性质有如下常用定理.该定理是下一章介绍的矩法估计的理论基础.定理 设定理 设nXXX,21是来自总体是来自总体X的容量为的容量为n的样本.若总体的样本.若总体X(不论不论 X 服从什么分布)有期望服从什么分布)有期望()E X和方差和方差2()D X,则,则(1)()E X,2()D Xn;(2)22)(SE,221()nE Bn;(3)();PXn (4)2222,()PPSBn ;(5)若总体若总体X
18、的的k阶矩阶矩E(Xk)存在(记为存在(记为k),则当则当n时时,PkkA,2,1k;()n (6)若若 g 为连续函数为连续函数,则则12(,)Pkg A AA 12(,)kg(n).证证 我们只证明结论(4)与(5)及(6),其它结论请读者自证.概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 199 页页 因为12,nX XX是来自总体 X 的容量为 n 的样本,根据第三章第三节定理 3,所以22212,nXXX也是独立同分布随机变量,且
19、22()()()iiiE XD XE X22(1,2,).i 由第五章第一节定理 4 得 22211()().nPiinXn 又因为PX,由第五章第一节定理 2 得到22PX,所以 22211()niinBXXn 2121XXnnii2222P.因此,我们又得到 222()1PnBnSn.定理 1 的结论(4)成立.又因为nXXX,21独立且与 X 同分布,根据第三章第三节定理 3,得到knkkXXX,21独立且与 Xk同分布,故有 12()()()()kkkknkEEEE XXXX,从辛钦大数定律知 11nPkkikiAXn,2,1k.所以,定理 1 的结论(5)成立.由依概率收敛序列的性质
20、(第五章第一节定理 2)知结论(6)成立.例如,2222123123,2323.PPAAAA 讲评讲评 (1)定理 1 揭示了样本中的概念和总体的相应概念的联系;(2)定理 1 是下一章介绍的矩估计法的理论基础,提示读者深刻理解.二、经验分布函数 二、经验分布函数 我们还可以做出与总体分布函数 F(x)相应的统计量经验分布函数.定义定义 3 设设nxxx,21是总体是总体 F 的一组容量为的一组容量为 n 的样本观察值的样本观察值.对于任意的对于任意的(,)x ,以以 sn(x)表示样本表示样本nXXX,21的的 n 个观察值中不大于个观察值中不大于 x的个数的个数.记 记 ()()nnsxF
21、 xn,概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 200 页页 则则 Fn(x)叫做总体叫做总体 F 的经验分布函数的经验分布函数(empirical distribution function).例例 6.2.2 设总体 X 具有一组样本值 1,2,2,2,4,求 X 的经验分布函数.建议:学生自看.经验分布函数与总体分布函数有如下的关系:定理定理2(格利文科格利文科(Glivenko-Cantelli)定理定理)对于任一实数对于任一实
22、数x,当,当n时经验分布时经验分布 Fn(x)以概率以概率 1 一致收敛于总体分布函数一致收敛于总体分布函数 F(x),即,即 lim sup()()01nnxPF xF x.(2.6)本定理证明从略12.讲评讲评 该定理表明,对于任一实数x,当n充分大时,经验分布函数Fn(x)与总体分布函数F(x)只有微小的差别,因此在实际应用中经验分布函数Fn(x)可当作总体分布函数 F(x)来使用.思考题思考题 1.为什么提出统计量这一概念?理解这个概念应关注哪些关键词?2.如何理解定理 1 中各条结论的实际意义或作用?解题参考解题参考 1.提出统计量这一概念的目的在于:用不含任何未知参数的关于样本的某
23、个函数来研究总体的有关性质,进而对总体的概率分布规律进行统计推断.理解这个概念应关注:统计量是样本的函数,统计量不含任何未知参数,统计量是随机变量.2.定理 1 中各条结论的实际意义或作用包括:(1)()E X,2()D Xn讲样本均值的数学期望与方差分别同总体均值与方差的联系:样本均值的数学期望等于总体均值,样本均值的方差等于总体方差的 n 分之一.(2)22)(SE,221()nE Bn讲样本方差与样本二阶中心矩同总体方差的联系:样本方差的数学期望等于总体方差,样本二阶中心矩的数学期望等于总体方差乘以1nn.(3)()PXn 再讲样本均值同总体均值的联系:(1)中讲“样本均值的数学期望等于
24、总体均值”,这里讲“n 充分大时,样本均值依概率收敛于总体均值”.因此,可以用样本均值来分析总体均值的性质,用样本均值近似代替总体均值.(4)2222,()PPSBn 再讲样本方差与样本二阶中心矩同总体方差的联系:(2)中讲“样本方差的数学期望等于总体方差,样本二阶中心矩的数学期望等于总体方差乘以1nn”,这里讲“样本方差与样本二阶中心矩都是依概率收敛于总体方差”.因此,可以用样本方差或样本二阶中心矩来分析总体方差的性质,用样本方差或样本二阶中心矩近似代替总体方差.(5)若总体X的k阶矩E(Xk)存在(记为k),则当n时,PkkA,2,1k讲样本 k 阶矩同总体 k 阶矩的联系,是结论(3)的
25、一般情形:(3)中讲“样本均值依概率收敛于总体均值”,这里讲“样本 k 阶矩依概率收敛于总体 k 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 概率论与数理统计教案 第六章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社版 第 201 页页 阶矩(k=1,2,)”,k=1 时就是结果(3).因此,可以用样本 k 阶矩来分析总体 k阶矩的性质,用样本 k 阶矩近似代替总体 k 阶矩.这就是矩估计法的理论基础.(6)若 g 为连续函数,则1212(,)(,)()Pkkg A AAgn 讲样本k阶矩的连续函数与总体k阶矩的同一函数
26、关系的联系,是结论(5)的推广:这里讲“样本 k 阶矩的连续函数依概率收敛于总体 k 阶矩的同一函数表达式(k=1,2,)”.因此,可以用样本 k 阶矩的连续函数来分析总体 k 阶矩的同一函数的性质,用样本 k 阶矩的连续函数近似代替总体 k 阶矩的同一函数表达式.小 结 与 思 考 在相同条件下,对总体 X 进行 n 次重复的、独立的观察,从而我们得到 n 个结果nXXX,21,称随机变量nXXX,21为来自总体 X的简单随机样本,它有三条性质:(1)nXXX,21都与总体具有相同的分布;(2)nXXX,21相互独立;(3)样本nXXX,21是一个随机变量,或说随机向量.我们就是利用简单随机样本的信息来推断总体,从而得到有关总体分布的种种结论的.