1、 5 样样本与本与统计统计量量第五章第五章 样本与统计量样本与统计量第一节第一节 样本与统计量样本与统计量第二节第二节 数据的简单处理数据的简单处理第三节第三节 统计量的分布统计量的分布1.5 样样本与本与统计统计量量“没有统计没有统计,其它科学可以存在其它科学可以存在,但是很渺小但是很渺小.”“Statistics is the science for learning from data.”统计是统计是“关于收集和分析数据的科学与艺术关于收集和分析数据的科学与艺术/art”不列颠百科全书不列颠百科全书数据有随机性数据有随机性(带偶然误差带偶然误差);应用时有人的判断和主动性应用时有人的判断
2、和主动性(“艺术艺术”).关于统计的一些说法关于统计的一些说法2.5 样样本与本与统计统计量量统计研究的特点统计研究的特点:2.目的的总体性目的的总体性,手段的个体性手段的个体性统计学是一门研究收集数据统计学是一门研究收集数据,表现数据表现数据,分析数据分析数据,解释数据解释数据,从而认识数量规律的方法论科学从而认识数量规律的方法论科学./collect/present/analyze/interprete/methodological统计研究的特点统计研究的特点1.内容的数量性内容的数量性目的是找出由大量个体组成的整体的总体特征目的是找出由大量个体组成的整体的总体特征,但常但常常从观察个体数
3、量特征入手常从观察个体数量特征入手.统计总是用数字来表述事实统计总是用数字来表述事实.3.5 样样本与本与统计统计量量描述统计描述统计:对整体的调查和描述对整体的调查和描述.常用表和图常用表和图,计算特征量计算特征量(如平均值如平均值)等等.统计描述是统计描述是“社会经济统计学社会经济统计学”(属文科属文科)的主要内容的主要内容.推断统计推断统计:分析部分资料分析部分资料,推断出整体情况推断出整体情况.中心问题是减少误差中心问题是减少误差,降低出错的可能性降低出错的可能性.统计推断是统计推断是“数理统计数理统计”(属理科属理科)的主要内容的主要内容.统计的分类统计的分类/descriptive
4、 statistics/inferential statistics4.5 样样本与本与统计统计量量描述统计与推断统计的关系描述统计与推断统计的关系反映客反映客反映客反映客观现象观现象观现象观现象的数据的数据的数据的数据总体的数总体的数总体的数总体的数量规律量规律量规律量规律推断统计推断统计推断统计推断统计运用概率论分析样本信运用概率论分析样本信运用概率论分析样本信运用概率论分析样本信息息息息,对总体的数量特征对总体的数量特征对总体的数量特征对总体的数量特征进行估计和检验等进行估计和检验等进行估计和检验等进行估计和检验等.概率论概率论概率论概率论描述统计描述统计描述统计描述统计(数据的搜集数据
5、的搜集数据的搜集数据的搜集,整整整整理理理理,显示和分析等显示和分析等显示和分析等显示和分析等)总体数据总体数据样本数据样本数据统计学探索数量规律性的过程统计学探索数量规律性的过程统计学探索数量规律性的过程统计学探索数量规律性的过程5.5 样样本与本与统计统计量量引言引言 概率论的问题中概率论的问题中,随机变量的概率分布是已知的或假设随机变量的概率分布是已知的或假设是已知的是已知的,而一切计算与推理都是在这已知的基础上进行的而一切计算与推理都是在这已知的基础上进行的.但实际中但实际中,一个随机变量所服从的分布可能是完全不知道的一个随机变量所服从的分布可能是完全不知道的,或者知道其分布概型或者知
6、道其分布概型,但是其中的某些参数是未知的但是其中的某些参数是未知的.例如例如,某公路上车辆的速度服从的分布是未知的某公路上车辆的速度服从的分布是未知的;电视机的电视机的使用寿命服从的分布是未知的使用寿命服从的分布是未知的;产品是否合格服从两点分布产品是否合格服从两点分布,但参数但参数合格率合格率p是未知的是未知的.数理统计数理统计的任务是的任务是以概率论为基础以概率论为基础,根据试验所得到的数据根据试验所得到的数据,对研究对象的客观统计规律做出推断对研究对象的客观统计规律做出推断.数理统计所包含的内容十分丰富数理统计所包含的内容十分丰富,从第五章开始从第五章开始,我们学习我们学习数理统计的基础
7、知识数理统计的基础知识,介绍其中的介绍其中的参数估计参数估计,假设检验假设检验,方差方差分析分析,回归分析回归分析等内容等内容.第五章主要介绍数理统计的一些基本术语第五章主要介绍数理统计的一些基本术语,基本概念基本概念,重要重要的统计量及其分布的统计量及其分布,它们是后面各章的基础它们是后面各章的基础.6.5 样样本与本与统计统计量量第五章第五章 样本与统计量样本与统计量第一节第一节 样本与统计量样本与统计量第二节第二节 数据的简单处理数据的简单处理第三节第三节 统计量的分布统计量的分布7.5 样样本与本与统计统计量量 在数理统计中在数理统计中,研究对象的全体称为研究对象的全体称为总体总体或母
8、或母体体,而组成总体的每个单元称为而组成总体的每个单元称为个体个体.要了解总体的分布规律要了解总体的分布规律,往往从总体中抽取一往往从总体中抽取一部分个体进行观测部分个体进行观测,这个过程称为这个过程称为抽样抽样.在抽样过程中在抽样过程中,每抽取一个个体每抽取一个个体,就是对总体就是对总体X进行一次随机试验进行一次随机试验,所抽取的所抽取的n个个体个个体(X1,X2,Xn)称为总体称为总体X的一个的一个样本样本或子样或子样,其中所含的个体其中所含的个体数量数量n称为称为样本容量样本容量.样本样本(X1,X2,Xn)的观测数据的观测数据(x1,x2,xn)称为称为样本值样本值或子样观察值或子样观
9、察值.population/individual/sample/size/observed value8.5 样样本与本与统计统计量量常用的抽样是常用的抽样是简单随机抽样简单随机抽样,它满足它满足代表性代表性:子样子样(X1,X2,Xn)的每个分量的每个分量 Xi与总体与总体X具有相同的概具有相同的概率分布率分布.独立性独立性:各次抽样的结果互不影响各次抽样的结果互不影响.由简单随机抽样所得子样由简单随机抽样所得子样(X1,X2,Xn)称为称为简单随简单随机子样机子样,它是来自总体它是来自总体X,与总体与总体 X具有相同分布的具有相同分布的n个相互独立的随机变量个相互独立的随机变量./stat
10、istic.9.5 样样本与本与统计统计量量统计量统计量是样本是样本(X1,X2,Xn)的不含未知参数的的不含未知参数的连续函数连续函数 f(X1,X2,Xn).例例1 下列哪些是统计量下列哪些是统计量?其中其中 X1,X2,X3 是来自总体是来自总体 N(,2)的一个样本的一个样本,为已知为已知,2 为未知为未知.10.5 样样本与本与统计统计量量几个常用的统计量几个常用的统计量样本均值样本均值设设(X1,X2,Xn)是总体是总体X的一个样本的一个样本,样本方差样本方差sample mean/sample variance样本均方差或标准差样本均方差或标准差它们的观测值用相应的小写字母表示它
11、们的观测值用相应的小写字母表示.11.5 样样本与本与统计统计量量第五章第五章 样本与统计量样本与统计量第一节第一节 样本与统计量样本与统计量第二节第二节 数据的简单处理数据的简单处理第三节第三节 统计量的分布统计量的分布12.5 样样本与本与统计统计量量数据的简单处理数据的简单处理 抽样调查所得的原始数据往往杂乱抽样调查所得的原始数据往往杂乱无章无章,需要以一种需要以一种直观明了直观明了方式对数据进行加工方式对数据进行加工:数据整理数据整理;计算样本特征数计算样本特征数.数据整理数据整理:将数据分组将数据分组,计算各组频数计算各组频数;作频率分布作频率分布表表,作频率直方图作频率直方图.计算
12、样本特征数计算样本特征数:(1)反映趋势的特征数反映趋势的特征数样本均值样本均值 前述前述.中位数中位数:数据按大小顺序排列后数据按大小顺序排列后,位置居中的那个数位置居中的那个数 或居中的两个数的平均数或居中的两个数的平均数.众数众数:样本中出现最多的那个数样本中出现最多的那个数.13.5 样样本与本与统计统计量量(2)反映分散程度的特征数反映分散程度的特征数:样本方差样本方差,样本标准差样本标准差极差极差,四分位数四分位数,四分位差数四分位差数.极差极差 样本数据中最大值与最小值之差样本数据中最大值与最小值之差:R=M m.四分位数四分位数 将样本数据依概率分为四等份的将样本数据依概率分为
13、四等份的3个数椐个数椐,依次称为第一依次称为第一,第二第二,第三四分位数第三四分位数.第一四分位数第一四分位数Q1:PX Q1=0.25,第二四分位数第二四分位数Q2:PX Q1=0.50,第三四分位数第三四分位数Q3:PX set c1DATA 87 88 111 91 73 70 92 98 105 94 99 91 98 DATA 110 98 97 83 90 83 92 88 86 94 102 99 89 104 DATA 94 94 92 96 87 94 92 86 102 88 75 90 90 80 DATA 84 91 82 94 99 102 91 96 94 94 8
14、5 88 80 83 DATA 81 69 95 80 97 92 96 109 91 80 80 94 102 DATA 80 86 91 90 83 84 91 87 95 76 90 91 77 103DATA 89 88 85 95 92 104 92 95 83 86 81 86 91 89 83 DATA 96 86 75 92DATA endMTB describe c122.5 样样本与本与统计统计量量显示显示:N MEAN MEDIAN TRMEAN STDEVC1 100 90.300 91.000 90.322 8.288 SEMEAN MIN MAX Q1 Q3C1 0
15、.829 69.000 111.000 85.250 95.000中位数中位数第第1四分位数四分位数第第3四分位数四分位数23.5 样样本与本与统计统计量量 MTBCODE(67.5:72.49)70 (72.5:77.49)75 (77.5:82.49)80 (82.5:87.49)85 (87.5:92.49)90 (92.5:97.49)95 (97.5:102.49)100 (102.5:107.49)105 (107.5:112.49)110 C1 C2MTBTALLY C2;SUBCALL.将将C1数据列重新编码数据列重新编码,并保存到并保存到C2数据列数据列显示各列数据的频数显示
16、各列数据的频数,累计频数累计频数,频率频率,累计频率累计频率 24.5 样样本与本与统计统计量量C2 COUNTS CUMCNTS PERCENTS CUMPCENTS (频数频数)(累计频数累计频数)(频率频率)(累计频率累计频率)70 1 2 0.02 0.02 75 5 7 0.05 0.07 80 10 17 0.10 0.17 85 18 35 0.18 0.35 90 30 65 0.30 0.65 95 18 83 0.18 0.83100 10 93 0.10 0.93105 4 97 0.04 0.97110 3 100 0.03 1.00显示结果显示结果25.5 样样本与本
17、与统计统计量量第五章第五章 样本与统计量样本与统计量第一节第一节 样本与统计量样本与统计量第二节第二节 数据的简单处理数据的简单处理第三节第三节 统计量的分布统计量的分布26.5 样样本与本与统计统计量量l统计量统计量f(X1,X2,Xn)是样本是样本(X1,X2,Xn)的的不含未知参数不含未知参数的函数的函数,它本身是一个随机变量它本身是一个随机变量,其分布称为其分布称为抽样分布抽样分布.l正态总体是最常见的总体正态总体是最常见的总体,以下主要讨论正态以下主要讨论正态总体下的抽样分布总体下的抽样分布.l常识常识 若若 X1,X2,Xn 相互独立且相互独立且 Xi N(i,i2),则它们的线性
18、组合仍服从正态分布且则它们的线性组合仍服从正态分布且:例如例如,X1 X2 N(1 2,12+22).27.5 样样本与本与统计统计量量U分布分布正态总体样本均值的分布正态总体样本均值的分布 设总体设总体X N(,2),则样本均值服从正态分布则样本均值服从正态分布标准化标准化28.5 样样本与本与统计统计量量概率分布的分位数概率分布的分位数对总体对总体 X 和给定的和给定的 (0 30)时时,t分布近似于标准正态分布分布近似于标准正态分布.l但对较小的但对较小的n值值,t分布与标准正态分布之间有较大分布与标准正态分布之间有较大差异差异.且且 P|T|t0 P|X|t0,其中其中X N(0,1)
19、,即在即在t分布的分布的尾部尾部比在标准正态分布的尾部有较大的概率比在标准正态分布的尾部有较大的概率.lt 分布的数学期望与方差分布的数学期望与方差(补充补充):设设Tt(n),则则E(T)=0,D(T)=43.5 样样本与本与统计统计量量定理定理5.2 设设(X1,Xn)为来自正态总体为来自正态总体 X N(,2)的样本的样本,则统计量则统计量证证 由于由于 X 与与S 2相互独立相互独立,且且由由t分布的定义得分布的定义得herehere44.5 样样本与本与统计统计量量定理定理5.3 设设(X1,X2,Xn1)和和(Y1,Y2,Yn2)分别是分别是来自正态总体来自正态总体N(1,2)和和
20、N(2,2)的样本的样本,且它们且它们相互独立相互独立,则统计量则统计量其中其中两总体的样本方差两总体的样本方差.证证 略略.而而 S12,S22分别为分别为45.5 样样本与本与统计统计量量t 分布的上分布的上 分位数分位数 t(n)满足满足 f(t)tOt(n)图图5-7由于对称性由于对称性,t 分布的双侧分布的双侧 分分位数是位数是 t/2(n):f(t)tOt/2(n)/2/2 t/2(n)图图5-8(5.11)(5.12)46.5 样样本与本与统计统计量量在附表在附表4(P260)中给出了中给出了 t 分布的临界值表分布的临界值表.例如例如,当当 n=15,=0.05 时时,查查 t
21、 分布表得分布表得,t0.05(15)=1.753,t0.05/2(15)=2.131,其中其中t0.05/2(15)由由 Pt(15)t0.025(15)=0.025 查得查得.但当但当 n 45 时时,如无详细表格可查如无详细表格可查,可以用标准正态可以用标准正态分布代替分布代替t分布查分布查t(n)的值的值,即即t(n)u ,n 45.一般的一般的 t 分布临界值表中分布临界值表中,详列至详列至 n=30,当当 n 30 就用就用标准正态分布标准正态分布N(0,1)来近似来近似.47.5 样样本与本与统计统计量量定义定义5.5 设设 X 2(n1),Y 2(n2)且相互独立且相互独立,则
22、称则称服从第一自由度为服从第一自由度为n1,第二自由度为第二自由度为n2的的F分布分布,记为记为 FF(n1,n2).显然显然,若若XF(n1,n2),则则1/X F(n2,n1).概率密度函数概率密度函数其中其中其图形见图其图形见图5-9.(P108)(5.13)48.5 样样本与本与统计统计量量F分布的上分布的上 分位数或上侧临界值分位数或上侧临界值F(n1,n2),f(y)xO 图图5-10F(n1,n2)(5.14)F(n1,n2)的值可由的值可由F 分布表查得分布表查得.附表附表5,6,7,8,9(P262P276)分分 =0.1,0.05,0.025,0.01,0.005 给出给出
23、了了 F 分布的分布的上上 分位数分位数.例如例如,例如例如,查表查表(p271)得得F0.01(2,18)=6.01.附表中所列的附表中所列的 值都比较小值都比较小,当当 较大时较大时,可用公式可用公式 49.5 样样本与本与统计统计量量F分布的双侧分布的双侧 分位数分位数分别是上分别是上 1 /2 分位数和上分位数和上 /2 分位数分位数.f(y)xO/2/250.5 样样本与本与统计统计量量定理定理5.4 设设 n1,S12为正态总体为正态总体N(1,12)的样本容量的样本容量和样本方差和样本方差;n2,S22为正态总体为正态总体N(2,22)的样本容的样本容量和样本方差量和样本方差;且
24、两个样本相互独立且两个样本相互独立,则统计量则统计量证明证明 由定理由定理5.1且相互独立且相互独立,故由故由 F 分布的定义有分布的定义有51.5 样样本与本与统计统计量量52.5 样样本与本与统计统计量量正态总体样本均值的分布正态总体样本均值的分布设总体设总体 X N(,2),(X1,X2,Xn)是是 X 的一个样本的一个样本,则样本均值服从正态分布则样本均值服从正态分布53.5 样样本与本与统计统计量量 2分布分布设总体设总体 X N(0,1),(X1,X2,Xn)是是 X 的一个样本的一个样本,则统计量则统计量 2=X12+X22+Xn2 服从自由度为服从自由度为 n 的的 2 分布分
25、布:2 2(n).即即,标准正态总体的样本的分量的平方和服从自由度标准正态总体的样本的分量的平方和服从自由度为样本容量的为样本容量的 2 分分布布.54.5 样样本与本与统计统计量量t 分布分布设设 X N(0,1),Y 2(n),且且 X 与与 Y 相互独立相互独立,则则服从自由度为服从自由度为n的的t分布分布:T t(n).t-分布的密度函数的图形相似于标准正态分布的密分布的密度函数的图形相似于标准正态分布的密度函数度函数.当当 n 较大时较大时,t 分布近似于标准正态分布分布近似于标准正态分布.55.5 样样本与本与统计统计量量F 分布分布服从自由度为服从自由度为(n1,n2)的的 F
26、分布分布:F F(n1,n2).设设 X 2(n1),Y 2(n2),且且 X,Y 相互独立相互独立,则则56.5 样样本与本与统计统计量量定理定理5.1 设设(X1,Xn)为来自正态总体为来自正态总体 X N(,2)的样本的样本,则则(1)样本均值样本均值 X 与样本方差与样本方差S 2相互独立相互独立;(2)(5.8)定理定理5.2 设设(X1,Xn)为来自正态总体为来自正态总体 X N(,2)的样本的样本,则统计量则统计量57.5 样样本与本与统计统计量量定理定理5.3 设设(X1,X2,Xn1)和和(Y1,Y2,Yn2)分别是分别是来自正态总体来自正态总体N(1,2)和和N(2,2)的
27、样本的样本,且它们且它们相互独立相互独立,则统计量则统计量其中其中两总体的样本方差两总体的样本方差.而而 S12,S22分别为分别为58.5 样样本与本与统计统计量量定理定理5.4 设设 n1,S12为正态总体为正态总体N(1,12)的样本容量的样本容量和样本方差和样本方差;n2,S22为正态总体为正态总体N(2,22)的样本容的样本容量和样本方差量和样本方差;且两个样本相互独立且两个样本相互独立,则统计量则统计量59.5 样样本与本与统计统计量量 例例1 设总体设总体XN(0,1),X1,X2,Xn为简单随机为简单随机样本样本,试问下列统计量各服从什么分布?试问下列统计量各服从什么分布?解解
28、(1)因为因为XiN(0,1),i=1,2,n.所以所以X1-X2 N(0,2),故故t(2).60.5 样样本与本与统计统计量量 例例1 设总体设总体XN(0,1),X1,X2,Xn为简单随机为简单随机样本样本,试问下列统计量各服从什么分布?试问下列统计量各服从什么分布?续解续解(2)因为因为X1N(0,1),故故t(n-1).61.5 样样本与本与统计统计量量 例例1 设总体设总体XN(0,1),X1,X2,Xn为简单随机为简单随机样本样本,试问下列统计量各服从什么分布?试问下列统计量各服从什么分布?续解续解(3)因为因为所以所以F(3,n-3).62.5 样样本与本与统计统计量量例例2
29、若若Tt(n),问问T2服从什么分布?服从什么分布?解解 因为因为Tt(n),可以认为可以认为其中其中UN(0,1),V 2(n),U2 2(1),F(1,n).63.5 样样本与本与统计统计量量例例3 设总体设总体XN(,42),X1,X2,X10是是n=10简单简单随机样本随机样本,S2为样本方差为样本方差,已知已知PS2=0.1,求求 .解解 因为因为n=10,n-1=9,2=42,所以所以 2(9).又又PS2 =0.1,所以所以查查表表14.684.故故 14.684x26.10564.5 样样本与本与统计统计量量作业作业 P111习题五习题五 2,3,4,5,7,8题题65.5 样样本与本与统计统计量量作作 业业预习预习:参数的点估计参数的点估计 (样本数字特征法样本数字特征法、矩法估计、估计量的评选标准矩法估计、估计量的评选标准)66.
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100