1、第十一讲 复习统计一、 本讲进度统计复习二、本讲主要内容1、本章内容是学校统计初步与高中概率内容的深化和扩展,对数理统计中要争辩的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析,从而对总体的相应状况作出推断,作了初步的介绍。几个基本名词:在统计中,考察对象的全体称为总体,总体中的每一个对象称为个体。若记总体中N个个体取值分别为x1,x2,xN,则称为总体平均数(为N个个体的算术平均数)若记,则称2为总体方差,称为总体标准差。学校统计初步的主要内容2、抽样方法的分类:依据抽取样本时总体中的每个个体被抽取的概率是否相等本章只争辩等概率抽样等概率抽样常用的三种抽样方法的比
2、较:类 别共同点不同点联 系适用范围简洁随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取是后两种方法的基础总体个数较少系统抽样将总体均分成几部分,按事先确定的规章在各部分抽取在超始部分抽样时用简洁随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时接受简洁随机抽样或系统抽样总体由差异明显的几部分组成3、用样本的频率分布估量总体分布,分两种状况:(1)当总体中的个数体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图。例如射击的环数,掷单粒骰子时消灭的点数等;(2)当总体中的个体取不同值较多甚至无限时,此时需要对样本数据进行
3、整理,其频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率。画其次种状况频率分布图的步骤是: 计算最大值与最小值的差; 打算组距与组数; 打算分点,通常使分点比数据多一位小数,并且把第一小组的起点略微减小一点;列出频率分布表;画出频率分布直方图频率分布将随着样本容量的增大而更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演化成一条光滑曲线反映总体分布的概率密度曲线。正由于频率分布与相应的总体分布的关系,通常是从总体中抽取一个样本,用样本的频率分布去估量相应的总体分布。4、概率密度曲线是某一函数的图象,其中最重要
4、最常见的是正态分布函数。正态分布函数的解析式:,x(-,+),其中,(0)分别表示总体的平均数与标准差,可简记为xN(,2)。此时曲线称为正态曲线:当=0,=1时,称为标准正态分布,简记为xN(0,1),分布密度函数用(x)表示,即,-x。一般正态分布的问题可以转化为标准正态变量来处理;若N(, 2),作代换(-)/,则N(0,1)。5、回归分析是争辩两个或两个以上变量之间相关关系的一种统计方法。严格说来,相关关系分为两种,对两个自变量来说,假如它们都是随机的,称它们为相关关系;假如其中一个是可以把握的,非随机的,另一个是随机的,称这种关系为回归关系。由一个非随机的变量来估量或猜测另一个随机变
5、量的观测值,所建立的数字模型及进行的统计分析,称为一元回归分析,假如这个数字模型是线性的则称为一元线性回归分析。尽管具有相关性的变量间的关系不确定,但可以通过大量试验来找出它们之间的统计规律性,然后用一个函数关系近似地描述它们,而且这个函数是线性的,则称它为线性回归函数。实际上在用相关系数判定出变量之间线性相关后,一般能用很多条直线来近似地表示x与y这两个变量间的线性关系,因此存在一条最合适的直线,这条直线用有名的“最小二乘法”可以求解,课本的阅读材料就是“最小二乘法”的运用。6、通过本章的学习,要强化理论联系实际,运用数学学问建立实际问题的模型的力量,生疏运动思想,用有限代替无限的思想。三、
6、典型例题例1、写出抽样过程:从拥有500个分数的总体中用简洁随机抽样方法抽取一个容量为30的样本。解:将总体的500个分数从001开头编号,始终至500号;从随机数表第1页第0行至第2页第4列的758号开头使用该表;抄录入样号码如下:335,044,386,446,027,420,045,094,382,215,342,148,407,349,322,027,002,323,141,052,177,001,456,491,261,036,240,115,143,402; 按以上编号从总体中将相应数取出组成样本,即可。例2、求正态总体在下面区间取值的概率。(1) 已知:xN(0,1),求P(-1
7、x2);(2) 已知xN(),求F(,)。解:(1)P(-1x2)=1-(2)=1(2) F(+)=()=(1.96)F()= =(1.96)=1-(1.96) F(,)=2(-例3、某班级的一次信息技术测试成果近似听从正态分布N(70,100),假如规定低于60分为不及格,不低于85分为优秀,那么:(1) 成果不及格的同学约占多少?(2) 成果优秀的同学约占多少?解:依题意,求题得分少于60分的同学的比为F(60),少于85分的同学的比为F(85)(1) F(60)=(=(-1)=1-(2) F(85)= = 1-F 成果优秀的同学约占6.68%四、本章测试(一) 选择题1、为了调查全国人口
8、的寿命,抽查了十一个省市的2500名城镇居民,则该问题中的2500名城镇居民是:A、总体 B、个体 C、样本 D、样本容量2、一个容量为100的样本分成若干组,已知某组的频率为,则该组的频数是:A、4 B、40 C、10 D、4003、利用简洁随机抽样从含有6个个体的总体中抽取一个容量为3的样本,则总体中每个个体被抽到的概率是:A、 B、 C、 D、4、假如xN(,2),则( )N(0,1):A、 B、 C、 D、15、假如提出统计假设,某同学数学成果x听从正态分布N(。下列哪种状况下可以说假设不成立:A、 B、C、 D、6、如图是一批产品中抽样得数据在频率分布图,从图中可以看出数据所落在范围
9、的频率最大的是:A、(8.1,8.3) B、(8.2,8.4) C、(8.4,8.5) D、(8.5,8.7)7、一个容量为20的样本,分组后,组距与频数如下:组距(10,20)(20,30)(30,40)(40,50)(5060)(60,70)频数234542则样本在区间(-,50)上频率为:A、5% B、25% C、50% D、70%8、三条正态曲线对应的标准差分别为1,2,3,如图,则:A、1213 B、12=13C、3211 D、32=119、如图是正态分布N(0,1)的正态曲线图,下面4个式子中,能表示图中阴影部分面积的个数为:-(-a)(-a)(a)-(a)-(-a)A、1个 B、2个 C、3个 D、4个10、利用随机抽样从含有12个个体的总体中抽取一个容量为4的样本,设个体a被抽到的概率为P1,个体a没有在其次次抽到的概率为P2,则P1与P2的大小关系是:A、P1P2 B、P1=P2 C、P10,-xx11,则h(x2)g(x2) g(x)在(1,+)上是减函数。6 / 6