资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 统计 单元复习,第一课时,知识结构,统计,用样本估计总体,随机抽样,简单随机抽样,系统抽样,分层抽样,变量间的相关关系,用样本的频率,布估计总体分布,用样本的数字特征估计总体数字特征,线性回归分析,知识梳理,1.,简单随机抽样,(,1,)思想:,设一个总体有,N,个个体,从中,逐个不放回,地抽取,n,个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样,.,抽签法:,第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上,.,第二步,将号签放在一个容器中,并搅拌均匀,.,第三步,每次从中抽取一个号签,连续抽取,n,次,就得到一个容量为,n,的样本,.,(,2,)步骤:,随机数表法:,第一步,将总体中的所有个体编号,.,第二步,在随机数表中任选一个数作为起始数,.,第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满,n,个号码为止,就得到一个容量为,n,的样本,.,2.,系统抽样,(,1,)思想:,将总体分成均衡的,n,个部分,再按照预先定出的规则,从每一部分中抽取,1,个个体,即得到容量为,n,的样本,.,(,2,)步骤:,第一步,将总体的,N,个个体编号,.,第二步,确定分段间隔,k,,对编号进行分段,.,第三步,在第,1,段用简单随机抽样确定起始个体编号,.,第四步,按照一定的规则抽取样本,.,3.,分层抽样,(,1,)思想:,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,.,(,2,)步骤:,第一步,计算样本容量与总体的个体数之比,.,第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数,.,第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体,.,第四步,将各层抽取的个体合在一起,就得到所取样本,.,4.,频率分布表,(,1,)含义:,表示样本数据分布规律的表格,.,(,2,)作法:,第一步,求极差,.,第二步,决定组距与组数,.,第三步,确定分点,将数据分组,.,第四步,统计频数,计算频率,制成表格,.,5.,频率分布直方图,(,1,)含义:,表示样本数据分布规律的图形,.,(,2,)作法:,第一步,画平面直角坐标系,.,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度,.,第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形,.,6.,频率分布折线图,在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称为频率分布折线图,.,7.,总体密度曲线,当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,.,8.,茎叶图,作法:,第一步,将每个数据分为,“,茎,”,(高位)和,“,叶,”,(低位)两部分;,第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;,第三步,将各个数据的叶按大小次序写在茎右(左)侧,.,9.,众数、中位数和平均数,众数:,频率分布直方图最高矩形下端中点的横坐标,.,中位数:,频率分布直方图面积平分线的横坐标,.,平均数:,频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和,.,10.,标准差,11.,相关关系,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系,.,12.,散点图,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图,.,如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线,.,13.,回归直线,14.,回归方程,巩固练习,例,1,为了了解某地参加计算机水平测试的,5000,名学生的成绩,从中抽取了,200,名学生的成绩进行统计分析,在这个问题中,,5000,名学生成绩的全体是 (),A.,总体,B.,个体,C.,从总体中抽取的一个样本,D.,样本的容量,A,例,2,在,2002,年春季,一家著名的全国性连锁服装店,进行了一项关于当年秋季服装流行色的民意调查,.,调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色,“,投票,”,.,根据这次调查,在某大城市,A,,服装颜色的众数是红色,而当年全国服装协会发布的是咖啡色,.,(,1,)这个结果是否代表,A,城市的人的想法?,(,2,)你认为这两种调查的差异是由什么原因引起的?,(,1,)这个结果只能说明,A,城市中光顾这家连锁服装店的人,比其他人较少倾向于选择咖啡色,同时由于光顾连锁店的人是一种方便样本,不能代表,A,城市其他人的想法,.,(,2,)是由样本的代表性引起的,.,因为,A,城市的调查结果来自于该市光顾这家连锁服装店的人群,这个样本不能很好地代表全国民众的观点,.,例,3,某初级中学有学生,270,人,其中七年级,108,人,八、九年级各,81,人,现要利用抽样方法抽取,10,人参加某项调查,.,使用分层抽样时,将学生按七、八、九年级依次统一编号为,1,,,2,,,,,270,;使用系统抽样时,将学生随机编号为,1,,,2,,,,,270,,并将整个编号依次分为,10,段,.,如果抽到的号码有下列四种情况:,7,,,34,,,61,,,88,,,115,,,142,,,169,,,196,,,223,,,250,;,5,,,9,,,100,,,107,,,111,,,121,,,180,,,195,,,200,,,265,;,11,,,38,,,65,,,92,,,119,,,146,,,173,,,200,,,227,,,254,;,30,,,57,,,84,,,111,,,138,,,165,,,192,,,219,,,246,,,270.,那么下列判断正确的是 (),A.,都不能为系统抽样,B.,都不能为分层抽样,C.,都可能为系统抽样,D.,都可能为分层抽样,D,作业:,P100,复习参考题,A,组:,4,,,6,,,7.,
展开阅读全文