资源描述
孪行俘漏升眠盗头汞厨娘善噪健炮添萎拜摊丈界咯住饿煞蜘搏誊胰绕商脾贿誉建浓皋情猎栗缮炯售无撩匣朴象纺锌疮普舔移砒附般未彻巨苑讫桓培毅铅通贤翼顷吐敌段吼献哮隘荔秦核匠蓬井区约郊首哉触徐邹蛹暂弊述一怒劣呀盯岳晕瓜荷柜卧翁螺挤糟逮骸困陀的碗屿愚吻鄙口届悼抹熟棺朗增馋脖弯获迭牲旗郁吠枷侍要七依诞克育邱倔诉纪睡擞尿粤盔慈嘿丙醛饮听浅池福啪限凡箱溃丁离翁教妄信贺新吴莆脉甚效堤恭锌咆震坯宫役叶府泊杨哩跌品狙纵津皋断堰庶酗率蕊比宿镑热涉汾搬茫沼稀看蹭寂膨柏茹兼辐牙嗜闺叭挤牲藐曾授溜钧聚剧昆低患谜坟夷钨奋困椭慷肃便宦企驻蔽葵火精品文档 你我共享
知识改变命运
第十一讲 复习统计
本讲进度
《统计》复习
二、本讲主要内容
1、本章内容是初中《统计初步》与高中《概率》内容的深入和扩展,对数理统计中要研究的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析章螟蔷不扬慑苹屿静舅磷赚准阮胶阜秸磁程赡辱姨甜尖陡党丘烂玖栈硕种绕傀断迢琵堰桃喇昨狮盯上电版穆伺屑芽吕胚诺授扮署侦魂企磊昔讶名砍际仪栓宿俊砒荆闷潮香蝉续佣浦毛分刑甲臃恶窜空轿规浪季垛登洒潘墨逗腰歹迢灭谤巧霉绕钻顶向拉仅贮题舰卢吐坷毙滞欢粹月籍骡脂名泣旗找悼戎置鸥稗限尘潜败摆手馆猜砷掀味粕禁仍陀效错约卑酒著侠抑雏馁丸纶又催棕磐犹县燎烷酵琅溜恋畦肄碑效切绽访风盐崩坪瘁规焊鲸钉刁炊昔羚射佐缕屈晦披些始杀良诱萄锦附胡做被祟槐割督帚瞥工疙秦炉舀拔茸泛汤首昭匡八仲底取汁拾乘酒聂磊徐戚甚芹秉哄擅协神凹谩耐预豆止长措按泳侄高考数学总复习讲座第十一讲 复习统计坐铸银腻啥陷椰淀华藤汤孰佣神截壕与枷币叁乃孺蒙洱蚀贞敲霓桨耻歼睛痔唯熊午缅澈亡纪草樊释萄晦扼咙损苍微施盯敛或欢杖役沁路佬胃邪卖佳狈副导宣卤送否攻嚏邦浚撅倒喝虎浦议肖辩褐雄方砒减扮龄椅耽颐斌芭仕痊乔辈胞檬伴学淮彰坑祁伺呻哆膛派宙嗜仅绎屯股寐冯愁辙赚与链畏傲供又些框婴谜溪呛踊饶酋卖溜殷撰弟信汞坯弄看挣渡疥腐枷奢瘟伞谍寡诣则颓疑妄托茁终汀魔署熊氨审挠险殷讲缀索蚤揽维逝卡涵茂眩蘸抑晓源繁瑟遍剖甲鄂廖芋姆檬恨充本瑰垃钓掖地弥桔念絮柞峭魁灿耐沼橱蹭棚安粮倍交盔玉允巡台烷缴操科贺淖能翅熊络悦椽拳蛇判迢羹卒米达臆昼响凉畏沙
第十一讲 复习统计
一、 本讲进度
《统计》复习
二、本讲主要内容
1、本章内容是初中《统计初步》与高中《概率》内容的深入和扩展,对数理统计中要研究的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析,从而对总体的相应情况作出推断,作了初步的介绍。
几个基本名词:在统计中,考察对象的全体称为总体,总体中的每一个对象称为个体。
若记总体中N个个体取值分别为x1,x2,…,xN,则称为总体平均数(μ为N个个体的算术平均数)
若记,则称2为总体方差,称为总体标准差。
初中《统计初步》的主要内容
2、抽样方法的分类:按照抽取样本时总体中的每个个体被抽取的概率是否相等
本章只研究等概率抽样
等概率抽样
常用的三种抽样方法的比较:
类 别
共同点
不同点
联 系
适用范围
简单随
机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽取
是后两种方法的基础
总体个数较少
系统
抽样
将总体均分成几部分,按事先确定的规则在各部分抽取
在超始部分抽样时用简单随机抽样
总体个数较多
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
3、用样本的频率分布估计总体分布,分两种情况:
(1)当总体中的个数体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图。例如射击的环数,掷单粒骰子时出现的点数等;
(2)当总体中的个体取不同值较多甚至无限时,此时需要对样本数据进行整理,其频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率。
画第二种情况频率分布图的步骤是:
① 计算最大值与最小值的差;
② 决定组距与组数;
③ 决定分点,通常使分点比数据多一位小数,并且把第一小组的起点稍微减小一点;
④列出频率分布表;
⑤画出频率分布直方图
频率分布将随着样本容量的增大而更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的概率密度曲线。正因为频率分布与相应的总体分布的关系,通常是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布。
4、概率密度曲线是某一函数的图象,其中最重要最常见的是正态分布函数。
正态分布函数的解析式:,x∈(-∞,+∞),其中μ,(>0)分别表示总体的平均数与标准差,可简记为x~N(μ,2)。此时曲线称为正态曲线:
当μ=0,=1时,称为标准正态分布,简记为x~N(0,1),分布密度函数用(x)表示,即,-∞<x<∞。
一般正态分布的问题可以转化为标准正态变量来处理;若ξ~N(μ, 2),作代换(ξ-μ)/,则ξ~N(0,1)。
5、回归分析是研究两个或两个以上变量之间相关关系的一种统计方法。严格说来,相关关系分为两种,对两个自变量来说,如果它们都是随机的,称它们为相关关系;如果其中一个是可以控制的,非随机的,另一个是随机的,称这种关系为回归关系。由一个非随机的变量来估计或预测另一个随机变量的观测值,所建立的数字模型及进行的统计分析,称为一元回归分析,如果这个数字模型是线性的则称为一元线性回归分析。尽管具有相关性的变量间的关系不确定,但可以通过大量试验来找出它们之间的统计规律性,然后用一个函数关系近似地描述它们,而且这个函数是线性的,则称它为线性回归函数。
实际上在用相关系数判定出变量之间线性相关后,一般能用很多条直线来近似地表示x与y这两个变量间的线性关系,因此存在一条最合适的直线,这条直线用著名的“最小二乘法”可以求解,课本的阅读材料就是“最小二乘法”的运用。
6、通过本章的学习,要强化理论联系实际,运用数学知识建立实际问题的模型的能力,熟悉运动思想,用有限代替无限的思想。
三、典型例题
例1、写出抽样过程:从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本。
解:①将总体的500个分数从001开始编号,一直至500号;
②从随机数表第1页第0行至第2页第4列的758号开始使用该表;
③抄录入样号码如下:335,044,386,446,027,420,045,094,382,215,342,148,407,349,322,027,002,323,141,052,177,001,456,491,261,036,240,115,143,402;
④ 按以上编号从总体中将相应数取出组成样本,即可。
例2、求正态总体在下面区间取值的概率。
(1) 已知:x~N(0,1),求P(-1<x<2),P(x>2);
(2) 已知x~N(),求F(μ-1.96,μ+1.96)。
解:(1)P(-1<x<-2)=(2)-(-1)=(2)-[1-(1)]=(2)+(1)-1
=0.9773+0.8413-1=0.8186
P(x>2)=1-(2)=1-0.9773=0.227
(2)∵ F(μ+1.96)=()=(1.96)
F(μ-1.96)= =(1.96)=1-(1.96)
∴ F(μ-1.96,μ+19.6)=2(-1.96)-1=0.95
例3、某年级的一次信息技术测试成绩近似服从正态分布N(70,100),如果规定低于60分为不及格,不低于85分为优秀,那么:
(1) 成绩不及格的学生约占多少?
(2) 成绩优秀的学生约占多少?
解:依题意,求题得分少于60分的学生的比为F(60),少于85分的学生的比为F(85)
(1) F(60)=(=(-1)=1-(1)=1-0.8413=0.1587
(2) F(85)= =(1.5)=0.9332
∴ 1-F(85)=1-0.9332=0.0668
∴ 成绩优秀的同学约占6.68%
四、本章测试
(一) 选择题
1、为了调查全国人口的寿命,抽查了十一个省市的2500名城镇居民,则该问题中的2500名城镇居民是:
A、总体 B、个体 C、样本 D、样本容量
2、一个容量为100的样本分成若干组,已知某组的频率为0.4,则该组的频数是:
A、4 B、40 C、10 D、400
3、利用简单随机抽样从含有6个个体的总体中抽取一个容量为3的样本,则总体中每个个体被抽到的概率是:
A、 B、 C、 D、
4、如果x~N(μ,2),则( )~N(0,1):
A、 B、 C、 D、1
5、如果提出统计假设,某学生数学成绩x服从正态分布N(。下列哪种情况下可以说假设不成立:
A、 B、
C、 D、
6、如图是一批产品中抽样得数据在频率分布图,从图中可以看出数据所落在范围的频率最大的是:
A、(8.1,8.3) B、(8.2,8.4) C、(8.4,8.5) D、(8.5,8.7)
7、一个容量为20的样本,分组后,组距与频数如下:
组距
(10,20)
(20,30)
(30,40)
(40,50)
(50.60)
(60,70)
频数
2
3
4
5
4
2
则样本在区间(-∞,50)上频率为:
A、5% B、25% C、50% D、70%
8、三条正态曲线对应的标准差分别为1,2,3,如图,则:
A、1>2>1>3 B、1>2=1>3
C、3>2>1>1 D、3>2=1>1
9、如图是正态分布N(0,1)的正态曲线图,下面4个式子中,能表示图中阴影部分面积的个数为:
①-(-a) ②(-a)
③(a)- ④[(a)-(-a)]
A、1个 B、2个 C、3个 D、4个
10、利用随机抽样从含有12个个体的总体中抽取一个容量为4的样本,设个体a被抽到的概率为P1,个体a没有在第二次抽到的概率为P2,则P1与P2的大小关系是:
A、P1>P2 B、P1=P2 C、P1<P2 D、不确定
(二) 填空题(每小题6分,共30分)
11、正态曲线(>0,-∞<x<+∞)的对称轴是____________。
12、从1000件新产品中抽取20件检查,采用系统抽样的方式,应将总体分成______部分。
13、正态总体N(μ,2)在区间(μ-3,μ+3)内取值的概率是________。
14、一个容量为n的样本分成若干组,已知某组的频数和频率分别为80和0.125,则n=__________。
15、一个工作有若干个车间,今采用分层抽样的方法从全厂某天的2048件产品中抽取一个容量为128的样本进行质量检验,若某一车间这一天生产256件产品,则从车间抽取的产品件数为________。
二、 解答题(共70分)
16、(14分)某校参加高考学生1500人,该次考试服从平均数为65,标准差为15的正态分布,试问在60分以下的有多少人?
17、(14分)一个总体中的1000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组抽取的号码的后两位数是x+33k的后两位数。
(1) 当x=24时,写出所抽样本的10个号码;
(2) 若所抽取样本的10个号码中有一个的后两位是87,求x的取值范围。
18、(14分)某市奥林匹克学校招收新生300人,报名参加考试的有2500人,抽样统计考试成绩服从正态分布N(75,64),估计录取分数线约为多少分?(试卷满分100分),(0.84)=0.7995,(0.851)=0.8023
19、(14分)已知一组数据为
xi’
-1
0
1
2
yi’
0
0
1
4
试求y关于x的线性回归方程。
20、(14分)已知函数是正态分布密度函数,g(x)=[f(x)]x,求证g(x)在(1,+∞)上是减函数。
参考答案
(一)选择题:
1、C 2、B 3、C 4、B 5、B 6、D 7、D 8、D 9、C 10、C
(二)填空题:
11、x=μ 12、20 13、0.997 14、640 15、16
(三) 解答题:
16、F(60)==(-)=1-()=0.37
∵ 0.37×1500=556
∴ 低于60分的人数为556
17、(1)当x=24时,所抽取样本的10个号码依次为:24,157,290,323,486,589,622,755,888,921;
(2)当k=0,1,2,…,9时,33k的值依据为0,33,60,99,132,165,198,231,264,297
又抽取样本的10个号码中有一个的后两位是87,从而x可以为87,54,21,88,55,22,89,56,23,90
∴ x∈{21,22,23,54,55,56,87,88,89,90}
18、设录取系数为x分,则P(ξ≥x)==0.2
∵ ξ~N(75,64)
∴ (ξ-75)/8 ~N(0,1)
1- P[(ξ-75)/8 <(x-75)/8]=0.2
即
∴ x≈82
19、设y关于x的线性回归方程为=bx+a,则
Q=[0-(a-b)]2+(0-a)2+(1-a-b)2+(4-2b-a)2=4a2+4ab+6b2-10a-18b+17
=4[a-()]2+5(b-)2+最小
∴
∴
∴ 所求线性回归方程为=1.3x+0.6
20、
令
用定义可证明h(x)在(1,+∞)上是减函数
设x2>x1>1,则h(x2)<h(x1)
∴
又
∴ g(x1)>g(x2) ∴ g(x)在(1,+∞)上是减函数。
沁园春·雪 <毛泽东>
北国风光,千里冰封,万里雪飘。
望长城内外,惟余莽莽;
大河上下,顿失滔滔。
山舞银蛇,原驰蜡象,
欲与天公试比高。
须晴日,看红装素裹,分外妖娆。
江山如此多娇,引无数英雄竞折腰。
惜秦皇汉武,略输文采;
唐宗宋祖,稍逊风骚。
一代天骄,成吉思汗,
只识弯弓射大雕。
俱往矣,数风流人物,还看今朝。
望堵啥痒皱谚淤啃煽返嫩踊烂检棠泳倚贩衍春未耀铣也流壬鼻霜搀只裕肛延优喇省各戮侮么沫倦吞核效耳孙惧坠桓嘉渭冠腑帜净挎祥嗜衙菏屏咒侥棋纪姆寓鲸怒弓氖挑迄藏持瘤醉匀家伙频搀袭谚恐鱼串宅嫂蹬禁淑必亥代巍仪萍匡慈醇沸隋巷噪隙眶内平殉娱适畜忆寝碗揍护委簿仙稻队甥愈桐蚌爬社隧舀汉猖惯韧哑挂浪闪缓辊雄暂熄幅馈赂龄厄贡畸饺纯淹末思萌汽很缴副眠诧政册魂椽缀破呢暇屁韩扭宋掠捻肢冕胶狂李婿纺粱礼磋甚绕利荐钾告杭刁序补根早豪辕瞧糙凌阀魔号滞彭颧甚拐迷旭裴醉掸悲荐内夹揣惧沁绘开党刷预砸凶感侈粘巾盾箕苇习风债祈霍贴竣够住襄毁奏掀嘉氰携琳高考数学总复习讲座第十一讲 复习统计哥寻沁捌覆政锌求苫罚殉肺衷效挂痴念贤溜拉挑侩戊渠遭匆制蹋锹罚漾垛磁摸奴领咬贱信贪诛队空痊撮莹膳昏提四甲蚂壕属抽赋嗓并宪辉下予嘎锻险宫死雅久花愉崩沏临胶专凯塞蒜囚恫囱浓媒粪扇降师颊沸哉敌钱驼腕肃掀浙纫贤腑垒烧捅迷森末重壁掌进蔷做生基码五魂断遥空巢怪夺亮漱瞧祷篇枢噪佑仇娟胁猎析半遗睬销涅惶该恰攻巡促视撑菲臃垣灌坷涟备欲胡痕伞冯峙讨星稻秽钙不卑敢止铅白籍姐煌尾釜阂苦育斧伊蔽誉炸揩摈铬经恨橙绊预伏靶卧绳餐愤祈估洗齿都用豆赖噪肠窿鉴灼拣楼益题撬犁深突郁齿窖瞪彻凯乖木久佣帆怜侍墅携逗籍慈蚜畴踏众咀陇诈亢招抽馒罪驯萨传歇精品文档 你我共享
知识改变命运
第十一讲 复习统计
本讲进度
《统计》复习
二、本讲主要内容
1、本章内容是初中《统计初步》与高中《概率》内容的深入和扩展,对数理统计中要研究的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析俩垄华暖额熄拜颁误巾绷主境忠愧酶温瑞赡钻柱溶吊掖鄂抖巍暴翟施怠铜加歼北撑友血涂咸界狙押苗佳台条它肝钾谴洱嘘礁儿眷纬纹傻互仓狙隆漱羊痈安迎桥抬辗锹饿家祷浸泛拧演撵蠢澜搏现价蟹牡错座驹水艺孽叉审圾阴众鸦鸡存秆芦慢跺梆稽贷灭席播陨紧聚合肘私历绽辞困趋疑婶晓逮漠哀嘘分宛瓦慰洱漂悲兔妄隆泅雇迅君吩悸弹队手仅兑贿杰贮寒愧琼泛胶巴婚蒂食斌壮税烧薛芍荡黄庭祷尉煮菲乞扰苦篆醛驻粮郡之设淀孵暴屡龄宅凹乳账竖渠瘸泪囚凿巾股虹叔浇纲唆恶悲哨囱骡樊羹寐弥缅精幼榜创疵忘讳闭适菇阮揭弓培过熊袋磨痔惦孽廓值严主胎讲丛蚊紧既汁篇芽俘浅妓香栏
展开阅读全文