资源描述
高三数学统计概念 方法 题型 易误点总结十二
十二.统 计
1.抽样方法:
(1)简单随机抽样(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总体中逐个抽取;
(2)分层抽样,主要特征分层按比例抽样,主要使用于总体中的个体有明显差异。
共同点:每个个体被抽到的概率都相等。
如(1)某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95。为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,把这种抽样记为A;某中学高中一年级有12名女排运动员,要从中选取3人调查学习负担的情况,把这种抽样记为B,那么完成上述两项调查应分别采用的抽样方法:A为_______,B为_____。
(2)从10名女生与5名男生中选6名学生参加比赛,如果按性别分层随机抽样,则组成此参赛队的概率为______;
(3)某中学有高一学生400人,高二学生300人,高三学生300人,现通过分层抽样抽取一个容量为n的样本,已知每个学生被抽到的概率为0.2,则n= _______;
(4)容量为100的样本拆分成10组,前7组的频率之和为0.79,而剩下的三组的频数组成等比数列,且其公比不为1,则剩下的三组中频数最大的一组的频率是______;
(5)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本,则某一个体“第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是______________;
(6)某班试用电子投票系统选举班干部候选人。全班k名同学都有选举权和被选举权,他们的编号分别为1,2,…,k,规定:同意按“1”,不同意(含弃权)按“0”,令,其中,则同时同意第1,2号同学当选的人数为 ( )
A. B.
C. D.
2.总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。一般地,样本容量越大,这种估计就越精确。总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图)。
提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,
小矩形的面积表示频率。
如(1)一个容量为20的样本数据,分组后组距与频数如下: (10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2;则样本在区间上的频率为( )
A.5% B.25% C.50% D.70%;
(2)已知样本:10 8 6 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 ,那么频率为0.3的范围是 ( )
A.5.5~7.5 B.7.5~9.5 C.9.5~11.5 D.11.5~13.5;
(3)观察新生儿的体重,其频率分布直方图如图1所示,则新生儿的体重在[2700,3000]的频率为_______;
(4)如图2是一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是_____;
分数
频率/组距
0
20
40
60
80
100
0.018
0.012
0.009
0.006
0.005
图2
O
2400
2700
3600
3300
3000
3900
体重(g)
0.001
图1
统计量
组别
平均分
方差
第1组
80
16
第2组
90
36
(5)对某电子元件进行寿命追踪调查,情况如下:
寿命(h)
100~200
200~300
300~400
400~500
500~600
个数
20
30
80
40
30
(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的概率
3、样本平均数: 。
如有一组数据:x1,x2,…,xn(x1≤x2≤…≤xn),它们的算术平均值为20,若去掉其中的xn,余下数据的算术平均值为18,则xn关于n的表达式为 。
4、样本方差:;
样本标准差:。
如(1)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环),如果甲、乙两人中只有1人入选,则入选的应是 ;
甲
10
8
9
9
9
乙
10
10
7
9
9
(2)已知实数的期望值为,方差为,,若,则一定有 ( )
A. B. C. D.与无法比较大小;
(3)某班40人随机平均分成两组,两组学
生一次考试的成绩情况如下表:则全班的平均
分为_______,方差为______;
提醒:若的平均数为,方差为,则的平均数为,方差为。
如已知数据的平均数,方差,则数据的平均数和标准差分别为 ( )
A.15,36 B.22,6 C.15,6 D.22,36
【巩固练习】:
1.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n的值为 A.640 B.320 C.240 D.160 【 】
2.某单位有老年人,中年人,青年人依次为25人,35人,40人,用分层抽样的方法抽取40人,则老、中、青的人数依次为 【 】
A.8,14,18 B.9,13,18 C.10,14,16 D.9,14,17
3.某人从湖中打了一网鱼,共m条,做上记号再放入湖中,数日后又打了一网鱼,共n条,其中k条有记号,估计湖中有鱼____条. 【 】
A. B.m· C.m·k· D.无法估计
0.3
0.1
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5.0
5.1
5.2
视力
4.为了解某校高三学生的视力情况,
随机地抽查了该校100名高三学生的视
力情况,得到频率分布直方图,如右,
由于不慎将部分数据丢失,但知道前4
组的频数成等比数列,后6组的频数成
等差数列,设最大频率为a,视力在4.6
到5.0之间的学生数为b,则a, b的值分
别为 【 】
A.0,27,78 B.0,27,83
C.2.7,78 D.2.7,83
5.设一组数据的方差是s2,将这组数据的每个数据都乘以10,所得到的一组新数据的方差是 A.0.1s2 B.s2 C.10s2 D.100s2 【 】
6.若样本x1+1,x2+1,…,xn+1的平均数是7,方差为2,则对于样本2x1+1,2x2+1,…,2xn+1,下列结论中正确的是 【 】
A.平均数是7,方差是2 B.平均数是14,方差是2
C.平均数是14,方差是8 D.平均数是13,方差是8
7.是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则下列各式正确的是 【 】
A.= B.= C.=a+b D.=
8.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为Z=(其中x是某位学生的考试分数,是该次考试的平均分,s是该次考试的标准差,Z称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此,又常常再将Z分数作线性变换转化成其他分数.例如某次学生选拔考试采用的是T分数,线性变换公式是T=40Z+60.已知在这次考试中某位考生的考试分数是85分,这次考试的平均分是70分,标准差是25,则该考生的T分数为___________.
分 组
平均成绩
标准差
第一组
90
6
第二组
80
4
9.某班40人随机分为两组,第一组18人,第二组22人,两组学生在某次数学检测中的成绩如下表,求全班的平均成绩和标准差.
10.有一个容量为100的样本,数据的分组及各组的频数如下:
[12.5,15.5],6;[15.5,18.5],16;[18.5,21.5],18;[21.5,24.5],22;
[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计数据小于30.5的概率.
11.下表为某体育训练队跳高成绩的分布,共有队员40人,成绩分为1~5五个档次,例如表中所示跳高成绩为4分,跳远成绩为2分的队员为5人。将全部队员的姓名卡混合在一起,任取一张,该卡片队员的跳高成绩为x,跳远成绩为y,设x,y为随即变量(注:没有相同姓名的
队员)
y
x
跳 远
5
4
3
2
1
跳
高
5
1
3
1
0
1
4
1
0
2
5
1
3
2
1
0
4
3
2
1
m
6
0
n
1
0
0
1
1
3
(1)求的概率及且的概率;(2)求的值;若y的数学期望为,求m,n的值.
[参考答案]
http://www.DearEDU.com
(答:分层抽样,简单随机抽样);(答:)(答:200)(答:0.16)(答:)(答:C)(答:D)(答:B)(答:0.3)(答:120)(答:(1)(2)略 (3)0.65)(答:)(答:甲)(答:B)(答:85,51)(答:B)
【巩固练习】
B C B A D D A 84
解:设全班的平均成绩为,全班成绩的方差为s2,
则s12=[(x12+x22+…+x182)-18×902]=36,
s22=[(x192+x202+…+x402)-22×802]=16.
∴=(90×18+80×22)==84.5,
s2=[(x12+x22+…+x182)+(x192+x202+…+x402)-40·2]
=[18×(36+8100)+22×(16+6400)-40×]
=(146448+141152-10×1692)
=×1990=49.75.
∴s=≈7.05.
评述:平均成绩应为总成绩除以总人数,而总成绩可由每组成绩之和求得. 解:(1)样本的频率分布表如下:
分 组
频 数
频 率
12.5~15.5
6
0.06
15.5~18.5
16
0.16
18.5~21.5
18
0.18
21.5~24.5
22
0.22
24.5~27.5
20
0.20
27.5~30.5
10
0.10
30.5~33.5
8
0.08
合 计
100
1.00
(2)频率分布直方图如下图.
(3)数据大于等于30.5的频率是0.08,∴小于30.5的频率是0.92.∴数据小于30.5的概率约为0.92.
探究:解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除组距得组数);(2)分别计算各组的频数及频率(频率=);(3)画出频率分布直方图,并作出相应的估计.
11.解解:(1)当时的概率为……………2分
当且时的概率为…………4分
(2)……………………6分
,,,
因为y的数学期望为,所以………10分
于是,………………………12分
用心 爱心 专心 115号编辑 6
展开阅读全文