资源描述
课时作业(十九)
(第一次作业)
1.下列两个变量之间的关系不具有相关关系的是( )
A.小麦产量与施肥量
B.正方体的体积与表面积
C.蛋鸭产蛋个数与饲养天数
D.甘蔗的含糖量与生长期的日照天数
答案 B
解析 正方体的体积与表面积之间是函数关系,不是相关关系.
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求回归方程;
④求相关系数;
⑤根据所收集的数据绘制散点图.
若根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
答案 D
解析 由线性回归分析的步骤可知.
3.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )
A.身高一定是145.83 cm B.身高在145.83 cm以上
C.身高在145.83 cm以下 D.身高在145.83 cm左右
答案 D
解析 回归直线是用来估计总体的,所以我们求的值都是估算值,所以我们得到的结果也是近似的.只要把自变量的值代入回归直线方程即可求得结果为145.83 cm.
4.工人月工资y(元)依劳动生产率x(千元)变化的回归方程为y=50+80x,下列判断不正确的是( )
A.劳动生产率为1 000元时,工资约为130元
B.劳动生产率提高1 000元时,工资平均提高80元
C.劳动生产率提高1 000元时,工资平均提高130元
D.当月工资为210元时,劳动生产率约为2 000元
答案 C
解析 x=1千元时,=50+80×1=130.A正确,B、D叙述都正确,故C错.
5.(高考真题·湖南卷)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
答案 D
解析 D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79 kg.故D不正确.
6.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
答案 A
7.设有一个回归方程=2-1.5x,当变量增加1个单位时,则( )
A.y平均增加1.5个单位 B.y平均减少1.5个单位
C.y平均增加2个单位 D.y平均减少2个单位
答案 B
解析 ′=2-1.5(x+1)=2-1.5x-1.5=-1.5,即x增加1个单位时,y平均减少1.5个单位.故选B.
8.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算得:xi=52,yi=228,xi2=478,xiyi=1 849,则y与x之间的回归直线方程是( )
A.=11.47+2.62x B.=-11.47+2.62x
C.=2.62+22.47x D.=11.47-2.62x
答案 A
解析 =6.5,=28.5,
===2.62,
=- =28.5-2.62×6.5=11.47,
所以回归方程是=11.47+2.62x.
9.(高考真题·山东卷)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额约为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
答案 B
解析 由表可计算
==,==42,
因为点在回归直线=x+上,且=9.4,
所以42=9.4×+,解得=9.1.
故回归方程为=9.4x+9.1,令x=6,得=65.5,故选B.
10.某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为=105.492+42.569x.当成本控制在176.5元/t时,可以预计生产1 000 t钢中,约有________t钢是废品.
答案 16.68
解析 ∵176.5=105.492+42.569x,
∴x=1.668,即成本控制在176.5元/t时,废品率为1.668%.
∴生产1 000 t钢中,约有1 000×1.668%=16.68(t)钢是废品.
11.为了了解全球金融危机对市民生活的影响,对某地的某社区的10户家庭进行调查,这10户家庭的年收入和年饮食支出统计资料如下表:
年收入
x(万元)
2
4
4
6
6
6
7
7
8
10
年饮食支
出y(万元)
0.9
1.4
1.6
2.0
2.1
1.9
1.8
2.1
2.2
2.3
(1)作出散点图;
(2)根据数据,家庭年收入与年饮食支出之间是否具有线性相关关系?若是求出两个变量的回归方程.
解析
(1)散点图如右图.
(2)由散点图可知,年收入越高,年饮食支出越高,图中点的趋势表明两个变量间也确实存在着线性相关关系.
依题意可计算得:
=6,=1.83,2=36,=10.98,
xiyi=117.7,xi2=406,
=≈0.17,=- =0.81,
∴=0.17x+0.81.
∴所求的回归方程为=0.17x+0.81.
12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3.0
4.0
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标中画出回归直线.
思路 (1)描点作图.
(2)求出相关数据,,xi2,xiyi,并求出,.
解析 (1)散点图如下图.
(2)由表中数据,得xiyi=52.5,=3.5,=3.5,
xi2=54,
∴=0.7,∴=1.05,∴=0.7x+1.05.
回归直线如下图所示.
13.某种产品的广告费支出x与销售额y(单位均为百万元)之间有如下对应关系:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)根据散点图判断x与y是否相关,若相关,则求回归直线方程;
(3)若广告费支出为12百万元,则销售额大约为多少百万元?
思路 把广告费支出与销售额之间的关系用线性回归方程表示出来,然后根据它来预测要求的销售额.
解析 (1)散点图如图,由图中散点可以看出,它们分布在一条直线的附近,因而它们是线性相关的.
(2)由上述散点图可知x与y具有相关关系.列出下表.
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
xi2
4
16
25
36
64
故回归直线方程为y=6.5x+17.5.
(3)当x=12时,y=6.5×12+17.5=95.5,
即广告费支出为12百万元时,销售额大约为95.5百万元.
课时作业(二十)
(第二次作业)
1.下列各关系中,不属于相关关系的是( )
A.产品成本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
答案 B
2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如下图所示.由这个散点图可以判断( )
A.变量x与y正相关
B.变量x与y不相关
C.变量x与y负相关
D.变量x与y是函数关系
答案 C
3.(高考真题·陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是( )
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
答案 A
解析 由样本点的中心(,)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D错.
4.农民工月工资y(元)与劳动生产率x(千元)变化的回归直线方程为=50+100x,下列判断正确的是( )
A.劳动生产率为1 000元时,工资为150元
B.劳动生产率提高1 000元时,工资平均提高100元
C.劳动生产率提高1 000元时,工资平均提高150元
D.当月工资为250元时,劳动生产率为2 000元
答案 B
解析 由回归直线方程=50+100x知,x每增加1,y增加100,但要注意x的单位是千元,y的单位是元.
5.某考查团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有线性相关关系,回归方程=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72%
C.67% D.66%
答案 A
解析 将=7.675代入回归方程得=0.66×x+1.562=7.675,解得x≈9.262.
所以,人均消费额占人均工资收入的比例为≈0.83.
6.改革开放以来,我国高等教育事业迅速发展,为调查某省从1990年到2000年农村18岁到24岁的青年人每年考入大学的百分比,为便于统计,把1990年到2000年的年号依次编号为0,1,…,10作为自变量x,每年考入大学的百分比作为因变量y,进行回归分析,得回归直线方程=1.80+0.42x.
下列对数据解释正确的是( )
①每年升入大学的百分比为1.80
②升入大学的18岁到24岁的人数按大约每年0.42%的速度递增
③1990年升入大学的百分比约为1.80%,2000年升入大学的百分比约为6%
④从1990年到2000年升入大学的人数成等距离增加
A.①② B.①③
C.②④ D.②③
答案 D
解析 由=0.42表示回归直线=1.80+0.42x的斜率估值,=1.80表示截距,再结合在直线方程中斜率与截距的意义可得②③正确.
7.某单位为了解用电量y千瓦时与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(千瓦时)
24
34
38
64
由表中数据得线性回归方程=x+中≈-2,预测当气温为-4 ℃时,用电量约为________千瓦时.
答案 68
解析 ==10,
==40,
=- ≈40+2×10=60,
∴=-2x+60.当x=-4时,=-2×(-4)+60=68.
8.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x)和高一英语成绩(y)如下:
x
74
71
72
68
76
73
67
70
65
74
y
76
75
71
70
76
79
65
77
62
72
则由此得到的回归直线的斜率约为________.(保留到小数点后第2位)
答案 1.22
解析 求回归方程中的,按照公式进行即可,即需要依次计算出=71,xi2=50 520,=72.3,xiyi=51 467,所以=≈1.22,所以斜率为1.22.
9.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y(单位:μm)与腐蚀时间x(单位:s)之间相应的一组观察值如下表:
腐蚀时间x
5
10
15
20
30
40
50
60
70
90
120
腐蚀深度y
6
10
10
13
16
17
19
23
25
29
46
(1)画出表中数据的散点图;
(2)求回归方程;
(3)如果腐蚀时间为100 s,试预测此时的腐蚀深度.
解析 (1)散点图如下图所示.
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.
利用计算器求得回归方程为=0.304x+5.344.
(3)根据上面求得的回归方程,当腐蚀时间为100 s时,=0.304×100+5.344=35.744(μm),即此时的腐蚀深度大约是35.744 μm.
10.某市近10年的煤气消耗量与使用煤气户数的历史资料如下:
年份
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
用户(万户)
1
1.2
1.6
1.8
2
2.5
3.2
4
4.2
4.5
煤气消耗量
(百万立方米)
6
7
9.8
12
12.1
14.5
20
24
25.4
27.5
(1)检验是否线性相关;
(2)求回归方程;
(3)若政府下一步再扩大5 000煤气用户,试预测该市煤气消耗量将达到多少?
解析 (1)观察散点图可知,煤气消耗量与使用煤气户数两者线性相关(图略).
(2)经计算可求得其回归方程=6.057 3x+0.081 1.
(3)x0=4.5+0.5=5,代入得=30.37,所以,若政府下一步再扩大5 000煤气用户,该市煤气消耗量将达30.37百万立方米.
11.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出回归方程=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
解析 (1)散点图,如图所示.
(2)由题意,得
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
==4.5,==3.5,
xi2=32+42+52+62=86,
∴===0.7,
=- =3.5-0.7×4.5=0.35.
故线性回归方程为=0.7x+0.35.
(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,
故能耗减少了90-70.35=19.65(吨).
12.某班40名学生,按某课程的学习时数每8人为一组进行分组,其对应的学习成绩如下表:
学习时数(x小时)
学习成绩(y分)
10
40
14
50
20
60
25
70
36
90
试根据上述资料建立学习成绩y与学习时间x的直线回归方程(要求列表计算所需数据资料,写出公式和计算过程,结果保留两位小数).
解析 根据已知数据,可以计算出:==21,==62.
根据资料列表计算如下表:
学生
xi
yi
xi2
xiyi
A
10
40
100
400
B
14
50
196
700
C
20
60
400
1 200
D
25
70
625
1 750
E
36
90
1 296
3 240
合计
105
310
2 617
7 290
进而,可以求得
==≈1.89,
=62-1.89×21=22.31,所以,学习成绩y与学习时间x的直线回归方程为=1.89x+22.31.
1.(2019·课标全国Ⅰ,文)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
答案 C
解析 由已知将1 000名学生分成100个组,每组10名学生,用系统抽样方法,46号学生被抽到,所以第一组抽到6号,则被抽到的同学编号为:6+10n(n=0,1,2,3…),当被抽到的同学编号为8,此时n=0.2,故A不符合题意;当被抽到的同学编号为200时,此时n=19.4,故B不符合题意;当被抽到的同学编号为616时,此时n=61,n为整数,故C符合题意;当被抽到的同学编号为815时,此时n=80.9,故D不符合题意.选C.
2.(2019·课标全国Ⅱ,理)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
答案 A
解析 设9位评委评分按从小到大排列为x1<x2<x3<x4…<x8<x9.原始中位数为x5,去掉最低分x1,最高分x9后剩余x2<x3<x4<…<x8,中位数仍为x5,A正确;原始平均数=(x1<x2<x3<x4…<x8<x9),后来平均数′=(x2<x3<x4…<x8),平均数受极端值影响较大,所以与′不一定相同,B不正确;s2=[(x1-)2+(x1-)2+…+(xq-)2],s′2=[(x2-′)2+(x3-′)2+…+(x8-′])2,由②易知,C不正确;原极差=x9-x1,后来极差=x8-x2,显然极差变小,D不正确.故选A.
3.(2018·课标全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下图所示的饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
解析 方法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a,建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.
方法二:因为0.6<0.37×2.所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.故选A.
4.(2017·课标全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
答案 B
解析 标准差能够反映样本的总体情况.故选B.
5.(2017·山东,文)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
甲组
乙组
6
5
9
2
5
6
1
7
y
x
4
7
8
A.3,5 B.5,5
C.3,7 D.5,7
答案 A
解析 根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以=,解得x=3.故选A.
6.(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60
C.120 D.140
答案 D
解析 由频率分布直方图知,数据落在区间[22.5,30]的频率为2.5×(0.16+0.08+0.04)=0.7.故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.
7.(2015·山东,文)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③ B.①④
C.②③ D.②④
答案 B
解析 由茎叶图中的数据通过计算求得
甲==29,
s甲=
=;
乙==30,
s乙=
=.
∴甲<乙,s甲>s乙,故①④正确.选B.
8.(2019·江苏)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.
答案
解析 数据6,7,8,8,9,10的平均数是=8,则方差是=.
9.(2018·课标全国Ⅲ,文)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
答案 分层抽样
解析 因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.
10.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
答案 18
解析 应从丙种型号的产品中抽取60×=18(件).
11.(2015·湖北,文)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
答案 (1)3 (2)6 000
解析 (1)0.1×1.5+0.1×2.5+0.1×a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3;(2)消费金额在区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.
12.(2019·课标全国Ⅱ,文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的
分组
[-0.20,
0)
[0,
0.20)
[0.20,
0.40)
[0.40,
0.60)
[0.60,
0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
解析 (1)根据产值增长率频数分布表得,
所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2=[(-0.40)2×2+(-0.20)2×
24+02×53+0.202×14+0.402×7]=0.029 6,
s==0.02×≈0.17,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
13.(2019·课标全国Ⅲ,理)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、物质的量浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解析 (1)由已知得0.70=a+0.20+0.15,故a=0.35,
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
14.(2018·课标全国Ⅰ,文)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5.0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
解析 (1)频率分布直方图,如图所示.
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
1=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48(m3).
该家庭使用了节水龙头后50天日用水量的平均数为
2=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35(m3).
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
15.(2018·课标全国Ⅱ,文)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①: =-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②: =99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解析 (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为 =-30.4+13.5×19=226.1(亿元).
利用模型②,可得该地区2018年的环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(答出一种理由即可)
16.(2016·课标全国Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y与t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:yi=9.32,tiyi=40.17, =0.55,≈2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=-t.
解析 (1)由折线图中数据和附注中参考数据得
t=4, (ti-t)2=28, =0.55,
(ti-t)(yi-)=tiyi-tyi=40.17-4×9.32=2.89,∴r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得==≈0.103,
=-t≈1.331-0.103×4≈0.92.
所以,y关于t的回归方程为=0.92+0.10t,
将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
1.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
8
7 7
9
4 0 1 0 x 9 1
则7个剩余分数的方差为( )
A. B.
C.36 D.
答案 B
解析 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,x=4.s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
2.(2014·山东,理)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.
已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8
C.12 D.18
答案 C
解析 第一组和第二组的频率之和为0.4,故样本容量为=50,第三组的频率为0.36,故第三组的人数为50×0.36=18,故第三组中有疗效的人数为18-6=12.
3.(2014·重庆,理)已知变量x与y正相关,且由观测数据算得样本平均数=3,y=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
答案 A
解析 依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5),代入A、B得A正确.
4.(2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
答案 (1)0.004 4 (2)70
解析 (1)(0.001 2+0.002 4×2+0.003 6+x+0.006 0)×50=1⇒x=0.004 4.
(2)[1-(0.001 2+0.002 4×2)×50]×100=70.
5.(2012·浙江)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
答案 600
解析 根据样本的频率分布直方图,成绩小于60分的学生的频率为0.02+0.06+0.12=0.20,所以可推测3 000名学生中成绩小于60分的人数为600名.
6.(2014·课标全国Ⅱ,理)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
=,=-t.
解析 (1)由所给数据计算,得
t=×(1+2+3+4+5+6+7)=4,
=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-t)2=9+4+1+0+1+4+9=28,
(ti-t)(yi-)=(-3)×(-1.4)+(-
展开阅读全文