资源描述
专题跟踪检测(十一) 统计、统计案例
1.发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:
年份
2015
2016
2017
2018
2019
编号x
1
2
3
4
5
年光伏发电量(亿千瓦时)y
395
665
1 178
1 775
2 243
其中iyi=23 574,≈4 837.5,=1 251.2.
(1)请用相关系数r说明是否可用线性回归模型拟合年光伏发电量y与x的关系;
(2)建立年光伏发电量y关于x的经验回归方程,并预测2021年年光伏发电量(结果保留整数).
参考公式:相关系数r=,经验回归方程=x+中斜率和截距的最小二乘估计公式分别为=,=-.
解:(1)因为=(1+2+3+4+5)=3,
iyi=23 574,≈4 837.5,
=1 251.2,
所以相关系数r==≈0.993.
所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合.
(2)因为=12+22+32+42+52=55,
所以===480.6,=-=1 251.2-480.6×3=-190.6,
所以回归方程为=480.6x-190.6.
因为2021年所对应的年份编号为7,当x=7时,=480.6×7-190.6=3 173.6≈3 174,故预计2021年年光伏发电量为3 174亿千瓦时.
2.为了解国内不同年龄段的民众旅游消费基本情况,某旅游网站从其数据库中随机抽取了100条客户信息进行分析,这些客户一年的旅游消费金额如下表:
旅游消费/千元
[0,2)
[2,4)
[4,6)
[6,8)
[8,10)
[10,12]
合计
年轻人/人
9
10
9
7
3
2
40
中老年人/人
5
9
13
13
11
9
60
(1)分别估计年轻人和中老年人的旅游消费的平均数(同一组中的数据用该组区间的中点值作代表)(精确到0.01);
(2)把一年旅游消费金额满8千元的客户称为“高消费”,否则称为“低消费”.
①从这些“低消费”客户中随机选一人,估计该客户是年轻人的概率;
②完成2×2列联表,并判断能否有97.5%的把握认为旅游消费高低与年龄有关.
低消费
高消费
合计
年轻人
中老年人
合计
附:K2=,其中n=a+b+c+D.
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)由表格可知,年轻人旅游消费的平均数为
1×+3×+5×+7×+9×+11×=4.55(千元).
中老年人旅游消费的平均数为
1×+3×+5×+7×+9×+11×≈6.43(千元).
(2)①由表格可知,样本中“低消费”总客户数为100-5-20=75,
其中“低消费”的年轻人有9+10+9+7=35人.
所以随机选一人,该客户是年轻人的概率为=.
②2×2列联表如下:
低消费
高消费
合计
年轻人
35
5
40
中老年人
40
20
60
合计
75
25
100
因为K2=≈5.556>5.024,所以有97.5%的把握认为旅游消费高低与年龄有关.
3.某市从2020年5月1日开始,若电子警察抓拍到机动车不礼让行人的情况后,交警部门将会对不礼让行人的驾驶员进行扣3分,罚款200元的处罚,并在媒体上曝光.但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患和机动车通畅率降低的情况.交警部门在某十字路口根据以往的监测数据,得到行人闯红灯的概率为0.2,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯的情况进行统计,得到2×2列联表如下:
45岁以下
45岁以上
合计
闯红灯人数
25
未闯红灯人数
85
合计
200
近期,为了整顿“行人闯红灯”这一不文明的违法行为,交警部门在该十字路口试行了对闯红灯的行人进行5元以上,50元以下的经济处罚.在试行经济处罚一段时间后,交警部门再次从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯的情况进行统计,得到2×2列联表如下:
45岁以下
45岁以上
合计
闯红灯人数
5
15
20
未闯红灯人数
95
85
180
合计
100
100
200
将统计数据所得频率视为概率,完成下列问题:
(1)将2×2列联表填写完整(不需要写出填写过程),并根据表中数据分析,在试行对闯红灯的行人进行经济处罚前,是否有90%的把握认为闯红灯行为与年龄有关;
(2)在试行对闯红灯的行人进行经济处罚后,闯红灯现象是否有明显改善,请说明理由;
(3)结合调查结果,请你对“如何治理行人闯红灯现象”提出合理的建议(至少提出两条建议).
附:K2=,其中n=a+b+c+D.
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)由题意,可将2×2列联表填写完整如下:
45岁以下
45岁以上
合计
闯红灯人数
15
25
40
未闯红灯人数
85
75
160
合计
100
100
200
因为K2===3.125>2.706,所以有90%的把握认为闯红灯行为与年龄有关.
(2)在试行对闯红灯的行人进行经济处罚后,行人闯红灯的概率为=0.1,
而在试行对闯红灯的行人进行经济处罚前,行人闯红灯的概率为0.2,故在试行对闯红灯的行人进行经济处罚后,闯红灯现象有明显改善.
(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,故可以针对45岁以上人群开展“道路安全”宣传教育;②由于经济处罚可以明显降低行人闯红灯的概率,故可以在法律允许范围内进行适当的经济处罚.
4.某公司为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.
(xi-)2
(xi-)·
(yi-)
(ui-)2
(ui-)·(yi-)
15.25
3.63
0.269
2 085.5
-230.3
0.787
7.049
表中ui=,=i.
(1)根据散点图判断:y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y与印刷数量x的回归方程?(只要求给出判断,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(结果精确到0.01);
(3)若该图书每册的定价为9.22元,则至少应该印刷多少册才能使销售利润不低于80 000元?(假设能够全部售出,结果精确到1)
附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归方程=+ω的斜率和截距的最小二乘估计分别为=,=-.
解:(1)由散点图判断,y=c+更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程.
(2)令u=,先建立y关于u的线性回归方程,
由于==≈8.957≈8.96,
所以=-·=3.63-8.957×0.269≈1.22,
所以y关于u的线性回归方程为=1.22+8.96u,
所以y关于x的回归方程为=1.22+.
(3)假设印刷x千册,依题意得9.22x-x≥80,解得x≥11.12,所以至少印刷11 120册才能使销售利润不低于80 000元.
5.(2021·南通二模)网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数yi和时间第xi天间的数据,列表如下:
xi
1
2
3
4
5
yi
75
84
93
98
100
(1)由表中给出的数据是否可用线性回归模型拟合人数y与时间x之间的关系?若可用,估计8月10日到该专营店购物的人数(人数用四舍五入法取整数;若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合,计算r时精确到0.01).
(2)运用分层抽样的方法从第1天和第5天到该专营店购物的人中随机抽取7人,再从这7人中任取3人进行奖励,求这3人取自不同天的概率.
(3)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满100元可减10元;方案二,一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1 000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考数据:≈65.88.
参考公式:相关系数r=,经验回归方程的斜率=,截距=-.
解:(1)由表中数据可得=3,=90,(xi-)2=10,
(yi-)2=434,(xi-)(yi-)=64,
所以r==≈0.97>0.75,所以可用线性回归模型拟合人数y与时间x之间的关系.
而===6.4,
则=-=90-6.4×3=70.8,
所以=6.4x+70.8,令x=6,
可得=109.2≈109.
即8月10日到该专营店购物的人数约为109.
(2)因为75∶100=3∶4,所以从第1天和第5天取的人数分别为3和4,从而3人取自不同天的种数为
CC+CC,所以概率P==.
即这3人取自不同天的概率为.
(3)若选方案一,需付款1 000-100=900元.
若选方案二,设需付款X元,则X的取值可能为600,800,900,1 000,
则P(X=600)=C×3=,
P(X=800)=C×2×=,
P(X=900)=C××2=,
P(X=1 000)=C×3=,
所以E(X)=600×+800×+900×+1 000×=<900,因此选择方案二更划算.
展开阅读全文