1、教育资源 章末综合测评(三) 统计案例 (时间:120分钟,满分:150分) 一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.下列说法中错误的是( ) A.如果变量x与Y之间存在着线性相关关系,则我们根据试验数据得到的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近 B.如果两个变量x与Y之间不存在着线性关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程 C.设x,Y是具有相关关系的两个变量,且Y关于x的线性回归方程为=bx+a,b叫做回归系数 D.为使求出的线性回
2、归方程有意义,可用统计检验的方法来判断变量Y与x之间是否存在线性相关关系 【解析】 任何一组(xi,yi)(i=1,2,…,n)都能写出一个线性方程,只是有的无意义. 【答案】 B 2.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y 4.5 4 3 2.5 由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是=-0.7x+,则等于( ) A.10.5 B.5.15 C.5.2 D.5.25 【解析】 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得=5.25. 【答案】 D 3.
3、对变量x,Y由观测数据(xi,yi)(i=1,2,…,10)得散点图1①.对变量u,V由观测数据(ui,vi)(i=1,2,…,10)得散点图②.由这两个散点图可以判断( ) 图1 A.变量x与Y正相关,u与V正相关 B.变量x与Y正相关,u与V负相关 C.变量x与Y负相关,u与V正相关 D.变量x与Y负相关,u与V负相关 【解析】 由这两个散点图可以判断,变量x与Y负相关,u与V正相关,选C. 【答案】 C 4.在下列各量与量之间的关系中是相关关系的是( ) ①正方体的表面积与棱长之间的关系;②一块农田的小麦的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的
4、收入与支出之间的关系;⑤某家庭用水量与水费之间的关系. A.②③ B.③④ C.④⑤ D.②③④ 【解析】 ①⑤属于函数关系. 【答案】 D 5.设有一个线性回归方程为=-2+10x,则变量x增加一个单位时( ) A.y平均减少2个单位 B.y平均增加10个单位 C.y平均增加8个单位 D.y平均减少10个单位 【解析】 10是斜率的估计值,说明x每增加一个单位时,y平均增加10个单位. 【答案】 B 6.在吸烟与患肺病这两个事件是否相关的判断中,下列说法中正确的是( ) ①若χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在
5、100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01前提下,认为吸烟与患肺病有关系时,我们说若某人吸烟,则他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. A.① B.①③ C.③ D.② 【解析】 χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故①不正确;②中对“确定容许推断犯错误概率的上界”理解错误;③正确. 【答案】 C 7.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归
6、方程可能是( ) 【导学号:62980070】 A.=0.4x+2.3 B.=2x-2.4 C.=-2x+9.5 D.=-0.3x+4.4 【解析】 因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A. 【答案】 A 8.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据得到如下结论中正确的是( ) 说谎 不说谎 合计 男 6 7 13 女 8 9 17 合计 14 16 30 A.在此次调查中有9
7、5%的把握认为是否说谎与性别有关 B.在此次调查中有95%的把握认为是否说谎与性别无关 C.在此次调查中有99%的把握认为是否说谎与性别有关 D.在此次调查中没有充分证据显示说谎与性别有关 【解析】 由表中数据得χ2=≈0.002 42<3.841. 因此没有充分证据认为说谎与性别有关,故选D. 【答案】 D 9.甲、乙两个班级进行一门课程考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表: 优秀 不优秀 合计 甲班 10 35 45 乙班 7 38 45 合计 17 73 90 利用独立性检验估计,你认为推断“成绩与班级有关系”错误
8、的概率介于( ) A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7 【解析】 ∵χ2==≈0.652 7>0.455, P(χ2≥0.455)=0.5,故选B. 【答案】 B 10.以下是两个变量x和Y的一组数据: x 1 2 3 4 5 6 7 8 Y 1 4 9 16 25 36 49 64 则这两个变量间的线性回归方程为( ) A.=x2 B.= C.=9x-15 D.=15x-9 【解析】 根据数据可知每一个Y值对应一个x2值,故选A 【答案】 A 11.以下关于线性回归的判断,正确的个数是(
9、 ) ①若散点图中所有点都在一条直线附近,则这条直线为回归直线; ②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图2中的A,B,C点; ③已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69; ④回归直线方程的意义是它反映了样本整体的变化趋势. 图2 A.0 B.1 C.2 D.3 【解析】 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a,b得到的直线=bx+a才是回归直线, ∴①不对;②正确;将x=25代入=0.50x-0.81,解得=11.69,∴③正确;④正确. 【答案】
10、D 12.设某大学的女生体重y(单位:kg)与身高x(单位:cm)有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,下列结论中不正确的是( ) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 【解析】 由回归方程为=0.85x-85.71知y随x的增大而增大,所以y与x具有正的线性相关关系;由最小二乘法建立回归方程的过程知=x+=x+-(=-),所以回
11、归直线过样本点的中心(,);利用回归方程可以估计总体,D不正确. 【答案】 D 二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上) 13.已知一回归直线方程为=1.5x+45,x∈{1,5,7,13,19},则=________. 【解析】 因为=(1+5+7+13+19)=9,且=1.5+45,所以=1.5×9+45=58.5. 【答案】 58.5 14.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示: 积极支持企业改革 不赞成企业改革 合计 新军事变革全面发展始于。
12、工作积极 植物细胞教学设计第二课时54 40 材料科学概论试题94 工作一般 32 63 数学文化答案95 合计 86 103 教学质量综合测评189 对于人力资源部的研究项目,根据上述数据试求χ2的观测值为________. 改革开放的历史性标志是()。【解析】 根据列联表中的数据,得到χ2=≈10.76. 【答案】 10.76 15.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),求得回归方程=0.67x+54.9. 教师教材学生零件数x(个) 教学诊断10 探索发现生
13、命尔雅答案20 30 机械工程师工作内容40 50 加工时间Y(min) 62 75 81 89 现发现表中有一个数据模糊看不清,请你推断出该数据的值为________. 【导学号:62980071】 【解析】 由表知=30,设模糊不清的数据为m,则=(62+m+75+81+89)=,因为=0.67+54.9, 即=0.67×30+54.9, 解得m=68. 【答案】 68 16.某地区恩格尔系数Y(%)与年份x的统计数据如下表: 年份x 2019 2019 2019 2009 恩格尔系数Y(%) 47 45.5 43.5 41 从
14、散点图可以看出Y与x线性相关,且可得回归方程为=bx+4 055.25,据此模型可预测2019年该地区的恩格尔系数Y(%)为________. 【解析】 由表可知=2 007.5,=44.25. 因为=b +4 055.25, 即44.25=2 007.5b+4 055.25, 所以b≈-2,所以回归方程为=-2x+4 055.25,令x=2 015,得=25.25. 【答案】 25.25 三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) 17.(本小题满分10分)改革开放以来,我国高等教育事业有了迅速发展,有人记录了某村2019到2019年10年间
15、每年考入大学人数所占该年参加高考总人数的百分比,为了便于计算,把2019年编号为0,2019年编号为1,…,2019年编号为10.如果把每年考入大学人数占该年参加高考总人数的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线: 农村=0.42x+1.80; 县镇=2.32x+6.76; 城市=2.84x+9.50. (1)对于农村青年来讲,系数等于0.42意味着什么? (2)在这10年间,农村、县镇和城市哪一个的大学入学率增长最快? (3)预测2020年县镇的入学率是多少? 【解】 (1)0.42是回归直线的斜率,意味着对于农村考生,每年的入学率平均
16、增长0.42%. (2)城市对应回归直线的斜率最大,所以城市的年入学率增长最快. (3)y=2.32×14+6.76=39.24,故2020年县镇的入学率为39.24%. 18.(本小题满分12分)为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据: 成绩优秀 成绩较差 合计 兴趣浓厚 64 30 94 兴趣不浓厚 22 73 95 合计 86 103 189 学生的数学成绩好坏与对学习数学的兴趣是否有关? 【解】 由公式得:χ2=≈38.459. ∵38.459>6.635,∴有99%的把握说,学生的学习数学兴趣与数
17、学成绩是有关的. 19.(本小题满分12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价x(元) 8 8.2 8.4 8.6 8.8 9 销量y(件) 90 84 83 80 75 68 (1)求回归直线方程=x+,其中=-20,=-; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 【解】 (1)==8.5, =(90+84+83+80+75+68)=80. ∵=-20,=-, ∴=80+
18、20×8.5=250,∴回归直线方程=-20x+250. (2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-202+361.25, ∴该产品的单位应定为元,工厂获得的利润最大. 20.(本小题满分12分)对于表中的数据: x 1 2 3 4 y 1.9 4.1 6.1 7.9 (1)作散点图,你从直观上得到什么结论? (2)求线性回归方程. 【解】 (1)如图,x,y具有很好的线性相关性. (2)因为=2.5,=5,xiyi=60, x=30,y=120.04. 故b==2, a=-b =5-2×2.5=0, 故所求
19、的回归直线方程为=2x. 21.(本小题满分12分)某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. 图3 (xi-)2 (wi-)2 xi-)2(yi-) (wi-)2(yi-) 46.6 563 6.8 289.8 1.6 1469 108.8 表中wi=,=wi (1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?
20、给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利率z与x、y的关系为z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x为何值时,年利率的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线y=α+βu的斜率和截距的最小二乘估计分别为:=,=- . 【解】 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型. (2)令w=,先建立y关于w的线性回归方程.由于 ===68,
21、=-=563-68×6.8=100.6, 所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68. (3)① 由(2)知,当x=49时,年销售量y的预报值 =100.6+68=576.6, 年利润z的预报值 =576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z的预报值 =0.2(100.6+68)-x=-x+13.6+20.12. 所以当==6.8,即x=46.24时,取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 22.(本小题满分12分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机
22、抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图: 图4 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性. (1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关? 非体育迷 体育迷 合计 男 女 合计 (2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性, 若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率. 附:χ2=, P(χ2≥k)
23、0.05 0.01 k 3.841 6.635 【解】 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成2×2列联表如下: 非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计 75 25 100 将2×2列联表中的数据代入公式计算,得 χ2===≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关. (2)由频率分布直方图可知,“超级体育迷”为5人,其中女生为2人. 记“从‘超级体育迷’中取2人,至少有1名女性”为事件A. 则P(A)==, 即从“超级体育迷”中任意选取2人,至少有1名女性观众的概率为. 教育资源






