1、第3讲变量间的相关关系、统计案例基础巩固题组(建议用时:40分钟)一、选择题1(2021湖北七市(州)联考)为争辩语文成果和英语成果之间是否具有线性相关关系,统计两科成果得到如图所示的散点图(两坐标轴单位长度相同),用回归直线bxa近似地刻画其相关关系,依据图形,以下结论最有可能成立的是()A线性相关关系较强,b的值为3.25B线性相关关系较强,b的值为0.83C线性相关关系较强,b的值为0.87D线性相关关系太弱,无争辩价值解析依题意,留意到题中的相关的点均集中在某条直线的四周,且该直线的斜率小于1,结合各选项知,故选B.答案B2.设(x1,y1),(x2,y2),(xn,yn)是变量x和y
2、的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y的相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数肯定相同解析由样本的中心(,)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在1到0之间,故C错;分布在回归直线两侧的样本点的个数并不确定平均,无论样本点个数是奇数还是偶数,故D错答案A3(2022重庆卷)已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能是()
3、A.0.4x2.3 B.2x2.4C.2x9.5 D.0.3x4.4解析由于变量x和y正相关,则回归直线的斜率为正,故可以排解选项C和D.由于样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排解B,故选A.答案A4(2021郑州质量猜测)通过随机询问110名性别不同的同学是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110附表:P(2k0)0.0500.0100.001k03.8416.63510.828若由2算得27.8.参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B
4、有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析依题意,由于P(7.86.635)0.010,因此有99%以上的把握认为“爱好该项运动与性别有关”,故选A.答案A5(2022青岛复习检测)下列说法:将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;设有一个线性回归方程35x,变量x增加1个单位时,y平均增加5个单位;设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强;在一个22列联表中,由计算得2的
5、值,则2的值越大,推断两个变量间有关联的把握就越大其中错误的个数是()A0 B1 C2 D3解析方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故正确;在回归方程35x中,变量x增加1个单位时,y平均减小5个单位,故不正确;依据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r,|r|越接近于1,相关程度越强,故不正确;对分类变量x与y的随机变量的值2来说,2越大,“x与y有关系”的可信程度越大,故正确综上所述,错误结论的个数为2,故选C.答案C二、填空题6已知回归方程4.4x838.19,则可估量x与y的增长速度之比约为_解析x每增长1个单位,
6、y增长4.4个单位,故增长的速度之比约为14.4522.事实上所求的比值为回归直线方程斜率的倒数答案5227(2021嘉兴联考)为了推断高中三班级同学是否选修文科与性别的关系,现随机抽取50名同学,得到如下22列联表:理科文科男1310女720已知P(23.841)0.05,P(25.024)0.025.依据表中数据,得到24.844.则认为选修文科与性别有关系出错的可能性为_解析24.844,依据假设检验的基本原理,应当断定“是否选修文科与性别之间有关系”成立,并且这种推断出错的可能性约为5%.答案5%8某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和1
7、82 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法猜测他孙子的身高为_ cm.解析儿子和父亲的身高可列表如下:父亲身高173170176儿子身高170176182设线性回归方程为x,由表中的三组数据可求得1,且过中心点(173,176),故1761733,故线性回归方程为3x,将x182代入得孙子的身高为185 cm.答案185三、解答题9假设关于某设备的使用年限x(年)和所支出的修理费用y(万元)有如下表的统计资料:使用年限x(年)23456修理费用y(万元)2.23.85.56.57.0若由资料可知y对x呈线性相关关系,试求:(1)线性回归直线方程;(2)依据回归直线方程
8、,估量使用年限为12年时,修理费用是多少?解(1)列表i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x49162536904,5;90;iyi112.31.23,于是51.2340.08.所以线性回归直线方程为1.23x0.08.(2)当x12时,1.23120.0814.84(万元),即估量使用12年时,修理费用是14.84万元10(2021深圳调研)某企业通过调查问卷(满分50分)的形式对本企业900名员工的工作满足度进行调查,并随机抽取了其中30名员工(16名女员工,14名男员工)的得分,如下表:女4736
9、3248344443474641434250433549男3735344346363840393248334034(1)依据以上数据,估量该企业得分大于45分的员工人数;(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平均得分为“满足”,否则为“不满足”,请完成下列表格:“满足”的人数“不满足”的人数合计女16男14合计30(3)依据上述表中数据,利用独立性检验的方法推断,能否在犯错误的概率不超过1%的前提下,认为该企业员工“性别”与“工作是否满足”有关?参考数据:P(2k0)0.0500.0250.0100.001k03.8415.0246.63510.828解(1)从表中
10、可知,30名员工中有8名得分大于45分,所以任选一名员工,他(她)的得分大于45分的概率是,所以估量此次调查中,该单位约有900240名员工的得分大于45分(2)完成下列表格:“满足”的人数“不满足”的人数合计女12416男31114合计151530(3)假设H0:性别与工作是否满足无关,依据表中数据,求得28.5716.635,查表得P(26.635)0.010.能在犯错误的概率不超过1%的前提下,认为性别与工作是否满足有关力量提升题组(建议用时:25分钟)11已知x与y之间的几组数据如下表:x123456y021334假设依据上表数据所得线性回归直线方程x,若某同学依据上表中的前两组数据(
11、1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A.b,a B.b,aC.a D.b,a解析由题意可知,b2,a2,.,a,选C.答案C12有甲、乙两个班级进行数学考试,依据大于等于85分为优秀,85分以下非优秀统计成果,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计已知在全部105人中随机抽取1人,成果优秀的概率为,则下列说法正确的是()A列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C依据列联表中的数据,若按95%的牢靠性要求,能认为“成果与班级有关系”D依据列联表中的数据,若按95%的牢靠性要求,不能认为“成果与班级有关系”解析由
12、题意知,成果优秀的同学数是30,成果非优秀的同学数是75,所以c20,b45,选项A,B错误依据列联表中的数据,得到26.63.841,因此有95%的把握认为“成果与班级有关系”答案C13某医疗争辩所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23.918,经查对临界值表知P(23.841)0.05.对此,四名同学得出了以下的推断:p:在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感
13、冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,真命题的序号是_p綈q;綈pq;(綈p綈q)(rs);(p綈r)(綈qs)解析23.9183.841,在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”,即命题p正确,命题q,r,s均不正确对依次进行推断,可知正确答案14某中学争辩性学习小组,为了争辩高中同学的作文水平是否与爱看课外书有关系,在本校高三班级随机调查了50名同学调查结果表明:在爱看课外书的25人中有18人作文水平好,另外7人作文水平一般;在不爱看课外书的25人中有6人作文水平好,另外19人作文水平一般(1)试依据以上
14、数据完成以下22列联表,并运用独立性检验思想,指出有多大把握认为高中同学的作文水平与爱看课外书有关系;爱看课外书不爱看课外书总计作文水平好作文水平一般总计(2)将其中某5名爱看课外书且作文水平好的同学分别编号为1,2,3,4,5,某5名爱看课外书且作文水平一般的同学也分别编号为1,2,3,4,5,从这两组同学中各任选1人进行学习沟通,求被选取的2名同学的编号之和为3的倍数或4的倍数的概率参考公式:2,其中nn11n12n21n22.参考数据:P(2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828解(1)22列联表如下:爱看课外书不爱
15、看课外书总计作文水平好18624作文水平一般71926总计252550由于211.53810.828,由表知P(210.828)0.001,所以有99.9%的把握认为高中同学的作文水平与爱看课外书有关系(2)设“被选取的2名同学的编号之和为3的倍数”为大事A,“被选取的2名同学的编号之和为4的倍数”为大事B.则基本大事为123451(1,1)(1,2)(1,3)(1,4)(1,5)2(2,1)(2,2)(2,3)(2,4)(2,5)3(3,1)(3,2)(3,3)(3,4)(3,5)4(4,1)(4,2)(4,3)(4,4)(4,5)5(5,1)(5,2)(5,3)(5,4)(5,5)共25个,由于大事A所包含的基本大事为(1,2),(1,5),(2,1),(2,4),(3,3),(4,2),(4,5),(5,1),(5,4),共9个,所以P(A);大事B所包含的基本大事为(1,3),(2,2),(3,1),(3,5),(4,4),(5,3),共6个,所以P(B).由于大事A、B互斥,所以P(AB)P(A)P(B),即被选取的2名同学的编号之和为3的倍数或4的倍数的概率为.