1、变量间的相关关系、统计案例一、选择题1有五组变量:汽车的重量和汽车每消耗1升汽油所行驶的平均路程;平均日学习时间和平均学习成果;某人每日吸烟量和身体健康状况;圆的半径与面积;汽车的重量和每千米耗油量其中两个变量成正相关的是()A B C D解析 由变量的相关关系的概念知,是正相关,是负相关,为函数关系,故选C.答案 C2.通过随机询问110名不同的高校生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由附表:0050001000013841663510828参照附表,得到的正确结论是( )A 有99%以上的把握认为“爱好该项运动与性别有关”B 有
2、99%以上的把握认为“爱好该项运动与性别无关”C 在犯错误的概率不超过01%的前提下,认为“爱好该项运动与性别有关”D 在犯错误的概率不超过01%的前提下,认为“爱好该项运动与性别无关”解析 由,而,故由独立性检验的意义可知选A.答案A3在争辩吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A100个吸烟者中至少有99人患有肺癌B1个人吸烟,那么这人有99%的概率患有肺癌C在100个吸烟者中确定有患肺癌的人D在100个吸烟者中可能一个患肺癌的人也没有解析统计的结果只是说明大事发生可能性的大小,具体
3、到一个个体不愿定发生答案D4设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y的相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数确定相同解析由样本的中心(,)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在1到1之间,故C错;分布在回归直线两侧的样本点的个数并不确定平均,即无论样本点个数是奇数还是偶数,故D错答案A5某产品的广告费用x与销售额y的
4、统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954依据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元C67.7万元 D72.0万元解析3.5(万元),42(万元),429.43.59.1,回归方程为9.4x9.1,当x6(万元)时,9.469.165.5(万元)答案B6已知数组(x1,y1),(x2,y2),(x10,y10)满足线性回归方程bxa,则“(x0,y0)满足线性回归方程bxa”是“x0,y0”的()A充分不必要条件 B必要不充分条件C充要条件 D既不充分也不必要条件解析x0,y0为这10组数据的平均
5、值,又由于线性回归方程bxa必过样本中心(,),因此(,)确定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点答案B7在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成果,稳居世界金牌榜榜首,由此很多人认为中国进入了世界体育强国之列,也有很多人持反对意见有网友为此进行了调查,在参与调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力()A平均数与方差 B回归直线方程C独立性检验 D概率解析由于参与争辩的公民按性别被分成了两组,而
6、且每一组又被分成了两种状况:认为有关与无关,故该资料取自完全随机统计,符合22列联表的要求,故用独立性检验最有说服力答案C二、填空题8. 在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若全部样本点(xi,yi)(i=1,2,n)都在直线y=x+1上,则这组样本数据的样本相关系数为_.解析 依据样子相关系数的定义可知,当全部样本点都在直线上时,相关系数为1.答案 189某医疗争辩所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利
7、用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列结论中,正确结论的序号是_有95%的把握认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.解析 K23.9183.841,而P(K23.841)0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为.答案 10调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收
8、入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元答案0.25411某小卖部为了了解热茶销售量y(杯)与气温x()之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对比表:气温()1813101杯数24343864由表中数据算得线性回归方程bxa中的b2,猜想当气温为5 时,热茶销售量为_杯(已知回归系数解析依据表格中的数据可求得(1813101)10,(24343864
9、)40(杯)ab40(2)1060,2x60,当x5时,2(5)6070(杯)答案7012某医疗争辩所为了了解某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列结论中,正确结论的序号是_有95%的把握认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.解析由于K23.9183.841,而P(K23.81
10、4)0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”要留意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆答案三、解答题13在某地区的1230岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)143156159172165171177161164160体重(kg)41496179686974696854依据上述数据,画出散点图并推断居民的身高和体重之间是否有相关关系解析以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关14.某地最近十年粮食需求量逐年上升,下表是部分统计数
11、据: 年份20022004200620082010需求量(万吨)236246257276286()利用所给数据求年需求量与年份之间的回归直线方程;()利用()中所求出的直线方程猜想该地2022年的粮食需求量。15有甲、乙两个班级进行数学考试,依据大于等于85分为优秀,85分以下为非优秀统计成果后,得到如下的列联表.优秀非优秀总计甲班10乙班30合计105已知从全部105人中随机抽取1人为优秀的概率为.(1)请完成上面的列联表;(2)依据列联表的数据,若按95%的牢靠性要求,能否认为“成果与班级有关系”;(3)若按下面的方法从甲班优秀的同学中抽取一人:把甲班优秀的10名同学从2到11进行编号,先
12、后两次抛掷一枚均匀的骰子,毁灭的点数之和为被抽取人的序号试求抽到6号或10号的概率附K2,解析(1)优秀非优秀总计甲班104555乙班203050合计3075105(2)依据列联表中的数据,得到k6.1093.841,因此有95%的把握认为“成果与班级有关系”(3)设“抽到6号或10号”为大事A,先后两次抛掷一枚均匀的骰子,毁灭的点数为(x,y),则全部的基本大事有(1,1)、(1,2)、(1,3)、(6,6),共36个大事A包含的基本大事有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,P(A).16地震、海啸、洪水、森林大火等自然灾难
13、频繁毁灭,紧急避险常识越来越引起人们的重视某校为了了解同学对紧急避险常识的了解状况,从七班级和八班级各选取100名同学进行紧急避险常识学问竞赛图K552(1)和图K552(2)分别是对七班级和八班级参与竞赛的同学成果按40,50),50,60),60,70),70,80分组,得到的频率分布直方图图K552(1)分别计算参与这次学问竞赛的两个班级同学的平均成果;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)(2)完成下面22列联表,并回答是否有99%的把握认为“两个班级同学对紧急避险常识的了解有差异”?成果小于60分人数成果不小于60分人数合计七班级八班级合计附:K2.临界值表:P(K2k)0.100.050.010k2.7063.8416.635解析 (1)七班级同学竞赛平均成果为(4530554065207510)10056(分),八班级同学竞赛平均成果为(4515553565357515)10060(分)(2)22列联表如下:成果小于60分人数成果不小于60分人数合计七班级7030100八班级5050100合计12080200K28.3336.635,有99%的把握认为“两个班级同学对紧急避险常识的了解有差异”