1、选修1-2第一章、统计案例测试一、选择题1已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为必过点( )A.(2,2) B. (1.5 ,4) C.(1.5 ,0) D.(1,2)【答案】B【解析】试题分析:由数据可知,线性回归方程为必过点(1.5,4)考点:本题考查了线性回归直线方程的性质点评:解决此类问题常常用到线性回归直线方程恒过定点这一结论,属基础题2年劳动生产率(千元)和工人工资(元)之间回归方程为,这意味着年劳动生产率每提高1千元时,工人工资平均增加70元 减少70元 增加80元 减少80元【答案】【解析】试题分析:由题意,年劳动生产率(千元)和工人工资(元)之
2、间回归方程为,故当增加1时,要增加70元,劳动生产率每提高1千元时,工资平均提高70元,故正确考点:线性回归方程点评: 本题考查线性回归方程的运用,正确理解线性回归方程是关键3已知某回归方程为:,则当解释变量增加1个单位时,预报变量平均:( ) A、增加3个单位 B、增加个单位 C、减少3个单位 D、减少个单位【答案】C【解析】解释变量即回归方程里的自变量,由回归方程知预报变量减少3个单位4变量与相对应的一组数据为(10, 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量与相对应的一组数据为(10,5), (11.3, 4), (11.8, 3),
3、 (12.5, 2), (13, 1),表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则A B C D 【答案】C【解析】解:变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),. X =(10+11.3+11.8+12.5+13) 5 =11.72. Y =(1+2+3+4+5) 5 =3这组数据的相关系数是r=7.2 19.172 =0.3755,变量U与V相对应的一组数据为 (10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). U =(5+4+3+2+1) 5 =3,这组数据的相关系数是
4、-0.3755,第一组数据的相关系数大于零,第二组数据的相关系数小于零,故选C5统计中有一个非常有用的统计量,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A老师教, 乙班B老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的22列联表.不及格及格总计甲班(A教)43640乙班(B教)162440总计206080根据的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为A99.5% B99.9% C95% D无充分依据.【答案】A【解析】解:k2= =80(424-1636) 2/ 20604040 =9.67.879不及格人数的多
5、少与不同老师执教有关系的把握大约为99.5%故选A6 下面是一个22列联表,则表中a、b处的值分别为( )y1y2总计x1a2173x222527总计b46100A. 94、96 B. 52、54C. 52、50 D. 54、52【答案】B【解析】解:因为根据表格中的数据可知,2+a=b,b+46=100,b=54,a=52,选B7右图是22列联表:则表中a 、b的值分别为 A.94,72 B.52,50 C.52,74 D.74,52【答案】C【解析】a=73-21=52 b=a+22=52+22=74 故选C8统计中有一个非常有用的统计量,用它的大小可以确定在多大程度上可以认为“两个分类变
6、量有关系”,下表是反映甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的22列联表.不及格及格总计甲班123345乙班93645总计216990则的值为( )A0.559 B0.456 C0.443 D0.4【答案】A【解析】,故选A。9若有的把握说事件与事件有关,那么具体算出的一定满足( )A B C D【答案】C【解析】在临界值表中,此临界值说明在假设事件A与事件B无关的前提下,的观测值大于6.635的概率接近0.010,是小概率事件;如果在假设事件A与事件B无关的前提下,计算出的6.635,说明小概率事件发生了,即说事件与事件有关犯错的概率不超过0.010,也就是说有99的把
7、握事件与事件有关。故选C10下面关于卡方说法正确的是( )A.K2在任何相互独立的问题中都可以用于检验有关还是无关B.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个分类变量是否相关的随机变量,当K2的值很小时可以推定两类变量不相关D.K2的观测值的计算公式是【答案】B【解析】只适用于22型列联表问题,且只能推定两个分类变量相关的大小,所以A错;的值很小时,只能说两个变量的相关程度低,不能推定两个变量不相关所以C错;选项D中,所以D错。故选B二、填空题11为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下列联表喜爱打篮球不喜爱打篮球合计男生20525女
8、生101525合计302050则至少有 的把握认为喜爱打篮球与性别有关(请用百分数表示).附0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828【答案】99.5%【解析】解:根据所给的列联表,得到k2=50(2015-105)2 (30202525) =8.3337.879,至少有99.5%的把握说明喜爱打篮球与性别有关故答案为:99.5%12为了解某班学生喜欢打篮球是否与性别有关,对本班50人进行了问卷调查得到了下表:喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050下面的临界值表供参考:P(K2k0)0
9、.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828则根据以下参考公式可得随机变量K2的值为 (保留三位小数),有 %的把握认为喜爱打篮球与性别有关(参考公式:K2,其中nabcd)【答案】8.333 99.5%.【解析】根据公式,所以有99.5%的把握认为喜爱打蓝球与性别有关.13下表是某数学老师及他的爷爷、父亲和儿子的身高数据:父亲身高(cm)173170176儿子身高(cm)170176182因为儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 参考公式: 回归直线的方程是:,其
10、中 ;其中是与对应的回归估计值.参考数据: ,.【答案】185cm【解析】由题可得(173,170),(170,176),(176,182)求得=173,=176,代入线性回归方程得,b=1,a=3所以Y=X+3,当X=182时,Y=185即他孙子的身高是185厘米14经过对卡方X2 统计量分布的研究,已经得到两个临界值,当根据具体的数据算出的X26.635时,有_ 的把握说事件A和B有关。【答案】99%【解析】当6.635时,有99%的把握说事件A与B有关15为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效有效总计男性患者153550女性患者64450总计217910
11、0设H0:服用此药的效果与患者的性别无关,则K2的观测值k_,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为_【答案】4.882,5%【解析】,因为。所以这种判断出错的可能性为0.05,即5%16吃零食是中学生中普遍存在的现象吃零食对学生身体发育有诸多不利影响,影响学生的健康成长下表给出性别与吃零食的列联表男女总计喜欢吃零食51217不喜欢吃零食402868合计454085试回答吃零食与性别有关系吗?(答有或没有)_ 【答案】有【解析】,则吃零食和性别有关系的概率为95%,所以两者有关系三、解答题17(本小题满分12分)甲乙两个班级进行一门课程的考试,按照学生考试成绩优秀
12、和不优秀统计成绩后,得到如下的列联表:班级与成绩列联表优 秀不优秀甲 班1035乙 班738根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为成绩与班级有关系? 附: 0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【答案】在犯错误的概率不超过0.01的前提下不能认为成绩与班级有关系。【解析】本试题主要是考查了独立性检验的思想的运用,求解分类变量的相关性问题的判定。只要将已知的数据代入到关系式中计算并比较列表中的数据可得结论。因为所以在
13、犯错误的概率不超过0.01的前提下不能认为成绩与班级有关系。18(本小题满分12分) 某中学采取分层抽样的方法从应届高三学生中按照性别抽取20名学生,其中8名女生中有3名报考理科,男生中有2名报考文科 (1)是根据以上信息,写出列联表 (2)用假设检验的方法分析有多大的把握认为该中学的高三学生选报文理科与性别有关?参考公式0.150.100.050.0250.0100.0050.0012.072.713.845.026.647.8810.83【答案】(1)男生女生总计报考理科10313报考文科257总计12820(2),所以我们有把握认为该中学的高三学生选报文理科与性别有关【解析】(I)写列联
14、表要注意格式,是列联表.(2)利用公式,然后与提供的数据表对照估计出把文理科与性别存在相关关系的可信度.解:(1)男生女生总计报考理科10313报考文科257总计12820(2) 假设:报考文理科与性别无关. 则的估计值因为,所以我们有把握认为该中学的高三学生选报文理科与性别有关19(12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如列联表所示(单位:人)80及80分以上80分以下合计试验班351550对照班2050合计5545(1)求,;(2)你有多大把握认为“教学方式与成绩有关系”?参考公式及数据: ,其中为样本容量.0100050025001000
15、050.0012706384150246635787910.828【答案】解: , 有995%的把握认为“教学方式与成绩”有关系【解析】第一问中利用列联表求解, 第二问中,利用,得到值因为, 从而说明有995%的把握认为“教学方式与成绩”有关系解: , 2分 4分 8分 9分因为, 所以 11分所以有995%的把握认为“教学方式与成绩”有关系12分20 (本小题满分12分)为考察某种药物预防疾病的效果,进行动物试验,调查了105个样本,统计结果为:服用药的共有55个样本,服用药但患病的仍有10个样本,没有服用药且未患病的有30个样本.(1)根据所给样本数据画出22列联表;(2)请问能有多大把握
16、认为药物有效?【答案】 (1)服药未服药合计患病104555未患病203050合计3075105 (2)这种判断出错的可能性不超过5% 【解析】根据题意,列出服用药的共有55个样本,则未服药的50个样本,服用药但未患病的有20个样本,没有服用药且未患病的有30个样本,列出22列联表;求出,记忆卡方范围,得出判断。解:(1)根据所给样本数据可画出22列联表如下:服药未服药合计患病104555未患病203050合计3075105.。6分(2)将表中数据代入公式,得到。10分因为,所以有95%以上的把握认为药物有效,即这种判断出错的可能性不超过5%.。12分21对某校小学生进行心理障碍测试得到如下的
17、列联表:有心理障碍没有心理障碍总计女生1030男生7080总计20110将表格填写完整,试说明心理障碍与性别的关系?附:0.150.100.050.0250.0100.0050.0012.0722.7063. 8415.0246.6357.87910.828【答案】有心理障碍没有心理障碍总计女生102030男生107080总计2090110有的把握认为心理障碍与性别有关.【解析】本试题主要考查了独立性检验的运用。解:有心理障碍没有心理障碍总计女生102030男生107080总计2090110; 所以有的把握认为心理障碍与性别有关,22某学校为调查高三年学生的身高情况,按随机抽样的方法抽取80名
18、学生,得到男生身高情况的频率分布直方图(图(1)和女生身高情况的频率分布直方图(图(2)已知图(1)中身高在170175cm的男生人数有16人。 (I)试问在抽取的学生中,男、女生各有多少人? (II)根据频率分布直方图,完成下列的22列联表,并判断能有多大(百分几)的把握认为“身高与性别有关”? ()在上述80名学生中,从身高在170175cm之间的学生按男、女性别分层抽样的方法,抽出5人,从这5人中选派3人当旗手,求3人中恰好有一名女生的概率。 参考公式: 参考数据:【答案】(1)40,40;(2)能有999的把握认为身高与性别有关;(3).【解析】(1)由频率分布直方图先得身高在170
19、175cm的男生的频率为;(2);(3)古典概型.解:()直方图中,因为身高在170 175cm的男生的频率为,设男生数为,则,得4分由男生的人数为40,得女生的人数为80-40=40()男生身高的人数,女生身高的人数,所以可得到下列二列联表:170cm170cm总计男生身高301040女生身高43640总计3446806分,7分所以能有999的把握认为身高与性别有关; 8分()在170175cm之间的男生有16人,女生人数有人按分层抽样的方法抽出5人,则男生占4人,女生占1人 9分设男生为,女生为从5人任选3名有:,共10种可能, 10分3人中恰好有一名女生有:共6种可能, 11分故所求概率
20、为 12分23第11届全国人大五次会议于2012年3月5日至3月14日在北京召开,为了搞好对外宣传工作,会务组选聘了16名男记者和14名记者担任对外翻译工作,调查发现,男、女记者中分别有10人和6人会俄语。(I)根据以上数据完成以下2X2列联表:并回答能否在犯错的概率不超过0.10的前提下认为性别与会俄语有关?(II)会俄语的6名女记者中有4人曾在俄罗斯工作过,若从会俄语的6名女记者中随机抽 取2人做同声翻译,则抽出的2人都在俄罗斯工作过的概率是多少?【答案】解:()如下表:会俄语不会俄语总计男10616女6814总计161430 3分假设:是否会俄语与性别无关.由已知数据可求得 .所以在犯错
21、的概率不超过0.10的前提下不能判断会俄语与性别有关. 6分()会俄语的6名女记者,分别设为A,B,C,D,E,F,其中A,B,C,D曾在俄罗斯工作过. 则从这6人中任取2人有AB,AC,AD,AE,AF,BC,BD, BE,BF,CD,CE, CF,DE,DF,EF 共15种, 9分 其中2人都在俄罗斯工作过的是AB,AC,AD,BC,BD,CD共6种, 11分所以抽出的女记者中,2人都在俄罗斯工作过的概率是P=. 12分【解析】略24某高校“统计初步”课程教师随机调查了选该课的一些学生情况,共调查了50人,其中女生27人,男生23人。女生中有20人选统计专业。另外7人选非统计专业;男生中中
22、有10人统计专业,另外,13人选非统计专业。(1)根据以上数据完成下列的22列联表 专业性别非统计专业统计专业总计男女总计(2)根据以上数据,能否在犯错误的概率不超过0.005的前提下,认为主修统计专业与性别有关系?【答案】(1) 列联表见解析(2)能在犯错误的概率不超过0.005的前提下,有95%认为主修统计专业与性别有关系【解析】本试题主要是考查了独立性检验的思想在实际中的运用。根据已知的列联表中的数据得到a,b,c,d,然后代入公式k2=得到的结果P(k2 可知犯错率,得到结论。解:(1)根据以上数据完成下列的22列联表 专业性别非统计专业统计专业总计男131023女72027总计203
23、0506分 (2)根据列联表中的数据,得到观测值k2= 10分P(k2 答:在犯错误的概率不超过0.005的前提下,有95%认为主修统计专业与性别有关系12分25(本小题共13分)某小区在一次对20岁以上居民节能意识的问卷调查中,随机抽取了100份问卷进行统计,得到相关的数据如下表: (1)由表中数据直观分析,节能意识强弱是否与人的年龄有关? (2)据了解到,全小区节能意识强的人共有350人,估计这350人中,年龄大于50岁的有多少人? (3)按年龄分层抽样,从节能意识强的居民中抽5人,再从这5人中任取2人,求恰有1人年龄在20至50岁的概率。【答案】(1)节能意识强弱与年龄有关;(2)280人;(3).【解析】解(1)因为20至50岁的54人有9人节能意识强,大于50岁的46人有36人节能意识强,与相差较大1分,所以节能意识强弱与年龄有关3分(2)年龄大于50岁的有(人)6分(列式2分,结果1分)(3)抽取节能意识强的5人中,年龄在20至50岁的(人)8分,年龄大于50岁的4人8分,记这5人分别为A,B1,B2,B3,B4。 从这5人中任取2人,共有10种不同取法9分,完全正确列举10分,设A表示随机事件“这5人中任取2人,恰有1人年龄在20至50岁”,则A中的基本事件有4种:完全正确列举11分,故所求概率为13分试卷第15页,总16页