1、_统计学期末复习(仅供参考)单项选择题20个,40分,论述题4个,20分,计算题40分(15+6+6+6+7)第3章累积分布图p51,第4,第7,第8章单项选择题1. 指出下面的数据哪一个属于分类数据 ( C )A某种产品的销售价格(元):21 26 22 28B对某一事物的看法:同意 保持中立 反对C购买商品时的支付方式:现金、信用卡、支票D某汽车生产企业各季度的产量(万辆):20 25 30 36A、D属于数值型数据,B属于顺序数据2.下列哪一个属于顺序变量( B )A年龄 B受教育程度 C企业所属的行业 D性别C、D属于分类变量 A属于数值型变量3. 一项调查表明,在所抽取的2000个消
2、费者中,他们每月在网上购物的平均花费是200元,这项调查的样本是( B )A.所有网上购物的消费者B.2000个消费者C.所有在网上购物的消费者的网上购物的平均花费金额D.2000个消费者的网上购物的平均花费金额A是总体, C是参数, D 是统计量4. 最近发表的一项调查表明,汽车消费税率调整后,消费者购买大排量汽车的比例显著下降。这一结论属于( D )A.对样本的描述 B.对样本的推断 C.对总体的描述 D.对总体的推断5.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是价格便宜。研究者使用的方法是(推断统计方法)6.分层抽样的特点是( B )A使得总体
3、中的每一个元素都有相同的机会被抽中B在抽样之前先将总体的元素划分为若干类,使得每一类都有相同的机会被抽中C先将总体划分为若干群,使得每一群都有相同的机会被抽中D先将总体各元素按某种顺序排列,使总体中的每一个元素都有相同的机会被抽中A是简单抽样的特点,C是整群抽样的特点,D是系统抽样的特点7.一名学生为了完成统计学作业,在统计年鉴中找到2010年城镇家庭的人均收入数据,这一数据属于( C )A.分类数据 B.顺序数据 C.截面数据 D.时间序列数据8.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的总体是( B )样本是(A)参数是(D)统计
4、量是(C)A.2000个家庭 B.200万个家庭 C.2000个家庭的人均收入 D.200万个家庭的总收入9.为了调查某学校的购书费支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是( C )A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样10.为了调查某学校的购书费支出,从全校抽取4个班级的学生进行调查,这种调查方法是( B )A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样11.为了调查某学校的购书费支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是( D )A.简单随机抽样 B.整群抽样 C.分层抽样
5、D.系统抽样12.为了解女性对某种化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查,这种调查方式是( C )A.简单随机抽样 B.分层抽样 C.方便抽样 D.自愿抽样13.研究人员根据对研究对象的了解有目的选择一些单位作为样本,这种调查方式是 ( A ) A.判断抽样 B.分层抽样 C.方便抽样 D.自愿抽样14.下面的哪种调查方法的结果不能用于对总体有关参数进行估计( D )A.分层抽样 B.系统抽样 C.整群抽样 D.判断抽样15.如果要收集某一特定群体的有关资料,适宜采用的调查方式是( C )A.系统抽样 B.整群抽样 C.滚雪球抽样 D.判断抽样16.下面哪种抽样方式属于非概率抽
6、样( D )A.系统抽样 B.整群抽样 C.分层抽样 D.滚雪球抽样17.一家公司的人力资源部主管要研究公司雇员的饮食习惯,改善公司餐厅的现状,将问卷发给就餐者,填写后再收上来。他的收集数据的方法属于( A )A.自填式问卷调查 B.面访式问卷调查 C.实验调查 D.观察式调查18.为掌握商品销售情况,对占该市商品销售额80%的五个大商场进行调查,这种调查方式属于( B )A 代表性抽样 B重点抽样 C抽样调查 D典型抽样典型抽样:如研究青少年犯罪问题,选择一些典型的犯人进行调查。代表性抽样:如某奶粉生产企业想了解消费者对奶粉成分的需求,调查一些年轻的母亲。19.为了解居民对小区物业服务的意见
7、和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这种数据收集方法称为( B )A.自填式问卷调查 B.面访式问卷调查 C.实验调查 D.观察式调查20.如果一个样本因人故意操纵而出现偏差,这种误差属于( B )A.抽样误差 B.非抽样误差 C.设计误差 D.实验误差21.某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。物业管理部门利用最初的居民户登记名单进行抽样。但现在的小区中,原有的一些居民已经搬走,同时有些新入住的居民户。这种调查产生的误差属于( B )A.随机误差 B.抽样框误差 C.回答误差 D.无回答误差22.某居民小区为了解住户对物业服务的看法,准备
8、采取抽样调查方式搜集数据。物业管理部门利用居民登记名单进行抽样。但现在的小区中,原有的一些居民已经搬走没有回答问题。这种调查产生的误差属于( D )A.随机误差 B.抽样框误差 C.回答误差 D.无回答误差23.某居民小区的物业管理者怀疑有些居民户有偷电行为。为了了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现有些居民户有虚报或瞒报的情况。这种调查产生的误差属于( A )A.有意识误差 B.抽样框误差 C.回答误差 D.无回答误差24.某居民小区的物业管理者怀疑有些居民户有偷电行为。为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现调查员在登记电表数时有抄错
9、的数据。这种调查产生的误差属于( C )A.有意识误差 B.抽样框误差 C.调查员误差 D.无回答误差25.落在某一特定类型或组中的数据个数称为( A )A.频数 B.频率 C.频数分布表 D.累积频数26.一个样本或总体中各个部分的数据与全部数据之比称为( C )A.频数 B.频率 C.比例 D.比率 27.样本或总体中各不同类别数值之间的比值称为( D )A.频数 B.频率 C.比例 D.比率 28.将比例乘以100得到的数值称为( B )A.频数 B.百分数 C.比例 D.比率 29.下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题(A )A.环形图 B.饼图 C.直方图
10、D.茎叶图30.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( B )A.单变量值分组 B.组距分组 C.等距分组 D.连续分组31.组中值是(B)A.一个组的上限与下限之差 B.一个组的上限与下限之间的中点值C.一个组的最小值 D.一个组的最大值32.下面的图形中最适合描述一组数据分布的图形是(C)A.条形图 B.箱线图 C.直方图 D.饼图33.对于大批量的数据,最适合描述其分布的图形是( C )A.条形图 B茎叶图 C.直方图 D.饼图34.小钱收集了上海、江苏和浙江三省2007年三次产业的增加值的资料,如果要反映2007年这三个省三次产业的结构,用
11、什么图形最为合适?( C )A. 直方图 B. 散点图 C. 饼图 D. 折线图35.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?( D )A. 直方图 B. 散点图 C. 饼图 D. 折线图36.对于小批量的数据,最适合描述其分布的图形是( B)A.条形图 B茎叶图 C.直方图 D.饼图 37.对于时间序列数据,用于描述其变化趋势的图形通常是( D )A.条形图 B.直方图 C.箱线图 D.线图38.为描述身高与体重之间是否有某种关系,适合采用的图形是(C )A.条形图 B.对比条形图 C.散点图 D.箱线图39.气泡图主要用于描
12、述( B)A.两个变量之间的相关关系 B.三个变量之间的相关关系C.两个变量的对比关系 D.三个变量的对比关系40.为了研究多个不同变量在不同样本间的相似性,适合采用的图形是( C )A.环形图 B.茎叶图 C.雷达图 D.箱线图41.10家公司的月销售额数据(万元)分别为:72,63,54,54,29,26,25,23,23,20。下列哪种图形不宜用于描述这些数据( B )A.茎叶图 B.散点图 C.条形图 D.饼图42.与直方图相比,茎叶图( B)A.没保留原始数据的信息 B.保留了原始数据的信息 C.不能有效展示数据的分布 D.更适合描述分类数据43.下面的哪个图形不适合描述分类数据(
13、D)A.条形图 B.饼图 C.帕累托图 D.茎叶图茎叶图描述数值型数据。44.下面的哪个图形适合描述顺序数据(C)A.直方图 B.茎叶图 C.累积频数分布图 D.箱线图45.将某企业职工的月收入依次分为2000元以下,2000元3000元,3000元4000元,4000元5000元,5000元以上几个组。第一组的组中值近似为( C)最后一组的组中值近似为( D )A.2000 B.1000 C.1500 D.5500第一组为1000-2000 最后一组为5000-600046.直方图与条形图的区别之一是( A )A.直方图的各矩形通常是连续排列的,而条形图则是分开排列的B.条形图的各矩形通常是
14、连续排列的,而直方图则是分开排列的C.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据D.直方图主要用于描述各类别数据的多少,条形图则主要用于描述数据的分布直方图描述数值型数据,条形图描述分类型数据47.一组数据排序后处于25%和75%位置上的值称为( C ) A众数 B中位数 C四分位数 D. 平均数48.非众数组的频数占总频数的比例称为( A )A异众比率 B离散系数 C平均差 D标准差49.四分位差是( A )A上四分位数减下四分位数的结果 B下四分位数减上四分位数的结果C下四分位数加上四分位数 D下四分位敬与上四分位数的中间值50.各变量值与其平均数离差平方的平均数称为( C
15、 )A极差 B平均差 C方差 D标准差51.变量值与其平均数的离差除以标准差后的值称为(A )A标准分数 B离散系数 C方差 D标准差52.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围之内大约有(A ),在平均数加减2个标准差的范围之内大约有( B ),在平均数加减3个标准差的范围之内大约有( C )A 68%的数据 B 95%的数据 C 99%的数据 D100%的数据53.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k= 2,其意义是( A ),对于k=3,其意义是( B ),对于k=4,其意义是( C )。 A至少有75%的数据落在平均数加减2个标准差的范围之内
16、 B至少有89%的数据落在乎均数加减3个标准差的范围之内 C至少有94%的数据落在平均数加减4个标准差的范刚之内 D至少有99%的数据落在平均数加减2个标准差的范围之内54、离散系数的主要用途是(C) A 反映一组数据的离散程度 B反映一组数据的平均水平 C 比较多组数据的离散程度 D比较多组数据的平均水平55.偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数( A )。A等于0 B等于l C大于0 D大于156.如果一组数据分布的偏态系数在0.51或-10.5之间,则表明该组数据属于( B )A对称分布 B 中等偏态分布 C高度偏态分布 D 轻微偏态分布高度偏态分
17、布,偏态系数大于1或小于-1,越接近0,偏态程度越低。 57.峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值( A )A等于0 B大于0 C小于O D等于l58.如果峰态系数k0表明该组数据是( A )A尖峰分布 B扁平分布 C左偏分布 D右偏分布K中位数众数 B 中位数平均数众数C众数中位数平均数 D众数平均数中位数64.在某行业中随机抽取10家企业,第一季度的利润额(单位,万元)分别是72, 63.1,54.7, 54.3,29,26.9,25,23.9,23,20。该组数据的平均数为(39.19 ),标准差为(19.54),中位数为(27.95 )65
18、.某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布可以判断成绩在60-100分之间的学生大约占( A ),可以判断成绩在7090分之间的学生大约占( C )A 95% B 89% C 68% D 99%60-100分在平均数加减2个标准差的范围内,对称分布,约有95%的数据。70-90分再平均数加减1个标准差范围内。66.某班学生的平均成绩是80分,标准差是5分。如果已知该班学生的考试分数为非对称分布,可以判断成绩在70-90分之间的学生至少占( D ) A 95% B 89% C 68% D 75%非对称分布,70-90分在平均数加减2个标准差的范围内,约有7
19、5%的数据。67.在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分。假设新员工得分的分布是未知的,则得分在6595分的新员工至少占( B ) A 75% B 89% C 94% D 95%68.在某公州进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数足86分,则新员工得分的分布形状是( B ) A. 对称的 B.左偏的 C. 右偏的 D. 无法确定69.下列叙述中正确的是( A )。 A如果计算每个数据与平均数的离差,则这些离差的和总是等于零 B如果考试成绩的分布是对称的,平均数为75标准差为l2则考试成绩在63-75分之间的比例大约为95% C平均
20、数和中位数相等 D中位数大于平均数70.在离散程度的测度中,最容易受极端值影响的是(A ) A极差 B 四分位差 C标准差 D平均差71.一组数据的离散系数为0 .4,平均数为20,则标准差为( D ) A 80 B 0.02 C 4 D 8离散系数V=标准差/平均数 72.在比较两组数据的离散程度时,不能直接比较它们的标准差因为两组数据的( D ) A.标准差不同 B方差不同 C 数据个数不同 D计量单位不同73.一项试验中所有可能结果的集合称为( C )。A.事件 B简单事件 C样本空间 D基本事件74.抛3枚硬币,用0表示反面,1表示正面,其样本空间为=( A )。A. 000, 001
21、, 010, 100, 011, 101, 110, 111) B. 1,2,3CO,1 D01,1075.抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A定义为:事件A=出现正面,这一事件的概率记作P(A)。则概率P=1/2的含义是( C )。 A抛掷多次硬币,恰好有一半结果正面朝上 B抛掷两次硬币,恰好有一次结果正面朝上 C抛掷多次硬币,出现正面的次数接近一半 D抛掷一次硬币,出现的恰好是正面76.一家超市所作的一项调查表明,有80%的顾客到超市是来购买食品,有60%的人是来购买其他商品,35%的人既购买食品也购买其他商品。设A=顾客购买食品,B=顾客购买其他商品。则某顾客来超市购买食
22、品的条件下,也购买其他商品的概率为( C )。A. 0.80 B.0.60 C.0.437 5 D.0.35P(A |B)=P(AB)/P(B)=0.35/0.8=0.437577.某考生回答一道四选一的考题,假设他知道正确答案的概率为1/2,而他不知道正确答案时猜对的概率应该为1/4。分别定义事件A=该考生答对了;B=该考生知道正确答案,考试结束后发现他答对了,那么他知道正确答案的概率为( D )。 A1 B0. 25 C 0.5 D0.878.下面关于n重贝努里试验的陈述中哪一个是错误的( D )。 A一次试验只有两个可能结果,即“成功”和“失败” B .每次试验成功的概率p都是相同的 C
23、试验是相互独立的 D在n次试验中,“成功”的次数对应一个连续型随机变量在n次试验中,“成功”的次数对应一个离散型随机变量79.从一个均值=10、标准差=0.6的总体中随机选取容量n=36的样本。假定该样本并不是很偏的,则样本均值小于9.9的近似概率( A )。A.0.1587 B.0.1268 C.0.2735 D.0.632480.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是(B )。A.正态分布,均值
24、为250元,标准差为40元B.正态分布,均值为2500元,标准差为40元C.右偏,均值为2500元,标准差为400元D.正态分布,均值为2500元,标准差为400元中心极限定理,标准差=根号(4002 /100)=4081.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为( B )。A.无偏性 B.有效性 C.一致性 D.充分性82.根据一个具体的样本求出总体均值的95%的置信区间( D )。A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值置信区间与
25、概率无关83.无偏估计是指( B )。A.样本统计量的值恰好等于待估的总体参数B.所有可能样本估计值的数学期望等于待估总体参数C.样本估计值范围绕待估总体参数使其误差最小D.样本量扩大到和总体单元相等时与总体参数一致83.一个估计量的一致性是指( C )。A.该估计量的数学期望等于被估计的总体参数B.该估计量的方差比其他估计量小C.随着样本量的增大,该估计量的值越来越接近被估计的总体参数D.该估计量的方差比其他估计量大84.某厂生产的化纤纤度服从正态分布,标准纤度为1,40.某天测得25根纤维的纤度=1.39,检验与原来的标准相比是否有所变化,则正确的假设是( A )A、H0:=1.40,H1
26、:1.40 B、H0:1.40, H1:1.40C、H0:1.40,H1:1.40 D、H0:1.40, H1:1.4085.一项研究表明,中学生中吸烟的比例高达30%,为检验这一说法是否属实,正确的假设应为( B )A、H0:30%,H1:30% B、H0:=30%,H1:30%C、H0:30%,H1:30% D、H0:30%, H1:30%86.某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为( A )A、H0:0.2,H1:0.2 B、H0:=0.2, H1:0.2C、H0:0.2,H1:0.3 D. H0:0.2,H1:0.2
27、87.某企业每月发生事故5起,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。用来检验这一计划有效性的假设应为( D )A、H0:=5,H1:5 B、H0:5, H1:=5C、H0:5,H1:5 D、H0:5,H1:5二、 论述题(4个,20分)1.解释描述统计和推断统计p2描述统计:它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计:它是研究如何利用样本数据来推断总体特征的统计方法。2.什么是二手资料?使用二手资料应注意什么问题?P14 必考与研究内容有关,由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以利用的资料为“二手资料”。使用时要进行评估,
28、要考虑到资料的原始收集人即考察搜记者的实力和社会信誉度,收集目的,收集方法,收集时间,使用时要注意数据的定义、含义、计算口径和计算方法,避免错用误用滥用,要注明数据来源,以尊重他人的劳动成果。3.直方图与条形图有何区别?P55-56 (1)条形图是用图形的长度表示各类别频数的多少,其宽度固定;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示组距,宽度和高度都有意义。(2)直方图各矩形是连续排列的,条形图是分开排列。(3)条形图主要展示分类数据,直方图主要展示数值型数据。4.茎叶图与直方图相比有什么优点?它们的应用场合是什么?P56(选择题)茎叶图既能给出数据的分布状
29、况,又保留了原始数据的信息。而直方图不能保留原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。5. 简述中心极限定理的意义p147必考设从均值为,方差为s2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均值为、方差为2/n的正态分布。6. 简述评价估计量好坏的标准p161必考无偏性:指估计量抽样分布的数学期望等于被估计的总体参数。有效性:指对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。一致性:随着样本容量的增大,点估计量的值越来越接近被估计总体的参数。7. 简述样本量与置信水平、总体方差、估计误差的关系。P179 样
30、本量与置信水平成正比,在其他条件不变时,置信水平越大,所需的样本量越大;样本量与总体方差成正比,总体方差越大,所需样本量越大。样本量与估计误差的平方成反比,可接受的估计误差越大,所需样本量越大。8.解释分类数据、顺序数据、数值型数据的含义p5(选择题)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;如人口按性别分为男女两类。顺序数据:只能归于某一有序类别的非数字型数据。如一个人的受教育程度可分为小学、初中、高中、大学及以上。数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。分类数据和顺序数据也可称为定性数据或品质数据,数值型数据也可称为定量数据或数量数据。Welcome ToDownload !欢迎您的下载,资料仅供参考!精品资料