1、 西安交大统计学考试试卷一、单项选择题(每小题2分,共20分)1。在企业统计中,下列统计标志中属于数量标志的是( C)A、文化程度 B、职业 C、月工资 D、行业2.下列属于相对数的综合指标有(B )A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量?A、0个 B、两个 C、1个 D、3个4。下列变量中属于连续型变量的是(A )A、身高 B、产品件数 C、企业人数 D、产品品种5.下列各项中,属于时点指标的有(A )A、库存额 B、总收入 C、平均收入 D、人均收入6。典型调查是(B
2、)确定调查单位的A、随机 B、主观 C、随意 D盲目7.总体标准差未知时总体均值的假设检验要用到( A ):A、 Z统计量 B、t统计量C、 统计量 D、X统计量8. 把样本总体中全部单位数的集合称为(A )A、样本 B、小总体 C、样本容量 D、总体容量9.概率的取值范围是p(D )A、大于1 B、大于1 C、小于1 D、在0与1之间10. 算术平均数的离差之和等于(A )A、零 B、 1 C、1 D、2二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分)1。数据的计量尺度包括( ABCD ):A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度2。下列属于
3、连续型变量的有( BE ):A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值3.测量变量离中趋势的指标有( ABE )A、极差 B、平均差 C、几何平均数 D、众数 E、标准差4.在工业企业的设备调查中( BDE )A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5。下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数三、判断题(在正确答案后写“对”,在错误答案后写“错。每小题1分,共10分)1、 “性别”是
4、品质标志。(对 )2、 方差是离差平方和与相应的自由度之比。(错 )3、 标准差系数是标准差与均值之比。(对 )4、 算术平均数的离差平方和是一个最大值.(错)5、 区间估计就是直接用样本统计量代表总体参数。(错 )6、 在假设检验中,方差已知的正态总体均值的检验要计算统计量。(错 )7、 统计方法包括推断统计方法和描述统计方法。( 对)8、 在一般情况下,当统计量时,通常选择作为备择假设。(错 )9、 总体比例方差的理论最大值是0。25.(错 )10、平均发展速度是增长量与基期水平的比值。 (错 )四、简答(每小题5分,共20分)1、怎样理解统计的三种含义 答:统计包含统计工作、统计资料和统
5、计学三个方面的含义。一是统计工作,即统计实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。二是统计资料(统计信息):统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称.三是统计学,是系统论述统计理论和方法的科学,是长期统计工作实践的经验总结和理论概括。2、什么是统计指标?它有哪些特点?答:统计指标是十分重要的统计学基本范畴。对统计指标通常有两种理解和使用方法:一是用来反映总体现象总体数量状况的基本概念;二是反映现象总体数量状况的概念和数值.统计指标主要有两个特点:第一,同质事物的可量性。没有质的规定性不能成为统计指标,有了质的规定性不能用数量表示,
6、也不能成为统计指标。有些抽象度较高的社会经济概念难以量化是不能直接用来作为指标名称的,必须将其分解为可以量化的概念才能成为统计指标。第二,量的综合性。统计指标反映的是总体的量,它是许多个体现象的数量综合的结果。3、什么是动态数列?试举一个时点数列的例子.答:动态数列指社会经济现象在不同时间上的一系列指标按时间先后顺序加以排列后形成的数列,也称时间数列。各年年末居民储蓄存款余额就是时点数列。4、何谓标准差?写出均值标准差的计算公式。 答:标准差(Standard Deviation) 也称均方差(mean square error),各数据偏离平均数的距离(离均差)的平均数,它是离均差平方和平均
7、后的方根。用表示。因此,标准差也是一种平均数.公式为:五、计算(每小题10分,共40分。要求计算过程保留4位小数,计算结果保留两位小数)1、以下为10位工人2005年11月11日的产量资料:(单位:件):100 120 120 180 120 192 120 136 429 120。试据以计算其中位数、均值及众数.答:将100 120 120 180 120 192 120 136 429 120按大小排序产量100120136180192429人数151111中位数:120;平均数:163。7;众数:1202、某厂2005年第四季度各月的生产工人人数和产量资料见下表:时 间10月11月12月
8、月初人数(人)200020802200产量(万件)260280369又知2005年12月31日的生产工人数为2020人,试计算第四季度的劳动生产率。 答:劳动生产率(元/人)=报告期工业总产值(万元)报告期全部职工平均人数(人) 或:报告期工业增加值报告期全部职工平均人数 (260/(2000+2080)/2+280/ (2080+2200)/2)+369/ (2200+2020)/2))/3=0。14453、从一火柴厂随机抽取了100盒进行调查,经检查平均每盒装有火柴98支。标准差10支,试以95的概率(置信水平)推断该仓库中平均每盒火柴支数的可能范围。答:体分布形式和总体方差2均未知,但由
9、于n=10030,属于大样本,故可近似地采用正态分布处理,并用样本方差代替总体方差。依题意又知:s=10,=0.05查标准正态分布表得: Z/2=1。96,于是抽样平均误差:=10/10=1 抽样极限误差 =1。96*1=1。96.X=98, 概率为95的条件下,平均每盒火柴支数范围为: 98-1.96 X 98+1.96 置信区间的公式为:计算结果为:(96.04,99。96)4、某商店2005年的营业额为12890万元,上年的营业额为9600万元,零售价格比上年上升了11.5,试对该商店营业额的变动进行因素分析. 答:销售额指数=1.3427,价格指数等于1。115,则销售量指数为:1.3
10、427/1。115=1。2042.表明,2005年与2004年相比,销售额提高了34.27,其中由于零售价格的变动使销售额提高了11。50,由于销售量的变动使销售额提高了20。42。统计学模拟试卷一1、依据统计数据的收集方法不同,可将其分为_数据和_数据。2、收集的属于不同时间上的数据称为 数据。3、设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值=5,则总体均值的置信水平为99%的置信区间_。(Z0。005=2。58)4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP年度化增长率为 .5、在某城市随机抽取13个家庭,调查得到每
11、个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。6、判定系数的取值范围是 。7、设总体X,为样本均值,S 为样本标准差.当未知,且为小样本时,则服从自由度为n-1的_分布。8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。二1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) 、应用统计学 、描述统计学 、推断统计学2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( )、扩大2倍 、减少到1/3
12、 、不变3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为 ( ) 、32.5 、33 、39.64、某地区粮食作物产量年平均发展速度:19982000年三年平均为1.03,20012002年两年平均为1.05,试确定19982002五年的年平均发展速度 ( )、 、 、5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) 、平均值的代表性越好 、离散程度越大 、稳定性越高6、对正态总体均值进行区间估计时,其它条件不变,置信水平越小,则置信上限与置信下限的差( ) 、越大 、越小 、不变7、若某总体次数分布呈轻微左偏分
13、布,则成立的有 ( )、 、8、方差分析中的原假设是关于所研究因素 ( ) 、各水平总体方差是否相等 、各水平的理论均值是否相等、同一水平内部数量差异是否相等9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( )、甲类较大 、乙类较大 、两类相同10、某企业2004年与2003年相比,各种产品产量增长了8,总生产费用增长了 15,则该企业2004年单位成本指数为 ( ) 、187。5 、7% 、106。48 11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征.在乘法模型中,季节指数是以其平均数等于什么为
14、条件而构成的? ( ) 、100% 、400 、1200 12、周末超市的营业额常常会大大高于平日数额,这种波动属于 ( ) 、长期趋势 、季节变动 、循环变动13、下列情况下,适合用算术平均法计算平均数的数据是 ( )、不同顾客所需的皮鞋尺码 、一群人的身高 、一群人的学历14、在试验中,两个事件有一个发生时,另一个就不发生,称这两个事件为 ( )、独立事件 、相容事件 、互斥事件三1、推断统计学研究的主要问题是: ( )、如何科学地由样本去推断总体 、如何科学地从总体中抽出样本、怎样控制样本对总体的随机性误差2、数据质量的评价标准包含的方面有: ( )、精度 、及时性 、关联性3、以下数据
15、的收集方法属于询问调查的是: ( )、抽样调查 访问调查 电话调查4、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 ( ) 、标准差 、离散系数 、几何平均数5、估计量的评价标准包括: ( )、无偏性 、有效性 、一致性6、如果两个变量之间有一定的相关性,则以下结论中正确的是 ( )、回归系数的绝对值大于零 、判定系数大于零 、相关系数的绝对值大于0.37、常用的加权综合指数包括: ( )、拉氏指数 、物质生活质量指数 、帕氏指数( )1、茎叶图主要用于顺序型数据的显示.( )2、四分位数不受数据极端值的影响。( )3、在设计调查问卷的回答项目时,封闭性问题的答案往往是选择
16、回答型,所以设计出的答案一定要穷尽和互斥。( )4、标准分数只是将原始数据进行线性变换,没有改变该组数据分布的形状,也没有改变一个数据 在该组数据中的位置,只是使该组数据的平均数为0,标准差为1. ( )5、假设检验中要使和同时减少的唯一方法是减少样本容量。( )6、对一个正态总体进行抽样调查,不论样本容量大小如何,样本均值统计量总是服从正态分布的。( )7、在参数估计中,样本比例p是非随机变量,而总体参数通常是未知的随机变量。( )8、对两个总体方差相等性进行检验,在=0。01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01.( )9、相关系数r的符号反映相关关系的方向,其绝对
17、值的大小反映相关的密切程度。 ( )10、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?2、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据.根据计算得到以下方差分析表,求A、B的值,并说明销售量的变差中有多少是由于广告费用的变动引起的?变差来源dfSSMSFSignificance F回归11422708.614227
18、08.6B 2.17E-09残差10220158。07A 总计111642866。671、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12。6元,标准差为2。8元。试以95.45的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(2)=0。9545)2、1991年-2000年我国油菜籽单位面积产量资料如下:(单位:kg/hm2)年份1991199219931994199519961997199819992000单产1215128113091296141613671479127214691519(1)用5项简单移动平均法预测20
19、01年的单位面积产量;(2)采用指数平滑法(平滑系数=0.5)预测2001年的单位面积产量(F1999=1345。578);(3)若经过计算,平滑系数=0.5时误差均方=9876.51,平滑系数=0。3时误差均方=11515。01,问用哪一个平滑系数预测更合适?3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量(台)xi4050507080生产费用(万元)yi130140145150156要求:、利用最小二乘法求出估计的回归方程;、计算判定系数R2。 附: 4、某家具公司生产三种产品的有关数据如下:产品名称总生产费用/万元报告期产量比基期增长()基期报告期写字台45。
20、453。614。0椅子30.033.813。5书柜55.258.58。6 计算下列指数:拉氏加权产量指数;帕氏单位成本总指数。统计学(1)卷评分标准一、 填空题(1分/题,不填或者填错不得分。)1、 观测数据、实验数据 5、1080、10802、 时间序列 6、0,13、 4.742 ,5.258 或 50.258 7、t4、 21% 8、16二、 单项选择题(1分/题,不填或者填错不得分。)1234567891011121314三、 多项选择题(2分/题,不填或者填错不得分。)1234567四、 判断题(1分/题,不填或者填错不得分.)12345678910五、 简要回答下列问1、举例略.
21、6分2、A=SSE / (n2) = 220158.07 / 10 =22015。807 2分 B=MSR / MSE =1422708.6 / 22015。807 =64。6221 2分 1分表明销售量的变差中有88。60是由于广告费用的变动引起的。 1分六、计算题1题 解: 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 1分已知: 则有: 平均误差= 2分极限误差 3分据公式 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 4分2题 解: 3分 4分(3)平滑系数=0.5时误差均方=9876。51
22、平滑系数=0。3时误差均方=11515.01 用平滑系数=0.5预测更合适. 3分3题 解 计算估计的回归方程:=0.567 2分144.2 0.56758=111.314 2分估计的回归方程为:=111.314+0.567 2分 计算判定系数: 4分4题 解: 拉氏加权产量指数= 5分 帕氏单位成本总指数= 5分 统计学期末考试试卷1、一个统计总体( )A、只能有一个标志B、只能有一个指标C、可以有多个标志D、可以有多个指标2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B、 2000名学生的学习成绩C、每一名学生 D、 每一名学生的学习成绩3、某地进行国有商
23、业企业经营情况调查,则调查对象是( )。 A、该地所有商业企业 B、该地所有国有商业企业 C、该地每一国有商业企业 D、该地每一商业企业4、以下哪种调查的报告单位与调查单位是一致的( )。 A、工业普查 B、工业设备调查 C、职工调查 D、未安装设备调查5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A、调查时间 B、调查期限 C、标准时间 D、登记期限6、某连续变量分为5组:第一组为40-50,第二组为5060,第三组为60-70,第四组为7080,第五组为80以上,则( )A、50在第一组,70在第四组 B、60在第三组,80在第五组C、
24、70在第四组,80在第五组 D、80在第四组,50在第二组7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( )A、简单算术平均法 B、加权算术平均法 C、加权调和平均法 D、几何平均法8、用水平法检查长期计划完成程度,应规定( )A、计划期初应达到的水平 B、计划期末应达到的水平 C、计划期中应达到的水平 D、整个计划期应达到的水平9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( ).A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标10、时间序列中,每个指标数值可以相加的是( )。A、相对数时间序列 B、时
25、期数列 C、间断时点数列 D、平均数时间序列11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( ).A、时间序列中各期的逐期增长量大体相等 B、各期的二级增长量大体相等C、各期的环比发展速度大体相等 D、各期同比增长量的大体相12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4,实际执行的结果降低了5,则该产品单位成本降低计划完成程度的算式为( )。A、 B、C、 D、13、某企业报告期产量比基期产量增长了10,生产费用增长了8,则其产品单位成本降低了( ).A、18 B、2% C、20 D、18%14、在不重复抽样中,抽样单位数从5增加到25%,抽样平均误差(
26、)。 A、增加39.7 B、增加约3/5 C、减少约3/5 D、没有什么变化 15、若某总体次数分布呈左偏分布,则成立的有( )。A、 B、 D、以上都不对二、多项选择题(每题2分,共20分)1、下列各项中属于品质标志的有( )。A、性别 B、年龄 C、职务 D、民族 E、工资2、从表式上看,统计表由哪些部分构成( )。 A、总标题 B、主词 C、纵栏标题 D、横行标题 E、指标数值3、在相对数中,子项和母项可以互换位置的有( )。A结构相对数 B比例相对数C比较相对数 D动态相对数 E计划完成相对数4、下列统计指标属于总量指标的是( )A、工资总额B、商业网点密度C、商品库存量D、人均国内生
27、产总值E、进出口总额5、定基增长速度等于( )。A。定基发展速度1 B。环比发展速度的连乘积C。环比增长速度的连乘积 D。环比增长速度加1后的连乘积再减1E。定基增长量除以最初水平6、某企业为了分析本厂生产的两种产品产量的变动情况,已计算出产量指数为118。6% , 这一指数是( ).A综合指数 B总指数 C个体指数 D数量指标指数 E质量指标指数7、影响抽样误差的因素有( )。A、是有限总体还是无限总体 B、是平均数还是成数 C、是重复抽样还是不重复抽样 D、总体标志变异程度大小 E、以上答案都对8、下列正确的说法有( )。A、类型抽样只存在组内抽样误差,不存在组间抽样误差.B、类型抽样只存
28、在组间抽样误差,不存在组内抽样误差。C、整群抽样只存在群间抽样误差,不存在群内抽样误差。D、整群抽样只存在群内抽样误差,不存在群间抽样误差。 E、类型抽样既存在组内抽样误差,又存在组间抽样误差。9、统计学的基本概念中( ).A、标志是说明总体单位特征的概念 B、指标是说明总体特征的概念C、可变的数量标志是变量 D、指标和标志都是变量E、质量指标是不能用数值表示的10、对某市工业企业状况进行调查,得到下面资料,属于统计指标的有( )。A、该市工业企业实际产值为110亿元 B、某企业为亏损企业C、该市工业企业职工人数80万人 D、某企业资金利润率为30E、该市工业企业机器台数为7500台三、判断题
29、(每题1分,共10分)1、总体和总体单位的关系总是固定不变的。( )2、样本指标是随机变量。( )3、所选择单位的标志值占总体标志总量的绝大比例,这些单位就是重点单位( )4、综合指数和平均指数都是总指数。( )5、在简单随机抽样时,当总体单位数较多时,若抽样比例为64,则不重复抽样的抽样平均误差比重复抽样的抽样平均误差大约减少40%( )。6、对于同一变量分布,其标准差永远小于平均差。( ).7、在抽样调查中,系统性误差是由人为的原因造成的,因此应当尽量克服。( )8、以1949年a0为最初水平,1997年an为最末水平,计算钢铁产量的年平均发展速度时,应当开48次方。( )9、各个变量值与
30、它们的算术平均数的离差平方和等于最小值。( )10、某城市有200万人,有商业零售机构10000个,商业网点密度的逆指标=5(个/千人)。( )五、计算题(共37分,其中第1小题9分,第2小题10分,第3小题10分,第4小题8分)1、某工厂工资水平和工人人数资料如下:工资级别工资水平(元)工人人数(人)基期报告期基期报告期一二三四3007109201330350780900143520030010080250277140118要求:计算全厂平均工资指数;用相对数和绝对数说明平均工资变动中两个因素的影响,并说明 它们之间的关系;2、一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了5
31、00个观众作样本(重复抽样),结果发现喜欢该节目的有175人。(1)试以95%的概率估计观众喜欢这一专题节目的区间范围。(2)若该节目主持人希望估计的极限误差不超过5。5%,问有多大把握程度?概率度t概率F(t)1。960.952。580.99(3、某市某产品连续四年各季度的出口额资料如下(单位:万元):季 度 一二三四第一年第二年第三年第四年16284550243715146714216851775105114要求计算该市该产品出口额的季节指数(用同期平均法中的直接平均法),并对其季节变动情况做简要分析。4、甲乙两班同时参加统计学课程的测试,甲班的平均成绩为70分,标准差为9分;乙班的成绩分
32、组资料如下:按成绩分组(分)60以下60-707080809090-100合计学生人数(人)262512550要求:计算乙班学生的平均成绩,并比较甲乙两班哪个班的平均成绩更有代表性?一、单项选择题(每题1分,共15分)1、D 2、C3、B4、C5、B6、B7、A8、B9、B10、B11、B12、C13、A14、C15、B二、多项选择题(每题2分,共20分)1、ACD2、ACDE3、BC4、ABCDE5、ADE 6、ABD7、CD8、AC9、ABC10、ACE三、判断题(每题1分,共10分)1、2、3、4、5、6、7、8、9、10、四、填空题(每空2分,共18分)1、99 2、16 3、定类尺度
33、 4、0 5、机械抽样或系统抽样或等距抽样6、A 7、 27。5 8、838。5 9、30五、计算题(共37分,其中第1小题9分,第2小题10分,第3小题10分,第4小题8分)1、列表计算如下:工资级别工资水平(元)工人人数(人)工资总额(元)x0x1f0f1x0f0x1f1x0f1一二三四300710920133035078090014352003001008015027714011860000213000920001064005250021606012600016933045000196670128800156940合计-680685471400563890527410全厂平均工资指数=
34、(可变构成指数)(3分)由于全厂平均工资上升而增加的平均工资额=823.20693.24=129.96(元)全厂工资水平指数= (结构固定指数)(2分) 由于各级别工资水平上升而增加的平均工资额=823.20769。94=53。26(元)(1分)工人人数结构指数=(结构变动影响指数)(2分)由于工人人数结构变化而增加的平均工资额=769。94693。24=76.70(元)(1分)2、(1),(2分),由于z=1.96, 抽样平均误差为(2分)抽样极限误差=0。042(2分),经计算得概率保证程度为95时,观众喜欢这一专题节目的置信区间为30。8,39。2%。(1分)(2)若极限误差不超过5。5,则z=,(2分)F(z