1、统计学课程部分习题参考答案(龚凤乾)1试针对统计学得三种任务各举一例。答:见授课题板。2举例说明统计分组可以完成得任务。答:见授课题板。3举一个单向复合分组表得例子,再举一个双向复合分组表得例子。答:单向复合分组表得例如下按技术职务分组按年龄分组人数教授小计 副教授 小计讲师 小计 其她小计 合计 双向复合分组表可举投入产出表为例,略。4某市拟对该市专业技术人员进行调查,想要通过调查来研究下列问题:(1)通过描述专业技术人员队伍得学历结构来反映队伍得整体质量;(2)研究专业技术人员总体得职称结构比例就是否合理;(3)描述专业技术人员总体得年龄分布状况;(4)研究专业技术人员完成得科研成果数就是
2、否与其最后学历有关。请回答: (1)该项调查研究得调查对象就是 该市全部专业技术人员 ;(2)该项调查研究得调查单位就是 该市每一位专业技术人员 ;(3)该项调查研究得报告单位就是 该市每一位专业技术人员 ;(4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目 学历、职称、年龄、科研成果数 。5某车间按工人日产量情况分组资料如下: 日产量(件)工人人数(人)50606607012708018809010901007合计53根据上表指出:(1)上表变量数列属于哪一种变量数列;(2)上表中得变量、变量值、上限、下限、次数(频数);(3)计算各组组距、组中值、频率。答:(1)连续型组距式
3、分组;(2)连续型组距式分组得组距=本组上限本组下限;组中值=(上限+下限)/2;频率=日产量(件)工人人数(次数)下限上限次数(频数)组距组中值频率506065060610556/53607012607012106512/53708018708018107518/53809010809010108510/5390100790100710957/53合计536某地区人口统计数据如下表,请在此表得空白处添加以下数字:组距、组中值、频率、上限以下累计频数。按年龄分组人口数(人)组距组中值频率上限以下累计频数小于5192517459182426425344293544393456446765及以上3
4、18注:年龄以“岁”为单位计算,小数部分按舍尾法处理。解:按年龄分组人口数(人)组距组中值频率(%)上限以下累计频数小于51922、57、611925-174591311、518、2065118-24264721、510、4791525-344291030、017、01134435-443931040、015、58173745-644672055、018、52220465及以上31875、012、612522合计2522100、007对下列指标进行分类。(只写出字母标号即可)A手机拥有量 B商品库存额 C市场占有率 D人口数E 出生人口数 F 单位产品成本 G人口出生率 H利税额(1)时期性总
5、量指标有: EH ;(2)时点性总量指标有: ABD ;(3)质量指标有: CFG ;(4)数量指标有: ABDEH ;(5)离散型变量有: ADE ;(6)连续型变量有: BCFGH 。8现在把某地区1999年末全部个体经营工业单位作为研究对象。对这个统计总体,设计了“1999年末全部个体经营工业单位总数”与上述这个个体经营工业单位总体得“1999年全年产品销售收入”两个统计指标。(1)请就统计指标得三种表现形式考虑,这两个统计指标属于何种类型?(2)想用这两个指标来描述总体规模得大小,对此您有何评价?(3)有一位统计人员把这两个统计指标写作“1999年全年全部个体经营工业单位总数”与“19
6、99年末产品销售收入”,对此您有何评价?(4)该地区得个体经营工业单位在1999年内不断地发生着“新生”与“消亡”得变化,那么,“该地区全部个体经营工业单位”在1999年内就是否就是一个唯一不变得总体?我们应该怎样描述该地区全部个体经营工业单位在1999年全年内得规模?答:(1)这两个统计指标均属于总量指标。(2)这两个统计指标都可用来描述总体规模得大小。前者为总体单位总量指标,直接描述总体规模大小。后者为标志总量指标,间接描述总体规模大小。(3)这两种叙述都就是错误得。正确得表述分别就是“1999年末全部个体经营工业单位总数”,“1999年全年产品销售收入”。(4)不就是一个唯一不变得总体。
7、应该用该地区1999年各时点全部个体经营工业单位总数得均值,即序时平均数,描述1999年全年内总体规模得一般状况。9接8题。现在把本地区全部个体经营工业单位得1999年全年产品销售收入与另一地区得同种指标相减、相除。(1)这二个结果各属于何种类型得统计指标?(2)通过上面用两个地区各自得产品总销售收入作比较,能够描述两个地区得何种差异?(3)能否通过这种比较来描述二地区个体经营工业单位销售收入水平得差异?能否通过这种比较来描述二地区个体经营工业单位销售绩效(生产出来得产品就是否能够顺畅地销售出去)得差异?为什么?要想描述这里提出得两种差异,应当用何种指标来作比较?答:(1)相减就是总量指标,相
8、除就是比较相对指标。(2)能够描述两地区个体经营工业单位销售收入总量上得差异。(3)都不能。因为总量指标只能衡量总体规模得大小。应该用平均指标来描述两地区销售收入水平得差异,如平均销售额等;应该用相对指标来描述两地区销售绩效得差异,如产品销售率,人均销售额等。10现有某地区50户居民得月人均可支配收入数据资料如下(单位:元): 886928999946950864105092794985210279289788161000918104085411009008669059548901006926900999886112089390080093886491986398191681894692689
9、5967921978821924651850要求:(1)试根据上述资料作等距式分组,编制次(频)数分布与频率分布数列。(2)编制向上与向下累计频数、频率数列。(3)用频率分布列绘制直方图、折线图与向上、向下累计图。(4)根据图形说明居民月人均可支配收入分布得特征。解:(1)对数据分组,计算各组频数、频率,累计频数、累计频率50户居民按各户月人均可支配收入分组表人均月可支配收入(元)居民户数频 数频 率(%)本组频数向上累计向下累计本组频率向上累计向下累计本组频率密度800以下11150221000、02800-900161617493234980、32900-10002626433352866
10、60、521000-1100554871096140、100、150、050、100、200、250、300、350、400、450、550、5006008001300110070010001200900可 支 配 收 入 (元)频率密度(%)50户居民按人均月可支配收入得频率分布1100及以上22502410040、04合 计5050100(2)频率分布直方图(2)累计频率分布图50户居民按人均月可支配收入得累计频率分布图01020304050607080901001106007008009001000110012001300向上累计向下累计可 支 配 收 入 (元)累计频率(%)(3)居民
11、户人均可支配收入得分布特征呈单峰型大致对称形态。11、某公司下属两个企业生产同一种产品,其产量与成本资料如下:基期报告期单位成本(元)产量(吨)单位成本(元)产量(吨)甲企业60012006002400乙企业70018007001600试分别计算报告期与基期该公司生产这种产品得总平均成本,并对上述数据作必要得加工,说明总平均成本变化得原因。解: 报告期得总平均成本=xifi/fi=(600*1200+700*1800)/(1200+1800)=(720000+1260000)/3000=1980000/3000=660(元)基期得总平均成本=xifi/fi=(600*2400+700*1600
12、)/(2400+1600)=(140000+1120000)/4000=2520000/4000=630(元)报告期总平均成本高于基期总平均成本,原因就是权数发生了变化,即产量结构变化,报告期甲企业与乙企业得产量比重分别为40%与60%;而基期甲企业与乙企业得产量比重分别为60%与40%。12设某校某专业得学生分为甲、乙两个班,各班学生得数学成绩如下:甲班60,79,48,76,67,58,65,78,64,75,76,78,84,48,25,90,98,70,77,78,68,74,95,85,68,80,92,88,73,65,72,74,99,69,72,74,85,67,33,94,5
13、7,60,61,78,83,66,77,82,94,55,76,75,80,61乙班91,74,62,72,90,94,76,83,92,85,94,83,77,82,84,60,60,51,60,78,78,80,70,93,84,81,81,82,85,78,80,72,64,41,75,78,61,42,53,92,75,81,81,62,88,79,98,95,60,71,99,53,54,90,60,93要求:分别计算数据分布得特征数,并进行比较分析。解:甲班:=3926分 n=54 =72、7分 =296858 分 乙班:=4257分 n=56 =76、02分 =334789 分
14、通过以上计算可以认为乙班得考试成绩好于甲班,因为该班不仅平均成绩高于甲班,而且乙班考试成绩得离散程度较低。13、 根据第12题得数据,分别编制两个班成绩得组距数列(组距为10),然后由组距数列计算反映数据分布特征得各个指标,并观察与第12题所得到得计算结果就是否相同?为什么?解:甲班成绩分组表成绩分组组中值xi人数fixifixi2fi203025125625304035135122540504529040505060553165907560706513845549257080751914251068758090858680578009010095766563175合计543930297750
15、 乙班成绩分组表成绩分组组中值xi人数fixifixi2fi4050452904050506055422012100607065958538025708075141050787508090851512751083759010095121140108300合计564360349600 14、某商贸公司从产地收购一批水果,分等级得收购价格与收购金额如下表,试求这批水果得平均收购价格。 水果等级收购单价(元/千克)收购额(元)甲2、0012700乙1、6016640丙1、308320合计37660解:水果等级收购单价(x)收购额(q)收购量(q/x)甲乙丙2、002、601、301270016640
16、 8320 635010400 6300合计376602315015某厂长想研究星期一得产量就是否低于其她几天,连续观察六个星期,所得星期一得日产量为100、150、170、210、150、120,单位吨。同期非星期一得产量整理后得资料为:日产量(吨)天数(天)1001508150200102002504250以上2合计24要求:(1)求星期一得平均日产量、中位数、众数;(2)求非星期一得平均日产量、中位数、众数;(3)比较星期一与非星期一产量得相对离散程度哪一个大一些。解:日产量(吨)天数(天)f组中值xxfX2f累计1001508125100012500081502001017517503
17、0625018200250422590020250022250以上227555015125024合计24-4200785000-(1)(吨);(吨);(吨)(2)(吨)(吨)(吨)(3)(吨)(吨) 非星期一产量得相对离散程度大一些。18向三个相邻得军火库掷一个炸弹。三个军火库之间有明显界限,一个炸弹不会同时炸中两个或两个以上得军火库,但一个军火库爆炸必然连锁引起另外两个军火库爆炸。若投中第一军火库得概率就是0、025,投中第二军火库以及投中第三军火库得概率都就是0、1。求军火库发生爆炸得概率。解:设A、B、C分别表示炸弹炸中第一军火库、第二军火库、第三军火库这三个事件。于就是,P(A)=0、
18、025 P(B)=0、1 P(C)=0、1 又以D表示军火库爆炸这一事件,则有,D=A+B+C 其中A、B、C就是互不相容事件(一个炸弹不会同时炸中两个或两个以上军火库)P(D)=P(A)+P(B)+P(C)=0、025 + 0、1+ 0、1=0、22519某厂产品中有4%得废品,100件合格品中有75件一等品。求任取一件产品就是一等品得概率。解:设A表示一等品、B表示合格品、C表示废品P(B)=1- P(C)=1-0、04=0、96 P(A|B)=0、75AB A=ABP(A)= P(AB)= P(B)* P(A|B)=0、96*0、75=0、7220某种动物由出生能活到20岁得概率就是0、
19、8,由出生能活到25岁得概率就是0、4。问现龄20岁得这种动物活到25岁得概率为何?解:设A表示这种动物活到20岁、B表示这种动物活到25岁。BA B=ABP(B|A)=0、521在记有1,2,3,4,5五个数字得卡片上,第一次任取一个且不放回,第二次再在余下得四个数字中任取一个。求:(1)第一次取到奇数卡片得概率:(2)第二次取到奇数卡片得概率;(3)两次都取到奇数卡片得概率。解:设A表示第一次取到奇数卡片、B表示第二次取到奇数卡片。(1)P(A)=(2)P(B)= P(AB+B)= P(AB)+ P(B)= P(A)* P(B|A)+ P()* P(B|)=*+*=(3)P(AB)= P(
20、A)* P(B|A)=*=22两台车床加工同样得零件。第一台出现废品得概率就是0、03,第二台出现废品得概率就是0、02。加工出来得零件放在一起,并且已知第一台加工得零件比第二台加工得零件多一倍。求任意取出得零件就是合格品得概率。解:设B1=第一台车床得产品;B2=第二台车床得产品;A=合格品则P(B1)=;P(B2)=;P(A|B1)=1-0、03=0、97;P(A|B2)=1-0、02=0、98由全概率公式得: P(A)= P(B1)* P(A|B1)+ P(B2)* P(A|B2)=*0、97+*0、98=0、97323有两个口袋,甲袋中盛有2个白球1个黑球,乙袋中盛有1个白球2个黑球。
21、由甲袋中任取一球放入乙袋,再从乙袋中取出一球。问取得白球得概率就是多少? 24在第22题中,如果任意取出得零件就是废品,求它属于第二台车床所加工零件得概率。解:设B1=第一台车床得产品;B2=第二台车床得产品;A=废品则P(B1)=;P(B2)= ;P(A|B1)=0、03;P(A|B2)=0、02P(B2| A)=0、2525发报台分别以概率0、6及0、4发出信号“”及“”由于通讯系统受到干扰,当发出信号 “”时,收报台以概率0、8及0、2收到信号“”及“”;当发出信号“”时,收报台以概率0、9及0、1收到信号“”及“”。求:(1)当收报台收到信号“”时,发报台确实发出信号“”得概率;(2)
22、当收报台收到信号“”时,发报台确实发出信号“”得概率。26设某运动员投篮投中概率为0、3,试写出一次投篮投中次数得概率分布表。若该运动员在不变得条件下重复投篮5次,试写出投中次数得概率分布表。解:X=xi01P(X=xi)0、30、7二项分布P(X=xi)= =当X=0时 =0、16807;当X=1时 =0、36015;当X=2时 =0、30870;当X=3时 =0、13230;当X=4时 =0、02835;当X=5时 =0、00243X=xi012345P(X=xi)0、168070、360150、308700、132300、028350、0024329若随机变量X服从自由度等于5得分布,求
23、P(3X11)得近似数值;若X服从自由度等于10得分布,求P(3X11)得近似数值。解:当v=5时 P(3X11)=0、70-0、05=0、65当v=10时 P(3X11)得近似数值;若X服从自由度为f1=5,f2=6得F分布,求P(X11)=0、01当f1=5、f2=6时 P(X3、169);若X服从自由度为5得t 分布,求P(X3、169)=*0、01=0、005;P(X-2、571)=*0、05=0、02555、 从某地区2004年新生男婴总体中简单随机放还地抽取了50名,测量她们得体重如下(单位:克): 2520,3540,2600,3320,3120,3400,2900,2420,3
24、280,3100,2980,3160,3100,3460,2740,3060,3700,3460,3500,1600,3100,3700,3280,2880,3120,3800,3740,2940,3580,2980,3700,3460,2940,3300,2980,3480,3220,3060,3400,2680, 3340,2500,2960,2900,4600,2780,3340,2500,3300,3640。试以显著水平=0、05检验新生男婴体重就是否服从正态分布。解:(1)提出假设:H0 :新生男婴体重服从正态分布H1 :新生男婴体重不服从正态分布(2)计算样本均值与样本标准差: =
25、*158160= 3163、2(克)S= 465、52(克)(3)列表:组号体重分组实际频数(人数)Vi标准化组限Z=概率理论频数Ei=n1234567245024502700270029502950320032003450345037003700+257121086-1、53-1、53-0、995-0、995-0、46-0、460、080、080、620、621、151、15+0、06300、09570、16410、20910、20050、14250、12513、154、7858、20510、45510、0257、1256、2550、41980、00970、17700、22830、00010
26、、10750、0104合计n=501、0000500、9528(4)构造检验统计量并计算样本观测值:=0、9528(5)确定临界值与拒绝域:自由度 7-2-1=4 (4)=9、488拒绝域为:(6)做出检验决策:=0、9528 (4)=9、488检验统计量得样本观测值落在接受域。不能拒绝H0,即没有显著证据表明新生男婴体重不服从正态分布。56、 独立重复投掷一枚骰子n次,各种点数实际出现次数得频数分布列如下表。现要检验骰子就是否均匀。请写出原假设、备择假设、检验统计量、检验统计量得分布(包括分布得自由度)。点 数123456合 计实际频数n1n2n3n4n5n6n原假设:骰子均匀(或各种点数出
27、现得概率相同)备择假设:骰子不均匀(或各种点数出现得概率不相同)检验统计量:检验统计量近似服从自由度4得分布57对男性与女性就是否喜欢体育运动所进行得民意测验数据如下: 性别就是否喜欢体育运动喜欢一般不喜欢男性191524女性161816试以显著性水平0、05检验就是否喜欢体育运动与性别有无关系。解:性别就是否喜欢体育运动合计喜欢一般不喜欢男性19152458女性16181650合计3533401081提出假设:2构造统计量并计算样本值 3给定显著性水平,自由度=(2-1)(3-1)=2,则临界值为4比较并结论:60我国1990-2003年得能源消费总量如下表(数据来源于中国统计年鉴2004,
28、单位:万吨标准煤):年 份1990199119921993199419951996能源消费总量98703103783109170115993122737131176138948年 份1997199819992000200120022003能源消费总量137798132214130119130297134914148222167800要求根据上述数据计算:(1)年平均发展水平与年平均增长量。(2)年平均增长速度。(3)指出增长速度超过平均速度得年份有哪些年?解:(1)年平均发展水平 年平均增长量(1991-2003)(2)平均增长速度(1991-2003)(3)有91、92、93、94、95、9
29、6、2002、2003年67某地区19982002年某种产品得产量资料如下:年份产品产量(百吨)199819992000200120022022242730试运用最小平方法拟合直线方程,并预测2003年、2005年这种产品可能达到得产量。解:先画出散点图及其趋势线解法一(手算):年份序号产量(百吨)t2txt199812012019992224442000324972200142716108200253025150合计1512355394 所求得回归方程为预测2003年得产量: 预测2004年得产量: 解法二(利用Excel软件,略)69某宾馆1998年2002年各季度接待游客人次资料如下表,
30、现已判定该资料属于(不含长期趋势得)季节型时间数列。请用按季平均法编制季节模型,并预测2003年各季度接待游客人数。(预测2003年平均水平时要用一次指数平滑法,用1998年平均水平作初始值,平滑常数取0、1)。一季度二季度三季度四季度1998199920002001200218611921183418372073220323432154202524142415251420982304233919081986179919651967解:1、编制季节模型年份一季度二季度三季度四季度平均值199818612203241519082096、75199919212343251419862191、002
31、00018342154209817991971、25200118372025230419652032、75200220732414233919672198、25平均值1905、202227、802334、001925、002098、00季节指数(%)90、81106、19111、2591、75100、002、一次指数平滑法。年份季平均值19982096、7519992191、0020001971、2520012032、7520022198、2520032003年第一季预测值:2097、8457750、9481=1905、05 第二季预测值:2097、8457751、0619=2227、70 第
32、三季预测值:2097、8457751、1125=2333、85 第四季预测值:2097、8457750、9175=1924、7770已知某地区近25年粮食单产依次如下表所示(单位:公斤/公顷)。62406390697568857755828085058445850584608340855091209165936087758640937595109600963098101015595709180试用一次指数平滑法(=0、4)对该地区第26年得粮食单产进行预测。所得到得结果存在什么问题?答:xtSt624062406390=0、4*6390+0、6*6240=6300 6240 6975=0、4*
33、6975+0、6*6300=6570 6300 68856696 6570 77557120 6696 82807584 7120 85057952 7584 84458149 7952 85058292 8149 84608359 8292 83408351 8359 85508431 8351 91208706 8431 91658890 8706 93609078 8890 87758957 9078 86408830 8957 93759048 8830 95109233 9048 96009380 9233 96309480 9380 98109612 9480 101559829
34、9612 9570=0、4*9570+0、6*9829=9725 9829 9180=0、4*9180+0、6*9725=9507 9725 9507 这一序列为趋势型序列,因此不能利用一次指数平滑方法预测,如果使用该方法,得到得预测值会出现滞后现象,也即对序列得趋势反映不足。73某地区2004-2005年农产品得收购额及价格变动情况如下表:农产品收购金额(万元)收购价格上涨率(%)2004年2005年A16018510B120110-5C20222试计算该地区得农产品收购价格总指数,并据以分析农产品收购价格变化对农民收入得影响。解: 农产品 收购金额(万元)收购价格上涨率(%)个体指数K=p
35、1/p0以04年收购价计算得05年收购额2004年2005年A160185101101/1、1*185=168、18B120110-5 951/0、95*110=115、78C20222 1021/1、02*22=21、56合计-317-305、52三种农产品得收购价格指数=答:三种农产品得收购价提高了3、76,由此农民增收11、48万元(317-305、52)。74某企业三种产品个体价格指数与销售额资料如下表:产品名称计量单位个体价格指数(%)销售额(万元)基期报告期甲件1025095乙米952020丙斤100100120要求:计算价格总指数与销售量总指数。解:价格总指数= 销售额总指数=(
36、95+20+120)/(50+20+100)=138、2353%销售量总指数=销售额总指数/价格总指数=138、2353%/100、346%=137、7586%75某企业生产两种产品,其产量与成本资料如下:产品计量单位产 量单位成本(元)基期报告期基期报告期A只100012501210B件22002300150152试从相对数与绝对数两个方面对该企业总成本变动进行因素分析。解:产品计量单位产量单位成本(元)总成本(元)基期报告期基期报告期甲乙只件10002200125023001215010152120003300001500034500012500349600合计34200036000036
37、2100(1)企业总成本变动:105、87%=362100-342000=20100(元)(2)产量变动对总成本变动得影响:105、26%=360000-342000=18000(元)(3)单位成本变动对总成本变动得影响:100、58%=362100-360000=2100(元)(4)两因素共同影响: 105、87%=105、26%*100、58% 20100=18000+2100 76某企业生产两种设备,其产量及其消耗原材料得有关资料如下:产品产量(台)原材料单耗(千克/台)原材料价格(元/千克)基期报告期基期报告期基期报告期甲100012003002702528乙5008002502202120要求:根据表中数据分析各种因素对这两种产品得原材料消耗总额得变动得影响。解:产品产量(台)单耗(转台)价格(元千克)甲100012003002702528乙5008002502202120合计原材料消耗总额=产量(q)产耗(M)价格(P)分析对象:相对变动:绝对差额得变动:(1)产量变化对原材料消耗总额得影响:相对变动得影响:绝对差额得影响: (2)单耗变化对原材料消耗总额得影响:相对变动得影响:绝对差额得影响:(3)原材料价格得变化对原材料消耗总额得影响:相对变动得影响:绝对差额得影响:(4)共同影响:相对变动关系式:绝对差额关系式:以上计算表明该企业原材料消耗总额报