1、第2章 统计数据的描述练习:2.1 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692
2、693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。2.2 某百货公司6月份各天的销售额数据如下(单位:万元):257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。 2.3 在某地区
3、抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)20030019300400304005004250060018600以上11合计120 计算120家企业利润额的均值和标准差。答案2.1 (1)排序略。(2)频数分布表如下: 100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100 直方图(略)。 (3)茎叶图如下:651866145686713467
4、9681123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741472.2(1)=274.1(万元);Me =272.5 ;QL=260.25;QU =291.25。(2) (万元)。2.3 =426.67(万元);(万元)。第3章 概率与概率分布练习:3.6某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件
5、产品全部达到优质。问该企业决策者会倾向于如何决策?答案3.6这是一个计算后验概率的问题。设A优质率达95,优质率为80,B试验所生产的5件全部优质。P(A)0.4,P()0.6,P(B|A)=0.955, P(B|)=0.85,所求概率为:决策者会倾向于采用新的生产管理流程。第4章 抽样与抽样分布练习:4.1 一个具有个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 给出的抽样分布(重复抽样)的均值和标准差 描述的抽样分布的形状。你的回答依赖于样本容量吗? 计算标准正态统计量对应于的值。 计算标准正态统计量对应于的值。4.4 一个具有个观察值的随机样本选自于和的总体。 你预计的最大
6、值和最小值是什么? 你认为至多偏离多么远? 为了回答b你必须要知道吗?请解释。4.6 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(旅行新闻Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 描述(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明服从怎样的分布以及的均值和方差是什么
7、?证明你的回答; 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢?4.7 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为克、标准差为克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量。(1)描述的抽样分布,并给出和的值,以及概率分布的形状;(3) 假设某一天技术人员观察到,这是否意味着装袋过程出现问题了呢,为什么?答案4.1 20, 2; 近似正态; -2.25; 1.50。 4.4 101, 99 1 ; 不必。4.6 正态分布, 213, 4.5918
8、; 0.5, 0.031, 0.938。4.7 406, 1.68, 正态分布; 0.001; 是,因为小概率出现了。第5章 参数估计练习:2.1 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。(1) 样本均值的抽样标准差等于多少?(2) 在95%的置信水平下,允许误差是多少?2.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。(1) 假定总体标准差为15元,求样本均值的抽样标准误差;(2) 在95%的置信水平下,求允许误差;(3) 如果样本均值为120元,求总体均值95%的置信区间。2.3 某大学为了解学生每天上网的
9、时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5 求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。2.4 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。2.5 根据
10、以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?答案5.1 (1);(2)E=1.55。5.2 (1);(2)E=4.2;(3)(115.8,124.2)。5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4 (18.11%,27.89%);(17.17%,22.835)。5.5 48。第6章 假设检验练习:6.1 某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5的
11、显著性水平下对该问题进行假设检验。a) 选择检验统计量并说明其抽样分布是什么样的?b) 检验的拒绝规则是什么?c) 计算检验统计量的值,你的结论是什么?6.2 一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?6.3 一个著名的医生声称有75的女性所穿鞋子过小,一个研究组织对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取0.01,
12、检验如下的假设: 对这个医生的论断你有什么看法?6.4 一个视频录像设备(VCR)的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差。并在0.05的显著性水平下做出结论。答案6.1 (1)检验统计量,在大样本情形下近似服从标准正态分布;(2)如果,就拒绝;(3)检验统计量2.941.645,所以应该拒绝。6.2 3.11,拒绝。6.3 7.48,拒绝。6.4 206.22,拒绝。第7章 方差分析与试验设计练习:7.1 从三个总体中各抽取
13、容量不同的样本数据,得到如下资料。检验3个总体的均值之间是否有显著差异?()样本1样本2样本31581481611541691531421561491691581807.2 某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据如下:试验号电池生产企业ABC12345505043403932283034264542384840试分析三个企业生产的电池的平均寿命之间有无显著差异?()如果有差异,用LSD方法检验哪些企业之间有差异? 答案7.1 (或),不能拒绝原假设。7.2 (或),拒绝原假设
14、。,拒绝原假设;,不能拒绝原假设;,拒绝原假设。第8章 相关与回归分析练习:8.1 表中是道琼斯工业指数(DJIA)和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:年份DJIA收益率(%)S&P500收益率(%)年份DJIA收益率(%)S&P500收益率(%)198816.016.6199316.810.1198931.731.519944.91.319900.43.2199536.437.6199123.930.0199628.623.019927.47.6199724.933.4计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相
15、关系数的显著性。 8.4美国各航空公司业绩的统计数据公布在华尔街日报1999年年鉴(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称航班正点率(%)投诉率(次/10万名乘客)西南(Southwest)航空公司818021大陆(Continental)航空公司766058西北(Northwest)航空公司766085美国(US Airways)航空公司757068联合(United)航空公司738074美洲(American)航空公司722093德尔塔(Delta)航空公司712072美国西部(A
16、mericawest)航空公司708122环球(TWA)航空公司685125(1)画出这些数据的散点图;(2)根据散点图。表明二变量之间存在什么关系?(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程;(4)对估计的回归方程的斜率作出解释;(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?8.5 表中是1992年亚洲各国人均寿命()、按购买力平价计算的人均GDP()、成人识字率()、一岁儿童疫苗接种率()的数据序号国家和地区平均寿命(年)人均GDP(100美元)成人识字率(%)一岁儿童疫苗接种率(%)1日本7919499992中国香港7718590793
17、韩国708397834新加坡7414792905泰国695394866马来西亚707480907斯里兰卡712789888中国大陆702980949菲律宾6524909210朝鲜7118959611蒙古6323958512印度尼西亚6227849213越南6313899014缅甸577817415巴基斯坦5820368116老挝5018553617印度6012509018孟加拉国5212376919柬埔寨5013383720尼泊尔5311277321不丹486418522阿富汗4373235资料来源:联合国发展规划署人的发展报告(1)用多元回归的方法分析各国人均寿命与人均GDP、成人识字率、一
18、岁儿童疫苗接种率的关系;(2)对所建立的回归模型进行检验。答案8.1(1)利用Excel计算结果可知,相关系数为 ,说明相关程度较高。(2)计算t统计量 给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值为2.306,显然,表明相关系数 r 在统计上是显著的。 8.4 (1)数据散点图如下:(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。(3)设投诉率为Y,航班正点率为X 建立回归方程 估计参数为 (4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。(5)航班按时到达的正点
19、率为80%,估计每10万名乘客投诉的次数可能为: (次/10万) 8.5 由Excel回归输出的结果可以看出:(1)回归结果为 (2)由Excel的计算结果已知:对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值,所以各个自变量都对Y有明显影响。 由F=58.20479, 大于临界值,说明模型在整体上是显著的。第9章 时间序列分析练习:9.2 某地区社会商品零售额19881992年期间(1987年为基期)每年平均增长10%,19931997年期间每年平均增长8.2%,19982003年期间每年平均增长6.8%。问2003年与19
20、87年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997年社会商品零售额为30亿元,按此平均增长速度,2004年的社会商品零售额应为多少? 9.4 某公司近10年间股票的每股收益如下(单位:元):0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50(1)分别用移动平均法和趋势方程预测该公司下一年的收益;(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向?9.5某县20002003年各季度鲜蛋销售量数据如下(单位:万公斤)年份一季度二季度三季度四季度200020012002200313.110.814.618.
21、413.911.517.520.07.99.716.016.98.611.018.218.0(1)用移动平均法消除季节变动;(2)拟合线性模型测定长期趋势;(3)预测2004年各季度鲜蛋销售量。答案9.1 (1)以1987年为基期,2003年与1987年相比该地区社会商品零售额共增长: (2)年平均增长速度为=0.0833=8.33%(3) 2004年的社会商品零售额应为(亿元)9.2 (1)用每股收益与年份序号回归得。预测下一年(第11年)的每股收益为元(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资方向。9.3 (1)移动平均法消除
22、季节变动计算表年别季别鲜蛋销售量四项移动平均值移正平均值()2000年一季度13.1二季度13.910.875三季度7.910.310.5875四季度8.69.7102001年一季度10.810.159.925二季度11.510.7510.45三季度9.711.711.225四季度1113.212.452002年一季度14.614.77513.9875二季度17.516.57515.675三季度1617.52517.05四季度18.218.1517.83752003年一季度18.418.37518.2625二季度2018.32518.35三季度16.9四季度18(2)(3)趋势剔出法季节比例计
23、算表(一)年别季别时间序列号t鲜蛋销售量预测 鲜蛋销售量趋势剔除值2000年一季度113.19.3323529411.403718878二季度213.99.9722058821.39387415三季度37.910.612058820.74443613四季度48.611.251911760.7643145612001年一季度510.811.891764710.908191531二季度611.512.531617650.917678812三季度79.713.171470590.736440167四季度81113.811323530.7964479272002年一季度914.614.45117647
24、1.010298368二季度1017.515.091029411.159629308三季度111615.730882351.0171076四季度1218.216.370735291.1117399232003年一季度1318.417.010588241.081679231二季度142017.650441181.133116153三季度1516.918.290294120.923987329四季度161818.930147060.950864245上表中,其趋势拟合为直线方程。趋势剔出法季节比例计算表(二) 季度年度一季度二季度三季度四季度2000年1.4037191.3938740.7444360.7643152001年0.9081920.9176790.736440.7964482002年1.0102981.1596291.0171081.111742003年1.0816791.1331160.9239870.950864平 均1.1009721.1510750.8554930.9058424.013381季节比率%1.0973011.1472370.8526410.902822400000根据上表计算的季节比率,按照公式计算可得:2004年第一季度预测值:2004年第二季度预测值:2004年第三季度预测值:2004年第四季度预测值: