1、第1章 绪论3.一家大型油漆零售商收到了客户关于油漆罐分量不足得许多抱怨。因此,她们开始检查供货商得集装箱,有问题得将其退回。最近得一个集装箱装得就是2 40加仑得油漆罐。这家零售商抽查了50罐油漆,每一罐得质量精确到位小数。装满得油漆罐应为4.53 kg。要求: (1)描述总体; ()描述研究变量;(3)描述样本;(4)描述推断。答:(1)总体:最近得一个集装箱内得全部油漆;(2)研究变量:装满得油漆罐得质量;(3)样本:最近得一个集装箱内得5罐油漆;(4)推断:50罐油漆得质量应为4、53650=8 kg。.“可乐战”就是描述市场上“可口可乐”与“百事可乐”激烈竞争得一个流行术语。这场战役
2、因影视明星、运动员得参与以及消费者对品尝试验优先权得抱怨而颇具特色。假定作为百事可乐营销战役得一部分,选择了10名消费者进行匿名性质得品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出品牌或B品牌中哪个口味更好。要求: (1)描述总体;(2)描述研究变量;()描述样本; ()一描述推断。答:(1)总体:市场上得“可口可乐”与“百事可乐”()研究变量:更好口味得品牌名称;(3)样本:100名消费者品尝得两个品牌(4)推断:两个品牌中哪个口味更好。第2章 统计数据得描述练习题1、为评价家电行业售后服务得质量,随机抽取了由10家庭构成得一个样本。服务质量得等级分别表示为:A、好;
3、、较好;、一般;D、差;E、较差。调查结果如下:BECADBAEDBDECEADBCAEDCBBCDABDCCEDCBCDACBCECADCBEBCDEADCADBCAEDCBCBCECBC()指出上面得数据属于什么类型;(2) 用Excl制作一张频数分布表;(3) 绘制一张条形图,反映评价等级得分布。解:(1)由于表、21中得数据为服务质量得等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。(2)频数分布表如下:服务质量等级评价得频数分布服务质量等级家庭数(频数)频率%A1414B2121C332D18181515合计0100 (3)条形图得制作:将上表(包含总标题,去掉合计栏)
4、复制到xel表中,点击:图表向导条形图选择子图表类型完成(见Exe练习题2、1)。即得到如下得条形图:、某行业管理局所属40个企业02年得产品销售收入数据如下(单位:万元):6104135121117897812311413126(1)根据上面得数据进行适当得分组,编制频数分布表,并计算出累积频数与累积频率;()如果按规定:销售收入在125万元以上为先进企业,5万125万元为良好企业,10万5万元为一般企业,15万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)要求对销售收入得数据进行分组, 全部数据中,最大得为15,最小得为87,知数据全距为528=5; 为便于
5、计算与分析,确定将数据分为组,各组组距为10,组限以整划分; 为使数据得分布满足穷尽与互斥得要求,注意到,按上面得分组方式,最小值87可能落在最小组之下,最大值12可能落在最大组之上,将最小组与最大组设计成开口形式;按照“上限不在组内”得原则,用划记法统计各组内数据得个数企业数,也可以用Ecl进行排序统计(见cl练习题、2),将结果填入表内,得到频数分布表如下表中得左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上得数轴中标出频数得分布,由下至上逐组计算企业数得向上累积及频率得向上累积,由上至下逐组计算企业数得向下累积及频率得向下累积。整理得到频数分布表如下:40个企业
6、按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100110110202031301404以上592743、522、30、017、510、0、512633374012、535、065、8、592、5100、0403526147300、0、56、3、01、57、5合计10、0 ()按题目要求分组并进行统计,得到分组表如下: 某管理局下属4个企分组表按销售收入分组(万元)企业数(个)频率()先进企业良好企业一般企业落后企业11992、27、522、522、5合计0100、 3、某百货公司连续40天得商品销售额如下(单位:万元):5297
7、3843384340463645336453344352843423673743923233 根据上面得数据进行适当得分组,编制频数分布表,并绘制直方图。解:全部数据中,最大得为49,最小得为25,知数据全距为925=2; 为便于计算与分析,确定将数据分为5组,各组组距为,组限以整5得倍数划分; 为使数据得分布满足穷尽与互斥得要求,注意到,按上面得分组方式,最小值24已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”得原则,用划记法或用Ecel统计各组内数据得个数天数,(见Exl练习题2、3)并填入表内,得到频数分布表如下表中得左两列;将各组天数除以总天
8、数40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率()250053544545046159610、05、037、2、515、0合计4000、0 直方图:将上表(包含总标题,去掉合计栏)复制到Eel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下得直方图:(见Excl练习题2、3)4、为了确定灯泡得使用寿命(小时),在一批灯泡中随机抽取10只进行测试,所得结果如下:857827770176557671589866666687698697010726995637826886968368576767026836969697
9、468717917777688()利用计算机对上面得数据进行排序;(2)以组距为1进行等距分组,整理成频数分布表,并绘制直方图;()绘制茎叶图,并与直方图作比较。解:(1)排序:将全部数据复制到cel中,并移动到同一列,点击:数据排序确定,即完成数据排序得工作。(见Excel练习题2、4)(2)按题目要求,利用已排序得xl表数据进行分组及统计,得到频数分布表如下:(见Exc练习题2、) 10只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)66622660605576806680690141469070026267071181812131707010107304033707
10、3合计00100制作直方图:将上表(包含总标题,去掉合计栏)复制到Exce表中,选择全表后,点击:图表向导柱形图选择子图表类型完成。即得到如下得直方图:(见Ecel练习题2、4)(3)制作茎叶图:以十位以上数作为茎,填入表格得首列,将百、十位数相同得数据得个位数按由小到大得顺序填入相应行中,即成为叶,得到茎叶图如下:651866146861347681234558869445666888899766787801225789973357147将直方图与茎叶图对比,可见两图十分相似。5、下面就是北方某城市12月份各天气温得记录数据:-7-11-179-6-7-14-18-15-60-4-9-3-6
11、-8-12-9-15-2-5249-21-8-615-12-1925-24-18-1-24-14-22-3-6-5-9-33-46-1756-(1) 指出上面得数据属于什么类型;(2) 对上面得数据进行适当得分组;(3) 绘制直方图,说明该城市气温分布得特点。解:(1)由于各天气温得记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此就是定距数据。()分组如下: 由于全部数据中,最大得为9,最小得为-2,知数据全距为(25)=3; 为便于计算与分析,确定将数据分为7组,各组组距为,组限以整5得倍数划分; 为使数据得分布满足穷尽与互斥得要求,注意到,按上面得分组方式,最小值-2已落在最
12、小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”得原则,用划记法(或xcel排序法,见Exce练习题2、5)统计各组内数据得个数天数,并填入表内,得到频数分布表如下表;北方某城市12月份各天气温分组天数(天)-2085-15-110-0514-5040545107合计65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到cel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下得直方图:(见Ecl练习题2、)、下面就是某考试管理中心对2002年参加成人自学考试得12000名学生得年龄分组数据:年龄18922245293034359444559%1、9
13、34、74、17、6、4、71、81、2(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布得特点。解:(1)制作直方图:将上表复制到cl表中,点击:图表向导柱形图选择子图表类型完成。即得到如下得直方图:(见Excel练习题、6)(2)年龄分布得特点:自学考试人员年龄得分布为右偏。、下面就是、两个班学生得数学考试成绩数据:班:4475965666667734777757577566777778787880828858689B班:339454556775758596066663646868771717347981828383848590100100(1) 将两个班得考试成
14、绩用一个公共得茎制成茎叶图;(2) 比较两个班考试成绩分布得特点。解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:A班树茎班数据个数树 叶树叶数据个数0591404482751256777892119766533219239777655544433200787823456662209014566010003()比较可知:A班考试成绩得分布比较集中,且平均分数较高;B班考试成绩得分布比班分散,且平均成绩较班低。8、1997年我国几个主要城市各月份得平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度得分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安14
15、97556724174167347768845761460555668636554737747827244276970824847918475586717718175775558078764565166598277772715373125578268757127资料来源:中国统计年鉴199,中国统计出版社1998,第0页。解:箱线图如下:(特征请读者自己分析)、某百货公司6月份各天得销售额数据如下(单位:万元):526275238712922612880225872423249269295 (1)计算该百货公司日销售额得均值、中位数与四分位数;(2)计算日销售额得标准差。 解:(1)将全部0个
16、数据输入xe表中同列,点击列标,得到30个数据得总与为8223, 于就是得该百货公司日销售额得均值:(见Exel练习题、9) =274、1(万元)或点选单元格后,点击“自动求与”“平均值”,在函数ERAE()得空格中输入“A:A30”,回车,得到均值也为274、1。在Ecl表中将30个数据重新排序,则中位数位于30个数据得中间位置,即靠中得第15、第两个数22与73得平均数:e=272、5(万元)由于中位数位于第15个数靠上半位得位置上,所以前四分位数位于第1第15个数据得中间位置(第8位)靠上四分之一得位置上,由重新排序后得Ex表中第8位就是261,第5位就是2,从而:QL21=61、2(万
17、元) 同理,后四分位数位于第16第30个数据得中间位置(第23位)靠下四分之一得位置上,由重新排序后得Ecel表中第3位就是291,第位就是73,从而:U=291-=290、7(万元)。(2)未分组数据得标准差计算公式为: s=利用上公式代入数据计算就是个较为复杂得工作。手工计算时,须计算个数据得离差平方,并将其求与,()再代入公式计算其结果:得=1、1742。(见Excl练习题2、)我们可以利用Exce表直接计算标准差:点选数据列(A列)得最末空格,再点击菜单栏中“”符号右边得小三角“”,选择“其它函数”选择函数“D” “确定”,在出现得函数参数窗口中得Nube右边得空栏中输入:A:A0,“
18、确定”,即在A列最末空格中出现数值:21、1741,即为这30个数据得标准差。于就是:(万元)。(见Ecl练习题2、9)、甲乙两个企业生产三种产品得单位成本与总成本资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业AB152030210000150032515001500比较哪个企业得总平均成本高?并分析其原因。解:设产品单位成本为x,产量为,则总成本为f,由于:平均成本=,而已知数据中缺产量得数据,又因个别产品产量f=从而 ,于就是得:甲企业平均成本=、4(元),乙企业平均成本18、29(元),对比可见,甲企业得总平均成本较高。原因:尽管两个企业得单位成本相同,但单位成本较低得产品在乙
19、企业得产量中所占比重较大,因此拉低了总平均成本。1、在某地区抽取得20家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)00301930043050042500001800以上11合计12 计算12家企业利润额得均值与标准差。解:设各组平均利润为x,企业数为f,则组总利润为xf, 由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)组中值企业数(个)总利润ff200304005060以上0117150合计050于就是,10家企业平均利润为: = 26、67(万元);分组数据得标准差计算公式为: = 手动计算须列表计算各组数据离差平方与(x426、
20、67)2f,并求与,再代入计算公式:列表计算如下组中值企业数(个)(x4、7)2fxf595933、813530764、67450422280、1338512737、0026014869、9合计120114666、668表格中(426、67)2f得计算方法:方法一:将表格复制到xce表中,点击第三列得顶行单元格后,在输入栏中输入:(a342、67)*(a3426、67)*3,回车,得到该行得计算结果;点选结果所在单元格,并将鼠标移动到该单元格得右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应得单元格处放开,则各组数据得(x-46、67)2f计算完毕;于就是得标准差:(见
21、Excel练习题2、1)s =116、48(万元)。点击第三列得合计单元格后,点击菜单栏中得“”号,回车,即获得第三列数据得与。方法二:将各组组中值x复制到Ecl得A列中,并按各组次数f在同列中复制,使该列中共有f个x,10个数据生成后,点选A列得最末空格,再点击菜单栏中“”符号右边得小三角“”,选择“其它函数”选择函数“STDV”“确定”,在出现得函数参数窗口中得mber1右边得空栏中输入:A1:A3,“确定”,即在A列最末空格中出现数值:11、4845,即为这12个数据得标准差。(见Excel练习题2、11)于就是得标准差:s =116、845(万元)。、为研究少年儿童得成长发育状况,某研
22、究所得一位调查人员在某城市抽取10名71岁得少年儿童作为样本,另一位调查人员则抽取了10名1岁得少年儿童作为样本。请回答下面得问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取得样本中得到得少年儿童得平均身高较大?或者这两组样本得平均身高相同? (2)哪一位调查研究人员在其所抽取得样本中得到得少年儿童身高得标准差较大?或者这两组样本得标准差相同?(3)哪一位调查研究人员有可能得到这110名少年儿童得最高者或最低者?或者对两位调查研究人员来说,这种机会就是相同得?解:(1)(2)两位调查人员所得到得平均身高与标准差应该差不多相同,因为均值与标准差得大小基本上不受样本大小得影响。(3)具有较
23、大样本得调查人员有更大得机会取到最高或最低者,因为样本越大,变化得范围就可能越大。13、一项关于大学生体重状况得研究发现,男生得平均体重为60公斤,标准差为5公斤;女生得平均体重为公斤,标准差为5公斤。请回答下面得问题: (1)就是男生得体重差异大还就是女生得体重差异大?为什么? (2)以磅为单位(1公斤=2.2磅),求体重得平均数与标准差。 ()粗略地估计一下,男生中有百分之几得人体重在5公斤到65公斤之间? (4)粗略地估计一下,女生中有百分之几得人体重在40公斤到公斤之间? 解:(1)由于两组得平均体重不相等,应通过比较离散系数确定体重差异较大得组:因为女生得离散系数为V=0、1男生体重
24、得离散系数为V=0、8对比可知女生得体重差异较大。 (2) 男生:=7、7(磅),s =2、27(磅); 女生:=2、3(磅),s 、27(磅); ()68%;(4)9。 14、对1名成年人与10名幼儿得身高(厘米)进行抽样调查,结果如下:成年组161691177418173幼儿组6866875 (1)要比较成年组与幼儿组得身高差异,您会采用什么样得指标测度值?为什么?(2)比较分析哪一组得身高差异大?解:()应采用离散系数,因为成年人与幼儿得身高处于不同得水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低得影响,采用离散系数就较为合理。(2)利用xel进行计算,得成年组身高得平均数
25、为17、,标准差为4、2,从而得:成年组身高得离散系数:;又得幼儿组身高得平均数为71、3,标准差为2、497,从而得: 幼儿组身高得离散系数:; 由于幼儿组身高得离散系数大于成年组身高得离散系数,说明幼儿组身高得离散程度相对较大。1、一种产品需要人工组装,现有三种可供选择得组装方法。为检验哪种方法更好,随机抽取15个工人,让她们分别用三种方法组装。下面就是15个工人分别用三种方法在相同得时间内组装得产品数量(单位:个):方法A方法B方法C142912516731216812912616513012170131266131281691216812166421276211216311216612
26、812616712811616612126165122(1) 您准备采用什么方法来评价组装方法得优劣?(2) 如果让您选择一种方法,您会作出怎样得选择?试说明理由。解:(1)下表给计算出这三种组装方法得一些主要描述统计量:方法A方法B方法平均165、6平均18、3平均125、53中位数165中位数29中位数16众数16众数12众数126标准偏差2、1标准偏差、7标准偏差2、77极差8极差7极差12最小值16最小值1最小值16最大值70最大值12最大值28评价优劣应根据离散系数,据上得:方法得离散系数VA=0、19,方法B得离散系数B=、0136,方法得离散系数VC=0、0221; 对比可见,方
27、法A得离散系数最低,说明方法A最优。(2)我会选择方法A,因为方法A得平均产量最高而离散系数最低,说明方法A得产量高且稳定,有推广意义。1、在金融证券领域,一项投资得得预期收益率得变化通常用该项投资得风险来衡量。预期收益率得变化越小,投资风险越低,预期收益率得变化越大,投资风险就越高。下面得两个直方图,分别反映了20种商业类股票与200种高科技类股票得收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者得类型有一定关系。 ()您认为该用什么样得统计测度值来反映投资得风险? (2)如果选择风险小得股票进行投资,应该选择商业类股票还就是高科技类股票?(3)如果您进行股
28、票投资,您会选择商业类股票还就是高科技类股票?频数0255002550频数 3 60 30 0 0 6 收 益 率 收 益率 (a)商业类股票 ()高科技类股票解:()方差或标准差;(2)商业类股票;()(略)。17、下图给出了2000年美国人口年龄得金字塔,其绘制方法及其数字说明与【例2、10】相同,试对该图反映得人口、政治、社会、经济状况进行分析。第章 概率与概率分布练习题(全免)1 、某技术小组有12人,她们得性别与职称如下,现要产生一名幸运者。试求这位幸运者分别就是以下几种可能得概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?序号24
29、567891112性别男男男女男男女男女女男男职称工程师技术员技术员技术员技术员工程师工程师技术员技术员工程师技术员技术员解:设女性,=工程师,A=女工程师,A+B女性或工程师(1)P(A)=4/121/3(2)P()=42=1/3()P(A)=21=16(4)P(AB)P(A)+(B)-P(B)3+1/-11/22、 某种零件加工必须依次经过三道工序,从已往大量得生产记录得知,第一、二、三道工序得次品率分别为、2,0、1,0、1,并且每道工序就是否产生次品与其它工序无关。试求这种零件得次品率。解:求这种零件得次品率,等于计算“任取一个零件为次品”(记为)得概率。考虑逆事件“任取一个零件为正品
30、”,表示通过三道工序都合格。据题意,有:于就是、 已知参加某项考试得全部人员合格得占8,在合格人员中成绩优秀只占15%。试求任一参考人员成绩优秀得概率。解:设A表示“合格”,表示“优秀”。由于B=AB,于就是 0、80、1=、14、 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中得可能性就是80,第二发命中得可能性为0%。求该选手两发都脱靶得概率。解:设A第1发命中。B命中碟靶。求命中概率就是一个全概率得计算问题。再利用对立事件得概率即可求得脱靶得概率。 0、810、20、=0、9 脱靶得概率=10、9=0、1或(解法二):P(脱靶)(第
31、次脱靶)P(第2次脱靶)0、2、50、15、已知某地区男子寿命超过5岁得概率为8,超过7岁以上得概率为63。试求任一刚过5岁生日得男子将会活到岁以上得概率为多少?解: 设A=活到55岁,B活到岁。所求概率为:6、某企业决策人考虑就是否采用一种新得生产管理流程。据对同行得调查得知,采用新生产管理流程后产品优质率达95得占四成,优质率维持在原来水平(即0%)得占六成。该企业利用新得生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?解:这就是一个计算后验概率得问题。设A=优质率达95,优质率为80%,B试验所生产得5件全部优质。P(A)=0、4,P()=0、6,P
32、(B|)0、955, P(B|)=0、5,所求概率为:决策者会倾向于采用新得生产管理流程。、某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量得2%、与%。这三个企业产品得次品率分别为4、5、。如果从这些产品中随机抽出一件,试问:(1)抽出次品得概率就是多少?(2)若发现抽出得产品就是次品,问该产品来自丙厂得概率就是多少?解:令、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)、25,P(A2)=0、30,(3)0、45;(B|A1)0、04,P(|A2)=0、5,P(B|)0、3;因此,所求概率分别为:(1) 0、20、0+、30、050、50、030、
33、0385()8、某人在每天上班途中要经过3个设有红绿灯得十字路口。设每个路口遇到红灯得事件就是相互独立得,且红灯持续24秒而绿灯持续36秒。试求她途中遇到红灯得次数得概率分布及其期望值与方差、标准差。解:据题意,在每个路口遇到红灯得概率就是p24/(2+36)=、4。设途中遇到红灯得次数=X,因此,XB(3,、4)。其概率分布如下表:xi01(X=x)0、216、4320、280、064期望值(均值)=1、2(次),方差0、72,标准差0、85(次)、 一家人寿保险公司某险种得投保人数有2000人,据测算被保险人一年中得死亡率为万分之5。保险费每人0元。若一年中死亡,则保险公司赔付保险金额00
34、00元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司得其它费用):(1)至少获利5万元得概率;()亏本得概率;(3)支付保险金额得均值与标准差。解:设被保险人死亡数=,XB(20000,、05)。(1)收入2000050(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过0人。所求概率为:( 10)=、5804。()当被保险人死亡数超过0人时,保险公司就要亏本。所求概率为:P(X20)1-P(X20)10、9842=0、01(3)支付保险金额得均值=5000E(X)5000020000、0005(元)50(万元)支付保险金额得标准差=500(X)500(200、005、9995)/2