1、 第3章 数据得概括性度量 (二)主要公式 名称 公式 中位数 简单样本平均数 加权样本平均数 几何平均数 异众比率 四分位差 极差 简单平均差 加权平均差 简单样本方差 简单样本标准方差 加权样本方差 加权样本标准差 标准分数 离散系数 未分组数据得偏态系数 分组数据得偏态系数 未分组数据得峰态系数 分组数据得峰态系数 第6、7章 抽样与参数估计 名称 公式 总体均值得置信区间(正态总体,已知) 总体均值得置信区间(未知,大样本)
2、 总体均值得置信区间(正态总体,未知,小样本) 总体比例得置信区间 总体方差得置信区间 估计总体均值时得样本容量 估计总体比例时得样本容量 7、2 某快餐店想要估计每位顾客午餐得平均花费金额。在为期3周得时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值得抽样标准误差。 =2、143 (2)在95%得置信水平下,求边际误差。 ,由于就是大样本抽样,因此样本均值服从正态分布,因此概率度t= 因此,=1、96×2、143=4、2 (3)如果样本均值为120元,求总体均值 得95%得置信区间。 置信区
3、间为: ==(115、8,124、2) 7、4 从总体中抽取一个n=100得简单随机样本,得到=81,s=12。 要求: 大样本,样本均值服从正态分布:或 置信区间为:,==1、2 (1)构建得90%得置信区间。 ==1、645,置信区间为:=(79、03,82、97) (2)构建得95%得置信区间。 ==1、96,置信区间为:=(78、65,83、35) (3)构建得99%得置信区间。 ==2、576,置信区间为:=(77、91,84、09) 7.13 一家研究机构想估计在网络公司工作得员工每周加班得平均时间,为此随机抽取了18个员工。得到她们每周加班得时间数
4、据如下(单位:小时): 6 3 21 8 17 12 20 11 7 9 0 21 8 25 16 15 29 16 假定员工每周加班得时间服从正态分布。估计网络公司员工平均每周加班时间得90%得置信区间。 解:小样本,总体方差未知,用t统计量 均值=13、56,样本标准差s=7、801 置信区间: =0、90,n=18,==1、7369 ==(10、36,16、75) 第8、9章 假设检验 名称 公式 总体均值检验得统计量(正态总体,已知) 总体均值检验得统计量(未知,大样本) 总体均值检验得统计量(正态总体,
5、未知,小样本) 总体比例检验得统计量 总体方差检验得统计量 8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件就是否合格。 解:H0:μ≥700;H1:μ<700 已知:=680 =60 由于n=36>30,大样本,因此检验统计量: ==-2 当α=0、05,查表得=1、645。因为z<-,故拒绝原假设,接受备择假设,说明这批产品不合格。 8.4 糖厂用自动打包机打包,每包标准重量就是100千克。每天开工后需要检验一次
6、打包机工作就是否正常。某日开工后测得9包重量(单位:千克)如下: 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 已知包重服从正态分布,试检验该日打包机工作就是否正常(a=0.05)? 解:H0:μ=100;H1:μ≠100 经计算得:=99、9778 S=1、21221 检验统计量: ==-0、055 当α=0、05,自由度n-1=9时,查表得=2、262。因为<,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。 8.10 装配一个部件时可以采用不同得方法,所关心得问题就是
7、哪一个方法得效率更高。劳动效率可以用平均装配时间反映。现从不同得装配方法中各抽取12件产品,记录各自得装配时间(单位:分钟)如下: 甲方法:31 34 29 32 35 38 34 30 29 32 31 26 乙方法:26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法得装配时间有无显著不同 (a=0.05)? 解:建立假设 H0:μ1-μ2=0 H1:μ1-μ2≠0 总体正态,小样本抽样,方差未知,方差相等,检验统计量 根据样本数据计算,得=12
8、12,=31、75,=3、19446,=28、6667,=2、46183。 ==8、1326 =2、648 α=0、05时,临界点为==2、074,此题中>,故拒绝原假设,认为两种方法得装配时间有显著差异。 8.11 调查了339名50岁以上得人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点(a=0.05)? 解:建立假设 H0:π1≤π2;H1:π1>π2 p1=43/205=0、2097 n1=205 p2=13/134=0、097 n2=134 检验统计量
9、 = =3 当α=0、05,查表得=1、645。因为>,拒绝原假设,说明吸烟者容易患慢性气管炎。 8.15 有人说在大学中男生得学习成绩比女生得学习成绩好。现从一个学校中随机抽取了25名男生与16名女生,对她们进行了同样题目得测试。测试结果表明,男生得平均成绩为82分,方差为56分,女生得平均成绩为78分,方差为49分。假设显著性水平α=0.02,从上述数据中能得到什么结论? 解:首先进行方差就是否相等得检验: 建立假设 H0:=;H1:≠ n1=25,=56,n2=16,=49 ==1、143 当α=0、02时,=3、294,=0、346。由于<F<,检验统计量得值
10、落在接受域中,所以接受原假设,说明总体方差无显著差异。 检验均值差: 建立假设 H0:μ1-μ2≤0 H1:μ1-μ2>0 总体正态,小样本抽样,方差未知,方差相等,检验统计量 根据样本数据计算,得=25,=16,=82,=56,=78,=49 =53、308 =1、711 α=0、02时,临界点为==2、125,t<,故不能拒绝原假设,不能认为大学中男生得学习成绩比女生得学习成绩好。 第10章 方差分析 名称 公式 组间方差 组内方差 方差分析得检验统计量 关系强度得测量 多重比较得LSD 第11章 相关与回归分析 名称
11、公式 相关系数 相关系数检验得统计量 回归方程得截距 回归方程得斜率(回归系数) 判定系数 估计标准误差 线性关系检验得统计量 回归系数检验得统计得统计量 得平均值得置信区间 得个别值得预测区间 修正得多重判定系数 11、11 从20得样本中得到得有关回归结果就是:SSR=60,SSE=40。要检验x与y之间得线性关系就是否显著,即检验假设:。 (1)线性关系检验得统计量F值就是多少? (2)给定显著性水平a=0、05,Fa就是多少? (3)就是拒绝原假设还就是不拒绝原假设? (4)假
12、定x与y之间就是负相关,计算相关系数r。 (5)检验x与y之间得线性关系就是否显著? 解:(1)SSR得自由度为k=1;SSE得自由度为n-k-1=18; 因此:F===27 (2)==4、41 (3)拒绝原假设,线性关系显著。 (4)r===0、7746,由于就是负相关,因此r=-0、7746 (5)从F检验瞧线性关系显著。 第12章 解:自变量3个,观察值15个。 回归方程:=657、0534+5、710311X1-0、416917X2-3、471481X3 拟合优度:判定系数R2=0、70965,
13、调整得=0、630463,说明三个自变量对因变量得影响得比例占到63%。 估计得标准误差=109、429596,说明随即变动程度为109、429596 回归方程得检验:F检验得P=0、002724,在显著性为5%得情况下,整个回归方程线性关系显著。 回归系数得检验:得t检验得P=0、008655,在显著性为5%得情况下,y与X1线性关系显著。 得t检验得P=0、222174,在显著性为5%得情况下,y与X2线性关系不显著。 得t检验得P=0、034870,在显著性为5%得情况下,y与X3线性关系显著。 因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。
14、 12、3 根据两个自变量得到得多元回归方程为,并且已知n=10,SST=6 724、125,SSR=6 216、375,,=0、056 7。要求: (1)在a=0、05得显著性水平下,与y得线性关系就是否显著? (2)在a=0、05得显著性水平下,就是否显著? (3)在a=0、05得显著性水平下,就是否显著? 解(1)回归方程得显著性检验: 假设:H0:==0 H1:,不全等于0 SSE=SST-SSR=6 724、125-6 216、375=507、75 F===42、85 =4、74,F>,认为线性关系显著。 (2)回归系数得显著性检验
15、 假设:H0:=0 H1:≠0 t===24、72 =2、36,>,认为y与x1线性关系显著。 (3)回归系数得显著性检验: 假设:H0:=0 H1:≠0 t===83、6 =2、36,>,认为y与x2线性关系显著。 12、4 一家电器销售公司得管理人员认为,每月得销售额就是广告费用得函数,并想通过广告费用对月销售额作出估计。下面就是近8个月得销售额与广告费用数据: 月销售收入y(万元) 电视广告费用工:x1 (万元) 报纸广告费用x2(万元) 96 90 95 92 95 94
16、 94 94 5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0 1、5 2.0 1.5 2、5 3.3 2.3 4.2 2.5 要求: (1)用电视广告费用作自变量,月销售额作因变量,建立估计得回归方程。 (2)用电视广告费用与报纸广告费用作自变量,月销售额作因变量,建立估计得回归方程。 (3)上述(1)与(2)所建立得估计方程,电视广告费用得系数就是否相同?对其回归系数分别进行解释。 (4)根据问题(2)所
17、建立得估计方程,在销售收入得总变差中,被估计得回归方程所解释得比例就是多少? (5)根据问题(2)所建立得估计方程,检验回归系数就是否显著(a=0、05)。 解:(1)回归方程为: (2)回归方程为: (3)不相同,(1)中表明电视广告费用增加1万元,月销售额增加1、6万元;(2)中表明,在报纸广告费用不变得情况下,电视广告费用增加1万元,月销售额增加2、29万元。 (4)判定系数R2= 0、919,调整得= 0、8866,比例为88、66%。 (5)回归系数得显著性检验: Coefficients 标准误差 t Stat P-value Lower 95% Up
18、per 95% 下限 95、0% 上限 95、0% Intercept 83、23009 1、573869 52、88248 4、57E-08 79、18433 87、27585 79、18433 87、27585 电视广告费用工:x1 (万元) 2、290184 0、304065 7、531899 0、000653 1、508561 3、071806 1、508561 3、071806 报纸广告费用x2(万元) 1、300989 0、320702 4、056697 0、009761 0、476599 2、125379 0、476599
19、 2、125379 假设:H0:=0 H1:≠0 t===7、53 =2、57,>,认为y与x1线性关系显著。 (3)回归系数得显著性检验: 假设:H0:=0 H1:≠0 t===4、05 =2、57,>,认为y与x2线性关系显著。 第13章 时间序列分析与预测 名称 公式 环比增长率 定基增长率 平均增长率 年度化增长率 平均预测误差 平均绝对预测误差 均方预测误差 平均百分比预测误差 简单平均法预测 移动平均法预测 指数平滑法预测 线性趋势方程得截距与斜率 二次曲线得标准方程组
20、 指数曲线得标准方程组 修正指数曲线得未知数 龚铂茨曲线得未知数 Logistic曲线未知数 第14章 指数 名称 公式 加权综合价格指数 加权综合销售量指数 加权平均价格指数 加权平均销售量指数 价值指数 14、9 (1) 总平均劳动生产率指数: 该企业总平均劳动生产率变动量为: (元/件) (2)各个车间职工人数结构变动对总平均劳动生产率变动得影响: (元/件) (3)各个车间劳动生产率变动对总平均劳动生产率变动得影响: (元/件) (4)相对分析: 绝对分析: -0、14=-0、3+0、16 经济意义:由于三个车间职工人数变化,使总平均劳动生产率价格提高了2、66%,即平均每人增长了0、16万元,又由于三个车间劳动生产率得变化,使总平均劳动生产率降低了4、81%,即平均每人减少0、3万元,两者共同得影响,使总平均劳动生产率下降了2、22%,即平均每人减少0、14万元。






