1、一,根据以下数据,分别计算:算术平均数,中位数,众数,标准差。抽取零售企业105家的销售收入如下表:月销售额(万元)分销店(个) 组中值40以下4060Me 608080100100120120以上 15 19Mo 26 20 14 11 30 50 70 90 110 130解: 先求出组中值,如上表所示。直接按计算器,可得:算术平均数=76.09 标准差=30.65 中位数=60+ (105/2)-3426*20=74.23众数=60+(26-19)/(26-19)+(26-20)*20=70.77附:计算器按法:开机mode2shiftmode1=输入数据(30 shift ,15 M+
2、 50 shift ,19 M+ )shift2计算器即显示各个指标,1为平均数,2为总体标准差,3为样本标准差2,区间估计求置信区间的方法与步骤:第一步 根据中心极限定理,构造一个含未知参数的分布 第二步 对给定的置信度, 1- 查表得到标准分z/2第三步 利用不等式变形,求出未知参数1-置信区间.二,总体均值的区间估计正态总体,方差已知,(大、小)样本例1,某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差s =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。解:已知-N(m,0.152),x2.14, n=9, 1-a
3、 = 0.95,a/2=1.96 总体均值m的置信区间为结论: 我们可以95的概率保证该种零件的平均长度在21.30221.498 mm间。当时,需要修正,例2,某企业生产某种产品的工人有1000人,某日采用非重复抽样 抽取100人调查他们的当日产量,样本人均产量为35件,如果总体产量的标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。正态总体,大样本,当方差未知时,以样本方差替代即可总体比例的区间估计重复抽样VS不重复抽样 : 例:某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该
4、企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。解:已知 n=200 , 0.7 , a= 0.95,a/2=1.96结论:我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%76.4%之间。 68.26% 1 80% 1.28 90% 1.645 95% 1.96 95.45% 2 99% 2.58 99.73% 3T分布:正态总体、当样本容量n30,总体标准差未知时,用样本标准差S代替。自由度为(n-1) 置信区间为:例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、79
5、4、762、802、813、770、785、810、806,如果袋装重量服从正态分布,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。三,样本容量的计算估计总体均值时样本容量的确定 :根据均值区间估计公式可得样本容量n为 根据比例区间估计公式可得样本容量n为 (若总体比例P未知时,可用样本比例来代替)例:某超级市场欲估计每个顾客平均每次购物的金额,根据过去的经验,标准差大约为160元,现要求以95%的置信度估计每个顾客的购物金额,并要求允许误差不超过20元,应抽多少顾客作样本?总体方差未知时样本容量的确定例1,某品牌电脑公司,准备将电脑销售市场转入拉美地区,事先派出有
6、关人员到该地区查询资料,以便估计一下该地区有电脑的家庭所占的比例。公司希望这一比例的估计允许误差不超过0.05,且置信度为95%。问:要抽取多大容量的样本?(事先对总体一无所知) 。解: 已知D=0.05,a=0.05,Za/2=1.96,当p未知时用最大方差0.25代替应抽取的样本容量为例2,某企业对一批产品进行质量检查,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?4. 假设检验步骤:1、提出原假设和备择假设原假设:有待检验的假设 备择假设:拒绝原假设后可供选择的假设。原则:
7、(1)“不轻易拒绝原假设(2) 原假设总是与等号连在一起。 假设的三种形式:(1)双侧检验:(2)左侧检验:如果指标越大越好以及要求指标是否明显降低。 (3) 右侧检验: 如果指标越小越好以及要求指标是否明显增加 2、选择适当的统计量,并按照中心极限定理确定其分布形式 3、选择选择显著性水平,确定临界值。显著性水平表示H0为真时拒绝H1 的概率,即拒绝原假设的风险。( 总是与 H1相对应)4、抽取样本,计算样本统计量, 比较统计量与临界值的大小。5、作出统计结论和经营管理决策结。例题1:(右侧检验) 根据过去大量资料,某厂生产的产品的使用寿命服从正态分布N(1020,1002),现从最近生产的
8、一批产品中随机抽取16件,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高? 例题2:(左侧检验)一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,要求抗热的平均温度是1250,在过去,供货商提供的产品都符合要求,并从大量的数据获知零件抗热的标准差为 150 ,在最近的一批进货中随机测试了100个零件,其平均的抗热为 1200 , 能否接 受这批产品?工厂希望对实际产品符合要求而错误地加以拒绝的风险为0.05。 例题3:(t-检验) 相关知识:正态总体、方差未知、小样本时服从t分布 某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每
9、包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的检验水平上, 能否认为这天自动包装机工作正常? 例题4: (Z-检验) 相关知识: 对总体比例的假设检验通常是在大样本的条件下进行的,根据正态分布来确定临界值,即采用Z-检验法。 某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200个家庭,其中68个家庭拥有电脑。试问该研究者的估计是否可信(=10%)? 5. 相关与回归分析:相关知识:(1)相关系数的计算公式:一般用 表示总体相关系数,用r 表示样本相关系数。相关系数r的平方等于可决系数。(2)估计标准误差:用来说明回归方程代
10、表性大小的统计分析指标。若估计标准误差小,表明回归方程代表性大;反之,若估计标准误差大,表明回归方程代表性小。例题:现有8个企业的月产量和生产费用资料如下表: 月产量(吨)1.223.13.856.17.28生产费用(万元)628680110115132135160求:(1)计算相关系数,指出两者之间的相关程度;(2)计算判定系数,并解释;(3)用最小平方法配合生产费用对月产量的回归直线模型;指出回归系数的经济含义;(4)求可决系数,并解释。(4)估计回归的标准误差; (3)回归系数的经济含义为当月产量每变动1吨时,生产费用同方向平均变动12.9万元。(2分)(4)r2=0.9697=0.94
11、0 生产费用的增加94%是由于月产量的增加,有6%是其他因素引起的。(注意:不确定是不是这样答) (5) =(10421451.30588012.94544.6)60.5 =233.47 6. 统计指数: 计算原则:(1)在计算综合指数时,同度量因素必须固定在同一期。 (2)在计算质量指标综合指数时,同度量因素选择数量,且必须固定在报告期。 (3):在计算数量指标综合指数时,同度量因素选择质量,且必须固定在基期。例题:设某粮油商店2006年和2007年三种商品的零售价格和销售量资料如表。计算三种商品的价格综合指数和销售量综合指数。并利用指数体系分析价格和销售量变动对销售额的影响 某粮粮油商店三
12、种商品的价格和销售量商品名称计量单位销售量单价(元)2006200720062007粳 米公斤120015003.64.0标准粉公斤150020002.32.4花生油公斤5006009.810.6计算过程: 商品名称计量单位销售量单价(元)销售额(元)2006q02007q12006p02007p12006p0q02007p1q1p0q1p1q0粳 米标准粉花生油kgkgkg12001500500150020006003.62.39.84.02.410.6432034504900600048006360540046005880480036005300合计12670171601588013700
13、(1) 价格综合指数为 :(2) 销售量综合指数为:(3) 结论与2006年相比,三种商品的零售价格平均上涨了8.06%,销售量平均上涨了25.34% ,销售额平均上涨了35.44%。 绝对变动: 分析 : 三者之间的相对数量关系 135.44%=108.06%125.34%三者之间的绝对数量关系4490(元)=1280(元)+3210(元)结论:2007年与2006年相比,三种商品的销售额增长35.44%,增加销售额4490元。其中由于零售价格变动使销售额增长8.06%,增加销售额1280元;由于销售量变动使销售额增长25.34%,增加销售额3210元 。7. 填表相关知识:发展速度 =(1
14、)环比发展速度:(2)定基发展速度: 二者关系:(1)观察期内各环比发展速度的连乘积等于最末期的定基发展速度 (2)两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度 增长速度= 环比增长速度= =环比发展速度-100% 定基增长速度= =定基发展速度-100% 注意:定基增长速度与环比增长速度之间不存在直接的换算关系。通常要先将增长速度转化为发展速度,再进行计算。已知:年份 出口总值(万美元)差额对比(万美元) 环比(%) 定基比(%) 逐期 累计发展 速度增长 速度发展 速度增长 速度199695.219974.819988.81999105.820004.52001128.2
15、结果:年份 出口总值(万美元)差额对比(万美元) 环比(%) 定基比(%) 逐期 累计发展 速度增长 速度发展 速度增长 速度199695.2-100-1997100.04.84.8105.05.0105.05.01998104.04.08.8104.04.0109.29.21999110.06.014.8105.85.8115.615.62000115.05.019.8104.54.5120.820.82001122.07.026.8106.16.1128.228.2计算过程:1997: 100=95.2+4.8 4.8=4.8+0 105%=10095.2100% 5.0%=105% 10
16、0% 1998: 4.0=8.8-4.8 104.0=100.0+4.0 104.0%=104.0100100% 4.0%=104.0%100% 109.2%=10495.2100% 9.2%=109.2%100% 1999: 110.0=104.0(1+105.8%100%) 6.0=110.0104.0 14.8=8.8+6.0 5.8%=105.8%100% 115.6%=110.095.2100% 15.6%=115.6%100% 2000: 15.0=110(1+4.5%) 5.0=115.0110.0 19.8=5.0+14.8 104.5%=115110100% 4.5%=104.5%100% 120.8%=115.095.2100% 20.8%=120.8%100% 2001: 122.0=95.2(1+128.2%100%) 7.0=122.0115.0 26.8=19.8+7.0 106.1%=122.0115.0100% 6.1%=106.1%100% 28.2%=128.2%100%