收藏 分销(赏)

6σ统计学基本概念电子教案.ppt

上传人:快乐****生活 文档编号:11231319 上传时间:2025-07-09 格式:PPT 页数:48 大小:1.54MB 下载积分:14 金币
下载 相关 举报
6σ统计学基本概念电子教案.ppt_第1页
第1页 / 共48页
6σ统计学基本概念电子教案.ppt_第2页
第2页 / 共48页


点击查看更多>>
资源描述
6,统计学基本概念,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,(6,导论),(ZTE-PGB103-V1.5),6,统计学,基本概念,主 要 内 容,1.波动(偏差)。,2.连续变量和离散变量。,3.平均值,中位数,众数,极差,方差,标准偏差。,4.,正态曲线及中心极限定理。,5,.简单图表分析,。,6,.样本容量与,置信度及置信,区间的关系。,波动的型式与原因,任何过程都包含,随机波动,(由于一般或普遍原因造成的)和,非随机波动,(由于特殊原因造成的)。,时 间,不合格产品率,非随机波动,历史水平,(,0,),最佳水平,(,1,),在,0,(3,0,),范围内的,随机波动,在,1,(3,1,),范围内的,随机波动,普遍原因:,过程波动随时间推移是稳定的,可预测的。,处于控制状态。,原因:固有的或是自然的。,例如:垂直向上空(先把硬币夹垂直)抛掷一枚硬币,统计硬币落地后每一面向上的次数。当抛掷次数很多时,每面向上的次数大约各占一半,只有微小差异。,普遍原因:,差异的原因:有风,每次抛掷动作有微小差异,地面不平整,等等。,随 机 波 动,特殊原因:,过程波动无法预测。,处于失控状态。,原因:机器调整不当,原材料不合格,操作者本身。,目标:检测和消除特殊原因。,特殊原因:,例如:同样是抛硬币,抛1000次,,AB,两面,各自向上的次数却相差400多次。,原因:操作者每次抛掷时,总时将硬币,平放,且总是将正面朝上,然后抛出。,非 随 机 波 动,数据的两种类型,连续,(可,变,),数据:,使用一种度量单位,比如英寸或小时。,连续,(可,变,),数据的例子:电压、电流、,功率、时间、距离、重量、速度。,离散,(,逻辑,),数据:,是类别信息,比如“合格”或“不合格”。,连续数据,离散数据,统计领域用下列方法处理波动(偏差):,描述型统计用图表或总结性的数字 (均值,方差,,标准偏差)来描述一系列数据。,统 计 推 断当结果差异可能因为随机偏差或不能归,属为随机偏差时所作的决定(假设检验)。,试 验 设 计,收集并分析数据估计过程改变效果。,数理统计的作用,总体和样本,总体(母体):,它是提供数据的原始集团,是所要研究分析的对象的全部。总体可以是一批产品(由于一批产品的数量是有限的,故称为有限总体),也可以是一道工序所生产的所有产品(由于其源源不断的运行,甚至也包含今后的产品,故称为无限总体),样本(子样,抽样,试样):,从总体中抽出一部分个体,总体中的这一部分个体称之为样本。它是直接被检测并提供数据的诸个体。,连续数据的测量,如何描述数据的统计特性:,measures of location(central tendency,居中程度),measures of dispersion(variation,离散程度),描述数据的居中程度,Mean,均值,Median,中位数,Mode,众数,Quartiles,四分位数,均 值(中心值),均值 总体或样本的平均值。,总体的中心值用,表示。,样本的中心值用,x,表示。,样本均值的计算公式如下:,The mean is the most common measure,of location or center of the data.,中 位 数,中位数 反应样本数据中间,50%,的数值,一系列数据,由低到高排列后所得到的中间数。,偶数,奇数,众数,-,-在一个数据集中最频繁出现的值。,众 数,The,mode,is the observation that occurs most frequently in the sample.,The mode may be unique,or there may be more than 1 mode.Sometimes,the mode may not exist.,Range,极差,Variance,方差,Standard Deviation,标准偏差,Inter Quartile Range,内四分位极差,描述数据的离散程度,离散程度的测量,用来判定一个数据 集合离散程度或宽度的恒量尺度,极 差-在一个样本中最大值与最小值的差值。,极差=最大值-最小值 即:,R=x,(max),x,(min),方 差,与中心值间距的平方和的平均值。,总体的方差用,表示,样本的方差用,s,2,表示,标准偏差 是方差的平方根,。,总体标准偏差由,表示,样本标准偏差由,s,表示,Units of Measure,直方图块的中点,中心光滑连接形成曲线,大多数(但不是所有)数据是正态分布或钟形曲线,正 态 分 布,在许多实际问题中,我们遇到的随机变量都受到为数众多的相互独立的随机因素的影响,而每一个因素的影响都是微小的,且这些影响是可以叠加的。,例如,电灯在指定条件下的耐用时间受到原料,工艺,保管等条件的影响,而且每一种因素在正常情形下都是可以叠加的。具有上述特点的随机变量一般都可以认为是具有正态分布的随机变量。,在现实生产生活中,我们所遇到实际问题大多数都属于具有正态分布的随机变量,因此在此我们重点讨论研究此类分布,。,正 态 分 布 简 介,正态分布的特点:,1.形态如钟;,2.左右对称;,3.于平均值处分布的频数最多。此外,越远离平均值,分布的频,数也越少。,正态分布的要素:,1.平 均 值:决定正态分布曲线的中心位置;,2.标准偏差:决定正态分布曲线的“宽窄”.,为何要研究正态分布?,1.它是自然界的一种最基本的最普遍的法则,反应了事物内在的变化规律;,2.它使我们得以将许多复杂的事物简化处理;,3.它使我们得以通过少量抽样来把握全体,从而节省大量人力,物力,财,力和时间。,正 态 分 布 简 介,正态检验为什么有用?,许多统计检验(均值和方差的检验)都假定数据是正态分布的,正态检验用来判定该假定是否有效。,何时用正态检验?,当你分析数据并要计算基本统计值如,Z,值或假定正态性的统计检验如,T-,检验或方差分析(,ANOVA),时。,分布的正态性检验,如何做正态性检验?,采用,Minitab,公司的专业统计软件,MINITAB,:,如何做正态性检验?,方法1:,从,Minitab,的菜单选项里,选择:,S,tat,B,asic Statistics,N,ormality Test,打开数据文件:,DOT-BOX-HISTOGRAM.MTV,如何做正态性检验?,从,Minitab,的菜单选项里,选择,Stat Basic Statistics Normality Test.,我们可以看到下图的对话框。,变量:选择一列数据用于,X,轴。,正态检验:有3种类型,通常用,Anderson-Darling test,.,标题:用你自拟的题目取代默认的。,单击,OK.,图形输出如下图,。,正态概率图:,如何做正态性检验?,如何做正态性检验?,方法2:,从,Minitab,的菜单选项里,选择:,S,tat,B,asic Statistics,D,isplay Descriptive Statistics,打开数据文件:,DOT-BOX-HISTOGRAM.MTV,如何做正态性检验?,从,Minitab,的菜单选项里,选择:,S,tat,B,asic Statistics,D,isplay Descriptive Statistics,我们可以看到下图的对话框。,如何做正态性检验?,结果显示:,P-Value,大于0.05,判定数据的分布为正态分布。,(,冒险概率,=0.05),如何做正态性检验?,显示在图上的总结包括添加了分布曲线的直方图和,Anderson Darling,正态检验的,P,值(显示在右上角),。,正态检验的通常规则当,P,值小于或等于0.05则认为样本数据的分布不同于标准的正态分布。相反,当,P,值 大于0.05,则认为样本数据的分布与正态没有显著差异。,进一步解释:正态性检验属于根据样本来检验关于,总体分布,的检验方法,属于数学中的非参数检验方法。对于正态检验,,原 假 设 为:,H,0,:,总体的分布与,正态分布无显著差异;,对立假设为:,H,1,:,总体的分布与,正态分布有显著差异。,其中,P,值代表,判断总体数据分布和正态分布没有显著差异的可能性,。上图表现了数据分布的直方图及分布曲线,从图中我们可以看出此图不是正态分布。,结果说明:,概率论基本概念:,1.随机变量根据试验结果对,随机试验,取什么值的变量。,2.随机事件的频率 设随机事件,A,在,n,次试验中出现了,r,次,,则称比值,r/n,为这,n,次试验中事件,A,出现的频率,记作,W(A),即:,W(A)=r/n,3.概率的统计定义随着试验次数,n,的增大,事件出现的频,率,r/n,在区间0,1上的某个数字,p,附近摆动,那么定义事件的,概率为:,P(A)=,p,根据,贝努里大数定理,,在实际应用中,当试验次数很大时,便可以用事,件出现的频率来代替事件发生的概率。,中心极限定理,中心极限定理,在实际问题中,有许多随机变量,它们是由大量的相互独立的随机因素,的综合影响所形成的,即可以表示成独立随机因素之和,,这种随机变量,往往近似地服从正态分布,,这就是中心极限定理的客观背景。,独立同分布的中心极限定理,指出,:,设独立随机变量序列,X,1,X,2,X,n,服从同一分布,,并具有有限的数学期望和方差,则只要,n,充分大,,不管,X,i,服从什么分布,,近似地服从正态分布,德莫佛拉普拉斯定理,指出:当,n,很大时,在,n,次独立重复试验中事件,A,发生地次数近似服从正态分布。从而,服从二项分布的随机变量近似服从正态分布,N(np,np(1-p),。,(附:在不合格率为,p,的一大批产品中任取,n,件产品,那么取得不合格品,的件数,服从二项分布)。,例1,“总销售量”是许多许多经销商销售的总和,一个销售商可能不是正态分布,但总的销售量大致是正态分布的。,例2,即使单一产品高度不是正态分布,但是许多产品的堆积高度大致是正态分布,,注意:不是所有数据服从正态分布,,如何检验正态性,及数据 非正态时如何办?,中心极限定理,举例说明:,Visual interpretation the data set.,Common graphical tools to illustrate a data set:,Dot Plot,散点图,Box Plot,盒子图,Histogram,直方图,图形工具描述,散点图(,Dot Plot),The,dot plot,is useful for displaying a small body of data.,散点图更易分析样本容量较少的参数特性。,The,location,or,central tendency,in the data set and its,spread,or,dispersion,are easily identified.,散点图,对单个样本数据的,居中程度和离散程度,都很容易看出来。,It can also be used in comparing two or more data sets.,散点图还可用于定性地比较两组样本或多组样本的数据之间有无显著差异。,案例:某器件,AM5003,特性参数电流增量(,mA):,批次,A:4.5,7.3,4.8,6.2,8.7,5.1,3.5,5.4,4.6,3.8,批次,B:4.5,7.3,4.8,6.2,8.7,5.1,11,13,9.7,10.5,Minitab:,G,raph D,o,tplot,散点图(,Dot Plot),打开数据文件:,DOT-BOX-HISTOGRAM.MTV,结论:,散点图 结果显示:批次,A,的电流增量比较集中,均值小,因此批次,A,的,质量比较稳定;而批次,B,的电流增量比较分散,均值较大,性能较差。,图形结果显示:,散点图(,Dot Plot),批次,A,批次,B,盒子图(,Box Plot),Not to be used when sample size is less than 10 units.,注意:当样本容量小于 10 时请勿采用!,盒子图,是比较样本数据间的分布差异,中心位置和分散大小。,和散点图相近,都是用来,分析样本数据的,居中程度和离散程度,,但比散点图更直观,更有效。,*,异常点,75%,数(3/4分位),Q3,Q1MaxMinimum,Q,1,-1.5 IQR,Q3+MinMaximum,Q,3,+1.5 IQR,25%,的数(1/4分位),Q1,中位数(1/2分位),Q2,注:,盒子的高度,内四分位极差(,IQR)Inter Quartile Range Q3-Q1,盒子图(,Box Plot),数据的中心50%,(盒子的高度),Minitab:,G,raph,B,oxplot:,盒子图(,Box Plot),打开数据文件:,DOT-BOX-HISTOGRAM.MTV,单个样本数据分析:,图形结果显示,单个样本数,据分析:,盒子图(,Box Plot),盒子图(,Box Plot),打开数据文件:,DOT-BOX-HISTOGRAM.MTV,多个样本数据比较分析,:,盒子图(,Box Plot),图形结果显示,多个样本数据比较分析,:,直方图(,Histogram),The histogram,a graphical presentation of the frequency,distribution,provides a visual impression of the shape of,the distribution of measurements.,直方图表征数据的概率分布,主要应用在了解数据分布的形状,及形态。便于掌握数据的居中趋势,数据的分布等。,X-axis:measurement scale,测量数据的区间划分,,随着区间的调,整,数据的形状分布略有不同。,Y-axis:frequency(or relative frequency)scale,事件发生的频数。,Not to be used when sample size is less than 50 units.,注意:当样本容量小于 50 时谨慎使用直方图!,Minitab:,G,raph,H,istogram,直方图(,Histogram),打开数据文件:,DOT-BOX-HISTOGRAM.MTV,图形结果显示:,直方图(,Histogram),参 数 估 计:,1.,点 估 计,对参数作定值估计,如用样本均值和样本方差作为总体的均值和方差的估计值。,2.,区间估计,点估计只是一种近似值,既没有反应这种近似值的精确度,又不知道它的误差范围。此时就引入了置信区间这个概念,它不仅能够反应点估计的误差范围,还能反应估计值落在该区间的概率即置信度,。,统 计 术 语,置 信 度,置信度是指,总体,的均值与标准偏差有多大可能性落在以,样本,为基础计算,出的置信区间中!,工业行业一般采用,95%,的置信度,它意味着,:,总体,的均值与标准偏差落在置信区间中的概率是,95%!,总体,的均值与标准偏差落在置信区间之外的概率(,风险)是,5%!,如果需要更高的置信度,(99%,置信度,),置信区间会怎样,?,“我现在有95%的信心投中所有的球。如果加宽球门,信心将更大,!”,注意:真实的总体均值和标准偏差或者不合格品率是确定的,只不过它们的数值是未知的。,离散变量:,确定置信度(95%,)。,用样本的不合格品率和样本尺寸计算置信限以确定置信区间。,连续变量:,确定置信度(95%,)。,用样本的平均值,标准偏差和样本尺寸计算置信限以确定置信区间。,可用,Minitab,或手工方法计算置信限。,置信度,VS,置信区间,置信区间太宽怎么办?,采用更大的样本.,允许的误差越小或置信区间越窄,,需要的样本容量越大!,THE END,James Bernoulli,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服