资源描述
第一章 概率统计基础知识
一、 概率基础知识
1 掌握随机现象与事件的概念
随机现象有两个特点:
l 随机现象的成果最少有两个;
l 至于哪一个出现,事先并不懂得。
事件
l 对立事件:例如在一次检查中,事件最少有一个疵点的对立事件是没有疵点
l 事件的并:事件a和b最少有一个发生。A∪B
l 事件的交:事件a和事件b同时发生。A∩B
l 事件的差:A-B
2 熟悉事件的运算——对立事件、并、交及差
事件的运算具备如下性质:
l 互换律:A∪B=B∪A;A∩B= B∩A
l 结合律:A∪(B∪C)=(A∪B)∪C; A∩(B∩C)=(A∩B) ∩C
l 分派律:A∪(B∩C)=(A∪B) ∩(A∪C); A∩(B∪C)=(A∩B)∪(A∩C);
l 对偶率:A∪B的对立事件=A的对立事件∩B的对立事件
A∩B的对立事件=A的对立事件∪B的对立事件
3 掌握概率是事件发生也许性大小的度量的概念
随机事件的发生是否带有偶然性,不也许事件的概率为0,必然事件的概率为1
4 熟悉概率的古典定义及其简单计算
概率的古典定义:
l 所包括的随机现象只有有限个样本点,设共有n个样本点;
l 每个样本点出现的也许性相同;
l 若被考查的时间A中含有k个样本点,则事件A的概率为:
排列:从n中不一样元素中任取r个元素排成一列称为一个排列
重复排列:从n个不一样元素中每次出去一个做统计后放回,再取下一个,如此连续取r次所得的排列称为重复排列,这种重复排列共有个。
组合:从n个不一样元素中任取r个元素组成一组,称为一个组合。
5 掌握概率的统计定义
l 与事件a有关的随机现象是能够大量重复试验的
l 若在n次重复试验中,事件a发生次,则时间a发生的频率为:
能反应事件a发生的也许性大小
l 频率将会伴随重复试验次数不停增加而趋于稳定。
6 掌握概率的基本性质
l 性质1:概率是非负的,其数值介于0与1之间。
l 性质2:若b是a 的对立事件,则P(A)+P(B)=1
l 性质3:若AB,则P(A-B)=P(A)-P(B)
l 性质4:事件A与B的并的概率为P(A∪B)=P(A)+P(B)-P(AB)
l 性质5:对于多个互不相容的事件A1、A2,有
P(A1∪A2…)=P(A1)+P(A2)+…
l 条件概率及概率的乘法法则:,P(A/B)为在b事件发生的条件下,事件a发生的概率。(条件概率)
l 性质6:对于任意两个事件A与B,有P(AB)=P(A/B)P(B)=P(B/A)P(A)
l 性质7:假如两个事件相互独立,则P(AB)=P(A)P(B)
l 性质8:假如两个事件相互独立,则在事件b发生的条件下,事件a的条件概率等于事件a的概率。
7 掌握事件的互不相容性和概率的加法法则
8 掌握事件的独立性、条件概率和概率的乘法法则
二、 随机变量及其分布
表示随机现象成果的变量称为随机变量
离散随机变量的分布可用分布列表示。
连续随机变量X的分布可用概率密度函数p(x)表示
l p(x)一定位于x轴的上方
l p(x)与x轴所加的面积恰好为1,即
l 连续随机变量x在区间[a,b]上的取值的该频率为概率密度曲线下,区间[a,b]上所夹曲边梯形的面积
l 随机变量x取一点的概率为零,因为在一点上的积分永远为零
l ,这是因为p(x=b)为零。
l 可用其概率密度函数来求得,即
F(x)=P(X)=
反之,
随机变量X的分布有几个重要的特性数,用来表示分布的集中位置和散步程度,均值用来表示分布的中心位置,用E(X)表示。方差用来表示分布的散步程度,用Var(X)表示,方差大意味着分布的散步程度大,
Var(X)=
-----X的标准差
随机变量的均值与方差的运算有如下性质:
l 设X为随机变量,a与b为任意常数,则有
E(aX+b)=aE(X)+b
Var(aX+b)=a2Var(X)
l 对任意两个随机变量x和y,则有E(x+y)=E(x)+E(y)
l 设随机变量x和y独立,则有Var(x+y)=Var(x)+ Var(y)
二项分布
X
0
1
P
1-p
P
E(X)=p
Var(X)=p(1-p)
泊松分布:一个铸件上的缺陷数,一平方的玻璃上的气泡的个数,若表示某特定单位内的平均点数,,又令X表示某特定单位内出现的点数,则X取x值的概率为:
E(X)=
Var(X)=
超几何分布:从一个有限总体中进行不放回抽样常会遇到超几何分布。
设N个产品组成的总体,其中含有M个不合格品,若从中随机不放回取n个产品,则不合格品的个数X是一个离散随机变量,能够求得X=x的概率是:
E(X)=
Var(X)=
正态分布:概率密度函数为
,-
标准正态分布,
l 标准正态分布函数用来计算形如:
l
l
l
l
有关正态分布的计算
l 设X~N(),则U=
l 设X~N(),对任意实数a,b有:,,
均匀分布:
均匀分布在两端点a与b之间有一个恒定那个的概率密度函数,即在(a,b)上概率密度函数是一个常数。
当,p(x)=
E(X)=
Var(X)=
对数正态分布:如化学反应时间,绝缘材料被击穿事件等,
指数分布:
E(X)=
Var(X)=
中心极限定理:
l 随机变量的独立性
l 正态样本均值的分布,设X1,X2,X3是n个相互独立的同分布的随机变量,设其共同分布为正态分布,则样本均值仍为正态分布。其均值为,即正态样本均值
l 非正态样本均值的分布,设X1,X2,X3是n个相互独立的同分布的随机变量,设其共同分布不为正态分布,但其均值为正态样本均值
三,统计基础知识
总体
样本
频数、频率直方图
在横轴上标上每个组的组限,以每一组的区间为底,以频数(频率)为高画一个矩形,所得的图形称为频数(频率)直方图。特点:中间高,两边低,左右基本对称,这阐明这个样本也许取自某正态总体。
直方图的观测与分析:
l 对称型:
l 偏态型:有时是剔除了不合格品后的图形,有的是质量特性值的单侧控制导致的(宁大勿小,宁小勿大)
l 孤岛型:往往体现为某种异常,如材料发生了变化,不纯熟的工人接班
l 锯齿型:测量措施不当、分组不当、精度较差
l 平顶型:某种迟缓的原因导致的,例如刀具的磨损
l 双峰型:往往由不一样精度的两种机床、不一样操作水平的工人等
统计量:
样本极差R=x(n)-x(1)
样本方差:
样本离差平方和
样本方差定义为,也能够用简便公式:或者=
样本标准差为s=,
样本变异系数:
三大抽样分布:
t分布:
分布:
F分布:
四、参数估量
点估量:
第二章 常用统计技术
一、 方差分析
方差分析实在相同方差假定下检查多个正态均值是否相等的一个统计分析措施。
单因子试验数据表
水平
试验数据
和
均值
A1
T1
A2
…
Ar
Tr
用表示n个数据的差异能够用总离差平方和表示:
引起数据差异的原因有两个,一个是水平A不一样,另一个是存在随机误差。
,因子A的平方和,
,误差平方和。
=n-1=rm-1
=r-1
=r(m-1)
均方:
,
F比=
单因子方差分析法
起源
平方和
自由度
均方
F比
因子A
r-1
误差e
n-r
总体T
n-1
重复数不等的情况,假定在Ai水平下进行了mi次,那么方差分析仍然能够进行,只是有些计算要改动,此时n=,,
回归分析:
散点图
有关系数r
有关系数的检查
拒绝域为:
一元线性回归方程:
Y=a+bx
回归方程的明显性检查
措施一:r的绝对值不小于临界值
措施二:=
计算F比,给出明显性水平,当F不小于。。。。,以为回归方程明显。
曲线回归方程的比较:
l 要求有关系数R大:
l 或者要求标准残差小:
试验设计
常常需要进行试验,从影响产品质量的某些原因中去寻找好的原料搭配、好的工艺参数搭配等,这便是多原因的试验设计问题。
正交表
,L是正交表的代号,9表示表的行数,即在9个不一样的条件下进行的试验。4表示表的列数,即最多可安排4个因子,3表示表的主体只有3个不一样的数字。
l 每列中每个数字重复次数相同
l 将任意两列的同行数字当作一个数对,那么一切也许数对重复次数相同。
常用的正交表有两大类,一般的正交表记为,行数n,列数p,水平q,有如下关系:
尚有一类正交表的行数、列数、水平数不满足上述的两个关系,往往只能考查各种因子的影响,不能用这些正交表来考查因子间的交互作用。
无交互作用的正交试验设计与数据分析:
(1)因子水平表
因子
水平1
水平2
水平3
A
B
C
(2)选用适宜的正交表,进行表头设计,列出试验计划:
表头设计
A(因子)
B
C
y
试验号\列号
1
2
3
4
1
2
3
。。。
R
表示其三个水平下的试验成果的平均,
(3)数据分析
(4)数据方差分析:在方差分析中,假定每个试验都是独立进行的,每一试验条件下的试验指标服从正态分布,这些分布的均值与试验的条件有关,也许不等,但他们的方差都是相等的。
平方和分解:用总平方和去描述数据的总波动:
,乘以3的意思是每个水平重复进行了3次试验。
F比:与方差分析类似,称平方和与自由度的比为均方,用因子的均方与误差的均方进行比较,当时,以为在明显性水平上因子是明显的。一个因子的自由度时期水平数-1,为论述以便,也称正交表一列的自由度为其水平数-1,即q-1,因子的自由度与所在列的自由度应当相等。误差平方和为正交表上空白列的平方和相加而得,其自由度为正交表上空白列的自由度相加,总平方和的自由度是试验次数-1,即n-1。正交表的自由度,
通过代数运算,能够用下式计算一列平方和与总平方和。
当试验指标不服从正态分布时,进行方差分析的依据就不充足,因此通过比较各因子的贡献率来衡量因子作用的大小。
为因子的纯平方和;称因子的纯平方和与的比为因子的贡献率;
称为误差的贡献率。
有交互作用的正交试验设计与数据分析:
数据分析:
第三章 抽样检查
一般应用于破坏性检查、批量很大、测量对象是散装或者流程性材料、其他不适于使用全数检查,或全数检查不经济的场所。
接收质量限AQL:可允许的最差过程平均质量水平。是允许的生产方过程平均的最大值。
极限质量LQ:它是在抽样检查中对孤立批要求的不应接收的批质量水平的最小值。
接收概率及抽检特性(OC)曲线:接收概率的计算措施有三种:
1、 超几何分布计算法。
超几何分布计算法可用于任何N和n,但计算较为复杂,当N很大的时候,可用二项分布计算
2、 二项分布计算法
P为批不合格品率。
3、 泊松分布计算法
抽样方案中的两种风险:
生产方风险
使用方风险
平均检查总数ATI:是平均每批的总检查数目,包括样本量和不接收批得全检量,这个指标衡量了检查的经济性。使用抽样方案(n,Ac)抽样不合格品率为p的产品,当批的接收概率为L(p)对与接收批,检查量即为样本量n;对与不接收批,实际检查量为N,因此该方案的平均检查总数ATI=nL(p)+N(1-L(p))
平均检出质量AOQ:是指检查后的批平均质量。使用抽样方案(n,Ac)抽检不合格品率为P的产品时,若检查的总批数为k,因为不接收批中的所有产品通过全检不存在不合格品,而在平均kL(p)接收批中,有(N-n)p个不合格品,因此抽样方案的平均检出质量为:AOQ=
平均验出质量上限:AOQL
怎样满足AOQL这个指标有两个途径:一是最根本的途径,减少过程的不合格率,假如不合格率达不到要求,只能靠检查来确保出厂质量。
抽样程序
l 确定质量标准
l 确定P0、P1,一般P1=(4~10)P0,确定的时候要综合考虑过程能力、制导致本、产品不合格对用户的算式、质量要求和检查费用等原因
l 批的组成:同一批内的产品应当是在同一制造条件下生产的,一般按包装条件及贸易习惯组成的批,不能直接作为检查批。批量越大,单位产品所占的检查费用的百分比就越小。
l 检索抽样方案:查表
l 样本的抽取
n 简单随机抽样:抽签、随机、
n 系统抽样法:等距抽样、机械抽样,操作简单,不易犯错,但轻易出现比较大的偏差,因此在总体会发生周期性的变化的场所,不宜使用这种抽样的措施。
n 分层抽样法:类型抽样法。例如从堆放零件的三个地方分别随机抽取5个,然后和在一起是15个。特点:样本代表性很好,抽样误差比较小,不过手续比较复杂。
n 整群抽样法:在整体中随机抽取若干个群,则这些群中的所有个体组成样本。实行以便,但代表性差,误差大。常用于工序控制中。
GB/T 2828.1的使用程序
正文、主表(样本量字码、正常、加严、放宽1次 2次和5次抽样表)和辅助图表(方案的oc曲线,平均样本量ASN和数值)
A、B、C类不合格或者不合格品
抽样方案检索要素确实定
l 过程平均估量:过程平均是在要求的时段或者生产量内平均的过程水平。是指过程处在统计控制状态期间的质量水平。用于估量过程平均不合格品率的批数,一般不应少于20批。
l 接收质量限AQL确实定:以产品为核心,应考虑所检产品特性的重要程度,并依照产品的不合格分类分别要求不一样的AQL值。项目越多,AQL值应当大些。产品复杂程度大或者缺陷只能在整机运行时才发觉时,AQL应当小些。产品对下道工序影响越大,AQL取值越小,产品越宝贵,AQL应当越小。还要兼顾生产企业和同行企业生产的实际特点。AQL一旦确定,不能随意变化
l 批量:应有生产条件和生产时间基本相同的同型号、同等级、同种类的单位产品数组成。
l 检查水平IL的选择:事先选定,重要作用在于明确N和n的关系,N越大,n也应对应的高,但不成百分比,重要是为了激励在过程稳定的情况下大批交验。检查水平有两种,一般检查水平和特殊检查水平,一般检查水平包括ⅠⅡⅢ3个检查水平;特殊检查水平要求了s-1。。。s-4,4个检查水平。选择检查水平要考虑:产品的复杂程度与价格,结构简单、价格低廉的产品检查水平应低些,检查费用高的产品应选择低检查水平;破坏性检查选低水平或者特殊检查水平;生产稳定性差的或者新产品选择高检查水平,批与批之间差异大的必须选择高水平,质量波动幅度小,能够采取低水平。
l 检查严格程度的要求:正常检查、加严、放宽
l 抽样方案类型的选用:往往使用方乐意采取二次或者数次抽样
l 检查批的组成:能够使投产批、销售批、运输批,但每批应当是同型号、同等级、同种类的产品,且由生产条件和生产时间基本相同的单位产品组成。
样本的抽取:随机抽取,当二次或者数次抽样时,每个后继的样本应从同一批的剩余部分中抽取。
转移规则:
l 正常→加严:连续5批或者不到5批中有2批不接收
l 加严----正常:加严检查时,连续5批接收,则下批正常
l 正常-放宽:
n 转移得分最少30分:该批被接收,转移得分加2分;加严检查也被接收,转移得分为3分
n 生产稳定
n 负责部门以为能够放宽
l 放宽---正常:在放宽检查时,有一批不接收、生产不稳定或者延迟、或者负责部门以为需要恢复正常。
l 暂停检查:加严后,累计5批不接收。
抽检特性曲线OC曲线:复合曲线的尾部和加严曲线吻合,复合曲线在P<AQL的时候,同放宽抽样方案的OC曲线相吻合。
平均样本量ASN:是指为了做出接收或者不接收决定的平均每批抽取的单位产品数。
孤立批计数抽样检查及GB/T 2828.2的使用
孤立批是脱离已生产或者聚集的批系列
孤立批的抽样方案是通过控制使用方风险来实现对批得质量确保的。
模式A:在生产方和使用方都是孤立批的情形下,如单件小批生产、质量不稳定、新产品试制。必须要求极限质量LQ,批量N和抽样类型
模式B:对生产方而言是连续批,不过对使用方采购的产品批数较小,视为孤立批。必须要求极限质量LQ,批量N和抽样类型和抽样水平
其他抽样检查措施:
序贯抽样检查:一般适合用于宝贵物品的检查,事先不固定样本数,逐一抽取个体
展开阅读全文