资源描述
全员六西格玛实用知识手册
(管理、专技岗)
不锈冷轧厂技术科
二〇〇九年八月
目 录
第一章 六西格玛管理概述4
第一节 六西格玛的含义4
一、六西格玛的统计学含义4
二、六西格玛DMAIC改进模式的含义5
三、DMAIC各阶段的步骤、使用工具及主要输出6
第二节 太钢的全员六西格玛工作8
一、太钢六西格玛管理的战略定位和目标8
二、六西格玛管理的核心理念9
三、六西格玛管理推进的总体思路9
四、六西格玛管理推进的主要内容和要求10
第二章 基本统计知识简介14
第一节 基本统计学14
一、统计学的特点14
二、概率论基础知识14
三、数据的收集与整理16
第二节 抽样方法18
一、简单随机抽样18
二、系统抽样18
三、分层抽样19
第三节 描述性统计方法20
第三章 六西格玛工具简介25
第一节 调查表25
第二节 分层法26
第三节 排列图28
第四节 因果分析图30
第五节 直方图32
第六节 散布图35
第七节 控制图36
第八节 关联图39
第九节 亲和图41
第十节 系统图法42
第十一节 矩阵图44
第十二节 矩阵数据分析法45
第十三节 过程决策程序图法46
第十四节 网络图法48
第十五节 头脑风暴法50
第十六节 流程图51
第十七节 其它简易图表54
第十八节 测量系统分析56
第十九节 过程失效模式与效果分析(PFMEA)64
第二十节 过程能力分析69
第二十一节 假设检验简介87
第一章 六西格玛管理概述
第一节 六西格玛的含义
一、六西格玛的统计学含义
σ(西格玛)是一个希腊字母,在数理统计中表示“标准差”,是用来表征任意一组数据或过程输出结果的离散程度的指标,是反映产品或生产过程某种特征波动大小的统计量。由于σ的大小可以反映质量水平的高低,所以六西格玛采用“σ水平”(也叫Z水平)的尺度来衡量过程绩效。σ水平是将过程输出的平均值、标准差与顾客要求的目标值、规格限联系起来进行比较,是对过程满足顾客要求能力的一种度量。σ水平越高,过程满足顾客要求的能力就越强;σ水平越低,过程满足顾客要求的能力就越低。
在正常生产过程中,过程大多存在着正常的波动---分布中心与规格中心之间的偏移。(通常为±1.5σ)
1.5σ
按1.5σ的偏移计算和缺陷数及合格率之间的关系如下表所示:
西格玛水平
百万机会缺陷数(DPMO)
合格率(%)
1
691500
30.85
2
308537
69.15
3
66807
93.32
4
6210
99.38
5
233
99.977
6
3.4
99.99966
如果不考虑中心偏移(即认为分布中心与规格中心重合),则σ水平与合格率关系如下表所示:
西格玛水平
百万机会缺陷数(DPMO)
合格率(%)
1
317300
0.6827
2
45500
0.9545
3
2700
0.9973
4
63
0.999937
5
0.57
0.99999943
6
0.0018
0.9999999983
二、六西格玛DMAIC改进模式的含义
Define 定义
Measure 测量
Analyze 分析
Improve 改进
Control 控制
DMAIC是六西格玛管理方法论中的改进模式,代表了六西格玛改进的五个阶段。DMAIC是一个逻辑严密的过程循环,它是在总结了全面质量管理几十年来的发展及实践经验的基础上产生的。DMAIC强调以顾客(外部和内部)为关注焦点,并将持续改进与顾客满意以及企业经营目标紧密地联系起来;它强调以数据的语言来描述产品或过程业绩,依据数据进行管理,并充分运用定量分析和统计思想;它追求的是打破旧有习惯、有真正变化的结果和带有创新的问题解决方案以适应持续改进的需要;它强调面向过程,并通过减小过程的变异或缺陷实现降低风险、成本与缩短周期等目的。
DMAIC 过程共分五个阶段实施,每个阶段的工作内容如下:
Define (定义阶段):确认顾客的关键需求并识别需要改进的产品或流程,决定要进行测量、分析、改进和控制的关键质量特性(CTQ),将改进项目界定在合理的范围内。
Measure (测量阶段):通过对现有过程的测量和评估,制定期望达到目标及业绩衡量标准,识别影响过程输出Y的输入XS,并验证测量系统的有效性。
Analyze (分析阶段):通过数据分析确定影响输出Y的关键XS,即确定过程的关键影响因素。
Improve (改进阶段):寻找最优改进方案,优化过程输出Y并消除或减小关键XS的影响,使过程的缺陷或变异降至最低。
Control (控制阶段):将改进成果进行固化,通过修订文件等方法使成功经验制度化。通过有效的监测方法,维持过程改进的成果并寻求进一步提高改进效果的持续改进方法。
DMAIC的基本逻辑
DMAIC的基本逻辑
需要解决的问题是什么?
当前的水平?
差距多大?
原因是什么?
关键因子是什么?
关键因子确实是哪些?
如何改进?
如何保持成果?
测量
分析
改进
控制
定义
三、DMAIC各阶段的步骤、使用工具及主要输出
D(定义阶段)
步骤
常用工具和技术
主要输出
项目背景
问题陈述
项目范围
问题定义
现状及目标
财务收益
项目组织架构
项目日程计划
头脑风暴法 力场图
亲和图 SDCA分析
树图 因果图
流程图 顾客之声
SIPOC图 劣质成本
平衡计分卡 项目管理
项目选择原因
项目起点基线,项目目标
软性和硬性财务指标
项目小组组长及组员名单及职责
项目时间计划表
M(测量阶段)
步骤
常用工具和技术
主要输出
针对Y的测量系统分析
工程能力分析
寻找所有因子
进行因子筛选
实施快速改进
测量阶段结论
排列图 劣质成本分析
因果图 PDPC分析
散布图 水平对比法
过程流程图 直方图
测量系统分析 趋势图
失效模式与影响分析 检查表
过程能力指数 抽样计划
测量系统重复性和再现性确认
工程能力现状确认
原因变量(X)初步确认
原因变量(X)初步筛选
原因变量(X)进一步筛选
需要进一步分析的关键原因变量名单
A(分析阶段)
步骤
常用工具和技术
主要输出
微观流程分析
描述统计分析
推理统计分析
分析阶段总结
头脑风暴法 试验设计
因果图 抽样计划
PDPC分析 假设检验
审核 多变量图
水平对比法 回归分析
方差分析 劣质成本分析
不增值步骤最小化
X测量系统重复性和再现性研究
原因变量概略分析
验证后的原因变量
验证后的关键变量名单以及阶段性改善效果
I(改进阶段)
步骤
常用工具和技术
主要输出
常规改善方案
DOE试验设计
验证改善方案
试验设计 调优运算
质量功能展开(QFD)测量系统分析
正交试验 过程改进
响应曲面法
部分改善前后的效果对比
DOE实施方案
KPIV及最优设置
KPIV及最优设置确认
改善方案落实
C(控制阶段)
步骤
常用工具和技术
主要输出
制定控制计划
SPC for Y
Y的工程能力再分析
SPC for X
X的工程能力再分析
改善效果跟踪
财务收益核算
下一步计划
控制图
过程能力指数分析
统计过程控制技术
标准操作程序(SOP)
防差错措施
过程文件控制
控制行动方案
Y控制图
Y工程能力
X控制图
X工程能力
改善后效果确认
实际财务效果确认
第二节 太钢的全员六西格玛工作
一、太钢六西格玛管理的战略定位和目标
六西格玛管理是太钢基本的经营战略,六西格玛理念是太钢的经营哲学。
(一)总体要求
1、公司不能不推行六西格玛;
2、公司不能允许不推行六西格玛的干部和员工。
(二)六西格玛管理在公司的定位
1、经营理念和企业文化的最重要内涵;
2、落实核心价值观、提升以质量为主的综合竞争力、实现战略目标的主要路径;
3、企业管理创新和经营绩效改善的最重要方法;
4、引领公司走出当前经营困境的极具现实意义的重要举措。
(三)目标
1、主要岗位6σ知识普及率和主要工序6σ方法应用覆盖率达到80%以上,使六西格玛成为全员的自觉行动和日常工作习惯,实现企业文化的落地生根;
2、形成太钢特色的以六西格玛为核心的管理创新体系;
3、实现公司综合竞争力的快速提升。
二、六西格玛管理的核心理念
(一)关注顾客——六西格玛的关注点和企业存在的价值
企业依存于顾客,获得高的顾客满意度和忠诚度是企业所追求的主要目标。六西格玛管理强调从倾听顾客的声音开始,基于顾客要求驱动进行持续改进。
(二)追求卓越——六西格玛的目标
六西格玛质量水平意味着百万出错机会(DPMO)中不超过3.4个缺陷,实施六西格玛并不一定要达到六西格玛水平的质量,但使过程趋于目标值并减少波动,追求零缺陷、追求卓越是我们不断改进和提升的目标。
(三)持续改进——六西格玛的核心工作
随着社会的不断前进和发展,顾客及其他相关方的需求和期望也会不断变化,持续改进是组织的一个永恒的目标,六西格玛管理的方法路径就是使所定义的绩效指标持续得到突破性的改善。
(四)强烈的危机意识和创新意识——六西格玛的动力
在当前日益竞争激烈的市场环境中,只有时刻胸怀强烈的危机和竞争意识,不断创新工作思路和方法,才能使企业永葆青春活力,而六西格玛为企业创新提供了所必需的管理工具和操作技巧。
(五)用数据说话——六西格玛的精髓
六西格玛管理的精髓就是强调一切用数据和事实说话,而不是基于感觉和经验。界定、测量问题要量化、清晰,分析问题要应用统计方法进行数据的分析以确定显著影响关键绩效指标的因素,并通过改进获得优化的结果。
三、六西格玛管理推进的总体思路
总体思路:建立“全员参与、持续改进的快速实效型六西格玛”模式,实现六西格玛管理的“理念化、实用化、现场化、快速化、普及化”。
具体特点是:
(一)全员、全方位参与
1、参与人员覆盖各级管理者、技术人员、岗位员工等各层次人员;
2、参与单位覆盖生产主流程、辅助工序、业务和管理等部门;
3、业务层面覆盖制造、研发、采购、销售、设备、环保、能源、安全、信息化、物流、财务、人力资源等各环节;
4、绩效要素覆盖质量、成本、效率、服务。
(二)管理和改进方法的系统性整合
在六西格玛管理的框架内,对战略管理、绩效评价、精益制造等各方面的管理方法和工具(包括平衡记分卡、标杆管理、5S、JIT、TPM等)进行系统化的梳理和整合,形成太钢特色的以六西格玛为核心的管理创新体系。
(三)多层次、系统化的6σ改进组织体系
将所有改进团队活动和改进项目纳入6σ改进范畴内,构建系统化的6σ改进组织体系。
(四)多样化的方法和技术工具应用
根据实际工作需求有针对性地、灵活地采用6σ改进(DMAIC)、6σ设计(DFSS)和精益生产(Lean)的流程和方法,实施全方位的绩效改进。
(五)快速和持续改进
通过运用6σ的方法和工具快速和持续地推进企业经营过程中存在的各类问题的解决,使6σ管理和公司日常生产运营有机结合。
四、六西格玛管理推进的主要内容和要求
(一)推进六西格玛的“实用化、现场化、快速化、普及化”,使六西格玛成为全员的自觉行动和日常工作习惯
1、主要采取以下两方面的工作来实施日常六西格玛的改进,其中第一方面是下一步需要全面推进的重点工作:
第一,各单位要重点分析、挖掘当前存在的各类产品质量问题以及设备运行、生产组织等各方面影响工作质量、工作效率和成本的问题,灵活运用六西格玛理念、方法实施动态、快速的自主改善,减少岗位工作偏差,实现工作绩效指标的稳定受控和持续改进。
第二,各单位要根据顾客需求和与标杆水平的差距,规范运用六西格玛的改进流程进行团队化、项目化的改进,实现经营绩效的突破性提升。必要时公司以指令性课题的形式立项,组织各相关单位予以推进。
2、各单位要全面推进岗位工作标准和操作要点的细化、量化和精确化,以作为量化分析工作偏差、评价工作绩效的基础。
3、各岗位要全面系统地进行绩效水平的测量以及数据的收集、统计和分析。所有的绩效指标都要实现量化描述,并用图表和统计工具进行日常绩效水平的分析。在绩效水平的描述和分析中必须用数据说话,杜绝含糊的、概念化的语言。
4、公司综合绩效指标和各岗位指标用六西格玛语言进行描述,实现绩效水平评价的科学性、可比性。
5、各单位要通过各类方式对基层员工进行针对性的六西格玛理念和基本方法的教育和培训,特别要完善现场进行数据化控制和分析所需要的基本的软件和硬件条件,为基层员工进行日常工作控制和改进创造良好的工作环境。
6、充分利用公司信息化系统资源,快速地获取绩效测量数据,研究存在的偏差,挖掘问题点,支持快速改进。
7、充分利用各种方式,开展交流互动和经验分享,不断总结、创新推进模式并通过信息化平台实现理念、信息、方法、知识等的快速、高效传播和共享。
(二)各业务改进环节六西格玛组织方式和改进方法、工具的运用
公司各业务主管部门在组织实施全公司相关业务的改进过程中,以及各单位在实施内部绩效改进过程中,针对具体的绩效改进内容,可参照下表中建议的组织方式和改进方法、工具,灵活运用各类科学的改进方法,突出体现用数据说话的要求,组织动员各层次管理人员和操作员工实施全方位改进。
序号
改进内容
改进
特点
组织方式
工具和方法
推进各阶段展开
定义
测量
分析
改进
控制
1
品质类
主要运用和的方法致力于改善产品质量。
攻关团队(Great Team)
DMAIC
定义清楚欲解决的问题,细化分解目标。
初步原因分析和快速改善。
查找、分析关键原因。
优化关键因子。
标准化、固化改进措施。
质量改进课题
DMAIC
定义清楚欲解决的问题。
初步原因分析和快速改善。
查找、分析关键原因。
优化关键因子。
标准化、固化改进措施。
DMAIC
定义清楚欲解决的问题。
初步原因分析和快速改善。
查找、分析关键原因。
优化关键因子。
标准化、固化改进措施。
DMC、DAC
定义清楚欲解决的问题,针对原因分析进行快速改善。
标准化、固化改进措施。
岗位精益控制点
DC、C
围绕控制参数进行有效控制、分析和改进。
2
生产效率类
主要运用精益的方法提高生产效率,缩短产品制造周期。
精益制造(5S、JIT等)
岗位标准化
QSS
价值流图分析,查找浪费和不增值工序,进行工序平衡。
用价值流图进行流程分析,明确需改进的是哪种浪费。
Pareto分析,时间分析,瓶颈分析。
精益改善工具使用:看板,快速换模等。
制度化建立,防错,标准化作业等。
3
成本改善类
主要运用精益和SPC的方法减少浪费、降低成本。
精益制造(5S、JIT等)
QSS
岗位精益控制点
直接实施快速改善(但对可能影响交期和质量的需要验证无负面影响)。
确定降本措施。
统计分析改善措施是否对质量、消耗和交期有影响。
执行降本措施。
建立质量、消耗、交期的监控制度。
4
设备故障类
主要运用TPM的方法减少设备故障。
TPM
QSS
岗位精益控制点
通过对设备的失效模式进行分析并对关键设备的关键部件进行TPM改进。
用设备构造图取代流程分析,以使M阶段确定故障发生点。
如果流程稳定性分析发现特殊原因是故障的主要构成部分,重点执行FMEA分析,并制定改善计划。
只有故障主要是由规律性发生的小故障构成为主才需要进行深入分析,一般用Pareto分析可以达到目标。
定期维护或状态维护计划的制定。
FMEA更新,点检制度化,责任制等。
5
管理类
主要运用流程优化的方法提高工作效率。
BPR
制度创新QSS
主要是流程的标准化和效率提升,流程的定性分析和时间分析。
用职能分布流程进行流程分析,流程规范化。
采集时间节点、工作量等方面的数据。
Pareto分析,时间分析,瓶颈分析。
未来流程图的建立,责任制建立。
流程控制系统建立,相关管理政策制定。
(三)六西格玛管理方法的学习、研究、借鉴和创新
1、在公司层面不断学习全球最优秀企业的管理方法,结合企业实际进行管理方法的整合和创新。
2、各单位要按照公司的六西格玛管理推进思路和要求,学习、借鉴公司内外的先进经验,进行本单位管理和推进方法的创新。
(四)管理、改进成果的固化和保持
及时将改进成果以管理程序、管理制度、操作规程、岗位工作标准等形式进行固化,纳入质量、环境、安全等各项专业管理体系中,使管理体系不断地在更高的水平上运行,提升公司整体绩效水平。
(五)各单位领导力的发挥
1、各单位主要领导是本单位推行六西格玛管理的第一责任人,必须亲自策划、组织和推进。
2、各单位要建立层层落实的六西格玛推进责任制。
3、各单位要确定工作热情高、能力强、业务素质优的员工专职担任本单位的六西格玛推进员。
第二章 基本统计知识简介
第一节 基本统计学
一、统计学的特点
简单地说,统计学是研究如何收集、整理、分析和解释数据资料的一门科学,它的性质特点主要表现在以下几个方面:
⑴ 统计学是研究数量方面的学问。
⑵ 统计学研究的是客观现象总体的数量特征。
⑶ 统计学主要研究不确定性现象。
⑷ 统计学是一门方法论的科学。
二、概率论基础知识
许多决策都涉及对不确定性问题的处理。过程能否满足要求?用于过程控制的标准度量是否准确?是否具有可重复性?接收到的一批产品的质量是否满足合同的质量要求?统计方法可以回答这些问题。先讨论一些基本的概率概念,它们是常用统计方法的基础。
1、随机现象、随机事件、随机变量的概念
a.随机现象:指不能完全准确预知结果的现象。例如:掷硬币出现正面还是反面?下期中奖彩票号码是多少?明日股市指数会是多少?
b.随机事件:在同一组条件下,对某种事物或现象进行观察或实验,把观察的结果叫做随机事件。随机事件是概率论中的一个基本概念。
如抛掷一枚质地均匀的骰子就是一次试验,骰子落地,可能出现1点、2点、…、6点,或为奇数点或为偶数点,点数大于3等等,这些就是一个个事件。这些事件在一次试验中可能出现也可能不出现。与此不同,还有两种事件,如“点数大于6”,在每次抛掷骰子时是一定不会出现,而“点数小于7”,在每次抛掷骰子时是一定会出现。于是,又引出两个概念:
l 必然事件:在同一组条件下,每次试验一定出现的事件。
l 不可能事件:在同一组条件下,每次试验一定不出现的事件。
必然事件和不可能事件可以作为两种极端的随机事件来看待。随机事件用大写字母A、B、C等表示。必然事件用 Ω 表示,不可能事件用Φ表示。如果一个事件不能分解成两个或更多的事件,则称为基本事件或简单事件。如“点数为1”、“点数为2”、…、“点数为6”是抛掷骰子这个试验的6个基本事件,又可记为{1}、{2} 、…、{6},其中:1、2、…、6称为样本点。试验中一切可能的样本点构成样本空间,记为Ω。抛掷骰子试验中,Ω ={1,2,3,4,5,6}。
c.随机变量:如果随机试验的每种结果可以用一个数字作为代表,则我们称此种变量为随机变量。
2、随机变量分布的概念
随机变量通常用大写字母X,Y,Z等表示,随机变量的取值常用小写字母x、y、z等表示。我们知道随机变量可以分为两类:连续型随机变量和离散型随机变量。
连续型随机变量一般指产品尺寸、强度、重量、温度、时间等的测量数据,离散型随机变量一般指不良品个数、缺陷个数、缺勤数等的测量数据。
⑴ 连续型随机变量
a.优点:
l 可以比较敏感地反映过程的变化,包含的信息丰富。
l 可以用较少的样本量获得分析结论。
b.缺点:
l 对测量手段的要求较高。
l 测量成本较高。
⑵离散型随机变量
a.优点:
l 对测量手段和测量精度的要求不高。
l 测量成本也比较低。
b.缺点:
l 在反映过程变化方面不如连续数据那样敏感。
l 往往需要较大的样本量和较长的测量周期才能得出分析结论。
在测量时,区分数据是连续型的还是离散型的十分重要。项目团队应根据项目的具体情况,确定样本的数据类型。一般来说,在收集数据时,应尽可能地采用连续型数据,以便提供尽可能多的可用于过程改进的信息。
三、数据的收集与整理
在六西格玛项目实施的过程中,需要不断与数据打交道,需要不断依据数据做出决策,需要处理形形色色的数据。而按照不同的分类方法,数据又可以分为不同的种类。
1、按变量在数轴上的取值分类
按变量在数轴上的取值,数据可以分为连续型数据和离散性数据。连续型数据是用连续坐标进行测量而得出的数据,也称计量型数据,如长度、人的身高、重量等。连续型数据的特点是,测量数据可以比较敏感地反映过程的变化,包含的信息丰富。但连续型数据一般对测量手段要求较高。离散性数据如合格/不合格、通过/失败、是/否等,其在反映过程变化方面不如连续型数据那样敏感,需要较大的样本量才能得出分析结论。但对测量手段和测量精度要求不高。
一般说来,在收集测量数据时,应尽可能采用连续型数据,以便提供尽可能多的可用于过程改进的信息。
2、按采用测量的尺度不同分类
测量是按照某种规则,用数据来描述观察到的现象,即对事物作出量化描述。测量是对非量化事物的量化的过程。测量尺度一般有四类:定类、定序、定距和定比。
⑴ 定类数据:用来测量被测对象类别归属的测度称为定类尺度,按定类尺度进行测量所得的变量称为定类变量,定类变量的观测值即为定类数据,定类变量表现为类别。如男人、女人;又如汽车、火车、自行车;定类尺度是测量形式中最简单的一种。定类尺度中类别划分是有要求的,那就是集合中的所有项都应属于一类且仅属于一类。能识别的关系只有“是”或者“不是”。
⑵ 定序数据:指用来测量被测对象具体属性的高低、大小、先后、优劣次序的测度称为定序尺度。按定序尺度进行测量所得的变量称为定序变量,定序变量的观测值即为定序数据。定序变量表现为有序的类别。如对太钢500名职工的经济收入按高、中、低进行测量,测量结果为高、高、低、中、低……等即为一组定序数据。再如将降水量按“旱”、“偏少”、“中等”、“偏多”、“涝”分为5类等。定序数据能识别的关系为“相等”、“不相等”、“大于”、“小于”。
⑶ 定距数据:用来准确测量被测对象之间确切差距的测度称为定距尺度,按定距尺度进行测量所得的变量称为定距变量,定距变量的观测值即为定距数据。定距变量表现为数值,可进行加减运算。如对钢厂职工进行钢铁知识测验,测验结果为70、89、96、……,分即为一组定距数据,再如记录事件发生的日期和时间等。定序数据能识别的关系除了“相等”、“不相等”、“大于”、“小于”之外,还能识别差距的大小如90分与60分的差距比80分与70分的差距要大。
⑷ 定比数据:定比尺度与定距尺度原则上属于同一层次,定比测量尺度具有定距测量尺度的所有功能,一般可不作区别。它们唯一区别在于定比尺度具有绝对零点,按定比尺度进行测量所得的变量称为定比变量,定比变量的观测值即为定比数据。定比变量也表现为数值,可进行加、减、乘、除运算 。定比数据一般在对同一个事物的两个不同测量结果之间的比值有意义时使用,如长度、质量、电流强度等,这类数据可以讨论它们的比值。如重量为2吨的钢板是重量为1吨的钢板的2倍是有意义的。
第二节 抽样方法
抽样是收集过程数据时最常用的工具,为了确保数据的准确性和代表性,必须采用适当的抽样方法,常用的是简单随机抽样、分层抽样等方法。
一、简单随机抽样
设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。简单随机抽样方法是其他更复杂抽样方法的基础。简单随机抽样是逐个抽取,不放回抽样,各个个体被抽到的概率相等。因此,必须满足两个基本的条件:
等可能性:总体中的每个个体有同等机会被抽到。
独立性:每次抽样都是相互独立的。
简单随机抽样的两种方法:
抽签法:编号写签,搅拌均匀,逐个抽取,先后抽取概率均等。抽签法简便易行,适用于个体数不太多的总体。
随机数表法:即“三步曲”,第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码。
二、系统抽样
当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样。
系统抽样的步骤:(总体中的个体的个数为N,样本容量为n)
⑴ 采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等
⑵ 确定分段(部分)的间隔k当是整数时,k=;当不是整数时,先从总体中用简单随机抽样剔除一些个体,使剩下的总体中个体数能被n整除,取k=。
⑶ 在第一段用简单随机抽样确定起始的个体编号。
⑷ 按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,……)。
与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的。
可以证明:当n不能整除N时,先剔除的个体与其它个体一样,被抽的概率也是1/N。
三、分层抽样
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
⑴ 两种方法:
先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。
分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
⑵ 分层标准:
以调查所要分析和研究的主要变量或相关的变量作为分层的标准。
以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。
以那些有明显分层区分的变量作为分层变量。
⑶ 分层的比例问题:
按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。
简单随机抽样、系统抽样和分层抽样都是等概率抽样,简单随机抽样是基础,系统抽样的第一部分和分层抽样的每一层都采用简单随机抽样。随机抽样、系统抽样、分层抽样都是不放回抽样。
第三节 描述性统计方法
在数据分析的时候,一般首先要对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布以及一些基本的统计图形。 常见的描述性统计指标见下表。
常见的描述性统计
样本统计量
说明
公式/记号
分布的位置或者中心趋势的度量
样本均值
取自分布的样本的中心或质心
中位数
有序样本中,排在中间位置的数据。
众数
出现最频繁的数
用Mode表示
散布程度的度量
极差
样本极值之间的差值
R=Max-Min
样本方差
对围绕均值散布的度量
标准差
对围绕均值散布的度量
案例应用:
项目小组为了详细了解某钢种的退火温度,随机抽取了30组数据,从这些数据可以获得以下信息:
项目小组测量的温度数据
1058
1069
1075
1062
1059
1068
1053
1064
1076
1061
1072
1063
1058
1068
1077
1066
1053
1076
1055
1064
1063
1059
1076
1068
1064
1064
1056
1067
1070
1062
使用MINITAB软件从统计-基本统计量-显示描述性统计进入。
描述性统计变量输入对话框
点击统计量选项,进入对话框,选择要统计的指标。再进入图形对话框。
描述性统计统计量指标输入对话框
描述性统计图形输入对话框
最终结果如图。
描述性统计
描述性统计: C1
平均值
变量 N N* 平均值 标准误 标准差 最小值 下四分位数 中位数 上四分位数
C1 30 0 1064.9 1.27 6.98 1053.0 1059.0 1064.0 1069.3
变量 最大值 极差 偏度 峰度
C1 1077.0 24.0 0.16 -0.75
第三章 六西格玛工具简介
六西格玛管理的基本特征之一就是要用“数据说话”,通过对数据的收集、整理和分析,从而为控制产品质量提供依据。以下就常用的基本质量工具逐一简介。
第一节 调查表
一、定义
调查表又叫检查表,是一种统计图表,利用这种统计图表可以进行数据的搜集、整理和原因调查,并在此基础上进行粗略地分析。
二、用途
主要用来调查生产现场不合格品项目频数和不合格品率,以便继而用排列图等分析研究。
三、使用步骤
(1)明确收集资料的目的。
(2)确定为达到目的所需搜集的资料。
(3)确定对资料的分析方法和负责人。
(4)根据不同目的,设计用于记录资料的调查表格式,其内容应包括:调查者、调查的时间、地点和方式等栏目。
(5)对收集和记录的部分资料进行预先检查。
(6)如有必要,应评审和修改该调查表格式。
四、注意事项
(1)检查表观察到的结果竖着列在检查表的左侧。
(2)设计表格时,在需要的地方使用注释,可以在以后分析时更容易使用检查表。
(3)把检查表放在记录数据的地方。
五、应用案例
一段时间,×插头焊接小组频繁出现焊接质量问题,为此小组用调查表形式调查插头焊接缺陷数,以便于找出关键症结所在,调查表如下:
插头焊接缺陷调查表 N = 4870
序号
项目
频数
累计
累计%
A
插头槽径大
3367
3367
69.14
B
插头假焊
521
3888
79.84
C
插头焊化
382
4270
87.69
D
接头内有焊锡
201
4471
91.82
E
绝缘不良
156
4627
95.02
F
芯线未露
120
4747
97.48
G
其他
123
4870
100.00
调查者:吴× × 地点:×插头焊接小组
_____年____月____日
第二节 分层法
一、定义
分层法又叫分类法、分组法。它是按照一定的标志,把收集到的大量有关某一特定主题的统计数据加以归类、整理和汇总的一种方法。它常与其他数据分析工具联合使用。
二、用途
常用于归纳整理来自不同的数据源的统计数据,如不同的班组、不同的时间、不同的批、不同的供应商及不同的设备等。
三、使用步骤
(1)收集数据。
(2)将收集到的数据根据不同目的选择分层标志。
(3)分层。
(4)按层分类。
(5)画分层归类图表。
四、注意事项
运用分层法时,不宜简单地按单一因素分层,必须考虑各个因素的综合影响效果。
五、应用案例
某冶炼厂所使用的某种气缸体与气缸盖之间经常发生漏油,经调查50件该产品后发现,一是由于三个操作工在装配时操作方法不同;二是所使用的气缸垫由两个制造厂提供。在用分层法分析漏油时采用:(1)按操作者分(表一);(2)按气缸垫生产厂分(表二)
表一
操作者
漏油
不漏油
漏油率(%)
王师傅
6
13
32
李师傅
3
9
25
张师傅
10
9
53
表二
生产厂家
漏油
不漏油
漏油率(%)
A厂
9
14
39
B厂
10
17
37
共计
19
31
38
由上两表容易看出:为降低漏油率,应采用李师傅的操作方法和B厂的气缸垫。然而事实并非如此,当采用此方法后,漏油率并未降到预期的指标。漏油率仍为3/7=43%。因此,这样的简单分层是有问题的。正确的方法应为:(1)用A厂气缸垫时用李师傅的操作方法;(2)用B厂气缸垫时用王师傅的操作方法。这时的漏油率平均为0%(表三)
表三
操作者
漏油情况
气缸垫
合计
A厂
B厂
操
作
者
王师傅
漏油
6
0
6
不漏油
2
11
13
李师傅
漏油
0
3
3
不漏油
5
4
9
张师傅
漏油
3
7
10
不漏油
7
2
9
合计
漏油
9
10
19
不漏油
14
17
31
共计
23
27
50
第三节 排列图
一、定义
排列图又叫帕累托图。它是将质量改进项目从最重要到最次要顺序排列而采用的一种图表。
二、用途
(1)按主要顺序显示出每个质量改进项目对整个质量问题的影响。
(2)识别进行质量改进的机会。
三、使用步骤
(1)选择要进行质量分析的项目。
(2)选择用来进行质量分析的度量单位,如出现的次数(频数、件数)、成本、金额或其它。
(3)选择进行质量分析的数据的时间间隔。
(4)画横坐标。按度量单位量值递减的顺序自左至右在横坐标上列出项目,将量值最小的一个项目或几个项目归并成“其它”项,放在最右端。
(5)画纵坐标。在横坐标的两端画两个纵坐标,左边的纵坐标按度量单位标定,其高度必须与所有项目的量值和相等。右边的纵坐标应与左边的纵坐标等高,并从0到100%进行标定。
(6)在每个项目上画长方形,它的高度表示该项目度量单位的量值,显示出每个项目的影响大小。
(7)由左到右累加每个项目的量值(以%表示),并画出累计频率曲线,用来表示各个项目的累计影响。
(8)利用排列图确定对质量改进最为重要的项目(关键的少数项目)。
四
展开阅读全文