收藏 分销(赏)

数据分析指南.doc

上传人:人****来 文档编号:8724351 上传时间:2025-02-27 格式:DOC 页数:22 大小:328.54KB
下载 相关 举报
数据分析指南.doc_第1页
第1页 / 共22页
数据分析指南.doc_第2页
第2页 / 共22页
点击查看更多>>
资源描述
数据分析指南 目录 1概述 3 1.1数据分析的目的 3 1.2整体思绪 3 2项目组数据分析指南 3 2.1进度-工作量-规模-成本 3 2.1.1进度分析 3 2.1.2工作量分析 4 2.1.3规模分析 4 2.1.4成本分析 4 2.2质量 4 2.2.1评审分析 4 2.2.2测试分析 5 2.2.3故障种类分析 5 2.2.4品质评价图表 5 2.3其他 5 3综合数据分析指南 5 3.1过程能力的分析 5 3.2“2-8”关键问题分析 6 3.3趋势分析 6 3.4潜在关系分析 6 3.5原因分析 7 附录1 成果分析图表 8 趋势图 8 直方图 8 排列图(Pareto图) 9 因果图 9 散点图 10 控制图 10 附录2 12 数据定义 12 1) 工作量 12 2) 进度 12 3) 成本 12 4) 规模 12 5) 质量 12 6) 其他 12 代码行计算原则 12 1概述 1.1数据分析的目的 对于项目组来说,数据分析的重要目的是实时理解项目状态,验证计划执行状况,并从数据分析中发现项目潜在的问题或风险,以便尽早采用应对措施,保证项目处在有效控制之下。对于组织层来说,数据分析的重要目的是分析记录组织过程的能力,为项目组做估计时提供根据,并作为过程改上进的基础。 1.2整体思绪 对于项目组来说,数据分析重要从三个纬度进行分析:1、进度-工作量-规模-成本;2、质量;3、其他。其中进度-工作量-规模-成本和质量是反应项目成功的关键参数,同步也是组织最关注的指标,而其他纬度的数据,重要作为数据分析时的参照。 本文描述的项目层的分析思绪或者分析角度重要有: a) 比较计划和实际的数据,验证计划执行状况并发现实际执行中的偏差; b) 将偏差与项目阈值或者组织能力上下限进行比较,发现偏离控制范围的点并找出主线原因,采用应对措施; c) 单一的分析并不能完全判断出过程与否稳定可控,还需要根据数据之间的互相联络结合其他角度或维度的数据分析来辅助判断项目的状态,以便发现潜在的也许超过控制范围的问题; 此外数据还需要进行综合分析,措施重要提成如下5种: a) 通过控制图对过程能力进行分析; b) 通过度布图或排列图状况对问题的等级进行分析。 c) 通过趋势图分析变化趋势; d) 通过散点图分析两类数据的潜在关系; e) 通过因果图分析问题产生的原因。 注意:各分析工具的简介请参见附录一。 2项目组数据分析指南 2.1进度-工作量-规模-成本 进度、工作量和规模这三者是互相关联的,因此在分析每个指标的同步,可以结合其他两个指标来辅助判断项目的状态,确定项目也许存在的问题。 2.1.1进度分析 ü 分析角度:计划与实际进度的比较,进度偏差率与进度控制阈值的比较 ü 分析阐明: n 进度的跟踪分为:各阶段进度的跟踪和各任务进度的跟踪。 n 运用干特图(或其他形式的图表)跟踪各任务的进度,当计划进度和实际进度产生偏差并超过控制界线时,需要分析原因,并及时处理问题。 n 每个阶段结束时,比较本阶段的计划进度和实际进度,当实际与计划进度有偏差时,计算出进度偏差率,并将进度偏差率与进度控制阈值进行比较,检查进度偏差与否处在控制范围内。 n 进度阈值是为项目设定的进度偏差的控制限,假如进度偏差在阈值范围内,则认为项目进度处在记录控制之下;假如进度偏差超过了阈值,则阐明进度偏离了控制,需要对偏差进行原因分析,找出影响进度的也许原因。 n 使用趋势图比较各阶段进度的偏差趋势,假如偏差处在逐渐增大的趋势,也许预示着过程有失去控制的风险,因此也需要对这种逐渐增大的趋势进行原因分析,找出导致偏差逐渐增大的原因,以便提前采用措施防止也许发生的进度超过控制范围的风险。 n 可以使用因果图列举出导致进度偏差的也许原因,再分析这些原因影响的优先级,可以使用Pareto图对原因进行优先级的排序,以便确定导致问题的重要原因,并采用应对措施。 n 产生进度偏差的也许原因: n 计划有问题; n 人员有问题; n 工作有问题; n 沟通有问题; n 风险发生; n 由外部原因引起问题; n 其他原因; ü 注:进度受到工作量投入的影响,也可以通过产品规模的完毕状况来反应,同步由于质量问题也会严重影响进度的完毕,因此在进行偏差原因分析时需要注意结合这些有关原因来进行。 2.1.2工作量分析 ü 分析角度一:计划与实际工作量的比较,工作量偏差率与工作量控制阈值的比较 ü 分析阐明: n 工作量的分析和进度分析的措施是同样的,也分为各任务工作量的分析和各阶段工作量的分析,详细可以参见进度分析。 2.1.3规模分析 ü 分析角度一:比较计划与实际的产品规模,比较规模偏差率和规模控制阈值比较 ü 分析阐明: n 当计划与实际存在偏差时,比较规模偏差率与对应的规模控制阈值,检查偏差与否处在控制范围内; n 假如偏差超过了控制范围,除了进行原因分析外,要将其作为进度和工作量偏差的也许原因输入,来辅助分析进度和工作量的偏差,考虑从控制规模上来控制进度和工作量。 2.1.4成本分析 ü 分析角度一:比较计划与实际的总成本,比较成本偏差率和成本控制阈值比较 ü 分析阐明: n 当计划与实际存在偏差时,比较成本偏差率与对应的成本控制阈值,检查偏差与否处在控制范围内; n 假如偏差超过了控制范围,需要进行原因分析外。 2.2质量 质量指标通过测试、评审以及缺陷的分布状况来表达。 2.2.1评审分析 评审故障检出率反应了被评审工作成果的质量状况;而评审准备速度和评审速度从另一种方面反应了评审过程的有效性,使用这两个参数可以辅助分析缺陷清除过程的有效性,进而协助判断阶段质量目的的到达状况。 ü 分析角度:评审故障检出率与质量目的相比较; ü 分析阐明: n 当评审故障检出率在质量目的范围之内时,阐明工作成果的质量水平到达了估计的目的。此外,此时还可以考虑评审速度和评审准备速度,看与否评审的充足的。 n 当评审故障检出率超过质量目的或未到达质量目的时,需要进行原因分析,分析的成果有两种:第一,目前质量状况正常,符合实际状况,不需要再次评审;第二,目前质量状况不正常,需要再次评审。 2.2.2测试分析 测试故障检出率反应的代码的质量状况,而测试密度和测试速度反应了测试过程的有效性。 ü 分析角度:测试故障检出率与质量目的相比较; ü 分析阐明: n 当测试故障检出率在质量目的范围之内时,阐明代码的质量水平到达了估计的目的。此外,此时还可以考察测试速度和测试密度,以此判断测试与否充足。 n 当测试故障检出率超过质量目的或未到达质量目的时,需要进行原因分析,分析的成果有两种:第一,目前质量状况正常,符合实际状况,不需要再深入测试,可以进入下一阶段;第二,目前质量状况不正常,需要深入的测试。 2.2.3故障种类分析 ü 分析角度:对故障种类的分布数据进行分析 ü 分析阐明: n 故障种类的辨别原则有诸多种,例如可以按:用例、缺陷的原因、重要程度、类型等。 n 计算出各类故障的分布状况后,可以使用排列图或饼图来标识出产生80%故障的种类,并分析其产生的原因,以作为改善项目质量的入口点。 2.2.4品质评价图表 ü 分析角度:对评审和测试的成果进行分析并做出评价 ü 分析阐明: 使用直方图、折线图、散点图对评审和测试的品质状况、故障趋势、测试覆盖(测试密度、故障密度)状况进行分析。 2.3其他 包括风险数据,悬案数据,变更数据,项目支持过程数据,培训数据等等。风险数据的分析可以参见《风险管理过程》,培训数据的分析定期由企业级的培训小组进行记录。 3综合数据分析指南 3.1过程能力的分析 l 分析目的:记录过程各项指标的能力,为项目估计提供参照,并为过程改善提供根据。 l 分析措施:一般般采用控制图进行分析,环节如下: a) 通过记录学措施(XmR)计算样本值的均值和上下限值; b) 对均值和上下限进行合理性调整; c) 画出控制图; d) 观测异常模式; e) 分析异常模式产生的原因(特殊原因和共同原因); f) 剔除异常,形成能力指标值,作为项目估计的参照数据之一; g) 根据以上分析的成果,列出需要处理的问题列表; h) 从问题的普遍性、严重性、紧急性等方面给问题分等级,从中选出最需处理的问题,作为过程改善的目的。 l 合用范围:此分析措施合用与所有能力指标(也就是《测量集》中列出的组织级测量项)。 3.2“2-8”关键问题分析 l 分析目的:把数据按一定准则进行分类,找出关键的类别。 l 分析措施:一般般采用饼图和排列图进行分析,环节如下: 1)记录各项分布数据的均值; 2)画出饼图和排列图; 3)从图中观测比例占80%少数数据类型; 4)分析产生这80%数据的原因; 5)根据原因列出问题; 6)从问题的普遍性、严重性、紧急性等方面给问题分等级,从中选出最需处理的问题,作为过程改善的目的。 l 合用范围:缺陷种类的分布(按用例,按试样,按功能,按类型,按阶段,按严重程度等),工作量阶段分布,工作量过程分布,各过程淘汰次数的比较,各过程NC次数的比较等等。 3.3趋势分析 l 分析目的:通过与此前数据(多种)的比较,观测指标的变化趋势。 l 分析措施:一般趋势图进行分析,环节如下: 1)记录目前指标值,并搜集历史指标值; 2)以时间为横轴画出趋势图; 3)从图中观测指标变化的趋势; 4)假如存在明显的趋势,需要深入确定是好的趋势还是坏的趋势; 5)对趋势产生的原因进行分析; 6)根据产生的原因,有选择的采用措施,保持好的趋势,克制坏的趋势。 l 合用范围:合用于各项指标,尤其是效率类、偏差类以及客户满意度指标。 3.4潜在关系分析 l 分析目的:找出两个指标间的关系 l 分析措施:一般采用散点图进行分析,环节如下: 1)假设两种存在关系的指标; 2)以各项目数据为样本值,画出散点图; 3)从图中观测两种指标的潜在关系; 4)假如从图中能明显看出两者存在关系(线性和非线性),继续下一步; 5)通过回归分析(线性回归和非线性回归)确定两者的函数关系;(此步比较复杂,可以采用最简朴的趋势分析来替代,例如:正比增长关系,负比增长关系等) 6)确定两者关系后来,可以考虑通过变化某一指标的投入状况来影响此外一种指标。 l 合用范围:合用于一切也许存在直接或间接关系的测量项。例如:质量成本与客户满意度、需求变更次数与生产率、测试工作量与生产率等。 3.5原因分析 l 分析目的:分析导致特定成果的多种原因,并对各原因规类。 l 分析措施:一般采用因果图(鱼骨图)进行分析,环节如下: 1)确定特定的成果; 2)确定影响成果的大的原因; 3)细化大原因; 注意:确定原因时可以采用头脑风暴的措施。 l 合用范围: 合用于所有原因分析。 附录1 成果分析图表 当我们对搜集到的数据进行分析时,需要将这些数据进行分类和整顿,并使用某些特定的工具来组织和总结数据以便寻找趋势以及互相关系。下面就对某些常用的分析工具进行简朴的简介。 趋势图 趋势图是专用于时序形式的散点图,可以迅速的检查数据在整个时间出现的趋势或其他模式。趋势图可以用来监控一种过程,看它与否有明显的趋势,或它的行为与否以其他的方式在变化。产品生产能力、产品大小、班组规模、发现的缺陷数目、积压的工作、合计或每天的资源消耗量,这些观测值都是趋势图处理的对象。趋势图可以清晰地显示任何按间隔或比例来标度变量的行为。如:工作量偏差有逐渐增大的趋势。 直方图 直方图用于显示以经验为主的观测分布。它显示了事件在整个一系列给定的观测值上或一段时间内发生的频率。直方图可以用于刻画几乎任何产品或过程的属性值,例如模块大小、缺陷修复时间、每次评审发现的缺陷数等。它尚有助于揭示在整个过程、项目产品的差异。如:柱体的高度与每个单元中出现的次数成比例。 排列图(Pareto图) 是直方图一种特殊形式,该图根据问题、原因和操作数量、发生的频率或影响把它们分为不一样的等级,按级别进行排列,有助于判断行为或改善机会的优先级。它是从“大量的无关紧要的问题”中突出“少数几种至关重要的问题”的一种有用的技术。如: 因果图 因果图是用来探测和展示问题(后果)与它也许的原因之间的关系图。它是由Ishikawa在1943年发明的,因此也被称为Ishikawa图。又由于它看起来像鱼的骨骼,一般也被称为鱼骨图。这种图一般是在持有不一样观点的人一起讨论期间进行绘制。如: 散点图 根据经验显示过程的两个特性之间的关系。绘制点的模式也许表明两个原因间有联络,例如因果关系。假如条件具有,也就是说假如存在一种偶尔原因的恒定系统,散点图是回归分析的自然预报器。它能更精确的揭示数据之间的互相联络。不过它的局限性在于一般只能处理两个变量。如:表达了一种变量相对于另一种变量是怎样体现的。 控制图 经典的控制图如下所示: 控制图均有一条中心线,并在中心线的两侧有控制限。中心线和界线都代表了计算的评估。计算该评估所用到的一组观测值是在过程运行时采集的。它用于判断观测值与否处在记录控制范围内,研究阐明:处在控制上下限内的数据之间的偏差是由于过程自身的原因(即公共原因)引起的,反应了过程的正常成果;而落在控制上下限之外的数据是由于可防止的偶尔原因引起的,它反应了过程的不稳定性,需要进行原因分析,找到这个偶尔原因并进行排除,从而保证过程的稳定性、可控性和可预测性。如:下图表达了一种稳定的过程观测值。 附录2 数据定义 1) 工作量 l 工作量:用人时、人日、人周、人月表达: 1人日=7.5人时;1人周=5人日;1人月=20人日。 l 工作量估算偏差=(估算值-实际值)/ 实际值 2) 进度 l 项目周期:用日历天、日历周、日历月表达;项目周期是从项目正式开始(项目开始日期)到交付给客户(项目结束日期)的时间(日历天数)。 l (项目进行中)进度估算偏差=(最新估算结束日期-最初估算结束日期)/(最新估算结束日期-开始日期+1) l (项目结束时)进度估算偏差=(项目结束日期-最初估算结束日期)/(项目结束日期-开始日期+1) 3) 成本 l 项目成本:这里关注的成本是项目受注书中的直接成本。 l 成本估算偏差=(估算值-实际值)/ 实际值 4) 规模 l 文档规模:用页数表达。 l 代码规模:用Kstep表达,不一样的语言需要分别搜集记录。代码行LOC的定义以及计算原则请参见下面的“代码行计算原则”。 l 代码规模估算偏差=(估算值-实际值)/ 实际值 5) 质量 l 故障(Defect):所有在评审和测试当中发现的对最终产品质量产生直接影响的问题。 l 评审故障检出密度:平均每页或每kstep评审发现的故障数。 l 测试故障检出密度:平均每kstep测试发现的故障数。 l 测试速度:平均每人日所执行的测试项目数。 6) 其他 l 总生产率(按编程语言的大类(C/C++, Java, Cobol等)进行分类记录) a) 生产率(工作效率)= 代码规模 / 项目的总工作量 b) 生产率(成本)= 项目总成本 / 代码规模 l 阶段生产率 l 质量成本 质量成本 = 同行评审工数 + 测试(UT,SI,PT)工数 代码行计算原则 程序中需要记录的部分: a) 数据定义,可执行语句; b) 数据申明; c) 子程序和宏的调用语句(每次调用都记录一次); d) 子程序代码行、宏定义代码行(每个子程序或宏定义的行数都只做一次记录); e) 标号(Labels)、逻辑分界符(delimiter) 例如:begin,end,{,}etc。(根据不一样的语言有所不一样); f) 程序头部(Headers)及包括的文献(每个程序头部和包括的文献的行数都只做一次统 计); g) 程序头部(Header)及包括的命令(每次使用都记录一次)。 程序中不应当记录的部分 a) 以开发为目的而编写的临时代码(为了探讨方案的可行性); b) 以测试为目的而编写的临时代码; c) 空白行及程序注释行。 注意: a) 记录应当以行为单位,这里所说的行是指代码的物理行而不是代码的逻辑语句行;此外, 记录代码的对象程序应当是符合编码规约的程序。(不一样的编程语言有不一样的编码规约,请参见对应编程语言的编码规约。) b) 本原则合用于所有的编程语言。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服