1、单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,公司,徽标,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计软件与模型,第,7,章,SPSS,常用统计图,一、概述,二、统计图的分类,三、常用统计图,四、小结,SPSS统计图,形,的,绘制,统计描述,:,包括统计指标和统计图、表,统计图的特征:,(,1,)形象化:,变抽象的文字为形象的视觉再现;,(,2,)直观性:,重点突出,对照鲜明,易于理解,便于比较;,省去长篇熬述或语言限制,一目了然,。,一、概述,1.,建立数据文件;,2.,选择适当的统计图;,3.,生成
2、图形;,4.,对图形进行编辑;,步骤,EXCEL,图形美观,易于操作,与,Word,兼容性好。但只能绘制较常用的统计图;,SAS,默认图形较粗糙,但通过丰富的编程语句可以绘制出相当精美的图形,甚至可以创新;,Stata,、,S-plus,、,R,图形精美,需要编程;,SPSS,图形美观,易于操作,可满足绝大多数用户需求,各种常用统计软件绘图功能比较,二、统计图的分类,1.,统计图一览表,2.,条图,3.,线图,4.,面积图,5.,饼图,6.,高低图,7.,帕累托图,8.,质量控制图,9.,箱图,10.,误差条图,11.,散点图,12.,直方图,13.P-P,图,&Q-Q,图,14.,金字塔图,
3、15.,普通序列图,16.,时间序列图,17.ROC,曲线,工具条,7.1 SPSS,统计图一览表,(2),图形名,符号,适用范围,误差条图,Error Bar Charts,显示数据的均值、标准差、置信区间等信息。,散点图,Scatter plots,直观反映两或两个以上变量的聚会大小及相互关系,直方图,Histogram,描述定距变量的分布。与条形图不同的是直方图不是用长条的高度来表示变量出现的频数,而是通过长条的面积来表示的。,P-P,图,P-P plots,用来直观表示数据是否服从特定分布,Q-Q,图,Q-Q plots,用来直观表示数据是否服从特定分布,普通序列图,Sequence
4、Charts,描述一组或几组数据随另一序列性变量变化的趋势。,时间序列图,Time Series Charts,描述与时间相关的变量随着时间变化的趋势。,简单条图,简单条图,分组条图,分段条图,数据描述方式:观测量分类,对应简单条图,变量分类,对应分组条图,单个观测量描述,条图统计量选择框,单击,Continue,,返回主对话框,图题,主标题,副标题,脚注,单击,Continue,,返回主对话框,选项对话框,单击,Continue,,返回主对话框,简单条图,分组条图,类型:选择,Clustered,数据描述方式:,选择,Summaries of separate variables,单击,De
5、fine,进行定义,分组条图例,对左表,(,条图,.sav,),数据,要求:,绘制分年级各班语文、数学、英语平均成绩的条图。,分组条图,分段条图,7.3,线图,SPSS,的线图描述连续性变量的变化趋势,非连续性变量通常不宜采用。,其定义方法与条图完全对应。,三种:,简单线图、,复式线图,垂线图。,复式线图,垂线图,7.4,面积图,面积图与条图、线图操作方法完全对应,有两种:,简单面积图和堆积面积图。,面积图,线图、条图和面积图都是描述变量在不同取值下的分布,饼图则是用来表示,部分与整体之间的关系,。,例:(超市,.sav),商品类别,营业额,食品,5660,生活用品,2148,家电,12400
6、办公用品,645,服饰,6521,其他,542,7.5,饼图,操作,饼图,7.6,高低图,一种说明某些现象在单位时间内变化情况的统计图。,适合描述每小时、每天、每周等时间内不断波动的市场信息资料,,如,股票、商品价格、货币牌价,等,高低图既能说明某些现象在短时间内的变化,也可说明他们长期的变化趋势。,高低图用于同时描述数据,长期和短期,的变化趋势。,仅介绍,简单高低图,。,7.6,高低图,观测量分类描述模式:,只能显示最高与最低,最高与最低在一个变量中输入,分类采用二元变量。,变量描述模式:,以变量的值显示最高、最低与收盘价,,用的最多,。,观测值模式:,以观测值显示最高、最低与收盘价,与变
7、量描述模式相似。,名称,图形,说明,简单高低图,Simple high-low-close,主要用于单位证券,通常以日期作为横坐标,每条线上,3,点分别代表证券价格的最高价、最低价和收盘价,分组高低图,Clustered high-low-close,与简单高低图类似,但是它可以同时描述两种或两种以上证券的价格情况,简单极差图,Simple range bar,主要用于单位证券,用长条的长度代表每个时间段最高值与最低值之差,分组极差图,Clustered range bar,与简单极差图类似,但是可以描述两个或两个以上证券的情况,对比面积图,Difference area,描述两个现象在同一时
8、间内相互变化的对比关系,高低图主要类型,7.7,质量控制图,主要用于监测生产过程中的,变化趋势,,从而提示生产者发现问题,并采用措施来及时纠正某些不良趋势。,SPSS,中质量控制图包括,4,类,:,均值,-,极差控制图(均值,-,标准差控制图),个值,-,移动极差控制图,不合格品率和不合格品控制图,缺陷数和单位缺陷数控制图,我们仅以均值,-,极差控制图为例。,质量控制图,1928,年沃特,休哈特(,Walter Shewhart,)博士率先提出。,指出,:,每一个方法都存在着变异,都受到时间和空间的影响,即使在理想的条件下获得的一组分析结果,也会存在一定的随机误差。,但当某一个结果超出了随机误
9、差的允许范围时,运用数理统计的方法,可以判断这个结果是,异常的、不足信的,。,例:绘制质量控制图,质量控制图类型选择,各观测样本只有一个值,各观测样本是一组值,缺陷数和单位缺陷数控制图,不合格品率和不合格品控制图,个值,-,移动极差控制图。当控制图每个小类的数据样本只有,一个,,则采用这种图形反映数据波动情况,包括均值,-,极差控制图、均值,-,标准差控制图。当控制图每小类样本小于,10,,默认前者,否则默认后者。,本例有,5,小类,每类,2,个样本,采用,第一种类型控制图,。,质量控制图定义,定义,零件质量,为监测变量;定义,零件号,为分类变量。,均值控制图,极差控制图,质量控制图,均数控制
10、图的使用方法,(1),如此点在上、下警告限之间区域内,则测定过程处于控制状态,环境样品分析结果,有效,;,(2),如果此点超出上、下警告限,但仍在上、下控制限之间的区域内,提示分析质量开始变劣,可能,存在“,失控,倾向,应进行初步检查,并采取相应的校正措施,:,(3),若此点落在上、下控制限之外,表示测定过程“,失控,应立即检查原因,予以纠正。环境样品应重新测定,;,帕累托图,帕累托图又叫排列图、主次图,按照发生频率大小顺序绘制的直方图,表示有多少结果是由已确认类型或范畴的原因所造成。,可以用来分析质量问题,确定产生质量问题的主要因素。,帕累托图是,ABC,管理法,的直观表示。,类别,甲地区营
11、业额,乙地区营业额,食品,5660,4000,生活用品,2148,1500,家电,12400,14000,办公用品,645,700,服饰,6521,5000,其它,542,500,例(超市,.sav,),1.,绘制甲地区,Pareto,图,2.,绘制甲乙分段图,简单帕累托图,注意:,分段,Pareto,图数据类型要选,第,2,项,Sums of separate variables,分段帕累托图,分段帕雷托图,7.8,箱图,箱图和误差条图都用于描述数据的分布信息。,箱图主要描述数据的中位数、四分位数及极值。,误差条图主要描述均值、标准差、置信区间等。,箱图从视觉观察,变量值的分布,情况,误差图
12、从视觉角度观察,样本的离散,度情况。,二都具体的绘制过程都与条图类似。,例:学生成绩,.sav,求,10,个班级语文成绩箱图,(1),建立数据文件,(2),调用,SPSS,过程,箱图类型选择对话框,按变量类别呈现资料,可呈现多个变量,按观测组呈现资料,只呈现,1,个变量,简单箱图分组定义对话框,简单箱图,按观测量百分比呈现的四分位数及中位数简单箱图。,误差条图主要描述均值、标准差、置信区间等。,其绘制过程箱图类似。,误差条形图,散点图是用来表示两个或两个以上变量之间相互关系的图形。在做统计分析时,要选择恰当的统计方法,通常都离不开散点图。,7.9,散点图,分类介绍,简单散点图,:描述两个变量之
13、间的相互关系,矩阵散点图,:在一张图上同时描述多个变量之间的两两关系,简单点图,:描述一个变量各个值的分布情况,重叠散点图,:将两幅简单散点图叠加到一张图上,描述多个变量之间的两两关系,3D,散点图,:描述三个变量的相互关系,例,:在,19,世纪,苏格兰物理学家,James D.Forbes,试图通过水的沸点来估计海拔高度,在阿尔卑斯山及苏格兰收集了沸点及海拔的数据如表所示。试绘制沸点与气压关系的散点图。(华氏,F=9/5+32,),序号,沸点,F,气压,(InchHg),序号,沸点,F,气压,(InchHg),1,194.5,20.79,10,201.3,24.01,2,194.3,20.7
14、9,11,203.6,25.14,3,197.9,22.40,12,204.6,26.57,4,198.4,22.67,13,209.5,28.49,5,199.4,23.15,14,208.6,27.76,6,199.9,23.35,15,210.6,29.04,7,200.9,23.89,16,211.9,29.88,8,201.1,23.99,17,212.2,30.06,9,201.4,24.02,简单散点图例,散点图,数据文件(散点图,.sav,),散点图定义对话框,以气压为,Y,轴,以沸点为,X,轴,可以设置图题,此处未设,选择项采取默认,单击,OK,输出结果,散点图绘制结果,直方
15、图主要用于描述变量的分布情况。它是,SPSS,中一种很常用的图形,但定义十分简单。,例:,(,直方图,.sav,),电缆耐压值直方图,7.10,直方图(,Histogram),7.11 P-P,图,&Q-Q,图,都是用来检验数据是否服从某种分布,区别,:,P-P,图比较的是真实数据和待检验分布的,累计概率,,而,Q-Q,图比较的是真实数据与待检验分布的,分位点值,上列各式中,,n,为观察单位数,,r,为,1,n,的秩次。,方法,推算公式,Blom,Rankit,Tukey,Van der Waerden,相同数值秩估算公式,例:某金属含碳量如下:,绘制,P-P,图,判断是否服从正态分布。,P-
16、P,图模型描述,P-P,图,7.12,人口金字塔图,population pyramid,定义:一种表示人口性别与年龄构成的条形统计图。可反映某一地区过去和现在的人口统计趋势。,在经济学中,常常出现这样一种现象,即低收入者占人口较大比例,高收入者占人口较小比例。这就是通常所说的金字塔。,人口,金字塔,三类,:,年轻型、成年型和年老型,增长型:塔顶尖、塔底宽,稳定型:塔顶、塔底宽度基本一致,在塔尖处才逐渐收缩。,缩减型:塔顶宽,塔底窄,从人口年龄结构对今后人口增长速度影响的角度,又可将人口,金字塔,分为增长型、稳定型和缩减型,人口金字塔图,例:收入,.sav,普通序列图主要用于描述一个或几个变量
17、随着另一个变量变化的趋势。,7.13,普通序列图,例:重庆,2007,年降雨量,.sav,绘制降雨量与月份的序列图,普通序列图设置对话框,是否多个变量绘在一张图上,普通序列图,时间序列图是研究与序列相关的数据特征的图形。包括,3,类:,Autocorrelations,自相关时间序列图,:用于研究同一变量的前一时间周期与后一时间周期对应观测点之间的相关关系。,Cross-correlations,交叉相关时间序列图,:主要用于研究多个变量在对应观测点之间的相互关系。,Spectral Plot,光谱图,:主要用于研究整个时间过程的周期性。,时间序列图,例:重庆,2007,年降雨量,.sav,自
18、相关时间序列图对话框,自相关系数,部分自相关系数,待绘图变量,自然对数转换,差分转换,季节差分转换,最大滞后时间,依据模型,巴特莱特近似,自相关时间序列输出结果,杨,-,博客斯残差平方卡方检验,自相关系数,标准误,收尾概率,,0.05,自相关显著,ROC,曲线,受试者工作特征曲线(,receiver operating characteristic curve,,简称,ROC,曲线),又称为感受性曲线(,sensitivity curve,)。,得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。,ROC,曲线是二元判决中用
19、来比较判决方法优劣的一种曲线。它以,pf,做横轴,,pd,做纵轴所生成。其中,pf,表示假误判为真的概率,即虚警概率;,pd,表示真误判为假的概率,即漏检概率的补。,例:仪器观测准确度的比较。,下表中,sensor1,、,sensor2,表示两个传感器关于真实数据在某一指标下的观测值,,通过绘制,ROC,曲线比较两个传感器的,优劣,。,(,ROC.sav,),ROC,曲线,定义边界值分类:,包括分类临界值,不包括分类临界值,定义检测方向:,结果越大越趋于真,结果越小越趋于真,定义曲线下面积的标准误:,方法:非参数、负指数双边,置信水平,缺失值处理:,有缺失值两变量均剔除,有缺失值剔除另变量有效,ROC,曲线,Options,对话框,7.14 ROC,曲线图,准则,1.ROC,曲线能很容易地查出任意界限值时的对,疾病,的识别能力。,2.,选择最佳的诊断界限值。,ROC,曲线越靠近,左上角,试验的,准确性,就越高。最靠近左上角的,ROC,曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。,3.,两种或两种以上不同诊断试验对疾病识别能力的比较。,靠近左上角的,ROC,曲线所代表的受试者工作最准确,。亦可通过分别计算各个试验的,ROC,曲线下的面积,(AUC),进行比较,哪一种试验的,AUC,最大,则哪一种试验的诊断价值最佳。,






