资源描述
,单击此处编辑母版,单击此处编辑母版文本样式,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。不能作为科学依据。,单击此处编辑母版,单击此处编辑母版文本样式,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。不能作为科学依据。,第二章,平均数与变异数,第一节 总体与样本,第二节 平均数,第三节 变异数,第四节 可疑数值取舍,第五节 数据标准化,第六节 数据转化,第七节,t,检验,1/85,第一节 总体与样本,总体,含有共同性质个体所组成集团,无限总体,总体有没有穷多个个体组成,有限总体-总体由有限个个体组成,参数,-由总体全部观察值而算得总体特征数,第二章,2/85,第一节 总体与样本,样本,-从总体中抽取若干个个体集合,统计数,-测定样本中各个体而得样本特征数,如平均数等。统计数是总体对应参数预计值。,3/85,第二节,平均数,算术平均数,中位数,几何平均数,第二章,4/85,一、算术平均数,Mean,1,定义,各单项测定值总和除以测定值个数,所得商。,2,计算方法,(1)如样本较小,即资料包含观察值个数不多,可直接计算平均数。,第二节 平均数,5/85,例,在同一稀释度,9,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,127,、,86,(单位:个)。试计算其平均数。,6/85,一、算术平均数,2,计算方法,(,2),若样本较大,且已进行了分组,可采取加权法计算算术平均数,即用组中点值代表该组出现观察值以计算平均数,其公式为,第二节 平均数,7/85,二、中位数,(,Median),1,定义,将资料内全部观察值从大到小排序,居中间位置观察值称为中数,计作,Md,。,2,计算方法,将观察值排序,,如观察值个数为奇数,则以中间观察值为中位数;,如观察值个数为偶数,则以中间二个观察值算术平均数为中位数。,第二节 平均数,8/85,例,在同一稀释度,9,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,127,、,86,(单位:个)。试计算其中位数。,9/85,第二节,平均数,三 几何平均数 (,Geometric mean,Geomean,),1,定义,如有,n,个观察值,其相乘积开,n,次方,即为几何平均数,用,G,代表。,2,计算方法,10/85,例,在同一稀释度,9,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,127,、,86,(单位:个)。试计算其几何平均数。,11/85,比较甲、乙两个小组(各,5,人)某门课成绩优劣。,甲班:,50,、,50,、,50,、,80,、,20,乙班:,100,、,0,、,50,、,80,、,20,第二章,12/85,比较甲、乙两个小组(各,5,人)某门课成绩优劣。,甲班:,100,、,0,、,50,、,80,、,20,乙班:,100,、,0,、,50,、,70,、,30,第二章,13/85,比较甲、乙两个小组(分别为,5,、,7,人)某门课成绩优劣。,甲班:,100,、,0,、,50,、,80,、,20,乙班:,100,、,0,、,50,、,80,、,20,、,70,、,30,第二章,14/85,第三节 变异数,变异程度指标,偏差,极差,方差,标准差,标准误,变异系数,第二章,15/85,第三节 变异数,一、偏差(,Deviation,),定义:测定值与平均值之差。,特点:有单位,有正负,个数与样本个数相等,16/85,第三节 变异数,二、极差(,Range,),极差,又称全距,记作,R,,是资料中最大观察值与最小观察值差数。,R,=,y,max,-,y,min,特点:有单位,一个值(表述较偏差简单),17/85,例,在同一稀释度,9,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,127,、,86,(单位:个)。试计算其极差。,18/85,第三节 变异数,三、方差,离差平方和,每一个观察值都有一个偏离平均数度量指标,离均差,但各个离均差总和为0,不能用来度量变异,那么可将各个离均差平方后加起来,求得,离均差平方和,(简称平方和),SS,(,sum of squares of deviations from mean,),,定义以下:,样本,总体,19/85,第三节 变异数,因为各个样本所包含观察值数目不一样,为便于比较起见,用观察值数目来除平方和,得到平均平方和,简称,均方或方差,(,variance),。,样本均方,(,mean square),用,s,2,表示,定义为:,20/85,第三节 变异数,它是总体方差()无偏预计值;此处除数为自由度(,n-1),而不用,n,,,其中,,N,为有限总体所含个体数。均方和方差这两个名称经常通用,但习惯上称样本,s,2,为均方,总体 为方差,21/85,第三节 变异数,自由度,Degree of freedom,自由度记作,df,,它统计意义是指样本内独立而能自由变动离均差个数。,比如一样本为(3,4,5,6,7),平均数为5,前个离差为-2,-1,0和1,则第5个离均差为前4个离均差之和变号数,即-(-2)=2。普通地,样本自由度等于观察值个数(,n),减去约束条件个数(,k),,即,df=n-k,。,22/85,第三节 变异数,一样,样本标准差是总体标准差预计值。总体标准差用 表示:,23/85,第三节 变异数,自由度,Degree of freedom,样本标准差不以样本容量,n,,而以自由度,n-1,作为除数,这是因为通常所掌握是样本资料,不知,数值,不得不用样本平均数 代替,。与,有差异,由算术平均数性质可知,比 小。所以,由 算出标准差将偏小。如分母用,n-1,代替,则可免去偏小弊病。,24/85,第三节 变异数,四、标准差,Standard deviation (SD),标准差为方差正平方根值,用以表示资料变异度,其单位与观察值度量单位相同。,样本资料计算标准差公式为:,25/85,第三节 变异数,在应用上,小样本一定要用自由度来预计标准差;如为大样本,因,n,和,n-1,相差微小,也可不用自由度,而直接用,n,作除数。但样本大小界限没有统一要求,所以普通样本资料在预计标准差时,,皆用自由度,。,26/85,第三节 变异数,标准差计算方法,分四个步骤:先求出 ,再求出各个 和各个 ,求和得 ,即可代入下式算得标准差。,27/85,例,在同一稀释度,9,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,127,、,86,(单位:个)。试计算其标准差。,28/85,表示方法,表格中:,Means SD Means(SD),图中:,误差线:正、负、正负,29/85,第三节 变异数,五、标准误,Standard error(SE),30/85,第三节 变异数,Adapted from:Jacobs et al.Relative contribution of initial root and shoot morphology in predicting field performance of hardwood seedlings.New Forests,30:235-251.,31/85,第三节 变异数,Adapted from:Boivin et al.Late-season fertilization of,Picea mariana,seedlings:intensive loading and outplanting response on greenhouse bioassays.Ann.For.Sci.61:737-745.,32/85,第三节 变异数,Adapted from:Rix et al.Paternal and maternal effects on the response of seed germination to high temperatures in,Eucalyptus globulus,.Ann.For.Sci.69:673-679.,33/85,第三节 变异数,Adapted from:Campo et al.Relationship between root growth potential and field performance in Aleppo pine.Ann.For.Sci.64:541-548.,34/85,第三节,变异数,六、变异系数,标准差和观察值单位相同,表示一个样本变异度。若比较两个样本变异度,则因单位不一样或均数不一样,不能用标准差进行直接比较。这时可计算样本标准差对均数百分数,称为变异系数。,35/85,例,在同一稀释度,10,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,96,、,127,、,86,(单位:个)。试计算其变异系数。,36/85,第三节 变异数,两个小麦品种主茎高度平均数、标准差和变异系数。,37/85,第三节 变异数,如只从标准差看,品种甲比乙变异大些;但因二者均数不一样,标准差间不宜直接比较。假如算出变异系数,就能够相互比较,这里乙品种变异系数为,11.3%,,甲品种为,9.5%,,可见乙品种相对变异程度较大。,38/85,第三节 变异数,不过在使用变异系数时,应该认识到它同时受标准差和平均数影响。所以,,在使用变异系数表示样本变异程度时,宜同时列举平均数和标准差,,不然可能会引发误解。,39/85,40/85,41/85,将变量送入右侧文本框,42/85,选择,点击Continue,43/85,点击Ok,Descriptive Statistics,N,Range,Minimum,Maximum,Mean,Std.Deviation,Statistic,Statistic,Statistic,Statistic,Statistic,Std.Error,Statistic,微生物数量,10,74,86,160,115.30,8.166,25.824,Valid N(listwise),10,44/85,练习题,1,:,在同一稀释度,10,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,96,、,127,、,86,(单位:个)。,利用,Excel,和,SPSS,分别计算,其变异系数。,45/85,练习题,2,:见附注课题数表“多组变量与,SPSS,统计值实现”,(,1,)利用,SPSS,分别计算,其平均值、标准差、标准误,(,2,)利用,Sigmaplot,作柱形图(含标准误),要求苗高为一张图,地径为另一张图。,46/85,第四节 可疑数值取舍,1.,可疑数据概念,在测量中有时会出现过高或过低测量值,这种数据称为可疑数据或逸出值,(,outlier,),。,2.,能够数值取舍(,拉依达法,、肖维纳特法、格拉布斯法,),拉伊达法:,当试验次数较多时,可简单地用,3,倍标准偏差(,3s,)作为确定可疑数据取舍标准。当某一测量数据()与其测量结果算术平均值()之差大于,3,倍标准偏差时,用公式表示为:,则该测量数据应舍弃。,先对数据排序,然后对极值按公式取舍,第二章,47/85,例,对一批苗木随机抽取,10,株测定其苗高,测定值分别为,24.8,、,27.0,、,25.5,、,25.2,、,58.0,、,25.8,、,25.0,、,26.0,、,24.5,、,10.3cm,,试用拉伊达法排除可疑值。,48/85,取,3,理由是:依据随机变量正态分布规律,在屡次试验中,测量值落在,x-3,与,x+3,之间概率为,99.73,,出现在此范围之外概率仅为,0.27%,,也就是在近,400,次试验中才能碰到一次,这种事件为小概率事件,出现可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可能,应将其舍弃。,49/85,第四节 可疑数值剔除及正态与方差齐次性判断,第二章,SPSS,实现,1,建立数表,2 Analyze-Descriptive Statistics-Explore,3,选择分析变量,Dependent,、分组变量,Factor,及标示变量,Label cases by,4,选择描述统计量,Statistics,5,剔除可疑值、判断正态性与方差齐次性,选择,Plots,菜单,6,读取结果,50/85,第五节 数据标准化,一、数据标准化意义,不一样要素数据往往含有不一样单位和量纲,其数值变异可能是很大,这就会对统计结果产生影响。所以,在聚类分析、主成份分析之前,首先要对要素进行数据处理。,第二章,51/85,第五节 数据标准化,二、数据标准化方法,第二章,标准差标准化:标准化后各要素平均值为,0,,标准差为,1,52/85,SPSS实现,53/85,54/85,55/85,56/85,第五节 数据标准化,二、数据标准化方法,极差标准化:标准化后各要素极大值为,1,,极小值为,0,,其余数值均在,0,与,1,之间。,57/85,第五节 数据标准化,二、数据标准化方法,极大值标准化,58/85,例,在同一稀释度,9,个培养皿中,计算出微生物数量分别为,148,、,92,、,115,、,132,、,89,、,108,、,160,、,127,、,86,(单位:个)。分别试用标准差法、极差法和最大值法对上述数据进行标准化处理。,59/85,第六节 数据转化,第二章,为何进行数据转化,参数统计分析方法对资料有一定要求,如t检验和方差分析要求样原来自正态分布总体,而且方差齐同;直线相关(回归)分析要求两变量间呈直线关系。,但实际工作中并非全部统计资料都能满足参数统计分析方法条件;对于不能满足条件资料,则不能直接应用参数统计分析方法,不然有可能造成错误结论。,60/85,数据转换惯用方法,对数变换(transformation of logarithm),将原始数据X取对数,以其对数值作为分析变量,对数变换用途,使服从对数正态分布资料正态化;,使方差不齐且各组靠近资料到达方差齐要求;,使曲线直线化,惯用于曲线拟合。,61/85,数据转换惯用方法,平方根变换(square root transformation),将原始数据X平方根作为分析变量,平方根变换用途:,使服从,Poisson,分布计数资料,或轻度偏态资料正态化;,使方差不齐且各样本方差与均数间呈正相关资料到达方差齐要求。,62/85,数据转换惯用方法,平方根反正弦变换(arcsine trasformation of square root),将原始数据X平方根反正弦作为分析变量,平方根反正弦变换用途:使总体率较小(70%)二项分布资料到达正态或方差齐要求。,三角函数转换有范围限制,在-1到+1范围之内数值才能进行转换。如成活率、浓度(小数)、相对生长率(小数),63/85,SPSS,怎样实现数据转化,第二章,对数,Transform,Compute,过程,目标变量框(,Traget,)取要转换后生成新变量名字,表示式框,(Numeric Express),中以下设置,:,对数:,LN(,原始变量名,),点击,OK,完成,平方根,Transform,Compute,过程,目标变量框(,Traget,)取要转换后生成新变量名字,表示式框,(Numeric Express),中以下设置,:,对数:,SQRT(,原始变量名,),点击,OK,完成,平方根反正弦,Transform,Compute,过程,目标变量框(,Traget,)取要转换后生成新变量名字,表示式框,(Numeric Express),中以下设置,:,反正弦:,ARSIN(SQRT(,原始变量名,),点击,OK,完成,64/85,举例,65/85,应用,The relative growth rate(RGR)for each method was calculated from the following expression.,RGR=ln(M2)-ln(M1)/(t2-t1),where ln(M2)and ln(M1)denote the mean ln-transformed plant dry mass at time t1 and t2,respectively.,Gonzlez-Rodrguez V,Navarro-Cerrillo RM,and Villar R.Artificial regeneration with,Quercus ilex,L.and,Quercus suber,L.by direct seeding and planting in southern Spain.Annals of Forest Science,68:637-646.,66/85,描述,Data were analyzed statistically using SPSS v.18(SPSS Inc.,Chicago,IL,USA).The explore function of SPSS was used to examine data for normality,and percent root biomass and percent EMF colonization were arcsine transformed prior to analyses(Kleczewski et al.).,Kleczewski NM,Herms DA,Bonello P.Nutrient and water availability alter belowground patters of biomass allocation,carbon partitioning,and ectomycorrhizal abundance in,Betula nigra,.Tree,26:525-533.,67/85,第七节,t,检验,第二章,T,检验,亦称,student t,检验(,Students t test,),主要用于样本含量较小(比如,n30,),,总体标准差,未知,正态分布,资料。,t检验是戈斯特为了观察酿酒质量而创造。戈斯特在位于都柏林健力士酿酒厂担任统计学家,基于Claude Guinness聘用从牛津大学和剑桥大学出来最好毕业生以将生物化学及统计学应用到健力士工业程序创新政策。戈斯特于19在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。,68/85,第七节,t,检验,第二章,t,检验前,首先利用,explore,进行判断数据是否满足正态、方差齐次性条件,满足即可进行,t,检验;若不满足,则需将数据进行转换,然后再次利用,explore,进行判断是否满足,满足后才能进行,t,检验;假如数据转换后实在无法条件,则进行非参数检验。,非参数检验,单样本检验:,Wilcoxon,符号秩检验,两配对样本检验:,Wilcoxon,符号秩检验,两独立样本检验:,Mann-Whitney U,检验,69/85,第七节,t,检验,第二章,单总体,t,检验:检验一个样本平均数与一个已知总体平均数差异是否显著。,:样本平均数 :整体平均数,:样本标准差 :样本数量,查,t,表 判断显著性,如:全国大学生英语四级平均成绩为,66,分,北林级林学,1,班参加英语四级考试人数为,25,人,平均成绩为,75,分,标准差为,4.82,,该班级学生英语成绩是否与全国成绩存在显著差异?,70/85,第七节,t,检验,第二章,双总体,t,检验:相关样本(配对)、独立样本。,相关样本平均数差异显著性检验:用于检验匹配而成两组被试取得数据或同组被试在不一样条件下所取得数据差异性,这两种情况组成样本即为相关样本。,独立样本平均数显著性检验:各试验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所取得数据差异性。,71/85,第七节,t,检验,(,双总体检验,-,配对样本,),第二章,为检验人对某品牌酒饮用清楚度影响,随机选取,8,个人,分别测定饮用该酒前后清楚度,数据以下。,样本,1,2,3,4,5,6,7,8,饮用前清楚度,23,25,26,28,21,28,27,25,饮用后清楚度,12,15,16,11,13,17,14,17,72/85,第七节,t,检验,(,双总体检验,-,配对样本,),配对样本,t,检验实际上是先求出每对观察值之差值,对差值变量求均值。检验配对变量均值之间差异是否显著。其实质检验假设,是差值变量均值与零均值之间差异显著性。,假如差值变量为,x,,差值变量均值为 ,样本观察数为,n,,差值变量标准差为,S,,差值变量均值标准误为 ,配对样本,t,检验,t,值计算公式为,第二章,73/85,第七节,t,检验,(,双总体检验,-,配对样本,),SPSS,实现,建立数据结构:两个变量分别在不一样列,选择菜单,Analyze-Compare Means-Paired Samples T Tests,选择一对或若干对检测变量到,Paired Variables,选择,Options,第二章,74/85,第七节,t,检验,(,双总体检验,-,独立样本,),两个平均数差异是否显著:,t,检验,第二章,:参数误差,n:,样本观察数,自由度,d.f.=(n1-1)+(n2-1),查,t,表 判断显著性,75/85,例,分析耕地与荒地土壤中微生物数量各,8,次,它们原始测量值、标准差、平均值分别为:,两个处理平均值是否有显著差异?,76/85,SPSS实现,Step 1,数表结构!,77/85,Step 2,78/85,Step 4,点击,“,Group Variable,”,点击,“,Define Groups,”,Step 3,Step 5,在Group 1、2中分别输入分类变量,点击Continue,79/85,Step 6,80/85,Step 7,点击 OK,81/85,Robert and Lindgren.Relationships between root form and growth,stability,and mortality in planted versus naturally regenerated lodgepole pine in north-central British Columbia.Canadian Journal of Forest Research,36:2642-2653.,82/85,83/85,练习:笔算与,SPSS,实现,分析耕地与荒地土壤中微生物数量分别为,8,次和,10,次,它们原始测量值分别为:,(,1,)两组数据是否存在可疑值,正态性及齐次性判断;,(,2,)计算微生物数量在不一样土壤中变异系数;,(,3,)利用,t,检验判断两个处理平均值是否有显著差异;,(,4,)尝试试用标准差法、极差法和最大值法对上述数据进行标准化处理。,84/85,春季将5种规格不一样苗木按照完全随机区组试验进行造林,分为3个区组,10月末待苗木进入休眠后调查苗木高度,见下表。试用t检验分析,判断10月末苗高是否存在显著差异。,85/85,
展开阅读全文