资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第一节 生物统计在农业生产研究中的作用,下一张,主 页,退 出,上一张,第二篇 统计分析基础,第四章 试验资料整理与特征数,为了推动农业生产的发展,常常要进行科学研究。进行科学研究离不开调查或试验。进行调查或试验必须解决二个问题:,如何合理地进行调查或试验设计;,如何科学地整理、分析所收集得来的具有变异的资料,揭示出隐藏在其内部的规律性。,下一张,主 页,退 出,上一张,合理地进行调查或试验设计、科学地整理、分析所收集得来的资料是生物统计,(,Biometrics,),的根本任务。,生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。它在畜禽、水产科学研究中具有十分重要的作用。,一、提供试验或调查设计的方法,试验设计这一概念有广义与狭义之分:,下一张,主 页,退 出,上一张,广义的试验设计是指试验研究课题设计,,也就是指整个试验计划的拟定,包含课题名称、试验目的,研究依据、内容及预期达到的效果,试验方案,供试单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试验结果的分析方法,经济效益或社会效益的估计、已具备的条件、需要购置的仪器设备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等内容。,下一张,主 页,退 出,上一张,狭义的试验设计主要是指试验单位,(,如田间试验的作物、品种,),的选取、重复数目的确定及试验单位的分组。,生物统计中的试验设计主要指狭义的试验设计。合理的试验设计能控制和降低试验误差,提高试验的精确性,为统计分析获得试验处理效应和试验误差的无偏估计提供必要的数据。,下一张,主 页,退 出,上一张,调查设计这一概念也有广义与狭义之分:,广义的调查设计是指整个调查计划的制定,,包括调查研究的目的、对象与范围,调查项目及调查表,抽样方法的选取,抽样单位、抽样数量的确定,数据处理方法,调查组织工作,调查报告撰写与要求,经费预算等内容。,下一张,主 页,退 出,上一张,狭义的调查设计 主要 包含抽样方法的选取,抽样单位、抽样数目的确定等内容。,生物统计中的调查设计主要指狭义的调查设计。合理的调查设计能控制与降低抽样误差,提高调查的精确性,为获得总体参数的可靠估计提供必要的数据。,试验或调查设计主要解决合理地收集必要而有代表性资料的问题。,下一张,主 页,退 出,上一张,二、提供整理、分析资料的方法,整理资料的基本方法是根据资料的特性将其整理成,统计表,、绘制成,统计图,。通过统计表、图可以大致看到所得资料集中、离散的情况。并利用所收集得来的数据计算出几个,统计量,,以表示该资料的数量特征、估计相应的总体参数。,下一张,主 页,退 出,上一张,统计分析最重要的内容是,差异显著性检验,。通过抽样调查或控制试验,获得的是具有变异的资料。产生变异的原因是什么?是由于进行比较的处理间,例如不同作物、不同品种间有实质性的差异或是由于无法控制的偶然因素所引起?,显著性检验的目的就在于承认并尽量排除这些无法控制的偶然因素的干扰,将处理间是否存在本质差异揭示出来,。显著性检验的方法很多,常用的有:,下一张,主 页,退 出,上一张,t,检验,主要用于检验两个处理平均数差异是否显著;,方差分析,主要用于检验多个处理平均数间差异是否显著;,检验,主要用于由质量性状得来的次数资料的显著性检验等。,下一张,主 页,退 出,上一张,统计分析的另一个重要内容是对试验指标或性状间的关系进行研究,或者研究它们之间的联系性质和程度,或者寻求它们之间的联系形式,即进行,相关分析与回归分析,。通过对资料进行相关、回归分析,可以揭示出试验指标或性状间的内在联系,为农业生产、新品种选育等提供强有力的依据。,下一张,主 页,退 出,上一张,还有一类统计分析方法不考虑资料的分布类型,也不事先对有关总体参数进行估算,这类统计分析方法叫,非参数检验法,。非参数检验法计算简便。通常的检验方法对畜禽、水产科研中的某些资料无能为力时,非参数检验法则正好发挥作用。,下一张,主 页,退 出,上一张,第一节 生物统计的常用术语,一、总体与样本,根据研究目的确定的研究对象的全体称为,总体,(population),;,总体中的一个研究单位称为,个体,(individual),;,总体的一部分称为,样本,(sample),;,含有有限个个体的总体称为,有限总体,;,包含有无限多个个体的总体叫,无限总体,;,下一张,主 页,退 出,上一张,在实际研究中还有一类,假想总体,。例如进行几种品种的品种试验,实际上并不存在用这几种品种的总体,只是假设有这样的总体存在,把所进行的试验看成是假想总体的一个样本;,样本中所包含的个体数目叫,样本容量,或,大小,(sample size),,样本容量常记为,n,。通常把,n,30,的样本叫,小样本,,,n,30,的样本叫,大样本,。,研究的目的是要了解总体,然而能观测到的却是样本,,通过样本来推断总体是统计分析的基本特点,。,下一张,主 页,退 出,上一张,为了能可靠地从样本来推总体,要求样本具有一定的含量和代表性。,只有从 总体 随机抽取 的样本才具有代表性。所谓,随机抽取,(random sampling),的样本,是指总体中的每一个个体都有同等的机会被抽取组成样本。,样本毕竟只是总体的一部分,尽管样本具有一定的含量也具有代表性,通过样本来推断总体也不可能是百分之百的正确。,有很大的可靠性但有一定的错误率这是统计分析的又一特点,。,下一张,主 页,退 出,上一张,二、参数与统计数,为了表示总体和样本的数量特征,需要计算出几个特征数。,由总体计算的特征数叫,参数,(parameter),;,由样本计算的特征数叫,统计数,(staistic),。,常用希腊字母表示参数,例如用,表示总体平均数,用,表示总体标准差;,常用拉丁字母表示统计数,例如用 表示样本平均数,用,S,表示样本标准差。,下一张,主 页,退 出,上一张,总体参数由相应的统计量来估计,例如用,估计,,用,S,估计,等。,三、准确性与精确性,准确性,(accuracy),也叫,准确度,,,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。,设某一试验指标或性状的真值为,,观测值为,x,,若,x,与,相差的绝对值,|x,|,小,则观测值,x,的准确性高;反之则低。,下一张,主 页,退 出,上一张,精确性,(precision),也叫,精确度,,,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。,若观测值彼此接近,即任意二个观测值,x,i,、,x,j,相差的绝对值,|xi,xj|,小,则观测值精确性高;反之则低。,调查或试验的准确性、精确性合称为,正确性,。,下一张,主 页,退 出,上一张,在调查或试验中应严格按照调查或试验计划进行,准确地进行观测记载,力求避免人为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试条件如作物、品种、土壤、栽培管理措施等应尽量控制一致,并通过合理的调查或试验设计努力提高试验的准确性和精确性。,由于真值,常常不知道,所以准确性不易度量,但利用统计方法可度量精确性。,下一张,主 页,退 出,上一张,四、随机误差与系统误差,随机误差,(random error),与,系统误差,(systematic error),随机误差,也叫,抽样误差,(sampling,error),,这是由于许多无法控制的内在和外在的偶然因素所造成。随机误差带有偶然性质,在试验中,即使十分小心也难以消除。,随机误差影响试验的精确性。,下一张,主 页,退 出,上一张,统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。,系统误差,也叫,片面误差,(lopsided error),,这是由于试验条件相差较大,作物种类、品种、品质、数量等条件未控制相同,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。,系统误差影响试验的准确性。,下一张,主 页,退 出,上一张,正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为,数量性状资料 、质量性状资料和半定量(等级)资料,三大类。,一、数量性状资料,下一张,主 页,退 出,上一张,第二节 资料的分类,数量性状,(quantitative character),是 指能够以量测或计数的方式表示其特征的性状。观察测定数量性状而获得的数据就是,数量性状资料,(data of quantitative characteristics),。数量性状资料的获得有量测和计数两种方式,因而数量性状资料 又分为计量资料和计数资料两种。,下一张,主 页,退 出,上一张,(一)计量资料,指用量测方式获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定 ,它们之间的变异是连续性的。因此,计量资料也称为,连续性变异资料,。,下一张,主 页,退 出,上一张,(二)计数资料,指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为,不连续性变异资料,或,间断性变异资料,。,下一张,主 页,退 出,上一张,二、质量性状资料,质量性状,(qualitative character),是指能观察到而不能直接测量的性状,如颜色、性别、生死等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:,下一张,主 页,退 出,上一张,(一)统计次数法,在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头数分类统计如下表。,下一张,主 页,退 出,上一张,表,2-1,白猪和黑猪子二代的毛色分离情况,下一张,主 页,退 出,上一张,这种由质量性状数量化得来的资料又叫,次数资料,。,(二)评分法,对某一质量性状 ,因其类别不同,分别给予评分。例如,在研究猪的肉色遗传时,常用的方法是将屠宰后,2,小时的猪眼肌横切面与标准图谱对比,由浅到深分别给予,1,5,分的评分,以便统计分析。,下一张,主 页,退 出,上一张,三、半定量(等级)资料,半 定 量 或 等 级 资 料,(semi-quantitative or ranked data),是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同。,如粪便潜血试验的阳性反应是在涂有粪便的棉签上加试剂后观察颜色出现的快慢及深浅程度分为六个等级;又如用某种药物治疗畜禽的某种疾病,疗效分为,“,无效,”,、,“,好转,”,、,“,显效,”,和,“,控制,”,四个级别;然后统计各级别的供试畜禽数。,半定量资料在兽医研究中是常见的。,下一张,主 页,退 出,上一张,三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。,例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按白细胞总数过高、正常、过低分为三组,清点各组次数 ,就转化成了半定量资料。,下一张,主 页,退 出,上一张,第二节 资料的整理,一、资料的检查与核对,检查和核对原始资料的目的在于确保原始资料的,完整性,和,正确性,。,所谓,完整性,是指原始资料无遗缺或重复。,所谓,正确性,是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料 ,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。,下一张,主 页,退 出,上一张,二、资料的整理方法,当观测值不多,(,n30,),时,不必分组,直接进行统计分析。,当观测值较多,(,n30,),时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。,(一)计数资料的整理,现以,50,枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。,下一张,主 页,退 出,上一张,表,2-2 50,枚受精种蛋孵化出雏鸡的天数,小鸡出壳天数在,1924,天范围内变动,有,6,个不同的观察值。用各个不同观察值进行分组,共分为,6,组,可得表,2-3,形式的次数分布表。,下一张,主 页,退 出,上一张,表,2-3 50,枚受精种蛋出雏天数的次数分布表,下一张,主 页,退 出,上一张,有些计数资料,观察值较多,变异范围较大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。对于这样的资料,可扩大为以几个相邻观察值为一组,适当减少组数,这样资料的规律性就较明显,对资料进一步计算分析也比较方便。例如观测某品种,100,只蛋鸡每年每只,下一张,主 页,退 出,上一张,鸡产蛋数(原始资料略),其变异范围为,200,299,枚。这样的资料如以每个观察值为一组,则组数太多(该资料最多可分为,100,组),如间隔,10,枚为一组,则可使组数适当减少。经初步整理后分为,10,组,资料的规律性就比较明显,见表,2-4,。,下一张,主 页,退 出,上一张,表,2-4 100,只蛋鸡每年产蛋数的次数分布表,下一张,主 页,退 出,上一张,(,二,),计量资料的整理,计量资料在分组前需要确定,全距、组数、组距、组中值及组限,,然后将,全部观测值划线计数归组,。,【,例,2.1】,将,126,头基础母羊的体重资料,(,见表,2-5),整理成次数分布表。,下一张,主 页,退 出,上一张,1,、求全距,全距,是资料中最大值与最小值之差,又称为,极差,(,range,),,用,R,表示,即,R=Max(x)-Min(x),本例,R,=,65.0-37.0=28.0,(,kg,),下一张,主 页,退 出,上一张,2,、确定组数,组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。一般组数的确定,可参考表,2-6,。,下一张,主 页,退 出,上一张,表,2-5 126,头基础母羊的体重资料,单位:,kg,下一张,主 页,退 出,上一张,表,2-6,样本含量与组数,本例中,,n,126,,根据表,2-6,,初步确定组数为,10,组。,下一张,主 页,退 出,上一张,3,、确定组距,每组最大值与最小值之差称为组距,记为,i,。分组时要求各组的组距相等。组距的计算公式为:,组距,(,i,),全距组数,本例,i,28.0,103.0,下一张,主 页,退 出,上一张,4,、确定组限及组中值,各组的最大值与最小值称为,组限,。最小值称为,下限,,最大值称为,上限,。每一组的中点值称为,组中值,,它是该组的代表值。组中值与组限、组距的关系如下:,组中值,(,组下限组上限,)/2,组下限,1/2,组距组上限,1/2,组距,由于相邻两组的组中值间的距离等于组距,所以当第一组的组中值确定以后,加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推。,下一张,主 页,退 出,上一张,组距确定后,首先要选定第一组的组中值。,在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近或等于资料中的最小值为好。,第一组组中值确定后,该组组限即可确定,其余各组的组中值和组限也可相继确定。注意,最末一组的上限应大于资料中的最大值。,下一张,主 页,退 出,上一张,表,2-5,中,最小值为,37.0,,第一组的组中值取,37.5,,因组距已确定为,3.0,,所以,第一组的下限为:,37.5-(1/2)3.0,36.0,;,第一组的上限也就是第二组的下限为:,36.0+3.0=39.0,;,第二组的上限也就是第三组的下限为:,39.0+3.0=42.0,,,,,以此类推,一直到某一组的上限大于资料中的最大值为止。,于是可分组为:,36.0,39.0,,,39.0,42.0,,,。,下一张,主 页,退 出,上一张,为了使恰好等于前一组上限和后一组下限的数据能确切归组,约定将其归入后一组。,通常将上限略去不写。,第一组记为,36.0,,,第二组记为,39.0,,,5,、归组划线计数,作次数分布表,分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。,下一张,主 页,退 出,上一张,表,2-7 126,头基础母羊的体重的次数分布表,下一张,主 页,退 出,上一张,在归组划线时应注意,不要重复或遗漏,归组划线后将各组的次数相加,结果应与样本含量相等,如不等,证明归组划线有误,应予纠正。,在分组后所得实际组数,有时和最初确定的组数不同,如第一组下限和资料中的最小值相差较大或实际组距比计算的组距为小,则实际分组的组数将比原定组数多;反之则少。,下一张,主 页,退 出,上一张,(三)质量性状资料、半定量(等级)资料的整理,对于质量性状资料、半定量(等级)资料,可按性状或等级进行分组,分别统计各组的次数,然后制成次数分布表。,下一张,主 页,退 出,上一张,表,2-8 F,2,代山羊的有角无角分离情况,下一张,主 页,退 出,上一张,表,2-9,仔猪死亡情况,下一张,主 页,退 出,上一张,第三节 常用统计表与统计图,一、统计表,(一)统计表的结构和要求,统计表由标题、横标目、纵标目、线条、,数 字及合计构成,其基本格式如下表,:,下一张,主 页,退 出,上一张,表号 标题,编制统计表的总原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和比较分析。具体要求如下:,下一张,主 页,退 出,上一张,1,、标题,标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。,2,、标目,标目分横标目和纵标目两项。横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并 注 明计算单位,如、,kg,、,cm,等等。,下一张,主 页,退 出,上一张,3,、数字,一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用,“,”,表示,数字是,“,0,”,的,则填写,“,0,”,。,4,、线条,表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可省去,表的左上角一般不用斜线。,下一张,主 页,退 出,上一张,(,二,),统计表的种类,统计表可根据纵、横标目是否有分组分为,简单表和复合表两类,。,1,、简单表,由一组横标目和一组纵标目组成,纵横标目都未分组。此类表适于简单资料的统计,如表,2-10,。,下一张,主 页,退 出,上一张,表,2-10,某品种鸡杂种二代冠形分离情况,下一张,主 页,退 出,上一张,2,、复合表,由两组或两组以上的横标目与一组纵标目结合而成 ,或由一组横标目与两组或两组以上的纵标目结合而成,或由两组或两组以上的横、纵标目结合而成。此类表适用于复杂资料的统计,如表,2-11,。,下一张,主 页,退 出,上一张,表,2-11,几种动物性食品的营养成分,下一张,主 页,退 出,上一张,二、统计图,常用的统计图有,长条图,(bar chart),、,园图,(pie chart),、,线图,(linear chart),、,直方图,(histogram),和,折线图,(broken-line chart),等。一般情况下,计量资料采用直方图和折线图,计数资料、质量性状资料、半定量(等级)资料常用长条图、线图或园图。,下一张,主 页,退 出,上一张,(一)统计图绘制的基本要求,1,、标题简明扼要,列于图的下方。,2,、纵、横两轴应有刻度,注明单位。,3,、横轴由左至右、纵轴由下而上,数值由小到大;图形长宽比例约,5,:,4,或,6,:,5,。,4,、图中需用不同颜色或线条代表不同事物时,应有图例说明。,下一张,主 页,退 出,上一张,(二)常用统计图及其绘制方法,1,、长条图,它用等宽长条的长短或高低表示按某一研究 指 标 划分属性种类或等级的次数或频率分布。如果只涉及一项指标,则采用,单式长条图,;如果涉及两个或两个以上的指标,则采用,复式长条图,。,下一张,主 页,退 出,上一张,在绘制长条图时,应注意以下几点:,(,1,)纵轴尺度从,“,0,”,开始,间隔相等,标明所表示指标的尺度及单位。,(,2,)横轴是长条图的共同基线,应标明各长条的内容。长条的宽度要相等,间隔相同。间隔的宽度可与长条宽度相同或者是其一半。,(,3,)在绘制复式长条图时,将同一属性种类、等级的两个或两个以上指标的长条绘制在一起,各长条所表示的指标用图例说明,同一属性种类、等级的各长条间不留间隔。,下一张,主 页,退 出,上一张,2,、园图,用于表示计数资料、质量性状资料或半定量(等级)资料的,构成比,。,所谓构成比,就是各类别、等级的观测值个数,(,次数,),与观测值总个数,(,样本含量,),的百分比。,把园图的全面积看成,100%,,按各类别、等级的构成比将园面积分成若干分,以扇形面积的大小表分别表示各类别、等级的比例。,下一张,主 页,退 出,上一张,绘制园图时,应注意以下三点:,(,1,)园图每,3.6,园心角 所对应的扇形面积为,1%,。,(,2,)园图上各部分按资料顺序或大小顺序,以时钟,9,时或,12,时为起点,顺时针方向排列。,(,3,)园图中各部分用线条分开,注明简要文字及百分比。,例如根据表,2-11,中的数据用园图绘出四种动物性食品的营养成分,见,图,2-3,。,下一张,主 页,退 出,上一张,3,、线图,用来表示事物或现象随时间而变化发展的情况。线图有单式和复式两种。,(,1,)单式线图,表示某一事物或现象的动态。,(,2,)复式线图,在同一图上表示两种或两种以上事物或现象的动态。这时可用实线,“,”,,断线,“,-,”,,点线,“,”,,横点线,“,-,-,-,-,”,等来标志区别。,下一张,主 页,退 出,上一张,4,、直方图,(,柱形图、矩形图,),对计量资料,可根据次数分布表作出直方图以表示资料的分布情况。其作法是:在横轴上标记组限,纵轴标记次数(,f,),在各组上作出其高等于次数的矩形,即得次数分布直方图。,下一张,主 页,退 出,上一张,5,、折线图,对于计量资料,还可根据次数分布表作出次数分布折线图。,其作法是:在横轴上标记组中值,纵轴上标记次数,以各组组中值为横坐标,次数为纵坐标描点,用线段依次连接各点,即可得次数分布折线图。,下一张,主 页,退 出,上一张,
展开阅读全文