1、第一章绪论生物试验统计学和特征数详解演示文稿第一页,共二十三页。优选第一章绪论生物试验统计 学和特征数第二页,共二十三页。随机事件就个体而言,很难寻找它的规律性;但对一个比较大的群体,也有规律可循。随机 事件在理论上服从正态 分布。统计学一一概率数学随机性中的必然性:从不完全的信息里取得准确知识的一系列 技巧”。小概率事件:在一次事件中不可能发生 O大概率事件:在一次事件中可能发生第三页,共二十三页。观察值(observation):将每次所取样品测定的结果称为一个观察 值,记为。例如:测定农大3号水稻品种的株高,得到以下数值(单位:cm):90、91.5,93、89、90.8,其中的每一个数
2、值就是一个观 案值。如果没有误差,上述观察值就不会出现差异,并始终保持 一个恒定的值,这个值称为理论值或真值,以表示。由于误差是客观存在的,所以:观察值=理论值+误差试验误差:观察值偶然偏离试验处理的真实值称为试验误差,或叫误差。误差(error):观察值与理论值之间的差异。第四页,共二十三页。系统误差(l opsided error,片面误差):指在相同的条件下,多次测量同一量时,误差的绝对值和符号保持恒定,在条件改变 时,则按某一确定的规律变化的误差。系统误差是可以消除的。或有一定原因引起的误差,也称偏差。系统误差使数据偏离了其 理论值,影响数据的准确性。成因:试验植物的种类品种、年龄等不
3、同,管理指施相差较大,仪 器不准、标准试剂未经校正,药品批次不同、药品用量以及种类不 符合试验计划的要求,以及观测、记载、抄录、计算中的错误所引第五页,共二十.5实验误差,也叫随机误差(random error):或叫抽样 误差,值然误差。指在相同条件下多次测量同一置 时,误善的绝对值和符号的变化,时大时小,时正 时负,没有确定的规律。这是由于许多无法控制的内在 和外在的因素所造成,完全是偶然的,找不出确切原因引 起误差,也称偶然性误差。在试验中,即使十分小心,随机误装是无法消除的。随机误差使数据相互分散,影响 了数据的精确性。*第六页系统误差源自某种系统性原 因,它的规律性比较明显。随机误差
4、就个体而言,很 难寻找它的规律性;但对 一个比较大的群体,也有 规律可循。如数量性状的 随机误差在理论上服从正 态分布。随机误差的分布模式第七页,共二十三页。生物统计学的基本术语具有相同性质的个体所组成的集合称为总体0组成总体的基本单元称为个体。从总体中抽出的若干个个体所构成的集合称为样本.样本个体数目的大小称为样本容量。通过从样本计算出来的统计数,如样本平均数、样本标准差等。一般在生物学研究中,样本容量在30个以下称为小样本,30个以上称为大样本。在一些计算和分析检验方法上,大样本和小样本是不同的。8第八页,共二十三页。寄黎”:2、统计数和资料类型一-:描述总体的蛤征数叫摹数。一般用箫腊字母
5、表示O族样本的将征数叫统计数。一般用拉丁字母 表示。如样本平均数。也称参量,是对一个总体特征的度量。如总体平 均数、总体标准差等均为参数。因为总体一般都很大,有的 甚至不可能取得,所以总体参数一般不可能计算出来。从样本 中 计算所得的 数值称为 它是总体参数的估 计值。数量资料(计数资料、计量资料)属性资料(频次或者计数)第九页,共二十三页。第2节就是把次数分布资料画成统计图形。柱形图适合于 的次数分布。作图时纵坐标表示次数。各组之间一般有距离。迨合十计数资第十一页,共二十三页。直方图适合于表示计量资料的次数分布。其作图方法与柱形图相似,以R分组的上下限,纵坐标表示次妻,截取一定距离代表组限大
6、小和次数多少。各组 之间一般没有距离,前一组上限与后-合并公月o以150尾随鱼体长的次数分布 和频率分布为例作出直方图第十二页,共二十三页。鲤鱼的体长次数分布直方图第十三页,共二十三页。第3节样本特征数的计算、算数平均数是描述观测资料的重要特征数,它的作用主要有以下两点:1.指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平2.作为样本或资料的代表数与其他资料进行比较。X _l x:X v-1 2 nnn为 Xn n第十六页,共二十三页。3.算术平均数的计算方法n n4.算术平均数的重要特性离均差的总和等于0离均差的平方和()第十七页,共二十三页。:、变异数变量的分布具有
7、 两方面特征,因而只有表示集中性的平均数是不够的,还必须计算变异数以度量其变量的离散性(变异性)。用来表示变异性的指标较多,常用的有标准差、方差和变异系数等,其中以标准差和变异系数应用最为广。第十八页,共二十三页。1.极差:极差又称全距。是资料中最大观察值与最小观察值的 差数。用“R”来表示。我们举个例子来说明。例如调 查两个不同品种的小麦每穗小穗数,每品种计10个数,经过整理其数字为R 甲=23-13=1。R乙=20-16=4品种名称每穗小穗数总和平 均甲1314151718181921222318018 I乙1616171818181819202018018|第十九页,共二十三页。方差、标
8、准差二一 方差、标准差用 观察值数目来除平方和,得到平均平方和,简称均方或方差,Ss:平方和;df:(degree of freedom)自由度,MS均方第二十页,共二十三页自由度(degree of freedom,所写为)M解释之一:对于一个具有n个观察值的样本,每个y与其平均数比较 时,虽然具有n个离均差,但因受到离均差之和等于0的限制,所,以只能有n-1个是自由的。例如:有5个观察值,其4个的高均差为3,2,-3,6,贝!J 第5个离均差必定为-8,才能保证离均差之和等于0。所以,在估 计其他统计数时,如果该统计数受K个条件限制,则其自由度应该为n _*。在应用上,小样本一定要用自 由度来估算标准差;若为大样本,因n和n -1相差较小,可直接用n作除数,但大样本的界限没有统一规定,一般以30以上为大样本。第二十一页,共二十三:解释之二:比较以上两式可以发现,样本标准差不以样本容量n而以n1作为 除数。这是因为通常我们只能掌握样本资料,不知道总体平均数的数 值,不得不用样本平均数代替总体平均数。但由于离均差平方和最小,即Eg 无)2 汇(超一计算出的标准差将失之过小。将分母用nl代替,可以避免偏小 的弊病,可以做到对总体标准差的较好的估计。一第二十二页,共二十.3.标准误sS .x/7 n匚示准误(SE);s标准差(SD);口=样本个数第二十三页,共二十三页。