资源描述
生物统计复习资料
绪 论
一、什么是“生物统计学”?
生物统计学是生物学和数学的结合。是指应用数理统计的原理、方法来分析和解释各种生物现象和数量资料的应用科学。
二、为什么要学习生物统计学?
简单讲,生物统计学所讲授内容是从事农业科学研究必须具备的理论知识,因为试验数据的分析是科研工作中重要的一环,要求科研人员必须具备分析试验数据的基本能力,故应学习之。
三、怎样学好生物统计学?
生物统计学是一门应用学科,重点要求大家会使用这一数据分析“工具” ,因而相对容易学。但是其所用的原理、公式较多,需费一定时间去理解、记忆。学好这门课主要做到:明白意义、结合实际、多做练习,“实战”运用。
第一章 变数的特征数
1.试验方案:是根据试验目的和要求所拟定的进行比较的一组试验处理的总称。具体就是指试验指标、试验因素和处理、重复次数、对照、小区以及设计方法的确定等。
2.指标、因素、处理:在试验中用来判断试验处理效果的标准称为试验指标(简称指标),有定性指标和定量指标。
因素:对试验指标有影响,在试验中需加以考察的条件叫试验因素,简称因素或因子,否则称非试验因素或非试验条件。
处理:是指试验因素的不同状态或不同的数量级别,简称处理,也叫水平。在单因素试验时,处理和水平的概念是等价的,但在复因素试验时,处理则是指各个因素水平的组合,叫处理组合。
3. 小区:安排每个处理所需试验材料的基本单位。用每个小区的数值(最好是平均值)进行统计分析。
4.总体与样本
总体是指在同一组试验条件下,由具有某种共同性质的大量个体所组成的集团,或者说是某一变数的全部可能值的集合。样本是指从总体中抽出的一部分个体。 (一个个体有一个数值)总体容量用N表示,样本容量n用表示。
5.参数与统计数
描述总体的特征数叫参数,它是总体的真正数值,是固定的常量,是由总体的全部变量计算而得到的,显然参数通常是无法得到的。
描述样本的特征数叫统计数它是由样本的观察值计算而得到的,是参数相应的估计数。统计数是变化的,它会随样本的不同而不同。
6.变数与变量
变数是指在同一组试验条件下所获得的某种性状或特性的一组有变化的数据。变数中的每一个具体数值叫变量或叫观察值。
(一)数量性状的数据
1、连续性变数:指由称量、度量或测量、分析化验等方法所得到的数据。其各个变量并不仅限于整数,在两个相邻数值之间可以有微量差异的其他数值存在。
2、间断性变数:也叫非连续性变数。是指由计数方法所获得的数据,其各个变量必须以整数表示,在两个相邻的整数间不能有带小数的数值存在。
(二)质量性状的数据
由只能观察描述或感觉而难以量测的性状获得的数量资料为质量性状的数据。这些性状本身不能以数字来表示,要获得这类性状的数量资料,一般可以采用分级法和统计次数法进行数量化。所获得的质量性状的数据性质类似间断性变数。
任何一个变数的分布具有两个基本特征,即集中性和离散性。
集中性是变数在趋势上有着向某一中心聚集、或者说以某一数值为中心而分布的性质。反映集中性的特征数是平均数,
离散性是变数离中、分散变异的性质。反映离散性的特征数为变异数。
一、平均数
1.算术平均数:(带变数单位)
二、变异数
1.方差:
2.标准差(根方差,带变数单位):
叫离均差
叫离均差平方和,简称平方和,用SS表示。
3.变异系数(不带变数单位):
在比较两个性质不同,单位不同,平均数大小各异的样本变异度时,不能用标准差进行直接比较,而用变异系数比较。
标准差与变异系数的异同点:
相同点:均表示变数的变异。
不同点:(1)标准差反映变数的平均变异量,而变异系数反映变数的相对变异量;(2)标准差带原变数的单位,而变异系数是不带单位的纯数。
第二章 试验资料的统计推断
第一节 统计假设测验的基本步骤
1. 首先对所研究的总体参数提出假设
设无效假设和备择假设,即:
2. 确定一个否定的概率标准,用a表示,常用a=0.05和a=0.01。
(三)测定误差的概率:在为正确的前提下,根据统计数的一定分布律计算实得差异由误差造成的概率(如U测验、t测验、测验、F测验)。
(四)判断:将计算所得的误差概率与a进行比较,作出接受还是否定无效假设的推断,并说明参数之间的差异是显著、极显著还是不显著。因此假设测验也被称作差异显著性测验。
第二节 平均数的假设测验
一、单个平均数的假设测验
指测验某个样本平均数的总体平均数m与某一已知总体平均数之间的差异是否显著。
如果样本为大样本(n³30 ),进行u测验;如果样本为小样本(n<30),则要进行t测验。
u或t =
U测验时,与临界U值进行比较;t检验时,依据自由度df=n-1查临界t值tα,与临界t值进行比较。(举例)
二、两个样本平均数的统计假设测验
指测验两个样本所属总体的平均数 m1和m2间有无显著性差异。
H0 : m1=m 2 HA :m1≠m2
测验的方法分为成组数据和成对数据两大类。
如果两个处理间的各变量之间彼此独立,即观察值之间无一一对应关系,即为成组数据,否则若存在一一对应关系,则为成对数据。
(一)成组资料的测验
1. 两个样本的容量均大于等于30时,用u测验。
2.两个样本的容量均小于30时,用t测验。
1.如果, 2. 如果,
用 df= 查t临界值 (举例)
(二)成对资料的测验
用df=n-1 查t临界值(举例)
第三章 方差分析
一、平方和与自由度的分解
SST = SSt+ SSe dfT= dft+ dfe
分析目的:获得各项变异来源的方差。
二、F测验:F =
F测验分析的目的是判断各个处理平均数之间是否存在显著差异,即可测验:
Ho: HA: 不相等
三、多重比较
如果F测验的结果为各处理间的差异不显著,则分析结束,否则将进行多重比较。多重比较分析的目的是进一步判断两两处理平均数之间的差异显著性。
(一)保护性最小显著差数法,即 PLSD法。
步骤:1. 根据 dfe 查出 tα 。
2. 计算平均数差数标准误: =
3. 计算显著尺度PLSDα值: PLSDα = tα ×
4. 将处理平均数由大到小排序,并依次求出各处理平均数之间的差值,将各均数差值均与PLSDα相比较,作出平均数间差异显著性判断:
差异为显著;
差异为极显著;
差异为不显著。
(二)最小显著极差法,即LSR法。
主要介绍SSR法。SSR法即邓肯氏新复极差法。
步骤:1.根据平均数秩次距k和dfe查出SSRα值。秩次距是指相比较的两个平均数之间(含这两个平均数)包含的平均数个数。
2.计算平均数标准误: =
4.将处理平均数由大到小排序,并依次求出各处理平均数之间的差值,将各均数差值与相应秩次距下的显著尺度进行比较,作出差异显著性判断。同样有:
(1)相应秩次距的 R0.01 > 平均数差值 ≥ 相应秩次距的R0.05,则两处理平均数间差异为显著;
(2)平均数差值 ≥相应秩次距的 R0.01 ,则两处理平均数间差异为极显著;
(3)相应秩次距的R0.05 > 平均数差值 ,则两处理平均数间差异为不显著。
第四章 卡平方()测验
一、卡方测验的基本公式
右面公式用于自由度为1资料的测验。用计算的值与相应自由度下的临界值比较做出判断。
第三节 适合性测验
一、概念
适合性测验是指测验观察的实际次数与某种理论或需要预期的理论次数是否相符合。
H0:相符 HA:不相符
df=K-1 K为计数资料的分组数
适合性测验主要可用于以下几个方面:
(1)试验资料的理论分布拟合。
(2)遗传育种研究中性状的分离表现。
(3)产品质量检测、技能检测。
第四节 独立性测验
一、概念
独立性测验是指进行两个计数资料之间是否相互独立的测验,是次数资料的一种相关研究。
H0:独立(不相关)
HA:不独立(相关)
df=(r-1)(c-1)(行、列自由度的乘积)
对于2×2表的独立性测验也可用下面公式进行计算:
第五章 直线相关回归分析
第一节 相关、回归的概念及异同点
一、概念
相关:研究两个或两个以上变数间的相关变异(或变数间共同变化规律)为相关。
回归:研究一个变数受另外一种或一种以上变数的影响程度为回归。
二、异同点:(以两个变数为例)
同:都是研究两个变数间相互关系的。
异: 相关 回归
1. 研究两个变数间的相关变 研究依变数随自变数的变化
变异(共同变化规律) 而变化的规律
2. 平行关系 依存关系
3. 两变数均含误差 依变数含误差,自变数
不含或极少含误差
4. 不具预测意义 具预测意义
5. 以计算相关系数为基础 以求算回归方程为基础
第二节 直线相关
一、度量相关的基本公式
表示x和y两变数相关密切程度及其性质的统计数叫相关系数。
r
相关系数的特性:
1. 相关系数r是一个纯数,不带单位。
2. 取值在-1~ +1之间。
3.相关系数的正负号反映相关的性质,其绝对值大小反映相关程度的高低。
二、相关系数的计算(举例说明):
主要掌握乘积和的计算。
三、相关系数的假设测验:
1.t测验法
2.查表法(主要)
第三节 线性回归
一、直线回归方程式
是和x的量相对应的依变数y的点估测值。a是x=0时的值,叫做回归截距。b是回归系数,表示x每增加一个单位,平均将要增加(b>0)或减少(b<0)的单位数。
二、回归方程的求算:
先计算b值,然后计算a值即可。
三、回归系数与相关系数的异同点:
同:1. 正负号相同。
2. 均反映两个变数之间的相关关系。
异:1. r反映两变数间的相关变异(共同变化规律),b反映依变数随自变数的变化而变化的规律。
2. r的取值在-1~+1,b的取值无限制,范围很大。
3. r不带单位,b带单位。
四、回归关系的显著性测验
(一)F测验:对线性回归关系进行显著性测验
(二)t测验:对回归系数进行假设测验
记住:在进行两个变数的相关回归研究中,对相关系数、回归系数的t测验以及回归关系的假设测验结果完全一致。
第四节 相关回归分析的应用注意
1. 采用相关回归分析方法进行研究,一定要有专业意义;
2. 进行试验设计、取样时,要注意样本容量n≥5;自变数x的取值区间尽可能大;
3. 注意除了被研究的两个变数外,其余试验条件应尽可能处于相对一致的条件下;
4. 正确理解假设测验的结果;
5. 应用回归方程进行预测时:
(1)其两变数间的相关系数r的绝对值
应≥0.7;
(2)要在自变数x的取值区间内进行预测;
(3)要在获得该方程的“原条件下”进行预测。
展开阅读全文