资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,生物统计统计数据的搜集与整理,从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。抽样方法有随机抽样、分类抽样等。生物统计学上要求抽样具有代表性,应是一个总体的缩影,因此要根据具体情况采用不同抽样方法。,1.1.3,抽样,2026/1/25 周日,要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。如抽签,抓阄,用随机数字表等。随机表的用法,(,附表,1,,自习,),1.1.4,随机抽样,2026/1/25 周日,放回式抽样,:,从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。,非放回式抽样,:,从总体中抽出个体后,不再放回。,有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。尤其是总体量不大,或抽样范围小的时候。,无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。,一般情况样本的含量越大越有代表性。,1.1.5,放回式抽样和非放回式抽样,2026/1/25 周日,1.2.1,连续型数据和离散型数据,统计学的最基本工作是收集数据,数据收集得越多越有可能揭示客观现象的特性和变化规律。,数据类型:,连续型数据(度量数据):与某种标准做比较所得到的数据,.,例如,:,长度,时间,重量。对连续型数据进行分析的方法,通常称为变量的方法。,离散型数据(记数数据):由记录不同类别个体的数目所得到的数据,.,例如,:,尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。,1.2,数据类型及频率分布,2026/1/25 周日,1.2.2,频数(率)表和频数(率)图的编绘,离散型数据与连续型数据的频数(率)表和频数(率)图略有不同。,离散型数据频数(率)表和频数(率)图。,例:调查每天出生的10名新生儿中,体重超过3kg的人数,共调查120天。每天的10名新生儿中,体重超过3kg的人数,可能有11种情况:1名也没有,有1名,有2名,10名都是,如表1-1的第一列所示,这一组称为组值。,2026/1/25 周日,表1-1每10名新生儿体重超过3kg的人数频数(率)表,2026/1/25 周日,2 频数(率)表和频数(率)图的编绘,m3 200、判断峭度g时,样本含量至少要 1000。,偏斜度:度量数据围绕众数呈不对称的程度。,5、将原始数据表中数据,填入频数表中,计算出每组的频数和频率。,2、决定划分的组数,分组数是由数据的多少决定的,统计学家斯特吉斯提出分组数公式:(式中为样本数)。,有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。,单位为物理学单位的立方,因此不同类型数据之间不易进行比较,自习:频数图、频数表、平均数的性质、平均数的简化计算公式。,图形的形状:对称与不对称,也可能显示异常分布,出现一些不规则的情况,需要寻找原因。,6、算术平均数有哪些基本性质?,2、如何提高试验的准确性与精确性?,其判断方法与m3是一样的。,为了回答这一问题,首先要对总体分布有所了解。,1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx (R=170-141=30),2、决定划分的组数,分组数是由数据的多少决定的,统计学家斯特吉斯提出分组数公式:(式中为样本数)。,3、根据极差与决定划分的组数、确定组限。(30/103),4、在频数表中列出全部组限、组界及中值。,5、将原始数据表中数据,填入频数表中,计算出每组的频数和频率。,编制连续型数据的频数(率)表的步骤:,2026/1/25 周日,表1-3“三尺三”株高频数(率)表,2026/1/25 周日,直方图:又称组织图,横轴表示组界,纵轴表示频数(频数图)或频率(频率图),两者图形完全一样。,直方图,2026/1/25 周日,多边形图(折线图):横轴表示各组中值,纵轴表示频数(率),连接各点得到多边形图。,累积频数图:横轴表示各组中值,纵轴表示累积频数(率),连接各点得到累积频数(率)图(向上累积与向下累积)。,频数(率)图的编绘,2026/1/25 周日,根据频数(率)表或频数(率)图,可以看出数据的三个重要特征。,集中情况:平均数,中位数,众数。,变异情况:集中在平均数两侧的程度,越集中在平均数附近说明数据越整齐。,图形的形状:对称与不对称,也可能显示异常分布,出现一些不规则的情况,需要寻找原因。,1.2.3,研究频数(率)分布的意义,2026/1/25 周日,同一总体中随机抽取的样本,其频数分布不完全相同,有时差距还很大。,由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有不同,因此,需要考察结果的可信度。为了回答这一问题,首先要对总体分布有所了解。后面的第二、三章的内容就是围绕总体展开的。,1.2.4,频数分布的不恒定性,2026/1/25 周日,样本特征数,:,描述样本频率分布特征的数字,.,1.3.1,平均数:数据集中点的度量,种类很多。,算术平均数,:,通常简称平均数。,常用简单算术平均数方法,实际应用中也常用加权平均的方法来计算。,几何平均数:,处于稳定消长过程中生物群体的数量变化呈几何级数,如在细菌、藻类等培养,求平均消长率应采用几何平均数,若用算术平均数则偏高,(,几何平均数小于算术平均数,)。,1.3,样本的几个特征数,2026/1/25 周日,中位数:居于中间位置个体的数值。,众数:具有最高频数的组值或中值。有单众数、双众数、三众数等。,生物统计学中一般都是用平均数,中位数和众数很少使用。,自习:频数图、频数表、平均数的性质、平均数的简化计算公式。,1.3.1,平均数,2026/1/25 周日,数据的变异程度,范围(或极差)(,R,),R,maxx-minx,平均离差(,MD,),:,离均差绝对值的和的平均数。,1.3.2,标准差,2026/1/25 周日,样本方差(,S,2,):,离均差平方的和(离差平方和)除以,n,。,标准差(,SD,)或(,S,):,样本方差的开平方。,1.3.2,标准差(续),2026/1/25 周日,非频数资料,标准差,的简化计算公式:,标准差的,简化,计算方法,2026/1/25 周日,连续型数据:用中值代替,类似离散型数据计算方法(数据较大时可用编码,),:,频数资料标准差的简化计算公式:,离散型数据:,2026/1/25 周日,没有计算数据变异的性质,因此没有一个绝对的含义。,m30,说明曲线向左偏斜,称左偏或正偏,此时众数小于中位数,而中位数小于平均数。,1 连续型数据和离散型数据,多边形图(折线图):横轴表示各组中值,纵轴表示频数(率),连接各点得到多边形图。,判断偏斜度g1 时,样本含量至少要 200、判断峭度g时,样本含量至少要 1000。,无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。,一般用三阶中心矩,m,3,:,m,3,=0,,说明曲线对称于平均数,此时平均数等于中位数也等于众数。,m,3,0,,说明曲线向左偏斜,称左偏或正偏,此时众数小于中位数,而中位数小于平均数。见图,A,。,m,3,0,,说明曲线过于陡峭;,g,200,、判断峭度,g,时,样本含量至少要,1000,。,峭度,g,2,:,也是用来度量曲线形状,其值为四阶中心距,m,4,与二阶中心距,m,2,的平方的商再减去:,2026/1/25 周日,考虑标准差和平均数两者关系,用来表明样本标准差对平均数的变异幅度。,可以用来判断数据整齐程度,变异系数比较小的数据组比较整齐。,1.3.4,变异系数CV,2026/1/25 周日,一、名词解释,总体 样本 标准差 方差 变异系数,偏斜度 峭度,习题,2026/1/25 周日,二、简答题,1,、简述生物统计学概念?它在水产科学研究中有何作用?,2,、如何提高试验的准确性与精确性?,3,、如何控制、降低随机误差,避免系统误差和总偶然误差?,习题,2026/1/25 周日,二、简答题,4,、频率(数)分布表与频率(数)分布图有何用途?常用频率(数)分布图、频率(数)分布表有哪些?,5,、生物统计中常用的平均数有几种?各在什么情况下应用?,6,、算术平均数有哪些基本性质?,7,、标准差有哪些特性?,8,、为什么变异系数要与平均数、标准差配合使用?,习题,2026/1/25 周日,三、计算题,1,、从某养鳗池随机抽取,5,条鳗鱼,其体重分别,50,,,100,,,100,,,75,,,50,(单位为克),试计算该鳗鱼样本的平均体重、标准差、变异系数。,2,、测定了,10,尾某种鱼雌亲鱼的体长平均为,22cm,,标准差为;此,10,尾雌亲鱼的体重平均为,标准差为。问这两性状哪个变异大?,习题,2026/1/25 周日,
展开阅读全文