Accuracy准确度与精确度.ppt

资源描述

基本概念（基本概念（Basic Concepts）1.总体（总体（population）:具有共同性质的个体所组成的集团。具有共同性质的个体所组成的集团。分为有限总体和无限总体。分为有限总体和无限总体。2.样本（样本（Sample）：）：从总体中抽出的若干个个体组成样本。从总体中抽出的若干个个体组成样本。3.观察值（观察值（Observed Value）：）：每一个体的某一性状、特性每一个体的某一性状、特性的测定数值。的测定数值。4.变数（变数（Variable）：）：凡表现出变异的观察值称为变数。凡表现出变异的观察值称为变数。5.参数（参数（Parameter）：）：由总体的全部观察值而计算得到的由总体的全部观察值而计算得到的总体特征数，如总体平均数等。总体特征数，如总体平均数等。6.统计数（统计数（Statistic）：）：测定样本中的各个体而得到的特征测定样本中的各个体而得到的特征数，如样本平均数等。数，如样本平均数等。7.随机样本（随机样本（Random Sample）：从总体中随机抽取的样本。）：从总体中随机抽取的样本。水平（水平（Level）：）：因素内设置的不同处理级别。因素内设置的不同处理级别。处理（处理（Treatment）：）：几个因素不同水平的组合。几个因素不同水平的组合。准确度（准确度（Accuracy）：）：同一处理的观察值与其真实值的接同一处理的观察值与其真实值的接近程度。近程度。精确度（精确度（Precision）：）：同一处理的重复观察值间彼此接近程同一处理的重复观察值间彼此接近程度。度。试验单元（试验单元（Experimental Unit）：）：是指接受某种处理的最是指接受某种处理的最小的一个独立的试验材料单位。如一张叶片、一个果实、小的一个独立的试验材料单位。如一张叶片、一个果实、一个枝条、一个植株等。一个枝条、一个植株等。13.误差（误差（Error）：观察值与处理真实值间的偏离程度。）：观察值与处理真实值间的偏离程度。14.系统误差（系统误差（Systematic Error）：观察值与处理真实值间）：观察值与处理真实值间出现有一定方向的系统偏离，如供试材料的遗传背景、仪出现有一定方向的系统偏离，如供试材料的遗传背景、仪器等方面存在的可辨识的差别所造成的误差。器等方面存在的可辨识的差别所造成的误差。15.随机误差（随机误差（Random Error）：）：观察值与处理真实值间出观察值与处理真实值间出现的大小、方向不同的微小差异。如在试验单元、管理方现的大小、方向不同的微小差异。如在试验单元、管理方法、操作方法等方面存在的不可辨识的差别所造成的误差。法、操作方法等方面存在的不可辨识的差别所造成的误差。16.样本含量（样本含量（Sample Size/Capacity）：）：样本中所包含的个样本中所包含的个体数目。体数目。第一节第一节试验设计试验设计experiment design试验和实验试验和实验试验是在人为控制条件下有目的地进行的一种实践活动。试验是在人为控制条件下有目的地进行的一种实践活动。一、试验类型（一）一、试验类型（一）1.田间试验田间试验2.温室试验温室试验3.实验室试验实验室试验4.皿内试验皿内试验5.人工气候室内试验等等人工气候室内试验等等二、试验的基本要求：二、试验的基本要求：1.目的明确目的明确2.结果可靠结果可靠3.试验条件有代表性试验条件有代表性4.试验结果能够重复试验结果能够重复精确度准确度UxFig.1 Mathematical model of experiment 离散的测定几个点，采用统计学的方法经验的估计离散的测定几个点，采用统计学的方法经验的估计 xf（U）（如上图所示），显然观测点未必都在曲线上。如果估（如上图所示），显然观测点未必都在曲线上。如果估计出了计出了xf（U），我们就掌握了，我们就掌握了x随随U而变化的规律，就可以而变化的规律，就可以进行预测和控制。进行预测和控制。三、处理设计三、处理设计田间试验按试验小区大小、试验年份、试验地点等可分为田间试验按试验小区大小、试验年份、试验地点等可分为若干类，但最基本的是根据试验因素可将田间试验分为：若干类，但最基本的是根据试验因素可将田间试验分为：单因素试验（单因素试验（Singlefactor experiment）仅研究某一个仅研究某一个问题，如施肥对产量的影响，可以包含肥料的不同等级。问题，如施肥对产量的影响，可以包含肥料的不同等级。优点：试验简单，容易分析、但是不能了解各因素之间的优点：试验简单，容易分析、但是不能了解各因素之间的关系。关系。多因素试验（多因素试验（Multiple-factor experiment）中包含了不中包含了不同因素及不同水平的组合。优点：便于了解各因素之间的同因素及不同水平的组合。优点：便于了解各因素之间的相互关系，试验复杂，设计不妥时不便于分析。相互关系，试验复杂，设计不妥时不便于分析。综合试验（综合试验（Comprehensive experiment）是在进行多因素是在进行多因素研究之后，将重要因素重新组合，进行试验分析，各因素研究之后，将重要因素重新组合，进行试验分析，各因素的水平不需要构成平衡处理。的水平不需要构成平衡处理。四、试验单元的排列方式四、试验单元的排列方式试验设计的目的是避免系统误差，缩小随机误差，以保证试验设计的目的是避免系统误差，缩小随机误差，以保证试验的准确度和精确度。试验的准确度和精确度。试验设计的三个基本原理：试验设计的三个基本原理：1.重复（重复（Replication）：）：重复的作用（重复的作用（1）若试验中没有系统误差）若试验中没有系统误差存在，只有随机误差，则可用处理多次重复观察值间的参差不存在，只有随机误差，则可用处理多次重复观察值间的参差不弃程度来估计随机误差。只有弃程度来估计随机误差。只有1次重复就无法估计随机误差次重复就无法估计随机误差（2）同一处理多次观察值的平均值是处理真值的最好估计。）同一处理多次观察值的平均值是处理真值的最好估计。2.随机化（随机化（Randomization）：）：通过试验单元的随机化排列来消通过试验单元的随机化排列来消除试验单元间的系统误差。除试验单元间的系统误差。3.局部控制（局部控制（Local control）：）：将整个试验空间分成若干个各自将整个试验空间分成若干个各自相对均匀的局部（区组），所以的区组构成区组因素。作用相对均匀的局部（区组），所以的区组构成区组因素。作用（1）可将系统误差分离出来增加准确度；（）可将系统误差分离出来增加准确度；（2）区组内保证试）区组内保证试验单元的一致性，增加精确度。验单元的一致性，增加精确度。随机化排列随机化排列重重复复 I重重复复 IIbcdefgck2ckckheabcfgdaabcdefghck1 1、田间试验设计、田间试验设计ckabcgedf利用查表或产生随机数的方法进行设计利用查表或产生随机数的方法进行设计ck2五、局部控制五、局部控制1 1、田间试验设计、田间试验设计abcdefck设置重复设置重复随机化排列随机化排列局部控制局部控制消除系统误差，消除系统误差，无偏试验误差估计无偏试验误差估计估计和降低估计和降低随机误差随机误差与随机化结合与随机化结合分离系统误差分离系统误差降低随机误差降低随机误差提高准确度和精确度提高准确度和精确度保证统计推断的可靠性保证统计推断的可靠性试验类型（二）试验设计可以归纳为全面实施试验和部分实施试试验设计可以归纳为全面实施试验和部分实施试验两种类型。验两种类型。全面实施试验分为顺序排列的试验设计和随全面实施试验分为顺序排列的试验设计和随机排列的试验设计两大类。前者常用在处理数量机排列的试验设计两大类。前者常用在处理数量大、精确度要求不高、不须作统计推断的预备试大、精确度要求不高、不须作统计推断的预备试验，容易发生系统误差；后者强调有合理的试验验，容易发生系统误差；后者强调有合理的试验误差估计，常用于对精确度要求较高的试验。误差估计，常用于对精确度要求较高的试验。全面实施试验（全因子试验）全面实施试验（全因子试验）一、顺序排列的试验设计一、顺序排列的试验设计1.对比法设计（contrast design）常用于少数处理试验及示范性试验，其试验单元排列特点是处理单元直接排列在对照区旁边，使每一小区可与其邻旁的对照区直接比较。IIIIII1CK23CK 45678CKCK7CK81CK 23456CKCK5CK67CK 81234CKCK2.间比法设计（interval contrast design）常用处理试验单元较多的试验，要求不高，但用随机区组排列有困难的试验。其试验单元排列特点是第一个小区和末尾小区一定是对照，每二个对照之间排列相同数目的处理小区，通常是4或9个，重复24次。CKCKCKCK123456789 10 11 1212个小麦品种的间比法排列个小麦品种的间比法排列二、随机排列的试验设计二、随机排列的试验设计1.完全随机设计（completely random design）将各个处理随机分配到各个试验单元（或小区）中，每一个处理的重复数可以相等或不相等。这种设计灵活机动，单因素和多因素均可使用。2.随机区组设计（randomized blocks design）亦称完全随机区组设计（random complete block design）根据局部控制的原则将试验地划分为等于重复次数的区组，一个区组安排一个重复，区组内各处理都独立随机排列。主要特点（1）简单；（2）适应性广；（3）能提供无偏的误差估计，降低误差；（4）对试验地形要求不严格；（5）试验的处理数目一般不要超过20。74211317368548732164524887566532IIIIIIIV肥力梯度：肥力梯度：8个品种个品种4次重复的随机区组排列次重复的随机区组排列3.拉丁方设计（latin square design）将各个处理从纵横两个方向排列为区组（或重复），使每一个处理在每一列和每一行中出现的次数相等（通常一次）。所以它比随机区组多一个方向进行局部控制的随机排列设计。拉丁方设计具有双向控制土壤差异的作用，有较高的精确度，但缺乏伸缩性，适应于48个处理的试验设计。ABCDEBCDEACDEABDEABCEABCD4.裂区设计（split-plot design）是多因素试验的一种设计形式。先按一个因素设计主处理小区（main plot），然后在这个主处理小区内引进第二个因素的各个处理的小区（副区或裂区，split-plot）。152541243634362651高高低低中中653231163142465254低低中中高高246532142135461653高高中中低低IIIIII5.再裂区设计（split-split plot design）若在裂区试验中需要引进第三个因素时，可以进一步裂区，将第三个因素的各个处理随机排列在裂区内。6.条区设计（strip blocks design）条区设计是裂区设计的一种衍生设计，当要研究的两个因素都需要较大的小区面积，且为了便于观察和管理，将每个区组划分为纵向长条形小区，安排第一个因素的各个处理，再将各个区组划分为若干个横向长条形小区，安排第二个因素的各个处理。部分实施试验（部分因子试验）部分实施试验（部分因子试验）正交设计（正交设计（orthogonal design）：）：两个重要的特点：两个重要的特点：（1）每列中因素各水平数字出现的次数相等，即整）每列中因素各水平数字出现的次数相等，即整齐可比性；齐可比性；（2）任两列放在一起，他们的行构成一个有序数对，）任两列放在一起，他们的行构成一个有序数对，这样的数对出现的次数也相等。或者说任两列之间的这样的数对出现的次数也相等。或者说任两列之间的所有可能的水平组合都出现，且出现的次数均等。即所有可能的水平组合都出现，且出现的次数均等。即均衡分散性。均衡分散性。具有这样特点的数表称为正交表。正交表是正交具有这样特点的数表称为正交表。正交表是正交拉丁方的推广。一般用拉丁方的推广。一般用LN（mk）表示正交表，表示正交表，N为试为试验次数；验次数；k为所能容纳的最多因素数；为所能容纳的最多因素数；m为每个因素的为每个因素的水平数。如水平数。如L8（27）。）。假设我们要做一个三因素二水平的试验，若已知不需要考虑任何假设我们要做一个三因素二水平的试验，若已知不需要考虑任何交互作用，可以用交互作用，可以用L4（23）表，）表，但在这种情况下，误差项但在这种情况下，误差项Sse分离不出来，分离不出来，无法作统计检验，只能直观比较哪个水平好。若存在交互作用，就会迭无法作统计检验，只能直观比较哪个水平好。若存在交互作用，就会迭加在其它列上，从而得到错误的结果。因此，若不能排除存在交互作用加在其它列上，从而得到错误的结果。因此，若不能排除存在交互作用的可能，则应利用的可能，则应利用L8（27）表）表。12345671111111121112222312211224122221152121212621221217221122182212112ColRow表头设计：首先将A、B放在第1，2列上，查交互作用表，他们的交互作用AB在第3列，因此，C因素不能放在第3列上，应放在第4列上，AC放在第5列上，BC放在第6列上，ABC放在第7列上,真正安排时只用1，2，4列。若ABC不存在，则第7列可作为误差e，这样就得到了表头设计如下：因素ABABCACBCe列号1234567第二节描述性统计一、试验资料的性质与分类一、试验资料的性质与分类1.数量性状资料（数量性状资料（quantitative trait）采用计数和采用计数和量测两种方式所得到的数据。量测两种方式所得到的数据。间断性变数间断性变数Discontinuous or discrete variable连续性变数连续性变数continuous variable小麦基本苗数、菌落数、穗数、分孽数等等病斑长度、作物产量、株高、土壤水分含量等等2.质量性状资料（质量性状资料（qualitative trait）观察而不能量观察而不能量测性状，如菌落的颜色、麦穗有无芒等等。测性状，如菌落的颜色、麦穗有无芒等等。统计次数法统计次数法给分法给分法统计具有某个性状的个体数目及具有不同性状的个体数目，按类别计其次数或相对次数给予每类性状以相对数量的方法，如小麦籽粒有红白两种颜色，可用0表示白色，用1表示红色二、次数分布表二、次数分布表将试验所得到的大量未加整理的数据，按观察值大小将试验所得到的大量未加整理的数据，按观察值大小或数据类别进行分组，制成关于观察值不同组别或不同分或数据类别进行分组，制成关于观察值不同组别或不同分类单位的次数分布表，就可以看出资料中不同表现的观察类单位的次数分布表，就可以看出资料中不同表现的观察值与其频率间的规律性，从而对资料有一个初步概念。值与其频率间的规律性，从而对资料有一个初步概念。1.间断性资料的整理间断性资料的整理2.参见参见 P13 例例2。3.2.连续性资料的整理连续性资料的整理4.参加参加 P14 例例3。5.3.属性变数资料的整理属性变数资料的整理6.在整理前，将资料按各种质量性状进行分类，分类数在整理前，将资料按各种质量性状进行分类，分类数等于组数，然后根据各个体在质量属性上的具体表现，等于组数，然后根据各个体在质量属性上的具体表现，分别归入相应的组中，即可以得到属性分布的规律性认分别归入相应的组中，即可以得到属性分布的规律性认识。识。三、次数分图三、次数分图条形图（条形图（bar diagram）适合于间断性变数和属性资料条形图（条形图（bar diagram）适合于间断性变数和属性资料多边形图（多边形图（polygon）适合于连续性变数资料方柱形图（histogram）适合于连续性变数资料饼图（饼图（pie diagram）适合于间断性变数和属性资料饼图（饼图（pie diagram）适合于间断性变数和属性资料四、平均数四、平均数1.算术平均数（算术平均数（arithmetic mean）,Mean2.中数（中数（median）Md3.众数（众数（mode）,Mo4.几何平均数（几何平均数（geometric mean）,G算术平均数的两个重要特性：算术平均数的两个重要特性：（1）离均差之和等于零。）离均差之和等于零。（2）离均差平方和最小。）离均差平方和最小。设设a为任意数，但为任意数，但a不等于不等于x的平均数，则的平均数，则（为一定量，但）样本平均数一般用样本平均数一般用表示。表示。n为观察值的个数。为观察值的个数。总体平均数一般用总体平均数一般用表示。表示。N为有限总体中观察值的个数。为有限总体中观察值的个数。五、变异数五、变异数1.极差（极差（Range）R=Xmax-Xmin，当，当n10时，常采时，常采用用R来表示资料的变异度。例如两个小麦品种的每来表示资料的变异度。例如两个小麦品种的每穗小穗数见下表。穗小穗数见下表。品种每穗小穗数每穗小穗数总和平均R甲131415171818192122231801810乙16161718181818192020180184 说明甲品种级差较乙品种的大，其变异范围较大，平说明甲品种级差较乙品种的大，其变异范围较大，平均数的代表较差；乙品种的极差较小，其变异幅度较小，均数的代表较差；乙品种的极差较小，其变异幅度较小，平均数的代表性较好。平均数的代表性较好。极差只是两个极端数据所决定的，没有充分利用资料极差只是两个极端数据所决定的，没有充分利用资料的全部信息，所以用它代表整个样本的变异度是有缺陷的。的全部信息，所以用它代表整个样本的变异度是有缺陷的。2.方差或均方（方差或均方（Variance）用观察值数目除离均差平方和用观察值数目除离均差平方和（简称平方和）。（简称平方和）。3.样本均方（样本均方（S2）4.总体方差（总体方差（2）方差是根据全部观察值来度量资料的变异度的，是方差是根据全部观察值来度量资料的变异度的，是能够正确反映资料的变异度的度量方法。能够正确反映资料的变异度的度量方法。3.标准差（标准差（Standard Deviation）是）是方差的正根值，可以方差的正根值，可以很好的表示资料的变异度，其单位与观察值的度量单很好的表示资料的变异度，其单位与观察值的度量单位相同位相同。样本标准差（样本标准差（S）总体标准差（总体标准差（）自由度（自由度（degree of freedom，所写为，所写为DF）解释之一：解释之一：对于一个具有对于一个具有n个观察值的样本，每个个观察值的样本，每个x与其平均数比较与其平均数比较时，虽然具有时，虽然具有n个离均差，但因受到离均差之和等于个离均差，但因受到离均差之和等于0的限制，的限制，所以只能有所以只能有n1个是自由的。个是自由的。例如：有例如：有5个观察值，其个观察值，其4个的离均差为个的离均差为3，2，3，6，则第则第5个离均差必定为个离均差必定为8，才能保证离均差之和等于，才能保证离均差之和等于0。所以，在估计其他统计数时，如果该统计数受所以，在估计其他统计数时，如果该统计数受K个条件个条件限制，则其自由度应该为限制，则其自由度应该为nK。在应用上，小样本一定要用自由度来估算标准差；若为在应用上，小样本一定要用自由度来估算标准差；若为大样本，因大样本，因n和和n1相差较小，可直接用相差较小，可直接用n作除数，但大样本作除数，但大样本的界限没有统一规定，一般以的界限没有统一规定，一般以30以上为大样本。以上为大样本。比较以上两式可以发现，样本标准差不以样本容量比较以上两式可以发现，样本标准差不以样本容量n而以而以n1作为除数。这是因为通常我们只能掌握样本资料，作为除数。这是因为通常我们只能掌握样本资料，不知道总体平均数的数值，不得不用样本平均数代替总体不知道总体平均数的数值，不得不用样本平均数代替总体平均数。但由于离均差平方和最小，即平均数。但由于离均差平方和最小，即解释之二：解释之二：因此，采用因此，采用计算出的标准差将失之过小。将分母用计算出的标准差将失之过小。将分母用n1代替，可以代替，可以避免偏小的弊病，可以做到对总体标准差的较好的估计。避免偏小的弊病，可以做到对总体标准差的较好的估计。4.变异系数（变异系数（Coefficient of Variation，缩写为，缩写为CV）样本标准差对平均数的百分数。它是一个不带单位样本标准差对平均数的百分数。它是一个不带单位的纯数，表示单位量的变异。的纯数，表示单位量的变异。例如：两个小麦品种主茎高度的测量结果分析如下表。例如：两个小麦品种主茎高度的测量结果分析如下表。品种品种平均数平均数标准差标准差变异系数变异系数甲甲95.09.029.5乙乙75.08.5011.3若两个样本的单位不同或均数不同，不能用标准差直接若两个样本的单位不同或均数不同，不能用标准差直接比较。在采用变异系数表示样本的变异程度是，宜同时比较。在采用变异系数表示样本的变异程度是，宜同时列举平均数和标准差，否则可能引起误解。列举平均数和标准差，否则可能引起误解。例：下面是金枪鱼两个样本的体重，请比较两个样例：下面是金枪鱼两个样本的体重，请比较两个样本的差异。本的差异。表表1 金枪鱼体重金枪鱼体重样本样本1样本样本28.93.19.617.011.29.99.45.19.918.010.93.810.410.011.02.99.721.2n1=9n2=9平均数为平均数为10.11平均数为平均数为10.11 可以看出，两个样本的样本容量相同，平均数相同。可以看出，两个样本的样本容量相同，平均数相同。对每一个样本的观察值进行排序，结果发现它们的中数都对每一个样本的观察值进行排序，结果发现它们的中数都为为9.9（详见下表）。（详见下表）。表表各个样本观察值排序结果各个样本观察值排序结果样本样本1样本样本28.93.19.617.011.29.99.45.19.918.010.93.810.410.011.02.99.721.2n1=9n2=9平均数为平均数为10.11平均数为平均数为10.11Md1=9.9Md2=9.9Range2.3Range18.3Variance0.641Variance49.851S10.80S27.06表表1 金枪鱼体重金枪鱼体重

展开阅读全文