1、第一章 绪论 一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。2、个体:总体中的一个研究单位称为个体。3、样本:总体的一部分称为样本。4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。6、参数:由总体计算的特征数叫参数。7、统计量:由样本计算的特征数叫统计量。8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。1
2、0、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。 二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。 (2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。 2、统计分析的两个特点是什么?答:统计分析的两个特点是:通过样本来推断总体。有很大的可靠性但也有一定的错误率。 3、如何提高试验的准确性与精确性?答:在调
3、查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。 4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。系统误差是由于一些可以控制但未加控制的因素造成的,一般只要试验工作做得精细是可以消除的。避免系统误差的主要措施有:尽量保证试验动
4、物初始条件的一致(年龄、初始重、性别、健康状况等),尽量控制饲料种类、品质、数量、饲养条件等,测量仪器要准确,标准试剂要校正,要避免观测、记载、抄录、计算中的错误。 第二章 资料的整理 一、名词解释1、数量性状资料:数量性状是指能够以量测或记数的方式表示其特征的象状,观察测定数量性状而获得的数据称为数量性状资料。2、质量性状资料:质量性状是指能观察到而不能直接测量的性状,观察质量性状而获得的资料称为质量性状资料。3、半定量(等级)资料:是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得到的资料。4、计数资料:指用计数方式获得的数量性状资料。5、计量资料:指用量测手
5、段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。6、全距(极差):是资料中最大值与最小值之差。7、组中值:分组后每一组的中点值称为组中值,是该组的代表值。 二、简答题1、资料可以分为哪几类?它们有何区别与联系?答:资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中数量性状资料又包括计量资料和计数资料。区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系:三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 2、为什么要对资
6、料进行整理?对于计量资料,整理的基本步骤怎样?答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。 (2)计量资料整理的基本步骤包括:求全距,全距即为资料中最大值与最小值之差。确定组数,一般根据样本含量及资料的变动范围大小确定组数。确定组距,通常根据等距离分组的原则,组距等于全距除以组数。确定组限和组中值,各组的最大值为组上限,最小值为组下限;每一组的中点值称为组中值。归组划线计数,作次数分布表。 3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对
7、计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。 4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么?答:(1)统计表用表格形式来表示数量关系;统计图用几何图形来表示数量关 系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。 (2)常用的统计图有长条图、圆图、线图、直方图和折线图等。 (3)常用的统计表有简单表和复合表两大类。 (4)列统计表的注意事项:标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。标目分横标目和
8、纵标目两项,横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位。数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“”表示,数字是“0”的须写“0”。表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可以省去,表的左上角一般不用斜线。 (5)绘统计图的注意事项:标题简明扼要并列于图的下方。纵、横两轴应有刻度,注明单位。横轴由左至右,纵轴由上而下,数值由小到大;图形长宽比例约为5:4或6:5。图中需用不同颜色或线条表示不同事物时应有图例说明。 第三章 平均数、标准差与变异系数 一、名词解释1、算术平均数:是指资
9、料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。2、无偏估计:当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计。3、几何均数:n个观测值相乘之积开n次方所得的方根称为几何均数,记为G。4、中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值称为中位数,记为Md。5、众数:资料中出现次数最多的那个观测值或次数最多一组的组中值称为众数,记为Mo。6、调和平均数:资料中各观测值倒数的算术平均数的倒数称为调和平均数,记为H。7、标准差:统计学上把样本方差S2的平方根叫做样本标准差,记做S。8、方差:统计量(x - )2/(n - 1)称为均方,又
10、称样本方差,记为S2。9、离均差平方和(平方和):各个观测值与平均数的离差(x - )称为离均差,各个离均差平方再求和即为离均差平方和,简称平方和,记为SS。10、变异系数:标准差与平均数的比值称为变异系数,是衡量资料中各观测值变异程度的另一个统计量,记做C.V。 二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物
11、的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。 2、算术平均数有哪些基本性质?答:算术平均数的两个基本性质是:离均差之和等于零。 离均差平方和最小。 3、标准差有哪些特性?答:标准差的特性主要表现在四个方面: 标准差的大小受资料中每个观测值的影响,若观测值间变异大求得的标准差也大,反之则小。 在计算标准差时,在各观测值加上或减去一个常数,其数值不变。 当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。 在资料服从正态分布的
12、条件下,资料中约有68.26%的观测值在平均数左右1倍标准差 ( S)范围内;约有95.43%的观测值在平均数左右2倍标准差 ( 2S)范围内;约有99.73%的观测值在平均数左右3倍标准差 ( 3S)范围内。 4、为什么变异系数要与平均数、标准差配合使用?答:变异系数是标准差与平均数的比值,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,若度量单位与平均数相同,可以直接利用标准差来比较;若单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而要用变异系数。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 第四章 常用概率分布
13、一、名词解释1、必然现象:某类现象是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,这类现象称为必然现象。2、随机现象:某类现象事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同,这类现象称为随机现象。3、随机试验:一个试验若满足下述三个特性则称为随机试验,简称试验:试验可以在相同条件下多次重复进行。每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果。每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪个结果。4、随机事件:随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,称为随机事件,简称
14、事件。5、概率的统计定义:在相同条件下进行n次重复试验,若随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值P,那么就把P称为随机事件A的概率。这样定义的概率称为统计概率,也叫后验概率。6、小概率原理:若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,简称小概率原理。7、随机变量:作一次试验,其结果有多种可能,每一种可能结果都可以用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用随机变量x
15、来表示。8、离散型随机变量:如果表示试验结果的变量x,其可能取值至多为可数个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量。9、连续型随机变量:如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量。9、标准正态分布: = 0,2 = 1 的正态分布称为标准正态分布。10、标准正态变量(标准正态离差):任何一个服从正态分布N(,2)的随机变量x,都可以通过标准化变换:u = (x )/,将其变换为服从标准正态分布的随机变量u,u称为标准正态变量。11、双侧概率(两尾概率):随机变量x落在平均数加减不同倍
16、数标准差区间之外的概率称为双侧概率。12、单侧概率(一尾概率):随即变量x小于-k或大于+k的概率称为单侧概率。13、贝努利试验:对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与A之一,在每次试验中出现A的概率是常数p(014、返置抽样:由总体随即抽样时,每次抽出一个个体后,这个个体还返置回原总体,则称为返置抽样。15、不返置抽样:由总体随即抽样时,每次抽出的个体不返置回原总体,则称为不返置抽样。16标准误:即平均数抽样总体的标准差,其大小反映样本平均数 的抽样误差的大小,即精确性的高低。17、样本平均数的抽样总体:样本平均数也是一个随机变量,其概率分布叫做样本平均数的抽样分布,由
17、样本平均数 构成的总体称为样本平均数的抽样总体。18、中心极限定理:若随机变量x服从正态分布N(,2),x1,x2,xn是由总体得来的随机样本,则统计量 = x/n的概率分布也是正态分布,且有 = , =/ n ,即 服从正态分布N(,2/n);若随机变量服从平均数是,方差是2的分布(不是正态分布),x1,x2,xn是由总体得来的随机样本,则统计量 = x/n的概率分布,当n相当大时逼近正态分布N(,2/n)。 二、简答题1、事件的概率具有那些基本性质?答:事件的概率一般具有以下三个基本性质: 对于任何事件A,有0 P(A) 1 必然事件的概率为1,即P()=1 不可能事件的概率为0,即P()
18、=0 2、离散型随机变量概率分布与连续型随机变量概率分布有何区别?答:离散型随机变量概率分布常用分布列来表示,其具有Pi 0和Pi = 1两个基本性质。连续型随机变量的概率分布不能用分布列来表示,其可能取的值是不可数的,一般用随机变量x在某个区间内取值的概率P(a x ) 3、标准误与标准差有何联系与区别?答:样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是:样本标准误等于样本标准差除以根号下样本含量。二者的区别在于:样本标准差是反映样本中各观测值x1,x2,xn变异程度大小的一个指标,它的大小说明了 对该样本代表性的强弱。样本标准误是样本平均数 1, 2, k的标准差,它是
19、 抽样误差的估计值,其大小说明了样本间变异程度的大小及 精确性的高低。 4、样本平均数抽样总体与原始总体的两个参数间有何联系?答:样本平均数抽样总体的平均数等于原始总体的平均数。 样本平均数抽样总体的标准差等于与原始总体的标准差除以根号下样本含量。 5、t分布与标准正态分布有何区别与联系?答:t分布与标准正态分布曲线均以纵轴为对称轴,左右对称。与标准正态分布曲线相比t分布曲线顶部略低,两尾部稍高而平;df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布,当n30时,t分布与标准正态分布的区别很小;n100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致。 第五章 t
20、检验 一、名词解释1、假设检验(显著性检验):主要包括提出无效假设和备择假设,再根据小概率实际不可能性原理来否定或接受无效假设,实际上是应用“概率性质的反证法”对试验样本所属总体所做的无效假设的统计推断。2、无效假设:是显著性检验中被检验的假设,其意义是试验的表面效应是试验误差,处理无效,记作H0。3、备择假设:显著性检验时在无效假设被否定时准备接受的假设,其意义是试验的表面效应是处理效应,处理有效,记做HA。4、显著水平:显著性检验中用来确定否定或接受无效假设的概率标准叫显著水平,记做,在生物学研究中常取=0.05或=0.01。5、型错误:真实情况是H0成立却否定了它,犯了“弃真”错误,称为
21、型错误。6、型错误:真实情况是H0不成立却接受了它,犯了“纳伪”错误,称为型错误。7、检验功效(检验力、把握度):犯型错误的概率用表示,而1-称为检验功效,其意义是当两总体确有差别(即HA成立)时,按水平能发现它们有差别的能力。8、双侧检验(双尾检验):利用两尾概率进行的检验叫双侧检验,t为双侧检验的临界t值。9、单侧检验(单尾检验):利用一尾概率进行的检验叫单侧检验,此时t为单侧检验的临界t值;显然单侧检验的t=双侧检验的t2。10、非配对设计(成组设计):是指当进行只有两个处理的试验时,将试验单位完全随机地分成两组,然后对两组随机施加一个处理,两组的试验单位相互独立,所得的两个样本相互独立
22、,其含量不一定相等。11、配对设计:是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中去;配对的要求是配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差别。12、自身配对:指同一试验单位在两个不同时间上分别接受前后两次处理,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。13、同源配对:指将来源相同、性质相同的两个个体配成一对,如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对,然后将配对的两个个体随机地实施不同处理。14、参数估计:是统计推断的一个重要
23、内容,就是用样本统计量来估计总体参数。15、点估计:将样本统计量直接作为总体相应参数的估计值叫点估计。16、区间估计:在一定概率的保证下指出总体参数的可能范围叫区间估计。17、置信区间:区间估计时所给出的可能范围叫置信区间。18、置信度(置信概率):区间估计时给出的概率保证称为置信度。 二、简答题1、为什么在分析试验结果时需要进行显著性检验?检验的目的是什么?答:通过样本来推断总体是生物统计的基本特点,即通过抽样研究用样本信息来推断总体的特征。由一个样本平均数来估计总体平均数时,样本平均数包含抽样误差,用包含抽样误差的样本平均数来推断总体,其结论并不是绝对正确的。所以在分析试验结果时需要进行显
24、著性检验。显著性检验的目的是通过样本对其所在的总体作出符合实际的推断,即分析试验的表面效应是由试验处理效应还是由试验误差引起的,推断试验的处理效应是否存在。 2、什么是统计假设?统计假设有哪几种?各有何含义?答:统计假设(统计推断)是根据样本和假定模型对总体作出的以概率形式表述的推断。统计假设主要包括假设检验(显著性检验)和参数估计两个内容。假设检验(显著性检验)的含义:提出无效假设和备择假设,再根据小概率实际不可能性原理来否定或接受无效假设,实际上是应用“概率性质的反证法”对试验样本所属总体所做的无效假设的统计推断。参数估计的含义:用样本统计量来估计总体参数。 3、显著性检验的基本步骤是什么
25、?根据什么确定显著水平?答:1、显著性检验的基本步骤: (1)首先对试验样本所在的总体作假设。 (2)在无效假设成立的前提下,构成合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率。 (3)根据“小概率实际不可能性原理”否定或接受无效假设。 2、确定显著水平的标准通常采用小概率事件的标准,即0.05和0.01。选择显著水平应根据试验的要求或试验结论的重要性而定。若试验中难以控制的因素较多,试验误差可能较大,则显著水平标准可选低些,即值取大些;反之若试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平标准应高些,即值取小些。 4、什么是统计推
26、断?为什么统计推断的结论有可能发生错误?有哪两类错误?如何降低两类错误?答:(1)统计推断是根据样本和假定模型对总体作出以概率形式表述的推断。 (2)统计推断是根据“小概率实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设都没有100%的把握,会发生错误。 (3)在检验无效假设H0时可能犯两种错误,其中真实情况是H0成立却否定了它,犯了“弃真”错误,称为型错误;真实情况是H0不成立却接受了它,犯了“纳伪”错误,称为型错误。 (4)犯型错误的概率用表示,犯型错误的概率用表示。即是显著水平,的大小与值的大小有关,所以在选用检验的显著水平时应考虑犯、型错误所产生后果严重性的大小
27、,还应考虑到试验的难以及试验结果的重要程度。降低值可降低犯型错误的概率但会加大犯型错误的概率(在其他因素确定时,值越小值越大)。若一个试验耗费大,可靠性要求高,不允许反复,或试验结论的使用事关重大,容易产生严重后果,值应取小些;对于一些试验条件不易控制、试验误差较大的试验值取大些。同时,在提高显著水平即减小值时,为了减小犯型错误的概率可适当增大样本含量。 5、双侧检验、单侧检验各在什么条件下应用?二者有何关系?答:(1)选用双侧检验还是单侧检验应根据专业知识及问题的要求在试验设计时确定。一般若事先不知道所比较的两个处理效果谁好谁坏,分析的目的在于推断两个处理效果有无差别,则选用双侧检验;若根据
28、理论知识或试验经验判断甲处理的效果不会比乙处理的效果差(或相反),分析的目的在于推断甲处理是否比乙处理好(或差),则用单侧检验。一般情况下不做特殊说明均用双侧检验。 (2)二者的关系:单侧检验的t=双侧检验的t2,可见双侧检验显著单侧检验一定显著,单侧检验显著双侧检验未必显著。 6、进行显著性检验应注意什么问题?如何理解显著性检验结论中的“差异不显著”、“差异显著”、“差异极显著”?答:(1)显著性检验中应注意的问题: 为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的,并且处理要有可比性,即除比较的处理外,其他影响因素应尽可能控制相同或基本接近
29、。 选用的显著性检验方法应符合其应用条件。 要正确理解差异显著或极显著的统计意义。 合理建立统计假设,正确计算检验统计量。 结论不能绝对化。 报告结论时应列出,由样本算得的检验统计量值,注明是单侧检验还是双侧检验,并写出P值的确切范围,如0.01 (2)显著性检验结论中的“差异不显著”表示P0.05,接受H0,否认HA,处理无效,记作“ns”;“差异显著”表示0.010,接受HA,处理有效,记作“*”;“差异极显著”表示P0.01,更加否认H0,接受HA,处理有效,嘉作“*”。 7、配对试验设计与非配对试验设计有何区别?答:非配对设计(成组设计)是指当进行只有两个处理的试验时,将试验单位完全随
30、机地分成两组,然后对两组随机施加一个处理,两组的试验单位相互独立,所得的两个样本相互独立,其含量不一定相等。配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中去。非配对设计要求试验单位尽可能一致,配对设计要求配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差别。一般说来,相对于非配对设计,配对设计能够提高试验的精确性。 第六章 方差分析 一、名词解释1、方差分析:是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应的不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这
31、些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等。2、试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。3、试验因素:试验中所研究的影响试验指标的因素叫试验因素。4、因素水平:试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。5、试验处理:事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。6、试验单位:在试验中能接受不同试验处理的独立的试验载体叫试验单位。7、重复:在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复。8、多重比较:方差分析差异显著或极显著时,进行多个平均数两两间的相互比较称为多重比
32、较。9、主效应:由于因素水平的改变而引起的平均数的改变量称为主效应。10、简单效应:在某因素同一水平上,另一因素不同水平对试验指标的影响称为简单效应。11、交互作用:在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上所产生的效应不同,这种现象称为该两因素存在交互作用。 二、简答题1、多个处理平均数间的相互比较为什么不宜用t检验法?答:主要有三方面的原因: 检验过程烦琐。若有k个处理,则要做Ck2次检验。 无统一的试验误差,误差估计的精确性和检验的灵敏性低。 推断的可靠性低,检验的型错误率大,主要是由于没有考虑相互比较的两个平均数的秩次问题。 2、方差分析
33、在科学研究中有何意义?答:t检验法适用于样本平均数与总体平均数及两个样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需要进行多个平均数间的差异显著性检验,而此时采用t检验法是不适宜的。而方差分析是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应的不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等,其实质上关于观测值变异原因的数量分析,在科学研究中应用十分广泛。 3、方差分析的基本假定是什么?答:方差分析的基本假定(前提)也是单因素方差分析的数
34、学模型,包括效应的可加性、分布的正态性、方差的同质性;一般而言,具有了方差的同质性,同时就具有效应的可加性和分布的正态性。 4、进行方差分析的基本步骤为何?答:(1)计算各项平方和与自由度。 (2)列出方差分析表,进行F检验。 (3)若F检验显著,则进行多重比较。 5、多个平均数相互比较时,LSD法与一般t检验法相比有何优点?还存在什么问题?如何决定选用哪种多重比较法?答:(1)多个平均数相互比较时,LSD法与一般t检验法相比的优点:利用F检验中的误差自由度dfe查临界t值,利用误差均方MSe计算均数差异标准误,解决了t检验法检验方法中过程烦琐、无统一的试验误差且估计误差的精确性和检验的灵敏性
35、低的问题。 (2)存在的问题:未解决推断的可靠性低、犯型错误的概率变大的问题。 (3)常用的多重比较的方法有LSD法、新复极差法和q检验法,其检验尺度的关系是LSD法新复极差法q检验法。一般而言,一个试验资料究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。若否定正确的H0是事关重大或后果严重的,或对试验要求严格时,用q检验法较为妥当;若接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法;生物试验中由于试验误差较大,常采用新复极差法;为了简便有时可采用LSD法。 6、为什么说两因素交叉分组单独观测值的试验设计是不完善的试验设计?在多因素
36、试验时,如何选取最优水平组合?答:(1)单因素试验只能解决一个因素各水平之间的比较问题,而科学研究中往往需要同时考察多个因素,这样才能作出更加符合客观实际的科学结论,才有更大的应用价值。两因素试验资料的方差分析就是对试验指标同时受到两个试验因素作用的试验资料的方差分析。两因素交叉分组单独观测值的试验设计只适用于两个因素间无交互作用的情况;若两因素间有交互作用,则每个水平组合只设一个试验单位的试验设计是不正确的或不完善的。 (2)以两因素为例说明在多因素试验时选取最优水平组合的原则:若A、B因素交互作用不显著,则可从A、B因素主效应检验中分别选出A、B因素的最优水平相组合,得到最优水平组合;若A
37、、B因素交互作用显著,则应进行水平组合平均数间的多重比较,以选出最优水平组合,同时可进行简单效应的检验。 7、两因素系统分组资料的方差分析与交叉分组资料的方差分析有何区别?答:(1)两因素交叉分组:设试验考察因素A、B两个因素,A因素分a个水平,B因素分b个水平,A因素每个水平与B因素每个水平都要碰到,两者交叉搭配形成ab个水平组合即处理,试验因素A、B在试验中处于平等地位,试验单位分成ab个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。 (2)两因素系统分组:在安排两因素试验方案时,将A因素分为a个水平,在A因素每个水平Ai下又将B因素分成b个水平,这样得到两因素水平组合的方式
38、称为系统分组。在系统分组中,首先划分水平的因素叫一级因素,其次划分水平的因素叫二级因素,类此还有三级因素等;在系统分组中,次级因素的各水平套在一级因素的每个水平下,它们之间是从属关系而不是平等关系,分析侧重于一级因素 第七章 次数资料分析卡方检验 一、名词解释1、c2的连续性矫正:由c2值计算公式计算的c2 只是近似地服从连续型随机变量c2 分布,在对次数资料进行c2 检验利用连续型随机变量c2 分布计算概率时, 常常偏低,特别是当自由度为1时偏差较大,此时需要将c2 值矫正为较小的c2 C值,称为c2 的连续性矫正。2、适合性检验:判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说
39、的假设检验称为适合性检验。3、c2 检验的再分割法:当c2 检验为差异显著或差异极显著时,有必要进一步检验确定哪样表现型的实际观察次数与理论次数不符合,此时采用 c2检验的再分割法;将一张列联表的总c2 统计量,分割为数目等于该表总自由度的多个分量,每个分量的c2 值对应于由原始数据所产生的一特殊列联表,且每个分量独立于其他分量,这样各分量的c2 值之和等于总c2 值。4、独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验称为独立性检验。 二、简答题1、c2 检验与t检验、F检验在应用上有什么区别?答:t检验、F检验是计量资料的统计分析方法,c2 是对次数资料和等级资料进行统计分
40、析的方法。 2、适合性检验和独立性检验有何区别?答:(1)研究目的不同。 (2)独立性检验的次数资料是按两因子属性类别进行归组,而适合性检验只按某一因子的属性类别将次数资料归组。 (3)适合性检验按已知的属性分类理论或学说计算理论次数,独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。 (4)在适合性检验中确定自由度时df=k-1(k为属性类别数),独立性检验中确定自由度是df=(r-1)(c-1),其中r为横行属性类别数,c为直列属性类别数。 3、什么情况下c2 检验需作矫正?如何矫正?什么情况下先将各组合并后再作 检验?答:(1)由c2 值
41、计算公式计算的 只是近似地服从连续型随机变量c2 分布,在对次数资料进行c2 检验利用连续型随机变量c2 分布计算概率时,c2 常常偏低,特别是当自由度为1时偏差较大,此时需要将c2 值矫正。 (2)用矫正公式将c2 矫正为较小的c2 C,矫正公式为 c2C=(A-T-0.5)2/T (3)主要是在用适合性检验来判断实际观测得来的资料是否服从某种理论分布(正态分布、二项分布、泊松分布)时,当组段内理论次数小于5时,必须与相邻组段进行合并,直至合并的理论次数大于5时为止。 4、在什么情况下需应用 c2检验的再分割法?如何对总c2 值进行分割?答:当 c2检验为差异显著或差异极显著时,有必要进一步
42、检验确定哪样表现型的实际观察次数与理论次数不符合,此时采用c2 检验的再分割法。 再分割的方法:将一张列联表的总c2 统计量,分割为数目等于该表总自由度的多个分量,每个分量的c2 值对应于由原始数据所产生的一特殊列联表,且每个分量独立于其他分量,这样各分量的c2 值之和等于总c2 值。 第八章 直线回归与相关 一、名词解释1、相关变量:变量间的关系不存在完全的确定性关系,但都存在十分密切的关系,统计中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。2、回归分析:相关变量间为因果关系,即一个变量的变化受另一或几个变量的影响,研究呈因果关系的相关变量间的关系称回归分析。3、一元回
43、归分析:回归分析中表示原因的变量称为自变量,表示结果的变量称为依变量,一个自变量与一个依变量的回归分析称为一元回归分析。4、多元回归分析:回归分析中表示原因的变量称为自变量,表示结果的变量称为依变量,多个自变量与一个依变量间回归分析称为多元回归分析。5、相关分析:研究呈平行关系的相关变量之间的关系称为相关分析。6、简单相关分析(直线相关分析):对两个变量间的直线关系进行相关分析称为简单相关分析。7、复相关分析:对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析。8、偏相关分析:研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。9、样本回归系数:建立直线回归
44、方程 =a + bx,其中b叫样本回归系数,表示x改变一个单位y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度。10、样本回归截距:建立直线回归方程 =a + bx,其中a叫做样本回归截距,是回归直线与y轴交点的纵坐标。11、离回归标准误:根据使偏差平方和(y - )2最小建立直线回归方程,偏差平方和(y - )2的大小表示了实测点与回归直线偏离的程度,又称为离回归平方和,离回归平方和的平方根叫离回归标准误。12、决定系数:比值( -y)2/(y - y)2叫做x对y的决定系数,记做r2,决定系数的大小表示了回归方程估测可靠程度的高低,即表示了回归直线拟合度的
45、高低。13、相关系数:决定系数r2的平方根称为x与y的相关系数,记为r,表示了y与x的直线相关的程度与性质。 二、简答题1、回归截距、回归系数与回归估计值 的统计意义是什么?答:建立直线回归方程 =a + bx,其中a叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时 =a;b叫样本回归系数,表示x改变一个单位y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度;回归估计值 ,是当x在其研究范围内取某一个值时,y值平均数取+x估计值。 2、决定系数、相关系数的意义是什么?如何计算?答:(1)决定系数的大小表示了回归方程估测可靠程度的高低,即表示了回归直线拟
46、合度的高低,记作r2,r2 =( -y)2/(y - y)2。 (2)相关系数表示了y与x的直线相关的程度与性质,记为r,r的计算方法是决定系数r2的平方根。 3、直线相关系数与回归系数的关系如何?直线相关系数与配合回归直线有何关系?答:(1)直线相关系数与回归系数的关系可以表示为b=r(sy/sx)或r=b(sx/sy)。 (2)直线相关分析不区分自变量与依变量,侧重于揭示它们之间的联系程度和性质,即计算出相关系数;进行显著性检验时,相关系数显著则回归系数也显著,相关系数不显著则回归系数必然不显著。利用查表法对相关系数进行检验十分简便,在实际进行直线回归分析时,可用相关系数显著性检验代替直线回归关系显著性检验;即可先计算出相关系数r并对其进行显著性检验,若检验结果r不显著,则不用再建立直线回归方程;若r显著,在计算回归系数b、回归截距a,建立直线回归方程,此时所建立的直线回归方程代表的直线关系是真实的,可用来进行预测和控制。 第九章 多元线性回归与多项式回归* 一、名词解释:多元回归分析、多元线性回归分析、偏回归系数、复相关系数、最优多元线性回归方程、标准偏回归系数(通径系数) 二、简答题1、如何建立多元线性回归方程?偏回归系数有何意义?2、多元线