1、第五章t检验(样本平均数的显著性检验)统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检 验和参数估计二个内容。第一节:假设检验概述1、显著性检验定义:假设检验(显著性检验):先对总体提出假设(建立二事件),再在原假设(事件)成立条件下,据样本统计量求其概率,判断假设是否成立过程,包 括t检验、F检验和/检验等。因为P(Ho)+P(Ha)=12、显著性检验目的、对象通过样本研究其所代表的总体。例如,设长 白猪经产母猪产仔数的总体平均数为,大白 猪经产母猪产仔数的总体平均数为,试验研 究的目的,就是要给、是否相同做出推断。由于总体平均数、未知,在进行显著性检验 时只能
2、以样本平均数、作为检验对象,更确 切地说,是以(-)作为检验对象。3、显著性检验指导思想试验观测值由两部分组成,即二 十总体平均数 反映了总体特征,表示误差。若样本含量为力,则可得到力个观测 值:,。于是样本平均数说明样本平均数并非总体平均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:X-x2=(41 4)+(弓一)(t检验指导思想)这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫试验的 处理效应;另一部分是试验误差(-)。即样本平均数的差(-)包含有试验误差 和试验的表面效应。因此,仅凭(-)就对 总体平均数、是否相同下结论是不可靠的。对
3、()进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。思考题1、试验的观察值可分为哪两部分?用公式又 如何表示?2、显著性检验对象可分为哪两部分?用公式 又如何表示?统计量一t值一概率一显著性判断 q 0.05接受Ji。,不显著。q 0.05接受Ha,显著。g0.05,不能否定H。若力0.053I力V力0”表示差异显著,H。成立的 概量在0.01 Q 0.05,否定H0.若|看上%0,表示差异极显著,H。成立概率0.01,即 Q 0.01,否定H0.t检验判断标准示意图(A)右侧检验Ho:Ui=u2(B)左侧检验Ho:Ui=pHa:Ha:Ui-
4、、X 口)例某品种鸡的平均蛋重30克,现随机抽取10枚 蛋重量如下:(单位:克)30、32、31、30、3131、31、31、30、32试分析样本所在总体均数与蛋重30克有无显 著差异。解:1、提出无效假设与备择假设Hox 0=30;乜:M羊302、计算1值经计算得:=30.90,5=0.74=0.23所以=(30.9-30)/0.23=3.91df=n-1=10-1=93、查临界值,作出统计推断因为.05(9)2.262,5.01(9)=3.25,否定:=30,接受耳:#30,表示这批蛋重与30克有极显著差异。I双侧检验与单侧检验双侧检验:利用两尾概率进行的检验叫双 侧检验单侧检验:利用一尾
5、概率进行的检验叫单 侧检验单、双侧检验的适用条件:无效假设 与备择假设.此时,备择假设中包括了 或两种可能。若检验目的不考虑谁大谁小(无方向 性)则采用双侧检验。考虑谁大谁小(有方向性)采用单侧检验。单、双侧检验的区别假检:HO:U1=U2;Ha:U1rU2(双侧检验)HO:U1=U2;Ha:UI VU2或U1U2(单侧检验)临界值:会为单侧检验的临界值。显然,单侧检验的 ta二双侧检验的包。若对同一资料进行双侧检验也进行单侧检验,所得的结论不一定相同。双侧检验显著,单侧检验一定显著;但单侧 检验显著,双侧检验未必显著。例按规定肉鸡平均体重之3kg方可出售,现从鸡群中随机抽取16只,平均体重
6、为2.8公斤,标准差为0.2公斤,问该批 鸡可否出售。解:1、提出无效假设与备择假设H。曲 3,32、计算1值经计算得:二2.8,S=0.2=0.05所以=(3-218)/0.05=4df=n-1=16-1=153、查临界值,作出统计推断因为”.05*2(15)=753,01*2(15)=2.49 9 否定Hox=3,接受乜:3,表示这批鸡还不能出售。“差异显著,指结论有95%把握,但同时有5%下 错结论风险。“差异极显著”指结论有99%把握,但同时有1%下错结论风险。“差异不显著”也不能理解为试验结果间没有 差异,因为一是本质上有差异,但被试验误差 所掩盖;二是可能确无本质上差异。结论不能绝
7、对化。统计推断的结论不是绝 对正确的,因为否定H。时可能犯I型错误,接受H。时可能犯n型错误。复习题1、对同一资料作统计分析,以下哪个显著水平犯I型误差概率最大 A.0.02 B.0.01 C.0.10 D.0.052、在自由度等于下列哪种情况下t分布基本与标准正态分布相同A.30 C.100,D.s3、若随机事件概率很小,如小于、则称为小概率事件。4、假设检验中否定H0可能犯错误,但犯这类错误概率不超过_5、若检验二种药物对仔猪促生长效果有无显著效果,则选用t检验时至 立假设为H。:_;Ha:_o第二节样本均数与总体均数显著性检验1、t检验适用条件;2、t检验类型;3、样本均数与总体均数差异
8、显著性检验;4、作用(应用)-一抽样检查;统计质量管理;推断结论。,t检验适用条件;计量资料或次数资料(df=8);处理数(组数)115 113、112、114、117 115 116、114 113(天),试分析样本均 数与总体平均数114天有无显著差异?根据题意,本例应进行双侧检验。1、提出无效假设与备择假设92、计算t值经计算得:=114.5,S=1.581所以=1.003、查临界值,作出统计推断由二9,查值表得柩(9)=2.262,因为t0.05,则接受品,表明样本平均数与总体平均数差异不显著,即该样本取自母猪 怀孕期为114天的总体。【例5.2】按规定某种饲料中维生素C不得少于 24
9、6g/T,现从产品中随机抽测12个样品,测得维生素C 含量如下:255、260、262、248、244、245、250、238、246、248、258 270g/T,问此产品是否符合 规定要求?(统计量t值-一概率一判断)按题意,此例应采用单侧检验。1、提出无效假设与备择假设246,2462、计算1值经计算得:=114.5,51.581所以=2.2813、查临界值,作出统计推断因为单侧 二双侧=1.796,2.281 单侧(,QV0.05,否定H。::246,接受Ha:246,可认为该批饲料维生素C含量符合规定。练习某品种鸡的平均蛋重30克,现随机抽取10枚 蛋重量如下:(单位:克)30、32
10、、31、30、3131、31、31、30、32试分析该样本所属总体均值是否有显著增加。(平均数-一t值一-概率-一显著性)第四节 两个样本平均数的差异 显著性检验检验两样本平均数差异显著性是为了解两样本 所属总体的平均数是否相同,可分为两种情况:非配对设计和配对设计。一、非配对设计(成组设计)两样本平均数 差异显著性检;非配对设计将试验动物完全随机地分成两组,每组随机施加一个处理。二个样本相互独立,其 含量不一定相等。表5-2非配对设计资料的一般形式非配对设计两样本平均数差异显著性检验的 基本步骤如下:(-)提出无效假设与备择假设(二)计算值 计算公式为:(5-3)合并自由度苴中/、合并方差注
11、:合并方差=55m=6$1+SS2)/(df 1+df2)(三)根据必(力广1)+(%4),查临界值:之心 0.01将计算所得,值的绝对值与其比较,作出统计推【例5.3】某种猪场分别测定长白后备种猪和蓝塘后 备种猪90kg时的背膘厚度,测定结果如表 5-3所示。试分析该两品种后备种猪90kg时 的背膘厚度有无显著差异?表5-3长白与蓝塘后备种猪背膘厚度腓骸11P1.2。、I。、1,28、1,35、你、LR 1,25、1,3。、坦 1.从 1 晚 1#圈1,砾1,78、1弧1脉丽IK 1,6晨1,以1触1、提出无效假设与备择假设2、计算值此例力广12、nj=ll9经计算得:=1.202、=0.0
12、998、分别为两样本离均差平方和。=0.0465=(12-1)+(11-1)=213、查临界值,作出统计推断当c21时,查临界值得:t001 21)=2.831,11 2.831,Q to.oi(9)Q 0.01,表明家兔注射该批注射液前后体温差异极显著,注射该批注射液可使体温极显著升高。练习 配对与非配对设计有何主要区别?配对与非配对设计各有何主要特点?复习题 非配对与配对设计有何主要区别?什么条件下适用t检验?非配对与配对设计求t值有何差异?生产实际中t检验有何主要作用?计算题随机抽测10头大白与长白经产母猪的产仔数如下:(单位:头)长白:11、11、9、12、10、13、13、8、10、
13、13大白:8、11、12、10、9、8、8、9、10、7 试求两样本的合并标准误值。正常人的脉搏平均为72次/分,现测得9名慢 性铅中毒患者脉搏为54、67、68、78、70、66、67、70、65次/分,试分析慢性铅中毒 患者脉搏与正常人有无显著差异为了比较国产与进口的超声波膘厚测定仪,对14头活体肥猪进行了测定(单位:mm),资料如下,试求其t值及概率?进 32 40 27 37 32 35 28 43 40 41 41 35 49 34 口国 43 44 30 34 30 31 26 26 42 40 42 43 37 43第五节 百分数资料差异显著性检验百分数资料如成活率、死亡率、孵化
14、率、感 染率、阳性率等服从二项分布。若自由度无限 大时(di)可用1检验法;因t值与标准正 态分布U值相等,故又称U检验。绝对数:相对数:两个绝对数比值,如变异系数,成 活率等。-、样本百分数与总体百分数差异显著性检验1、检验目的:样本百分数 是否来自总体百 分数为R的二项总体。若卬或力30时,应对u进行连续性矫正。检验的基本步骤是:(-)提出无效假设与备择假设(二)计算谴或值的计算公式为:67P 或 q03O)P48页当试验结果以事件/发生的频率左/力表示时(4-21)也称为总体百分数标准误,当/未知时,常以样本百分数 来估计。此时(4-21)式改写为:称为样本百分数标准误。(三)将计算所得
15、的减小的绝对值与196、2.58(双侧检验)比较,作出统计推断.单侧检验的临界值是:1.64;2.24若(或)0.05,表明样本百分数与总体百分数差异不显著;若 2.58,0.0K Q 36,不需作连 续性矫正。1、提出无效假设与备择假设2、计算谴因为于是3、作出统计推断 因为1.96VV2.58,0.01p 1.6、1.2(kg),求该品种猪仔猪初生重总体平均 数的置信区间。经计算得9由得,95%置信半径为95%置信下限为,查,值表,因此95%置信上限为所以该品种仔猪初生重总体平均数P的95%置信区间为又因为99%置信半径为99%置信下限为99%置信上限为故该品种仔猪初生重总体平均数口的99
16、%置信区间为练习(选择题):已知9头猪的血红蛋白含量平均数为11.56,标 准差为1.35,则其总体均数u的95%置信区间 为(5.05=2.306)A.10.52-12.60,B.8.45-14.67,C.9.68-10.26,D.9.67-12.65 o:、二项总体百分数P的置信区间当 时,总体P的95%、99%置信区间为:(5-16)(5-17)其中,为样本百分数,为样本百分数标准误,的计算公式为:(5-18)【例5.10】调查某地1500头奶牛,患结核病 的有150头,求该地区奶牛结核病患病率的95%、99%置信区间。由于1000,1%,采用正态分布近似法求置信区间。因为所以该地区奶牛
17、结核病患病率P的95%、99%置信区间为:即区间估计与显著性检验一致性若检验对象(-)小于允许误差时差异不显著;相反显著或极显著。例按规定肉鸡平均体重之3kg方可出售,现从鸡群中随机抽取16只,样本的标 准差为0.2公斤,问(1)允许误差是多 少可以出售;(2)可出售的样本平均 数最小应取何值?解:置信半径(R):to.O50f)*Sx 或 Goi(df)*Sx 它也等于允许误差(-|i)或最小显著差数(LSD)。LSD=2.131*0.2/4=0.10655 3-0.10655=2.9 kg即平均体重最小达2.9kg方可出售。练习1、抽测10头母猪的怀孕期分别为116、115、113 112
18、 114 117 115 116、114、113(天),试求其总体均数的置信区间。2、简述P(尸0.95与的区别。P(口一1.96。口+1.96。)=0.953、某种蛋孵化率为90%,现100枚种蛋孵化 雏鸡80只,试分析这批种蛋孵化率与90%有 无显著性差异,并求其率95%的置信区间。2、解:(1)假设:Ho:P=0.9;/:P?0.9(2)求Uc值:SP=0.03 P=80/100=0.8Uc=(Po-P)-O.5/N)/Sp=3.17(3)判断:因U值大于3.17,故其差异极显著。(4)SP=0.04 R=1.96*0.04=0.080.8-0.08P 0.8+0.080.72 P 0.88作业 P77 页第10题和第12题.