5总体均数估计假设检验1.pptx

资源描述

<p>总体一、总体均数的估均数的估计二、假设二、假设检验检验三、正态三、正态性、方差性、方差齐性检验齐性检验四、四、t t检检验验五、假设五、假设检验注意检验注意问题问题六、六、P P 时检验效时检验效能能1 1-的的估算估算七、区间七、区间与假设检与假设检验的关系验的关系2024/8/22周四3第一第一节总体均数的估体均数的估计2024/8/22周四42024/8/22周四5一、标准误、样本均数分布一、标准误、样本均数分布62024/8/22周四总体样本(n1=10)样本(n2=10)样本(n3=10)样本(n100=10).100个图1.1999年某市18岁男生身高N(167.7，5.32)的抽样示意72024/8/22周四均数的抽样误差：由个体变异引起，由抽样产生的样本均数与总体均数之间以及样本均数与样本均数之间的差异。美国科学院院士美国科学院院士-C.R.劳劳82024/8/22周四C.R.劳指出“如果错误是不可避免的，则在一定的规律下做出抉择，最好知道犯错误的概率，是我们减少盲目性，使错误决策产生损失最小”。摘自统计与真理怎样运用偶然性（美）C.R.劳/著C.R.劳美国科学院院士，当今仍健在的国际上最伟大的统计学家之一92024/8/22周四102024/8/22周四样本均数的分布特征：围绕着总体均数（167.7cm），中间多，两边少，左右基本对称，也服从正态分布1631641651661671681691701711721730510152025平均身高112024/8/22周四122024/8/22周四，各样本均数各样本均数未必等于总体均数；未必等于总体均数；各样本均数间存在差异；各样本均数间存在差异；样样本本均均数数的的分分布布为为中中间间多多，两两边边少少，左左右右基基本本对称。对称。样样本本均均数数的的变变异异范范围围较较之之原原变变量量的的变变异异范范围围大大大缩小大缩小。样本均数的抽本均数的抽样分布具有如下分布具有如下特点：特点：132024/8/22周四142024/8/22周四例：例：2000年某研究者随机年某研究者随机调查某地健康成年男子某地健康成年男子27人，得到血人，得到血红蛋白量的均数蛋白量的均数为125g/L，标准差准差为15g/L。试估估计该样本均数的抽本均数的抽样误差。差。所以所以该样本均数的抽本均数的抽样误差差为2.89g/L。样本均数分布的常用性质样本均数分布的常用性质152024/8/22周四162024/8/22周四二、二、t t分布分布1 1、若某一随机变量、若某一随机变量X X服从总体均数为服从总体均数为，总体标准差为，总体标准差为的正态分布的正态分布N(N(,2 2),),则则可可通过通过u u变换变换()()将一般正态分布转化为将一般正态分布转化为标准正态分布标准正态分布N(0,N(0,1 12 2),),即即u u分布。分布。172024/8/22周四2 2、若某一随机变量服、若某一随机变量服从总体均数为从总体均数为，总体标准差为，总体标准差为的正态分布的正态分布N(N(,2 2),),则则可通过可通过u u变换将（变换将（）一般正态分布）一般正态分布转化为标准正态分布转化为标准正态分布N(0,N(0,1 12 2),),即即u u分布。分布。182024/8/22周四192024/8/22周四T T分布创始人分布创始人-William Gosset-William Gossetv英国英国统计学家学家William Gosset发现t 分布与正分布与正态分布不同，曲分布不同，曲线下面下面积与抽与抽样例数有关。例数有关。v1980年他以笔名年他以笔名“student”发表了表了t 分布。分布。v使依据小使依据小样本本进行行统计推断成推断成为可能。可能。202024/8/22周四212024/8/22周四例：例：从13岁女学生身高这个正态总体中分别作样本量为3和50的随机抽样，各抽取1000份样本，并分别得到1000个样本均数及其标准误。对它们分别作(4-4)式的t转变换，并将t值绘制相应的直方图。222024/8/22周四如图5-12(a)、(b)所示。可以看出，这两个t值分布图并不完全一样，样本量为3的图(a)较之样本量为50的图(b)显得矮胖，两侧尾部稍高。232024/8/22周四vt值的分布与自由度有关（实际是是样本含量本含量n不同不同）。t分布的图形不是一条曲线，而是一簇曲线。=(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3不同自由度下的t分布图242024/8/22周四t 分布的图形有如下特征：单峰分布，以0为中心，左右对称。t分布与自由度有关。df越小，则曲线的峰部越矮，尾部越高，t值越分散；随着自由度逐渐增大，t分布逐渐逼近标准正态分布；当df趋于时，t分布就完全成为标准正态分布，故标准正态分布是t分布的特例。(3)t值越大，对应t值外侧面积（概率）就越小。t t分布的规律分布的规律252024/8/22周四统计学家将t分布曲线下的尾部面积（即概率P）与横轴t值间的关系编制了不同自由度下的t界值表（附表2）。t界值表：横标目为自由度，纵标目为概率P。t临界值：表中数字表示当和P 确定时，对应的值。单侧概率(one-tailed probability)：用t,表示双侧概率(two-tailed probability)：用t/2,表示正态分布概率呢？正态分布概率呢？两个分布尾部的界值和概率两个分布尾部的界值和概率262024/8/22周四统计中常用分布尾部面积，记为“”，对应的u值或t值，记为u/2或t/2，v界值。通过与界值逼近，对抽样结果进行概率推断。u0.05/2=1.96P（tt/2，v）=？vt 界界值表表P432：272024/8/22周四df单侧0.25双双侧0.50.10.2.0.00050.00111.0003.078.636.61920.8161.886.31.599.100.7001.372.4.578282024/8/22周四v例如例如,当当 =16=16，单侧概率，单侧概率P=0.05P=0.05时，由表中查得单侧时，由表中查得单侧t t0.05,160.05,16=1.746=1.746；而当；而当 =16=16，双侧概率，双侧概率P=0.05P=0.05时，由表中时，由表中查得双侧查得双侧 t t0.05/2,160.05/2,16=2.120=2.120。按。按t t分布的规律，理论上有分布的规律，理论上有单侧：单侧：P P（t t t t0.05,160.05,16）=0.05 =0.05 和和 P P（t t t t0.05,160.05,16）=0.05=0.05双侧：双侧：P P（t t t t0.05/2,160.05/2,16）P P（t t t t0.05/2,160.05/2,16）=0.05=0.05 t界值含义：理论上在该总体抽样，抽到t值t界值的概率P。292024/8/22周四更一般的表示方法如更一般的表示方法如图图(a)a)和和(b)(b)中阴影部分所示为：中阴影部分所示为：单侧：单侧：P P（t t t t,）=和和 P P（t t t t,）=双侧：双侧：P P（t t t t/2,/2,）P P（t t t t/2,/2,）=302024/8/22周四从从t界界值表表中亦可中亦可看出：看出：(1)在在相同自由度相同自由度时，t值越大，概率越大，概率P越小；越小；(2)而而在相同在相同t值时，双，双侧概率概率P为单侧概率概率P的两倍，即的两倍，即t0.10/2,16=t0.05,16=1.746。(3)同同样的尾部面的尾部面积，t分布的界分布的界值大于大于标准正准正态分布的界分布的界值。df趋于于，t分布界分布界值逼近正逼近正态分布界分布界值。=(标准正态分布)=15012345-1-2-3-4-5f(t)0.10.20.3 不同自由度下的t分布图三、总体均数的估计三、总体均数的估计312024/8/22周四统计推断参数估计假设检验点估计区间估计参数估计：用样本指标（统计量）去估计总体指标（参数）322024/8/22周四332024/8/22周四v置信区置信区间：区：区间估估计所所给出的范出的范围称称为该参数的参数的(1-)可信区可信区间或置信区或置信区间(confidence interval，CI)。v这个区个区间包含参数包含参数值的可信程度的可信程度为(1-)，称称为可信度或置信度或可信概率。可信度或置信度或可信概率。342024/8/22周四v 95%的可信区的可信区间的理解：的理解：v（1）所要估）所要估计的的总体参数有体参数有95%的可能在我的可能在我们所估所估计的可信区的可信区间内。内。v（2）从正）从正态总体中随机抽取体中随机抽取100个个样本，可算得本，可算得100个个样本均数和本均数和标准差，也可算得准差，也可算得100个均数的可信区个均数的可信区间，平均平均约有有95个可信区个可信区间包含了包含了总体均数体均数。v（3）但在）但在实际工作中，只能根据一次工作中，只能根据一次试验结果估果估计可可信区信区间，我，我们就就认为该区区间包含了包含了总体均数体均数。352024/8/22周四v可信可信区区间具有两个要素具有两个要素(1)准确度（准确度（accuracy），即可信区），即可信区间包含的概包含的概率的大小，一般而言概率越大越好率的大小，一般而言概率越大越好。v反映在反映在(1-)的大小，即区的大小，即区间包含包含总体参数的可能体参数的可能性性(概率概率)的大小，准确度越接近的大小，准确度越接近1 越好。越好。v例如例如;99%比比95%犯犯错误的的风险小小vv(2)精确度（精确度（precision），反映区），反映区间的的长度，区度，区间的的长度越窄，估度越窄，估计的精确度越好，反之越差。的精确度越好，反之越差。v精确度与精确度与资料的料的样本含量、本含量、标准差和准差和(1-)的大小有关，的大小有关，在在标准差不准差不变，(1-)确定的情况下，增大确定的情况下，增大样本含量是控本含量是控制置信区制置信区间的的宽度的有效度的有效办法，法，n 增大，相增大，相应的界的界值(如如s 界界值)减少，减少，标准准误也减小，可提高精确度。也减小，可提高精确度。v在在样本含量确定的情况下本含量确定的情况下.(1-)愈大，愈大，总体参数估体参数估计的的准确度愈高，但精确度愈差。准确度愈高，但精确度愈差。为兼兼顾准确度和精确度，常准确度和精确度，常用用95%置信区置信区间。362024/8/22周四372024/8/22周四v总体均数可信区体均数可信区间的的计算算v需考需考虑：v（1）总体体标准差准差是否已知，是否已知，v（2）样本含量本含量n的大小的大小v通常有两通常有两类方法：方法：v（1）t分布法分布法（2）u分布法分布法382024/8/22周四 1.1.单一总体单一总体均数未知的均数未知的可信区间可信区间392024/8/22周四例例5-3：已知某地：已知某地27名健康成年男子的血名健康成年男子的血红蛋白量蛋白量均数均数=125 g/L，标准差准差S=15 g/L。试问该市地市地健康正常成年男子血健康正常成年男子血红蛋白血清胆固醇平均含量蛋白血清胆固醇平均含量的的95%置信区置信区间和和99%置信区置信区间各是多少各是多少？解：本例n=27，=271=26，查t界值表（附表2），=0.05时，双侧 t0.05/2,26=2.056，=0.01时，t0.01/2,26=2.779；按公式计算402024/8/22周四412024/8/22周四422024/8/22周四432024/8/22周四v例例某地抽取正常成年人某地抽取正常成年人200名，名，测得其血清胆固得其血清胆固醇的均数醇的均数为3.64 mmol/L，标准差准差为1.20mmol/L，估，估计该地正常成年人血清胆固醇均数的地正常成年人血清胆固醇均数的95%可可信区信区间。插入公式插入公式442024/8/22周四故故该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的双双侧95%可信区可信区间为(3.47,3.81)mmol L。452024/8/22周四462024/8/22周四472024/8/22周四v（3）两）两总体均数之差的可信区体均数之差的可信区间：从：从相等，但相等，但不等的两个正不等的两个正态N（1，2）和和N（2，2）进行随机抽行随机抽样，则两两总体均数之差（体均数之差（1-2）是双是双侧1-的可信区的可信区间为：482024/8/22周四492024/8/22周四502024/8/22周四第一第一步步 512024/8/22周四522024/8/22周四*也可用也可用对应于双尾概率于双尾概率时),*也可用也可用对应于于双尾概率双尾概率时)表表3-2 总体均数的可信区体均数的可信区间与参考与参考值范范围的区的区别第二第二节假假设检验532024/8/22周四542024/8/22周四552024/8/22周四已知总体：一般北方儿童未知总体：东北某县儿童n=36 样本是否不同研究目的点值估计562024/8/22周四572024/8/22周四582024/8/22周四提出假设假设其中一个成立规定以H0做为论点先假设H0成立在H0成立的前提下，看实际抽到的样本是否为小概率事件是小概率事件在H0成立的前提下，出现这样的样本是不太可能的拒绝H0接受H1不是小概率事件在H0成立的前提下，出现这样的样本是可能的不拒绝H0假设检验步骤：假设检验步骤：592024/8/22周四602024/8/22周四vH1的内容直接反映了检验单双侧。若H1中只是0或 0，则此检验为单侧检验。它不仅考虑有无差异，而且还考虑差异的方向。v单双侧检验的确定，首先根据专业知识，其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果，此时应该用单侧检验。一般认为双侧检验较保守和稳妥。612024/8/22周四v(3)检验水准，过去称显著性水准，是预先规定的概率值，它确定了小概率事件的标准。在实际工作中常取=0.05。可根据不同研究目的给予不同设置。v2、假设检验的方法应针对不同研究目的、设计及资料的类型选定。v假设检验的名称常用所选定的检验统计量来称之。计算统计量是指建立在无效假设H0基础上，用于确定P 值，来抉择是否拒绝H0而选定的样本函数。v对参数进行检验的检验统计量要求满足以P下条件:在H0 成立的条件下，它的分布函数是已知的:它必须包含要检验的总体参数:对于给定的样本数据，能计算出该检验统计量的数值。622024/8/22周四632024/8/22周四 P的的含含义是指从H0规定的总体随机抽样，抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。例例3-5的的P值可可用用图3-5说明明，P为在在=0=140g/L的的前前提提条条件件下下随随机机抽抽样，其其 t 小小于于及及等等于于-2.138和和大大于于及及等等于于2.138的概率。的概率。3.确定确定P值值642024/8/22周四652024/8/22周四662024/8/22周四若若，是否也能下，是否也能下“无差别无差别”或或“相等相等”的结论？的结论？v 与与P 都可用都可用检验统计量分布的尾部面量分布的尾部面积大小表大小表示，所不同的是示，所不同的是:v 是在是在统计推断推断时，预先先设定的一个小概率定的一个小概率值，是当是当H0为真真时，允，允许错误地拒地拒绝H0的概率，是的概率，是检验水准。水准。672024/8/22周四而而P 值是由是由实际样本决定的，是指从由本决定的，是指从由H0所所规定定的的总体中随机抽体中随机抽样，获得大于及等于得大于及等于现有有样本本检验统计量量值的概率。的概率。682024/8/22周四假假设检验示意示意图692024/8/22周四</p>

展开阅读全文