收藏 分销(赏)

第3章-数值变量资料的统计推断.ppt

上传人:精*** 文档编号:12524089 上传时间:2025-10-24 格式:PPT 页数:39 大小:502.50KB 下载积分:12 金币
下载 相关 举报
第3章-数值变量资料的统计推断.ppt_第1页
第1页 / 共39页
第3章-数值变量资料的统计推断.ppt_第2页
第2页 / 共39页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,学习目标,说出抽样误差的概念,记住标准误计算公式并能说出公式的含义,描述,t,分布的特征及其应用,说出参数估计的含义及方法,描述均数假设检验,t,检验和,u,检验的方法,第一节,均数的抽样误差与标准误,抽样研究,用统计量(如样本均数,样本率P)来推断总体参数(如总体均数,总体率)的方法称为抽样研究。,统计推断,通过样本信息推断总体特征,此过程称为统计推断,。,抽样误差,在抽样过程中由于个体差异造成的样本统计量与总体参数的差异,或同一总体的相同统计量之间的差别称为抽样误差,。,实例:如某年某市120名12岁健康男孩,已求得 均数为143.07,cm,,标准差为5.70,cm,,按公式计算,则标准误为,:,二、标准误的应用,1.表示抽样误差的大小;,2.进行总体均数的区间估计;,3.进行均数的假设检验等。,第二节,分,布,英国统计学家,W.S Goset(,哥塞特),于,1908,年以笔名“,Student”,提出了分布,发现了 的分布规律,即,分布。,哥塞特(,W.S.Gosset,,18761937),1908年,哥塞特首次以,Student,为笔名,在生物计量学杂志上发表了“平均数的概率误差”。由于这篇文章提供了“t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。,一、t 分布的概念,正态变量X采用u(X)/变换,则一般的正态分布,N,(,)即变换为标准正态分布,N,(0,1)。,又因从正态总体抽取的样本均数服从正态分布,N,(,),同样可作正态变量的u变换,即,实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是,u,变换而是,t,变换了,即下式:,二、t分布曲线的特征,t,分布曲线是单峰分布,以0为中心,左右两侧对称,,曲线的中间比标准正态曲线(u分布曲线)低,两侧翘得比标准正态曲线略高。,t,分布曲线随自由度而变化,当样本含量越小(严格地说是自由度=n-1越小),t分布与u分布差别越大;当逐渐增大时,,t,分布逐渐逼近于u分布,当=时,t分布就完全成正态分布。,t分布曲线是一簇曲线,而不是一条曲线。,t分布下面积分布规律:查t分布表。,t 分布示意图,我们常把自由度为的,t,分布曲线下双侧尾部合计面积或单侧尾部面积为指定值时,则横轴上相应的,t,界值记为,t,。,如当=20,=0.05时,记为,t,0.05,20;当=22,=0.01时,记为,t,0.01,22。对于,t,值,可根据和值,查附表2,,t,界值表。,t,分布曲线下双侧或单侧尾部合计面积,统计推断,参数估计,假设检验,点估计,区间估计,第三节,总体均数的估计,参数估计,:用样本指标(统计量)估计总体指标(参数)称为,参数估计,。,估计总体均数的方法有两种,即:,点值估计,区间估计,。,一、点值估计,点值估计:,是直接用样本均数作为总体均数的估计值。,此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度。,二、区间估计,区间估计,是按一定的概率(,1-,),估计包含总体均数可能的范围,该范围亦称总体均数的可信区间缩写为,CI,)。,1-,称为,可信度,,常取,1-,为,0.95,和,0.99,,即总体均数的,95%,可信区间和,99%,可信区间。,1-,(,如,95,)可信区间的,含义是:,总体均数被包含在该区间内的可能性是,1-,,,即(,95,),没有被包含的可能性为,,,即(,5,)。,总体均数的可信区间的计算,1.未知且,n,较小(,n,100)按,t,分布的原理,2.已知,或,n,较大(,n,100)按,u,分布的原理,总体均数的可信区间的计算步骤,1.计算自由度V=n-1,2.计算标准误,3.查表,4.计算,95%的可信区间,为123.72.064(查表)2.38(11.9/,5,),,即(118.79,128.61)。故该地1岁婴儿血红蛋白平均值95的可信区间为118.7128.61(,g/L,)。,例3.1,为了了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7,g,/,L,,标准差为11.9,g,/,L,。试求该地1岁婴儿的血红蛋白平均值95的可信区间。,例3.2,上述某市120名12岁健康男孩身高均数为143.07,cm,,标准误为0.52,cm,,试估计该市12岁康男孩身高均数95%和99%的可信区间。,95%的可信区间为,143.071.960.52,即(142.05,144.09)。,99%的可信区间为,143.072.580.52,即(141.73,144.41)。,注 意 点,标准误愈小,,估计总体均数可信区间的范围也愈窄,说明样本均数与总体均数愈接近,对总体均数的估计也愈精确;,反之,标准误愈大,,估计总体均数可信区间的范围也愈宽,说明样本均数距总体均数愈远,对总体均数的估计也愈差。,标准差和标准误的区别,第四节,均数的假设检验,案例,根据大量调查,已知健康成年男子脉搏的均数为72次/分钟据,某医生在一山区随机抽查了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次分钟,能否认为该山区健康成年男子的脉搏数与一般健康成年男子的脉搏数不同?,一、,假设检验的意义和一般步骤,本例两个均数不等有两种可能性:,由于抽样误差所致,受山区某些因素的影响,假设检验一般步骤,第一步:建立假设,确定检验水准,H,0,:无效假设(null hypothesis),H,1,:备择假设(alternative hypothesis),检验水准亦称显著性水准,。它是判别差异有无统计学意义的概率水准,其大小应根据分析的要求确定。通常取,=0.05,。,第二步:,选定检验方法和计算统计量,数值变量资料:两组大样本均数的比较,选择,u,检验,两组小样本均数的比较,选择,t,检验;,分类变量资料:两个率的比较,可选择,u,检验也可选择,2,检验,。,第三步:,确定概率,P,值,P,值是指在,H,0,所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。当求得统计量后,一般可根据有关统计用表查得,P,值。例如,t,检验中,,t,t,,,则,P,;,t,t,,则,P,。,第四步:作出推断结论,当,P,时,结论为按所取检验水准拒绝,H,0,,接受,H,1,,即差异有统计学意义;,当,P,时,结论为按所取检验水准不拒绝,H,0,,即差异无统计学意义。,二、均数的,t,检验,样本均数与总体均数的比较,配对数值变量资料的比较,两独立样本均数的比较,(一)样本均数与总体均数的比较,已知的总体均数一般为理论值、标准值或经大量观察所得的稳定值等。,公式:,(二)配对数值变量资料的比较,配成对子的两个个体随机分配两种不同的处理,同一批对象治疗前后某些生理、生化指标的比较,同一种样品(如同一份血样分为两部分),采用两种不同的方法进行测定,来比较两种方法有无不同,公式:,(三)两独立样本均数的比较,也称成组比较,适用于比较按完全随机设计而得到的两组资料。,公式:,式中 和 为两样本含量,,为两样本合并的方差,计算公式为,:,如已计算出,S,1,和,S,2,时,可用公式:,三、两个大样本均数比较的,u,检验,当两个样本含量较大时,其均数的比较可用,u,检验,公式:,四、假设检验的注意事项,资料要来自严密的抽样研究设计,选用假设检验的方法应符合其应用条件,正确理解差别有无统计学意义的涵义,结论不能绝对化,要根据资料的性质事先确定采用双侧检验或单侧检验,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服