收藏 分销(赏)

高等教育统计.pptx

上传人:w****g 文档编号:8549152 上传时间:2025-02-17 格式:PPTX 页数:55 大小:1MB 下载积分:14 金币
下载 相关 举报
高等教育统计.pptx_第1页
第1页 / 共55页
高等教育统计.pptx_第2页
第2页 / 共55页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,1,、掌握:(,1,)正态分布的概念及其应用;,(,2,)正常值范围的估计方法;,(,3,)误差的类型、抽样误差的概念、抽样的方法。,2,、熟悉:抽样误差的规律及减小抽样误差的方法和意义。,教学目的与要求,频率和概率概念复习,关于频率和概率:,频率:对于随机事件,A,,在相同的条件下进行了,n,次实验,,事件,A,发生的次数为,比值,/n,为频率,记为,fn(A),概率,:,描述某随机事件发生的可能性大小,记为,P(A),当,时,频率fn(A),概率 P(A),频率和概率概念复习,实验者,n,m,正,f,n,(正),德,.,摩根,2048,1061,0.5181,蒲丰,4040,2048,0.5069,K.,皮尔逊,12000,6019,0.5016,K.,皮尔逊,24000,12012,0.5005,频率具有波动性,但当,n,越来越大时,频率趋于某个稳定的常数,(,概率,),,所以只要观察单位数充分多,可以将频率作为概率的估计值。,扔“硬币”实验,一、正态分布,正态分布,(,normal distribution,)也叫,高斯,分布(,Gaussian distribution,),一种最常见、最重要的连续型对称分布。,(正态分布是对称分布,但对称分布不一定是正态分布。),2.,实际频数分布:中间频数多,两端越来,越少,且左右大致对称,理论频数分布:正态分布曲线。,每个直方条的面积,=,纵坐标,组距,=,(频率,/,组距),组距,=,频率,各个直方条的面积之和各个组段的频率之和,观察例数逐渐增多,组段不断分细,概率密度曲线,当,n,,直方条面积,(,频率,),各自的概率,然后组距时,直方条的宽度,直方条垂直线,各个直方条顶点间的连线构成一条光滑的曲线,即:概率密度曲线,而曲线下,(,直方条,),的总面积始终为,红细胞数在区间,a,b,的概率对应曲线段下的面积,(,直方条面积,),。,probability density curve,正态曲线(,normal curve,):高峰位于中央,两侧逐渐下降并完全对称,曲线两段永远不与横轴相交的钟型曲线。,正态曲线的函数表达式称为正态分布概率密度函数:,则称,X,服从正态分布,记作,X,N,(,2,),其中,,为分布的均数,,为分布的标准差。,正态分布特征一:,正态分布有两个参数,(,parameter,),,即位 置参数,(,均数,),和变异度参数,(,标准差,),。,正态分布由参数,和,确定。,是位置参数,当,不变时,,越大,则曲线沿横轴越向右移动;反之,,越小,曲线沿横轴越向左移动。,是变异参数,当,不变时,,越大,表示数据越分散,曲线越平坦;,越小,表示数据越集中,曲线越陡峭。,、,M,0,、,M,e,0,.1,.2,.3,.4,f,(,x,),正态分布特征二:,高峰在均数处;均数两侧完全对称;正态分布有两个拐点。,正态分布特征三:正态分布曲线下面积分布规律,正态曲线下的面积规律,二、标准正态分布,标准正态分布,(,standard normal distribution,),是均数为,0,,标准差为,1,的正态分布。,记为,N(0,1),。,标准正态分布是一条曲线。,概率密度函数:,三、正态分布的应用,1,医学参考值范围的估计;,2,进行误差分析和检测的质量控制;,3,将偏态分布的资料转换成正态分布后进行处理;,4,正态分布是今后将要学习各种统计推断方法的理论基础。,建立参考值范围,(,reference value range,),参考值范围又称,正常值范围,(,normal range,),什么是参考值范围:,是绝大多数正常人的某观察指标所在的范围,绝大多数:,95%,,,99%,等等。,为什么会波动?,同一指标的数据因人而异;同一个体的数据随环境、时间的改变而改变,确定参考值范围的意义:,用于判断正常与异常。既然同属正常,就不能以甲的数据为标准,认为已异常,亦不能以甲此时的数据为标准,认为彼时的异常。,“正常人”的定义:,排除了影响所研究的指标的疾病和有关因素的同质的人群。,四、医学参考值范围的制定方法,(,1,)选择足够数量的正常人作为参照样本;,至少应在,120,例以上,(,2,)对选定的正常人进行准确的测定;,(,3,)决定取单侧范围还是双侧范围值;,单双侧:,根据指标的实际用途,有的指标有上下界值(双侧)。某些指标只需确定上限(单);某些指标只需确定下限(单)。,(,4,)选择适当的百分范围;,习惯上是确定包含,95,的参照总体的正常值范围。,2.5%,2.5%,95%,-1.96,+1.96,正态分布法:适于正态或近似正态分布的资料,(,5,)估计参考值范围的界限。,P,2.5,P,97.5,百分位数法:,适于任何分布的资料,95%,百分范围,(,%,),单侧,双侧,下限,上限,下限,上限,95,P,5,P,95,P,2.5,P,97.5,99,P,1,P,99,P,0.5,P,99.5,确定医学参考值范围,例,估计某地健康成年女子的血红蛋白的,95%,医学参考值范围,具体步骤如下:,1.,根据研究背景确定研究对象的入选标准和排除标准。这类研究一般要求参加体检并且要求除研究指标血红蛋白指标外,其他指标均正常的对象。,2.,根据研究背景,确定血红蛋白过高或过低均属于不正常(双侧范围)。,确定医学参考值范围,3.,血红蛋白检测的容许误差和研究背景容许误差的范围,确定受检者的样本量。,4.,由于在实际研究中,总体均数和方差均不知道的,需要用样本资料进行估计,所以一般至少在,100,人以上,这样参数估计的平均误差是资料的离散程度的,/10,以下。,确定医学参考值范围,5.,如果受检指标血红蛋白近似服从正态分布,则可以用 确定其,95%,参考值范围;,6.,如果受检指标血红蛋白呈偏态分布,则可以用百分位数,P2.5,P97.5,确定,95%,参考值范围,但样本量要充分大。,7.,样本量充分大是相对于指标的变异程度,指标变异大,要求样本量大;指标变异程度小,要求样本量可以相对小一些。,确定医学参考值范围,本例:成年正常女子,200,人的血清总蛋白含量(近似正态分布),得到均数,=73.5,克,/,升,标准差,S=3.9,克,/,升。,由于样本量很大,可以用样本均数和标准差近似总体均数和标准差,按下式计算,:,确定医学参考值范围,下限:,上限:,即:该地成年正常女子的,95%,参考值范围为,65.9,81.1(g/L),总结,正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;,正态分布是一簇分布,由两个参数决定:均数和标准差;,正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应,(,以标准正态离差为单位,),。,制定医学参考值范围的方法主要有正态分布法和百分位数法。,第四章 抽样误差与假设检验,第一节抽样研究与抽样误差,一、抽样研究,(一)定义:从总体中随机抽取样本进行研究以推论总体的方法。,(二)抽样的方法,、单纯随机抽样:不考虑总体的构成情况如何,将总体全部打散进行抽样。,优点:操作简单,均数、率及相应的标准误计算简单;,缺点:总体较大时,难以一一编号。,2,、机械抽样:又称系统抽样、等距抽样,随机选取第一个个体后,按一定顺序机械的每隔若干个单位抽取一个单位的方法。,优点:易于理解、简便易行;,缺点:总体有周期或增减趋势时,易产生偏性。,3,、分层抽样:又称分类抽样,将总体按某项特征分成若干类型或部分,称为层,再在每层内进行随机抽样。,优点:样本代表性好,抽样误差减少。,4,、整群抽样:被抽取的不是一个个个体,而是由个体所组成的集团,成为群,群内个体全部调查。,优点:便于组织、节省经费;,缺点:抽样误差大于单纯随机抽样。,二、误差,在严格遵守随机化抽样的原则时,抽到的个体之间有差异,计数资料:,阳性率:多抽到一些阳性个体,则样本阳性率,总体阳性率,少抽到一些阳性个体,则样本阳性率,总体阳性率,计量资料:,阳性率:多抽到一些数值较大的个体,则样本均数,总体均数,少抽到一些数值较大的个体,则样本均数,总体均数,1,、抽样误差:由于从总体中抽取样本而造成的样本均数(阳性率)与总体均数(阳性率)之间的差异。,抽样误差的特点:,不可避免性,有规律可循,2,、系统误差:人为原因造成的误差,实验者的技术错误,仪器不准确,诊断标准偏差,特点:,单向性(偏差方向一致,系统的偏高或,偏低,重复实验重复出现),可消除性,研究工作中不允许存在系统误差,3,、随机测量误差:由一些暂时无法控制的微小因素引起的误差,特点:,双向性(时大时小,时正时负),不可消除性(通过完善的实验设计可尽量缩小),例 求甲、丙两组数据的标准差,甲组,26 29 30 31 34,乙组,24 27 30 33 36,丙组,26 28 30 32 34,课堂练习:计算算术平均数、标准差、变异系数并比较甲、乙两组资料的变异程度。,例如:,同年龄同性别学生的身高和体重两组观察值。,同年龄同性别学生的身高和胸围两组观察值。,不同年龄儿童的身高的几组观察值。,例 收集了,100,名男孩的身高体重资料,得到身高的均数为,125.62cm,,标准差为,5.01cm,;体重的均数为,23.92kg,,标准差为,2.82kg,,比较身高和体重的变异程度。,例 某省开展交通运输量抽样调查,调查产生运输量的车辆构成的总体。,可按照运输工具分类:客车、货车、拖拉机和其他车辆。,例 在一个有近百幢楼房的小区调查,那么抽取,15-20,幢楼,对抽到的每幢楼的住户逐个进行调查。,例 一把钢尺名义上是,30cm,,实际上是,30.02cm,每量一次就多量,0.02cm,例 微气候,电磁场的微小变化,操作员的技术不稳定,例,1.10,某地,1993,年抽样调查了,100,名,18,岁男大学生身高(,cm,),其均数,=172.70cm,,标准差,s,=4.01cm,,估计该地,18,岁男大学生身高在,168cm,以下者占该地,18,岁男大学生总数的百分数;分别求,范围内,18,岁男大学生占该地,18,岁男大学生总数的实际百分数,并与理论百分数比较。,根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。,高斯,(,Johann Carl Friedrich Gauss,),是德国著名数学家、物理学家、天文学家、大地测量学家。他有数学王子的美誉,并被誉为历史上最伟大的数学家之一,和阿基米德、牛顿、欧拉同享盛名。,独立发现了二项式定理的一般形式、数论上的“二次互反律”,(Law of Quadratic Reciprocity),、“,质数分布定理”,(prime numer theorem),、,及“算术几何平均”,(arithmetic-geometric mean),等,。,高斯的肖像已经被印在从,1989,年至,2001,年流通的,10,德国马克的纸币上。,例 某地调查正常成年男子,144,人,其红细胞数近似服从正态分布,获得均数为,5.538,10,12,/L,,标准差为,0.44,10,12,/L,,试估计该地成年男子红细胞数的,95%,参考值范围。,红细胞过多或过少均属于异常,故此参考值范围应是双侧范围。该指标近似呈正态分布,故可用正态分布法求,95%,参考值范围的上下限如下,下限为:,上限为:,发汞值,(,g/g),男性,女性,1,8,12,20,20,3,31,35,66,86,5,28,32,60,146,7,23,25,48,194,9,11,7,18,212,11,12,4,16,228,13,3,3,6,234,15,1,0,1,235,17,1,0,1,236,19,21,2,1,3,239,合 计,120,119,239,-,例 某市,239,名正常人发汞值,求其,95%,的正常值范围,累计频数,频数,该市,95%,的发汞值正常值范围为小于,12.88,单侧与双侧参考值范围,根据医学专业知识确定!,双侧:白细胞计数,血清总胆固醇,,单侧:上限,:,转氨酶,尿铅,发汞,下限,:,肺活量,,IQ,,,1,、什么是抽样研究?,2,、常用的抽样方法有哪几种?分别简述他们的定义和优缺点。,3,、,常见的误差有哪几种?分别简述他们的定义和特点。,4,、什么是随机原则?在抽样调查中为什么要坚持随机原则?,5,、,什么是抽样误差?影响抽样误差的因素有哪些?,6,、,什么是抽样估计?它有什么特点?,7,、,抽样估计的优良标准是什么?,8,、,什么是抽样极限误差,和抽样平均误差,,抽样极限误差与概率度,抽样平均误差有什么关系?,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服