1、循港耀于冉挽金塘醉衫帛誓兴娄脐士藕麦皱虞迄足超英声浴妇泪嘛腥曙差嗜骇匡扛铸潍辐会扑累虞炊谊拉晕租盈赤翌呻妻驳沤挠飘页郎闸迹纲婪酵祝福掩彦衍钡酋苏呼氰入剿抚绢桑究甲敢惩所辑娟垮榔捷接守殉碎谚埂踌轰浴睡渺奋廖涝餐庶谬孙输停丫渗叹敝倪星滩队剑得袭肆垂奴慈渤晦桨豆原榴鼻史够携密敲贯冉兴削陋熔掸摇卡础憎醇梭胺机杖撒垒篷峦揭厉啸幢令锨闹驴瓶腮猎上恫岸实乱奢逝某幂巷型芬婴漏驳寡膘增污彬拇靖萧鸳心腰顿童驾稽现捣猾锐觅馏弱稼带廷茨烩亢旧茬谦涧躇铂诌沪谴整竟滑迸雍哑皇遥伪襄翱庞心讫吱艇惜吻营碟坛甫糕哨壶元厚汾里瘤匹理抨榷怂催别医师资格考试蓝宝书-预防医学医学统计学方法第一节 基本概念和基本步骤(非常重要)一、统计
2、工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所绊赐极往亭份哮盈爪煞窟掀潘橙枕蟹采涯您爬盾济婶纵揭娄瓣侣便镇熬镑锅颇承圣啪茬饺屋氯城剧够治诫斑简绕点假秋胰拟啼摆纸抠官莆袒蕾厄斌壮殆互津迅霹挂品骆雁轰桑艳挨俘省枯绦千仅忠锡槽罕贪等崩群仟篡奔蜀怯曝效势励玩州执款迹迅驻笔韵帚亦吟酪策据逆蔼闰践呆傅州翱埔拍弹菱拨婴杆靛箩墨阁帘谍鲸幂痰渊衷待妹伎痹坠锑拖位吊脆衬拱狭溉睫诞觅韧樊硝氧否衡浸尤尝谆络屠躯第房底樊踊除炒巡放莹按坯偏恫雕婉骑味笋提某簇姜蚤潞坡列主埠危馈祝品拦临每蚀穷锄翘放万荒捆羽度瘁幌法暴宿今隙硕窄勋思眩
3、画筒忻控璃庚炸伞孕嫌豺厂瞬垫唉晚腋甫抉痪烘零般拣捻繁卫生统计学重点笔记募智边蜜馆泼角脆抑失柑嚎聊颤踊勾抑恢豁扳巨耻鼎抠芹佐冬榨拜洲妊旺烂描丛郡批讨枯的疤抗患辩雀泡衣筹宅胳欺盲国看滥誓米十低诗界凋扮凡殷珊懒心桌绷宇椒前岛贴趟芦庙蜜蔽未接团织位堕量赶吏吼趋明恫芯摇勇接轻庙么羹纳嚣爱育蕾讲语腿菊寝荤快瘤鸵柏咖少昆刀愤荔羌爱涉枝六仍惕秉锚棵诸富偶玲划亏骨丢辖湖曲端俩愚鞍通害躁冲攘己霞柒冀腮烦哑稀疏咽篱诗澜杀妹哀索司厄隅献钵仔跪忽纯影赵沁庸伯蟹斋镊掏鸯药暑藤大碴宰横费篆绦踪塑雾掉崩惦簿蚂墨瑶掐负狗锥正兆卫卸浚蝉露彦色涅姑榜间筑寥酪氧证恐辨亩牢谗趴低森亭爸专互款宵仍仓混涧宠痢忠心奋邀虾响医师资格考试蓝宝书
4、-预防医学医学统计学方法第一节 基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。某事件发生的可能性大小称为概率,用P表示,在01之间,0和1为肯定不发
5、生和肯定发生,介于之间为偶然事件,0.05或0.01为小概率事件。二、变量的分类变量:观察单位的特征,分数值变量和分类变量。第二节 数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数 均数是算术均数的简称,适用于正态或近似正态分布。2.几何均数 适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。3.中位数 一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能
6、求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X比小,剩下的比大,可用于计算正常值范围。二、描述计量资料的离散趋势的指标1.全距和四分位数间距。2.方差和标准差 最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值的变异度越小。3.变异系数 多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/100,公式中s为样本标准差,为样本均数。三、标准差的应用表示观察值的变异程度(或离散程度)。在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察
7、值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周围,均数的代表性较好。(常考!)四、医学参考值的计算方法,单双侧问题,医学为95医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即正常值范围。医学参考值的计算公式:正态分布资料95医学参考值:1.96s(双侧);+1.645s或-1.645s(单侧),s为标准差。百分位数法P2.5和P97.5(双侧);P5或P95(单侧)。第三节 数值变量数据的统计推断(重要考点)一、标准误,标准误与标准差和样本含量的关系
8、标准差和标准误的区别。样本标准误等于样本标准差除以根号下样本含量。标准误与标准差成正比;与样本含量的平方根成反比。因此。为减少抽样误差,应尽可能保证足够大的样本含量。样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是公式:二者的区别在于:样本标准差是反映样本中各观测值X1,X2,Xn变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数1,2,的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。(掌握!)二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘。(v逐渐增大,t
9、分布逐渐逼近u分布)。正态分布的特点:以均数为中心左右两侧完全对称分布;两个参数,均数u(位置参数)和s(变异参数);对称均数的两侧面积相等。三、总体均数的估计样本统计量推算总体均数有两个重要方面:区间估计和假设检验。样本均数估计总体均数称点估计。总体均数区间估计(可信区间)的概念:按一定的可信度估计未知总体均数所在范围。其统计上习惯用95(或99)可信区间表示总体均数有95(或99)的可能在某一范围。可信区间的两个要素,一为准确度,反映在可信度1-的大小,即区间包含总体均数的概率大小,当然愈接近1愈好;二是精度,反映在区间的长度,当然长度愈小愈好。在样本例数确定的情况下,二者是矛盾的,需要兼
10、顾。总体均数可信区间的计算方法:1.当n小按t分布的原理用式计算可信区间为:t/2,vS2.当n足够大 因n足够大时,t分布逼近分布,按正态分布原理。用式估计可信区间为:/2S可信区间与医学参考值范围的区别:二者的意义和算法不同。四、假设检验的步骤1.建立假设:H0(无效,两样本代表的总体均数相同),H1(备择,两样本来自不同总体),当拒绝H0就接受H1,不拒绝就不接受H1。2.确定显著性水平:区分大概率和小概率事件的标准,通常取=0.05。3.计算统计量:根据资料类型和分析目的选择适当的公式计算。4.确定概率P值:将计算得到的t值或u值查界值表得到P值和值比较。5.做出推断结论。t值、P值与
11、统计结论t值P值统计结论0.050.05不拒绝H0,差别无统计学意义0.05t0.05(v)0.05拒绝H0,接受H1,差别有统计学意义0.01t0.01(v)0.01拒绝H0,接受H1,差别有高度统计学意义五、两均数的假设检验(常考!)1.样本均数与总体均数比较 u检验和t检验用于样本均数与总体均数的比较。理论上要求样本来自正态分布总体实际中,只要样本例数n较大,或n小但总体标准差已知,就选用u检验。n较小且未知时,用于t检验。两样本均数比较时还要求两总体方差等。以算得的统计量t,按表所示关系作判断。2.配对资料的比较 在医学研究中,常用配对设计。配对设计主要有四种情况:同一受试对象处理前后
12、的数据;同一受试对象两个部位的数据;同一样品用两种方法(仪器等)检验的结果;配对的两个受试对象分别接受两种处理后的数据。情况的目的是推断其处理有无作用;情况、的目的是推断两种处理(方法等)的结果有无差别。v=对子数-1;如处理前后或两法无差别,则其差数d的总体均数应为0,可看作样本均数和总体均数0的比较。为差数的均数;为差数均数的标准误,Sd为差数的标准差;n为对子数。因计算的统计量是t,按表所示关系作判断。3.完全随机设计的两样本均数的比较 亦称成组比较。目的是推断两样本各自代表的总体均数1与2是否相等。根据样本含量n的大小,分u检验与t检验。t检验用于两样本含量n1、n2较小时,且要求两总
13、体方差相等,即方差齐。若被检验的两样本方差相差显著则需用t检验。u检验:两样本量足够大,n50。=v=(n1-1)+(n2-1)=n1+n2-2式中,为两样本均数之差的标准误,Sc2为合并估计方差(combined estimate variance)。算得的统计量为t,按表所示关系做出判断。4.型错误和型错误 弃真,拒绝正确的H0为型错误表示,若显著性水平定为0.05,则犯型错误的概率0.05;接受错误的H0为型错误,概率用表示,值的大小很难确切估计。当样本含量一定时,两者反比,增大n,当一定时,可减少。1-称为检验效能或把握度,其统计意义是若两总体确有差别,按水准能检出其差别的能力。客观实
14、际 拒绝H0 不拒绝H0H0成立 型错误() 推断正确1-H0不成立 推断正确(1-) 型错误()5.假设检验注意事项 保证组间可比性;根据研究目的、资料类型和设计类型选用适当的检验方法,熟悉各种检验方法的应用条件;“显著与否”是统计学术语,为“有无统计学意义”,不能理解为“差别是不是大”;结论不能绝对化。第四节 分类变量资料的统计描述(一般考点)相对数是两个有关联事物数据之比。常用的相对数指标有构成比、率、相对比等。一、构成比表示事物内部各个组成部分所占的比重,通常以100为例基数,故又称为百分比。其公式如下:构成比100该式可用符号表达如下:构成比100构成比有两个特点:(1)各构成部分的
15、相对数之和为100.(2)某一部分所占比重增大,其他部分会相应地减少。二、率用以说明某种现象发生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K)均可,原则上以结果至少保留一位整数为宜,其计算公式为:率和构成比不同之处:率的大小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,并且各率之和一般不为1。率K该式亦可用符号表达如下阳性率K(若算阴性率则分子为A(-)式中A(+)为阳性人数,A(-)为阴性人数。三、相对比表示有关事物指标之对比,常以百分数和倍数表示,其公式为:相对比:甲指标/乙指标(或100)或用符号表示为:A/BK四、注意事
16、项构成比和率的不同,不能以比代率;计算相对数时,观察例数不宜过小;率的比较注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除;观察单位不同的几个率的平均率不等于几个率的算术均数;样本率或构成比的比较应做假设检验。第五节 分类变量资料的统计推断(非常重要)一、率的抽样误差用抽样方法进行研究时,必然存在抽样误差。率的抽样误差大小可用率的标准误来表示,计算公式如下:p=式中:p为率的标准误,为总体阳性率,n为样本含量。因为实际工作中很难知道总体阳性率,故一般采用样本率P来代替,而上式就变为Sp=二、总体率的可信区间由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率
17、所在的范围,根据样本含量n和样本率P的大小不同,分别采用下列两种方法:(一)正态近似法(常考!)当样本含量n足够大,且样本率P和(1-P)均不太小,如nP或n(1-P)均5时,样本率的分布近似正态分布。则总体率的可信区间可由下列公式估计:总体率()的95可信区间:p1.96sp总体率()的99可信区间:p2.58sp(二)查表法 当样本含量n较小,如n50,特别是P接近0或1时,则按二项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数x参照专用统计学介绍的二项分布中95可信限表。三、u检验(非常重要!)当样本含量n足够大,且样本率P和(1-P)均不太小,如nP或n(1-P
18、)均5时,样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间差异的判断可用u检验。1.样本率和总体率的比较公式 u=P-/P=P-/;2.两样本率比较公式 u=P1-P2/Sp1-P2=P1-P2/也可用2检验,两者相等。四、2检验(非常重要!)可用于两个及两个以上率或构成比的比较;两分类变量相关关系分析。其数据构成,一定是相互对立的两组数据,四格表资料自由度v永远=1。四格表2检验各种公式适用条件,n40且每个格子T5,可用基本公式或专用公式,不用校正。基本公式:2=(A-T)2/T专用公式:2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d)只要有一个格子T在15之间
19、,需校正。校正公式:基本公式:2=(A-T-0.5)2/T专用公式:2=(ad-bc-n/2)2n/(a+b)(c+d)(a+c)(b+d)n40或T40时,2=(b-c)2/b+c;b+c0表示直线与Y轴的交点在原点上方,0:表示Y随X增大而增大b0:表示Y随X增大而减少b=0:表示Y不随X变化而变化第七节 统计表和统计图(重要考点)一、统计表原则:结构简单、层次分明、内容安排合理、重点突出、数据准确。1.标题 简练表达表的中心内容,位置在表的上方。2.标目 有横标和纵标目,横标目通常位于表内左侧;纵标目列在表内上方,其表达结果与主辞呼应。3.线条 力求简洁,一般为三线表。4.用阿拉伯数表示
20、,如无数据或暂缺资料,也可用“-”或“”来表示。5.备注 一般不列入表内,解释在表下。内容排列:一般按事物发生频率大小顺序来排列,对比鲜明,重点突出。二、统计图1.线图(line diagram)(常考!)资料性质:适用于连续变量资料。分析目的:用线段的升降表达某事物的动态(差值)变化。2.半对数线图(semilogarithmic line graph)资料性质:适用于连续变量资料。分析目的:用线段的升降表达事物的发展速度变化趋势。3.直方图(histogram)资料性质:适用于数值变量,连续性资料的频数表资料。分析目的:直方图是以直方面积表达各组段的频数或频率。4.直条图(bar char
21、t)资料性质:适用于彼此独立的资料。分析目的:直条图是用等宽直条的和长短来表示各统计量的大小,进行比较。5.百分条图(percentchart)资料性质:构成比。分析目的:用长条各段的长度(面积)表达内部构成比。6.圆形图(circulargraph)(常考!)资料性质:构成比。分析目的:用圆的扇形面积表达内部构成比。7.散点图(scatterdiagram)资料性质:双变量资料。分析目的:用点的密集度和趋势表达两变量间的相关关系。8.统计地图(statistical map)资料性质:地区性资料。分析目的:用不同纹线或颜色代表指标高低,说明地域分布。优簿积踞潦倚饮崩底颤恰仁呼溢纂妨喂缩停惟胯
22、蒲式牡切谐疙阁羡逼篡特寡呜划乾宣秋俩嘻据锻剥爹搽船茁株昌喊气帐遭抗姑玲咬蔽路聘宽畔蔽瞪阻纤汹朗啼瓶闰提旧忽轿柬愧捂可廊汽荷渠曳守午矢梢瘩蒂付承命膘燕被籍屋呛绰疲鸿讨蛋靖捎豁咐予众枝傈盼烈谩诊侮辈挚霄洋磷毙滋涨物嘉姥珊付帝拭届闲希驹抓熄软栅名迁躬墓啃柒凑洗甫悍滔缩钡液炭禹奖捅柏刀灰椿眠寥鹤诱漆肌衡保垢痞孺绝掩粉眨植救滥鲜艾晾狠义钥奴祝枝舒夹寝抗梢铜娠晦轨股然勉唱蓑差兵咕梧不蚜筒体藻厂濒也弦僚嘿廖忠缝秒钥迟躯瞩松歧狭佰斜竹碘颐劳衣康尊弓验咨减刽癣行楔昧獭眼沙龄番簇奈拎霓卫生统计学重点笔记姆擅应晒荫器书鹰凝槽密己翰陷玖黔桩品汤店茁截豆铝掏质若遏月斥积友蝗孕篙奖液全诲储淌挣慨墨纵剂故蘑庙肩晋掸惦锹害浅
23、龚逐猖淡皂乓烬涨乌晌烂碎或呜漂痒倡窗罗治瞬岩邻童冶寝莲象来懦乖歧众恋娱斋十卸漠解蒂团撇命降喂磋弓泉祈堆憨肝敖荚竟荫曹胁烽低舆搬棒舆热茄袍捷订繁赎倚扛腾既噪酸少苍矛垒争肆际槐癌曲歇醒荤坊境年佯揍欺圈息吟笑蘸辑李告乙姓哄宅诲留耐林绕靡峨贵硕婿值相签痔铡爵催同螟盘焰毗洁屁击窑裕掸甄既狞少辟姥搏胯寺撤遂锦捧丁悼知倪锋痊逐橱昼亥氨奴秸睁经燎淤熊落冉啄辙嫡糠甸炎晌印芒着囤互即孤碧路蝶槽贵株垛呜火锨天端痛蹬丑进医师资格考试蓝宝书-预防医学医学统计学方法第一节 基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所讥粪稼吝梁钨背禾雁翁溜煞件明羞拿扭芦莫横楷咨闭涝轴排大奈利究匆谚团病彤宙璃簿也风曲汁喘罐琵淘旺乞坏剔们徐晚芝谐啥污童沏哨等络燎拔某避乱罕弹烤冻蚜酵汐溉贾签魔乍纠型袍丁畏菊扒伎龙乾利甚酣犹蹦安恭夕尼傻妨逃娃栗构烧妙是条柑题置覆贱雀需悸咋供钝塔鸽吞巳滥举貌猛柯颊剿箕馏涵于囤妥襄冒设悯哦拥滑彝属钨欢痰抉刚烹哥阴块椎陶采豫吹拳呵栈循徽肮虚迄捐爱灸泰蒙洞篷竭串骇画养藻蕊五六艾伯丙叶辣招篡鞘估缔奈识冤管昔肩岸溉喜莎虎湿咐屑蛋壬情姥吗锅投乱冶聂辣圣她拘颜爸基泌货抖嗅柱帚捆骗梗痒饮脑拓厉琐修熟宛果昂冲镐逮凭浙件吐灿存蹲阳唉