收藏 分销(赏)

医学统计学知识点例题总结.pdf

上传人:曲**** 文档编号:12477610 上传时间:2025-10-16 格式:PDF 页数:29 大小:2.50MB 下载积分:10 金币
下载 相关 举报
医学统计学知识点例题总结.pdf_第1页
第1页 / 共29页
医学统计学知识点例题总结.pdf_第2页
第2页 / 共29页


点击查看更多>>
资源描述
医学统计学第一章绪论 第一节 统计学的h个基本概念统计学:是研究数据的收集、整理与分析的科学。&医学统计学:是研究居民健康状况以及卫生领域中数据的收集、整理和分析的一门科学。或将统计学原理和方法,应用于医学和卫生事业中的一门应用性科学。9 同质(bomogeneity):总体中的所有个体均具有共同的性质,大同小异或被研究指标的影响因素相同。变异(variation):指在同质的基础上各观察单位(或个体)之间的差异。&总体(population):指根据研究目的确定的全部同质的观察单位(研究个体)某项变量的集合。&样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位,他是统计研究中最基本的单位。9 参数(parameter):总体的统计指标9 统计量(statistic):样本的统计指标&误差(error):观察值与实际值之差。包括过失误差、系统误差、随机误差。9 过失误差:由于观察过程中不认真仔细造成错误的判断或记录所致。&系统误差(systematic):由于在观察过程中仪器、试剂等未经校准,使观察值统一的偏低或偏高 随机测量误差:偶然因素使同一个样品的测定值在不同的观察者之间观察结果不完全相同或相同的观察者两次观察结果不完全相同被称为随机测量误差。&随机抽样误差:由于抽样使样本变量值的统计指标和总体的统计指标不可能完全相同,其差值为随机抽样误差。9 概率(probability):描述随机事件发生可能性大小的数值,常用P表示。随机事件发生的概率P值范围在01之间。Q 小概率事件:PW0.05或PW0.01为随机事件的小概率事件,即发生的可能性很小,统计学上认为一次抽样不可能(或极小的可能)发生。第二节统计资料的类型&数值变量资料:用定量的方法对观察单位某个变量进行观察得到的资料称数值变量资料,也称做计量资料(measurement data)o其 变量值是定量,表现为数值大小,一般有度量单位,如身高;体重;血压等均属定量资料。&分类变量资料:用定性的方法得到的资料称作分类变量资料或计数资料(enumeration data)o其观察值是定性的,表现为互不相容 的类型或属性。如性别;血型;学习成绩等。心 等级资料:变量的测定值若不能准确定量,仅能大致分为几个等级,称等级资料(ranked data)o其表现为半定量的性质,计数。如 疗效;病情;疾病分级等。第三节医学统计工作的基本步骤一、设计(design):指指定周密的医学研究计划、包括调查设计和实验设计。二、搜集资料(data collection):选择获得资料的最佳途径和获取完整、准确、可靠资料的过程。三、整理资料(data sorting):将搜集到的原始资料系统化、条理化,便于计算统计指标和深入分析。四、分析资料(data analysis):根据研究设计的目的、要求,资料的类型和分布特征选择正确的统计方法进行统计分析。设计(design)9 调查设计(包括专业设计和统计设计):明确调查目的和确定研 究指标;确定研究对象和观察单位;选择调查方式;设计调查项 目和调查表;估计样本含量;搜集、整理、分析资料的计划。&实验设计,遵循四个原则:对照、随机、均衡、重复原则。搜集资料(data collection)&资料的来源:统计报表;报告卡;日常工作记录;专题调查或实验。&资料的搜集:(一)搜集计划:选择搜集资料的地点、人员、时 间;搜集资料人员培训方案;拟订预调查或预实验方案;资料记 录方式;调查表的拟订和印刷;调查或实验仪器试剂的准备;调 查资料的抽样复核比例和方法;搜集资料所需经费。(二)搜集原则:准确、完整、及时。(三)搜集方式:直接观察、采访、填表、通信。整理资料(data sorting)9 质量分组:将观察单位按属性和类别分组,如按性别、职业、病种 等分组。&数量分组:将观察单位按数值大小分组,如划分年龄组,身高组等。分析资料(data analysis)描述性统计:计算统计指标,如平均值、发病率等。&分析性统计:推断总体的特征,如推断总体均数、总体率及其可 信区间;总体指标的比较。第1页共29页医学统计学 第二章计量资料的统计描述 第一节频数分布 频数(frequency):某变量值出现的次数。0 频数分布表制作1.计算极差或全距(range):R二最大值一最小值2.决定组数、组段和组距:组段数:根据观察例数确定(815);组距(class interval):相邻两组段下限之差,或极差/组段数的整数 值。第一组段:包含最小值。最末组段:包含最大值。3.划记归组。心 频数分布的特征1.集中趋势(central tendency):变量值向中间集中的趋势2.离散趋势(tendency of dispersion):变量值向两端分散的趋势O 频数分布形态1.正态分布(normal distribution)或近似正态分布:高峰在图形中央,两边对称或基本对称的逐渐减少。2.偏态分布:正偏态分布(skewed positively distribution):高峰偏左侧;负偏态分布(skewed negatively distribution):高 峰偏右侧。第二节集中趋势的描述平均数(average):是用于描述数值变量资料平均水平(即集中趋势)的指标。在医学领域常用的平均数有算术平均数、几何均数、中 位数。算术平均数(arithmetic mean)几何均数(geometric mean)中位数(median)定一组性质相同的数值之和除以数值个将n个观察值x的乘积再开n次方,所得的平用M表示,是把一组观察值按大小顺序排列,义数所得的商。总体均数为p,样本均数方根(或各观察值x对数均值的反对数),用G位置居中的那个数。为无表示。适用资料为正态或近似正态分布。资料为对数正态分布。资料呈明显的偏态分布。条件各观察值呈倍数关系或近似倍数关系。资料的一端或两端无确定数值。资料的分布情况不清楚。计公 直接法_ 元,n _6 直接法:1回返土里 1跳升心 直接法:样本含量不大时,将观察值按 大小顺序排列。n为奇数时,位置居中的那个工 n G=h%二算&加权法数即为Mo n为偶数时,位置居中的两个数的方 加权法平均值即为M。法-_ _ 力为+/2%+aX 不 力+人+G-1(/1财+皿+,+力虹)V 7 4心 加权法:.M=+(n-50%-5;)fm百分位数:用Px表示,是一组数据从小到大排列,分成100等份,各等份含1%的观察值,中位数是50百分位数,为P50,另有P25,P75,P95等。公式夕=L+上(%玩)h 第三节离散趋势的描述离散趋势指标:是描述资料的变异度指标。常用的指标有:全距、四分位数间距、方差、标准差及变异系数。全距(range)四分位数间距(inter-quartile range)方差(variance)和标准差(standard deviation)变异系数(coefficient of variation)定 义亦称极差,即全部观 察值中最大值与最小 值之差,用符号R表 小O指上下四分位数之差,即QQl。通过P25,P50及P753个点将全部观察值等分为4个部 分,处于分位点上的数值就是四分位数(Q)。下四分位数即第25百分位数,用小 表示。上四分位数即第75百分位数,用Qu 表示。方差:取离均差平方和的均数。标准差:方差的单位是观察值单位的平 方,将方差开平方即得到标准差。亦称离散系数,为标准差与 均数之比。将标准差转化为 算术均数的倍数,以百分数 的形式表示。第2页共29页医学统计学适 用 条 件9意 义 及 缺 点心 最简单但又较粗 率的变异指标,可用 于各种分布的资料。心 全距越大,离散 程度越大。反之,说 明变异程度小。&仅考虑两端数据 的差异,未考虑其他 数据的变异情况,不 能全面反映一组资料 的离散程度。&常用于描述偏态分布资料的离散程 度。Q值越大,说明变异程度越大。&仍未考虑每个观察值。Q 描述对称分布,特别是正态分布 或近似正态分布资料的离散趋势的常 用指标。&方差和标准差的意义:说明资料 的变异程度,其值越大,变异度越大。&标准差的用途:反映一组观察 值的离散程度,标准差越小,说明观察 值的离散程度越小,用平均数反映平均 水平的代表性越好。计算变异系数;计算标准误;结合均值与正态分布 的规律估计参考值范围。比较度量衡单位不同的两 组或多组资料的变异程度;比较均数相差悬殊的两组 或多组资料的变异程度公R二最大值一最小值Q=Qu-QlQu=鸟 5总体方差 2 EQ)?c 二-N样本方差2_次七-a、-n-1q CV=4x100%X式Ql=P25总体标准差_ 12(一)2N 样本标准差(_ L 2(冽)2S=():,几V n-l V n-1F以-1第四节正态分布 正态分布(normal distribution):中间高,两侧逐渐降低,并完全对称的一条光滑曲线,为正态分布曲线。用N(口,O)表示,其位置与均数有关,形状与标准差有关,标准差越大,离散程度越大,正态分布曲线越“胖”,反之则“瘦”。d 正态分布概率密度函数(probability density function):/(%)=-)-Q/2)(x/一 8xV+8。f(x):与 x 对应的正crV 2兀态曲线的纵坐标高度;M:总体均数;O:总体标准差;TT:圆周率(TT=3.14159);e:为自然对数的底(e=2.71828)。&标准正态分布:为了应用方便,对于任何一个均数和标准差分别为(|J,o)的正态分布,都可以通过变量的标准正态变换,使之成为标准正态分布,用N(0,1)表示,即u值的均数为0,标准差为lo N(0,1)的概率密度函数为:0()=_oox7 2兀p 0M=M 0M M 0是否口 p 0M=M 0M 100)或o已知。第4页共29页医学统计学t检验包括:单个样本t检验;配对样本t检验;两独立样本t检验。单个样本t检验配对样本t检验两独立样本t检验单个样本t检验,即样本均数与总体均 数比较的t检验。是描述样本均数X 所代表的总体均数P和已知总体均数|J。的比较。已知总体均数一般为标准值,理论值,或经大量调查所得的比较稳定的指标 值。t=X _氏=X 一氏_ S 又 S!4n _配对设计的三种情况:自身比较,指同一受试对象处理前后的比 较。同一样品(受试对象)用两种方法检验的 结果(分别接受两种不同的处理)。成对设计的两个受试对象(两个同质受试 对象)分别给予两种处理。1、两个独立样本t检验,又称成组t检验,适用于完全随机设计的两样本均数的比较。2、两样本均数所代表的总体均数服从正态分 布 N1(p 1,a J),N2(p 2,。22)o3、当比较两总体均数p 1,p 2是否相等时,理论上还应考虑两总体方差。er?是否具 有齐性。即。:二。22”单个样本例您例:m 0=140g/L,n=36,X=130.83g/L,S=25.74g/LHo:p=p。铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等。H1:p 铅仔芈男性工人y均血红蛋白含量与正常成年男性平均值不等。a=0.05 X /70 X 氏 130.83 140。t=-=-=-=2.138S 又 S/4n 25.74/V36v=n-36-l=35,查 t用值表,得 t。,,35=2.030因为tt.。5,35,所以P4.781,.P0.001,按。=0.05 水准,拒绝d-0 t _-02724-7 925L Sd0.1087/V10第5页共29页医学统计学两独立样本例题表3-4试验组和对照组空腹血糖下降值(mmol/L)试验组X1-0.70-5.602.002.800.703.504.005.807,10-0.50(町=20)2,50-1.601.703.000.404.504.602.506.00-1.40对照组x23.706.505,005,200,800/200.603.406.60-140(&二20)6.003.802.001.602.002:201.203.10L70-2.00已知:m=20,s尸3.060immol/L,=2.Q65Qmmol/L由=20,s2=2,4205mmol/L,X2=2.6250mmol/L1、建立检验假设 一Ho:p尸口 2两种药物空腹血糖下降值的总体均数相同。H1:M廿|J 2两种药物空腹血糖下降值的总体均数不同。2、确定检验水准。=0.053、算检验统计量:2 先122.0650-2.6250“小=-0.6423.06012+2.42052204、确定P值和作出推断结论 u=ni+ri22=20+202 38o 查 t 界值表,to,05,38=2.024,to.5,38=0.681Vt=0.642 0.5,按c(=0.05水准,不拒绝H0,认为两种药物对空腹血糖的降糖效果是相同的,无统计学意义。第五节假设检验的注意事项假设检验的注意事项1、要有严密的研究设计:使资料具有代表性,组间具有均衡性、可比性。2、选用的假设检验方法应符合应用条件:配对t与两样本t;两样本t与u等。3、单侧、双侧检验的选择:例某山区健康成年男子脉搏数与一般成年男子脉搏数比较。p=72次/分,p=74.2次/分,S=6.0次/分t=1.854,u=29,to.os,29=2.045(双侧),P0.05 而29=1.699(单侧),P0.054、结论不能绝对化:按。=0.05的水准,P0.05,不拒绝H。,说明H。假设成立的可能性为95%,还有5%风险结论是错的。5、正确理解P值与差别有无统计意义:正确理解假设检验的结论:PW0.05,拒绝H。,不能理解为差别很大。P0.05,不拒绝H。,不能 理解为差别不大或没有差别。假设检验中的两类错误I型错误:拒绝了实际上是成立的H0,为“弃真”的错误。犯I型错误的概率为。o n型错误:不拒绝实际上是不成立的ho,为“存伪”的错误。犯n型错误的概率为b o 规定的检验水准发现该差异的能力。(i-p)为检验效能,即当两总体确有差别,按示意图假设检验中的两类错误客观实际假设检验结果拒绝H0不拒绝H0H0成立I型错误(Q)推断正确(1-Q)H0不成立推断正确(1-p)II型错误(B)实际工作中,可根据研究要求适当控制。和B。若重点在于减少。,一般取。=0.01;若重点在 于减少B,一般取。=o.05o同时减少。和B的 唯一方法是增加样本含量。第6页共29页医学统计学t检验和U检验常用公式U检验t检验单样本U检验 _ X _ _ X-u 1S 又 S/4n单样本t检验t=X _ No=X _ No S 又 S/yln两样本U检验 占一配对样本t检验d 0 d 0 f _ _c s/S /V2 92X一不2/A|A 2V 4%一七r/y/n冷配对样本u检验u=d d 一%tS=-红V n-1两独立样本t检验 _吊元2x-jU x-jUk 一少S34回运,(当L时)n2 一1)+5;(2-1)2:_(2玉)2/+江2-(2)2/23 c -2 +2-2u=ni+n22第四章 方差分析(ANOVA)第一节方差分析的基本思想多个样本均数比较的方差分析(ANOVA)应用范围:完全随机设计两个或两个以上样本均数比较的方差分析;随机区组设计的方差分析;多个研究因素的交互作用;回归分析中,直线方程的假设检验应用条件:各样本是相互独立的随机样本;各样本均来自正态总体;各样本总体方差相等,o:2=o/=。方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。首先按照设计类型将总变异分解成几个部分,每部分都与特定的因素相联系,然后以某处理因素与随机因素的均方之比构造检验统计量F,通过比较F值与临界值的大小作出统计推断。方差分析的基本思想的具体阐述:1 首赤显.k ni 一 c k/k%、尼戈*.SS 咨=EE(XX)2=/N村、i=i j=i lJ i=i j=i lJ i=i j=i lc=(L B X/2/N u 总=5 1/=i 1”2.将总变异分解:处理组间变异和组内变异(误差变异):组间变异:k SS组间=片叫(,X)1=12=_i=1 n.u组间=k1组内变异:左,_55=SJi(X,-X2=S(n-l)S:SS组内=SS总一SS组内u组内=Nk求均方:MS组间=SS组间/u组间。MS组内=SS组内/u组内。求F值:F=MS组间/MS组内。FT说明处理因素无作用。若F2/).05m”则认为处理因素有作用。其中,u 1为组间,u 2为组内。第二节 完全随机设计资料的方差分析(one-way ANOVA)第7页共29页医学统计学.完全随机设计方差分析的计算按照下表进行即可:表10.2完全随机设计方差分析计算表变异来源SSMSF总变异xx2-cNT组间(处理)3.98,.P3.072.171.576.81(SS Xv)Xi0.6140.4340.3140.454(X)Wj=12.02071.05870.54513.6245(22 XQ表46 5个区组小白鼠按随机区组设计分配结果区组号12345小白鼠1 2 34 5 67 8 910 11 1213 14 15随机数68 35 2600 99 5393 61 2852 70 0548 34 56序号3 2 11 3 23 2 12 3 12 1 3分配结果丙 乙 甲甲 丙 乙丙 乙 甲乙 丙 甲乙 甲 丙1、建立检验假设Ho:p l=p 2=p 3三种药物作用后,小白鼠肉瘤重量的总体均数相等。H1:口 1、口 2、p 3三种药物作用后,小白鼠肉瘤重量的总体均数不全相等。Ho:p 1=|J 2=p 3=p 4=p 5不同区组间小白鼠肉瘤重量的总体均数相等。Hi:p 1、p 2、p 3 p 4、|J 5不同区组间小白鼠肉瘤重量的总体均数不全相等。2、确定检验水准a=0.053、选定检验方法和计算检验统计量06.81715=3.0917 SS 总二3.6245-3.0917=0.5328ss 处理=1(3.072+2.172+1.572)-3.0917=0.2280SS 区绢=-(1.982+1.502+1.052+0.932+1.352)-3.0917=0.2284SS 误差二0.5328-0.2280-0.2284=0.0764 u 总=15-514,u 处理=g-l=3T=2,u 区组二nT=5-1=4,u 误差二(nl)(g-1)=(5-1)(3-1)=8MS 处理=SS 处理/u 处理=0.2280/2=0.1140 MS 区组=SS 区组/u 区组=0.2284/4=0.0571MS 误差=SS 误差/u 误差=0.0764/8=0.0096F 处理=MS 处理/MS 误差=0.1140/0.0096=11.88 F 区组=MS 区组/MS 误差=0.0571/0.0096=5.954、确定P值和作出推断结论u 1 为处理组间,u 2 为误差,查 F 界值表:F.(2,8)=4.46,Fom(2,8)=8.65。本例 F 处理=H.888.65,;.PVO.01,按。=0.05 水准,拒绝H。,接受乩,认为三种药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差别。u 1 为区组间,u 2 为误差,查 F 界值表:“05(4,8)=3.84,Fo.oi(4,8)=7.O1。本例 F 区组=5.95 3.84,/.P0.05。当q q 0.05(U,a)时,P 0.051,30.30036.854.045.640.012,30.18024.113.264.75u八1,O3AElFF*OE八13ARL5FC人EF-I)八EJBU表4.12拉丁方设计资料方差分析表变异来源自由度SSMSF总变异N-12x%c处理组g-1SS处理/处理MS处理/MS误差行区组gTJ X咫-cSS行/行MS行/MS误差列区组g-1-i-SC?-C gSS列/酎列MS列/MS误差误差(g-D(g-2)SS总一 SS处理一 SS行一 SS列ss误差/?误差、_(2x9)2注:N=g2-i,c=n cm 帮用拉丁万支八HUC?AC:八A13c;I)1/X J13uU1)八IB13u1)AAE13户4 5CO八131E尸八FlUoI,E尸C3八13uUI 二EF*CJXB1 bEF*o人人13cI)E尸FIM/、13UI、1:KCi-.I I/XBU1)EKKGH人C*rEEOIABUr5nIF*OF4/BuC Jr)ErCiH八1413u1ZE尸一Cf-4人9 9_ARur,fc:打C F4II/13uIDEFGI11I人liC2DEFOCiI I1八HOI 卜二_K_roH1八13UDEFOMI/、BC_UI)F:F*OII人LiC:UTOEFCSH1人J3人1 uI)1FCiMI八第12页共29页医学统计学例子比较甲、乙、丙、丁、戊、己6种药物给家兔注射后产生的皮肤疱疹大小,研究者选用6只家兔,并在每只家兔的6个不同部位进行注射,试验结果见表4-11.表 4-11拉丁方设讨与试验结果(皮肤疱疹大小,mrr?)家兔编号(行区组)12注射部位编号(列区组)3 456行区组 合计(RQ1A(73)B(75)C(67)E(61)D(69)F(79)42470.72坟83)A(81)E(99)F(82)C(85)1X87)51786.23E(73)D(60)F(73)C(77)B(68)A(74)42570.84F(58)C(64)B(64)D(71)A(77)E(74)40868.05C(64)F(62)D(64)A(81)E(85)B(71)42771.26D(77)E(75)_ A(73)B(59)F(85)_C(82)45175.2列区组 合计(G)42841744043146946771.369.573.371.878.277.8药物DECABF合计428467439459420439X=73.7xk71.377.873.276.570.073.21、/=Nb=Nc=Nd=Ne=4六种药物注射后家兔产生皮肤疱疹大小的总体均数相等。H1:六种药物注射后家兔产生皮肤疱疹大小的总体均数不全相等。2、:r r-r-r-jUR=Nr六个区组家兔皮肤疱疹大小的总体均数相等。H1:六木区组展兔皮膜疱疹大X的总;本均数下全相等。3、Ho:4g=%2=此=g=k=k 六个注射部位皮肤疱疹大小的总体均数相等。hi:六个;主射部,立皮肤窟疹大沼的总向匀数不,相等。a=0.05Z X2=202241,Z X=2687,C=200554.691、总变异:SS=EX:*C=202241-200554.69=1686.30 u 总=nt=36-1=35 IJK2、处理组变异:SS处理-C=-(4492+4602+4642+4832+4272+4042)-200554.69=667.14 g 6u 处理=g-l=6T=53、仃区组变异:ss-c=1(4682+4692+4482+4372+4272+4382)-200554.69=250.48仃区组 g j 6u 行区组二g-1=6T=54、列区组变异:lo I/O o O O 0、SSm=EC;-C=-(4492+4382+4652+4492+4492+4372)-200554.69=85.48 g 6u 列区组二g-1=6T=55、误差变异:SS 误差二SS 总一SS 处理一SS 行一SS 列=683.2 u 误差二(gT)(g-2)=(6-1)(6-2)=20MS 处理二SS 处理/u 处理=667.14/5=133.4MS行区组(家兔)=SS行区组/u行区组=3250.48/5=50.1 MS列区组(部位)二SS列区组/u列区组二85.48/5=17.1MS 误差二 SS 误差/u 误差=683.2/20=34.16F 处理二MS 处理/MS 误差二 133.43/34.16=3.91 F 家兔间二MS 家兔间/MS 误差二50.1/34.16=1.47 F 部位=MS 部位/MS 误差二 17.1/34.17=0.5u处理二u行(家兔)二u歹!(部位)=5,u误差二20Fo.05(5,20)=2.71,Fo.05(5,20)=4.10F 处理2.71,P0.05 F 部位V2.71,P0.05第七节2X2析因设计的方差分析例子第13页共29页医学统计学将20只家兔随机分成4组,每组5只,进行神经损伤后的缝合实验,处理由两个因素组成,A因素为缝合方法,有两个水平,一水平 为外膜缝合,记作al,另一水平为束膜缝合,记作a2;B因素为缝合后的时间,有两个水平,一水平为缝合后1个月,记作bl,另一水 平为缝合后2个月,记作b2;实验结果为家兔神经缝合后的轴突通过率。欲比较不同缝合方法和缝合后不同时间对轴突通过率的影响,试做析因分析?表UT家兔神经缝合后的轴突通过率(%)A(缝合方法)B(缝合时间)外缝合(al)束膜缝合(a2)bl缝合后1个月b2缝合后2个月bl缝合后1个月b2缝合后2个月1030105010302050407030705060506010303030平均24442852Ti(Z Xi)120220140260740(Z X)Z X244001120048001440034800(Z X2)0=7402/20=27380;SS 总二Z X2-C=34800-27380=74202X2析因表的均数差别A因素缝合方法B因素平均b2-blB1缝合后1个月B2缝合后2个月A124443420A228524024平均264822a2-al486心 单独效应:指其他因素水平固定在一个水平时,同一因素不同水平之间均数的差别。如:A因素固定在A1水平时,B因素的单独效 应为20(b2-bl);A因素固定在A2水平时,B因素的单独效应为24(b2-bl);B因素固定在Bl水平时,A因素的单独效应为4(a2-al);B因素固定在B2水平时,A因素的单独效应为24(a2-al)o _ _心 主效应:指某一因素各个水平的平均差别。如:A因素的主效应为40-34=6,4主=(4-4)即B因素的主效应为48-26二22,即 石主=(瓦一瓦)&交互效应:如果某个因素的单独效应随另一个因素水平的变化而变化,且其变化的幅度不能用随机误差解释时,称这两个因素间存 在交互效应。如:对B1水平,A因素的单独效应为4。对B2水平,A因素的单独效应为8。若8与4之间的差别不能用随机误差解释,说 明A与B之间有交互作用;AB=(a2b2 alb2)(a2bl-albl)/2=(8一4)/2=2对Al水平,B因素的单独效应为20;对A2水平,B因 素的单独效应为24O若24与20之间的差别不能用随机误差解释,说明B与A之间有交互作用BA=(a2b2 a2bl)(alb2-albl)/2=(24 20)/2=22X2析因方差分析表变异来源自由度SS总变异2X2Xn-lSS 总二Z X2-C=(SSA+SSB+SSAB+SSE)处理组间u处理二kTSS 处理工(72+52+7;2)_0 _ nA因素主效应u A=2TSSa=La;+A;)-c.A 2n 1B因素主效应u B=2-1SSB=(B+B|)-C 2nAB交互效应u AB二(2-1)(2-1)SSAB=SS 处理-SSA-SSB误差u E=2X2X(n-1)SSE=SS 总-SSA-SSB-SSAB第14页共29页医学统计学Tl=alb120;T2=alb2=220;T3=a2b140;T4=a2b2=260;Al=T1+T2=120+220=340;A2=T3+T4=140+260=400;Bl=T1+T3=120+140=260;B2=T2+T4=220+260=480;1、HO:A因素主效应二0 Hl:A因素主效应WO 2、HO:B因素主效应二0 Hl:B因素主效应WO3、HO:AB交互效应=0 Hl:AB交互效应W0a=0.052X2析因方差分析表变异来源自由度SSMSFP总变异197420处理组间32620A因素主效应11801800.60.05B因素主效应1242024208.070.05误差164800300Fo.os(1,16)4.49;Fo.oi(1,16)8.53;补充例题某研究人员采用某法测定人血清C3(mg/L)值,欲了解不同保存时间,不同温度对测定值有无影响,并研究保存时间与温度对测定 值有无交互作用,为此安排了如下试验,结果如下:两种温度及两种保存时间下某法测定的C3值(mg/L)A因素(保存时间)B因素(保存温度)20(bl)20(b2)1 天(al)1320,1320,1330,1310,1300,1320,1330,1310,1330,1300,3 天(a2)1340,1340,1350,1330,1320,1420,1420,1430,1410,1400,Tl=alb6580;T2=alb2=6590;T3=a2bl=6680;T4=a2b2=7080;ATl+T2=6580+6590=l3170;A2=T3+T4=6680+7080=13760;Bl=T1+T3=6580+6680=13260;B2=T2+T4=6590+7080=13670;心 单独效应:指其他因素水平固定在一个水平时,同一因素不同水平之间均数的差别。如:A因素固定在A1水平时,B因素的单独效应 为2(b2-bl);A因素固定在A2水平时,B因素的单独效应为80(b2-bl);B因素固定在Bl水平时,A因素的单独效应为20(a2-al);B 因素固定在B2水平时,A因素的单独效应为98(a2-al);_ _ 主效.指至:因素各个水平的平均差别。如:A因素的主效应为1376-1317=59,艮叫=(4-4)B因素的主效应为1367-1326二41,即5主=(当一片)&交互效应:AB=(a2b2alb2)(a2bl-albl)/2=(1416-1318)(1336-1316)/2=391、HO:A因素主效应二0 Hl:A因素主效应W0 2、HO:B因素主效应二0 Hl:B因素主效应W03、HO:AB交互效应二0 Hl:AB交互效应W0a=0.052X2析因方差分析表变异来源自由度SSMSFP总变异1935655处理组间333415A因素主效应11740517450124.60.01B因素主效应18405845060.40.01AB交互效应17515751553.7=9048 200四格表资料自由度为1X之检验的统计量X 2值为:A实际频数;T理论频数104x26 96x174 96x26=13.32=oj.jZ 1”=12.4o12 200 200 2002 V(A-T)2%TX 2值的大小反应了实际频数与理论频数的差别,若无效假设H。成立,则理论频数T与实际频数A相差不会很大,出现较大的X 2值的概率 较小。若计算的X,值越大,则越有理由推翻H0假设。X 2 X 20.05(v)AP0.05 1、建立检验假设:Ho:n 2,试验组与对照组降低颅内压的有效率相等H1:n IWn 2试验组与对照组降低颅内压的有效率不相等q=0.052、计算理论数和x 2 统计量:2(99-90.48)2(5-13.52)2(75-83.52)2(21-12.48)2。乙90.48 13.52 83.52 12.483、确定P值和判定结果:v=(行数T)(列数-1)二(2-1)(2-1)R根据自由度查X 2界值表,*2。5比=7.88,本列x?=12.86V7.88,P0.005,按。二0.05水准,拒绝H。,接受乩,认为两种降低颅内压总体有效率不同,试验组(异梨醇口服液)的降低颅内压的有效率高于对照组(氯嘎嗪+地塞米松)。2二、四格表资料专用公式 2=(必-be)n(a+b)(c+d)(Q+c)(Z7+d)三、四格表资料x 2检验的校正公式当n240,所有的T25时,不用校正。1WT40,对X?统计量进行校正T VI或nTT 2,两种药物治疗脑血管病的有效率相等H1:TT1WTT2,两种药物治疗脑血管病的有效率不相等。=0.052、计算理论频数和X 2统计量:T22=26X 14/78=4.67,n=7840,故用校正公式计算X 2值:2(|46 X 8 6 X18|78/2)2 X 59X 52x26x64x143、确定P值和判定结果:v=(行数-1)(列数-1)=(2-1)(2-1)=1根据自由度查X 2界值表,x 2o,okd=3.84,本列x匈=3.140.05,按。=0.05水准,不能拒绝H0,尚不能认为两种药物治疗脑血管病的有效率不相等。若不校正,x2=4.35,则PV0.05第二节配对四格表资料的X 2检验配对四格表资料的X之检验是对配对设计研究所获得的计数资料进行比较。“配对设计包括:常用于两种不同的检验方法、培养方法、诊断方法、治疗方法的比较;观察对象根据配对条件配成对子,同一对 子内的两个不同的个体分别接受两种不同的处理;在病因和危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种 病因或危险因素。若观察的结果只有阴性、阳性两种可能,清点成对资料时发现观察结果只有四种情况:(a)甲+乙+,(b)甲+乙-,(c)甲-乙+,(d)甲-乙-。将(a)、(b)、(c)、(d)四种情况的对子数填入四格表。用配对四个表资料的X 2检验公式进行假设检验。第17页共29页医学统计学例子两种方法的检验结果免疫荧光法的阳性率:23/58=39.66乳胶凝集法的阳性率:13/58=22.41若检验两种方法的检验结果有无差别,应采用下列公式:2 _(b-cY当b+c240时,可用公式:*b+c当b+cV40时,可用公式:.二(卜。1)b+c免疫荧光法 乳胶凝集法 合计+11(a)12(b)23-2(c)33(d)35合计 13 45 581、建立检验假设:Ho:B=C,两种方法的总体检测结果相同Hi:BWC,两种方法的总体检测结果不相同Q=0.052、计算X2值:之_(。卜方_12 2卜_X Db+c 12+23、确定概率P值和判断结果:配对四格表资料的自由度v=1,查X 2界值表,X 1.侬=5.02,本例X=5.793.84,P0,计算满足Di D*和PiW P*条件的各种组合下的四格表的累计概率。若现有四格表中,D*V0,计算满足DiW D*和PiW P*条勺的各种组合下的四格表的累计概率。双侧检验:计算满足AD*和PiW P*条件的各种组合下的四格表的累计概率。若遇到a+b=c+d或a+c=b+d时,四格表内的各种组合序列呈对称分布,可按单侧检验条件,只计算单侧累计概率,然后乘以2即得双侧累计概率。例子表7-4两组新生儿HBV感染率的比较组另U阳性阴性合计感染率预防注射组4(6)18(16)2218.18非预防组5(3)6(8)1145.45合计9243327.27Ho:tt 1=tt2,两组新生儿HBV的总体感染率相同H1:tt 1#tt2,两组新生儿HBV的总体感染率不相同Q=0.051、计算原四个表的D*和P*,计算各种组合的四个表Di和Pi(见表7-5),本例D*=-66,P*=0.087627282、计算满足巳。*|条件的各种组合的四个表概率Pi3、计算满目66和PiWP*条件的四个表累计概率。本例Pl、P2、P3、P4、P5、P10满足条件,累计概率为:P=P1+P2+P3+P4+P5+P100.1210 P0.05,按。=0.05的检验水准,不拒绝H。,尚不能认为预防注射与非预防组的新生儿HBV的感染率不同。表7-5 例7-4的 Fisher确切概率法计算表i西格表组合Di ad-be匕abc d102292-1980.000001432121831650.00009412322074一 1320.00197656431965990.018447855 4185666.0.08762728651747-337616380871529339814110660.0912039011913011990.01289752为现有样本第18页共29页医学统计学 _ 表76胆囊腺癌与胆囊腺瘤1餐
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服