收藏 分销(赏)

医学统计学总复习-liufen-sms-PPT课件.ppt

上传人:精*** 文档编号:2377936 上传时间:2024-05-29 格式:PPT 页数:88 大小:1.39MB
下载 相关 举报
医学统计学总复习-liufen-sms-PPT课件.ppt_第1页
第1页 / 共88页
医学统计学总复习-liufen-sms-PPT课件.ppt_第2页
第2页 / 共88页
医学统计学总复习-liufen-sms-PPT课件.ppt_第3页
第3页 / 共88页
医学统计学总复习-liufen-sms-PPT课件.ppt_第4页
第4页 / 共88页
医学统计学总复习-liufen-sms-PPT课件.ppt_第5页
第5页 / 共88页
点击查看更多>>
资源描述

1、医学统计学总复习医学统计学总复习-liufen-smsliufen-sms一、概述一、概述.科研统计工作的步骤科研统计工作的步骤n(1 1)研研究究设设计计(research research design):design):根据研究的目的,从统计学的角度对各步提前做出的周密的计划和安排 调查设计 实验设计 (临床设计、新药设计)科研设计n(2)收集资料(data collection)n(3)整理资料(data sorting)n(4 4)分析资料)分析资料(data analysis)一、概述一、概述.科研统计工作的步骤科研统计工作的步骤统计分析统计分析统计推断统计推断参数估计参数估计假设

2、检验假设检验点估计点估计区间估计区间估计统计描述统计描述 均数、中位数、标准差均数、中位数、标准差 统计量统计量 率、构成比率、构成比 相关系数、回归系数等相关系数、回归系数等 统计表统计表 编制规则编制规则 统计图统计图 条图、直方图、圆图、线图等条图、直方图、圆图、线图等统计描述的方法统计描述的方法类型、适用条件类型、适用条件n用样本的信息来推断总体的特征叫统计推断n统计分析的主要目的是由样本推断总体,故统计学的主体是统计推断统计推断统计推断统统计计推推断断参数估计假设检验点估计区间估计参数非参z检验t 检验F检验直线相关与回归卡方检验秩和检验等级相关.资料类型资料类型n(1)定量资料 计

3、量资料(measurement data):对每个观察单位用定量方法测定某项指标的数值大小所得的资料 n(2)定性资料n计数资料(enumeration data)按性质或类别进行分组,然后再清点各组数目所得的资料 n等级资料(ranked data)将观察单位按某项指标的等级顺序分组,再清点各组观察单位的个数所得的资料.资料类型资料类型二、二、定量资料定量资料的基本统计方法的基本统计方法n有个模块:n 统计描述n 区间估计n 假设检验n 相关与回归1、统计描述统计描述统计指标统计指标平均指标和变异指标分别反映资料的不同特征平均指标和变异指标分别反映资料的不同特征,常配套使用常配套使用,根据根

4、据资料类型不同有不同组合资料类型不同有不同组合,如如 正态分布正态分布:均数、标准差均数、标准差 偏态分布偏态分布:中位数、四分位数间距中位数、四分位数间距n描述描述集中集中趋势指标趋势指标:算术均数(简称均数)()几何均数(G)中位数(M)n描述描述离散离散程度指标程度指标:极差(R)四分位数间距(Q)方差(S2)标准差(S)变异系数(CV)n1、描述偏态分布集中趋势(尿氟均值)的指标:中位数中位数n2、比较几组量纲不同的资料的离散程度的指标:变异系数变异系数统计描述统计描述1 1)统计表)统计表组合表组合表简单表简单表2 2)统计图)统计图条图条图圆图圆图线图线图直方图直方图散点图散点图.

5、*类型、适用条件类型、适用条件*1、统计描述、统计描述统计表与统计图统计表与统计图 例例1现有现有145例粪链球菌食物中毒病人,例粪链球菌食物中毒病人,其潜伏期分布如表其潜伏期分布如表1所示所示,属于不对称分布属于不对称分布表表1粪链球菌食物中毒潜伏期粪链球菌食物中毒潜伏期潜伏期(小时)潜伏期(小时)频数(频数(f)累计频数累计频数018186456312401031830133246139300139364143422145 图 1 粪链球菌食物中毒潜伏期分布 表表2某地某地144名正常成年男子名正常成年男子红细胞数胞数频数表数表组段段频数数f4.224.444.674.8165.0205.

6、2255.4245.6225.8166.026.256.46.61直方图直方图 图2144名正常男子红细胞计数的直方图 2、区间估计区间估计正常值正常值(参考值)范围(参考值)范围(p21p21)总体均数的可(置)信区间(总体均数的可(置)信区间(p69p69)正态分布(正态分布(normal distributionnormal distribution)可信区间(可信区间(confidence interval,confidence interval,CICI)注意注意:95%CI:95%CI与与95%95%正常值范围区别正常值范围区别(p70p70)单个样本(onesample)t 检验

7、配对资料(pairedsample)比较的t 检验两独立样本(twoindependentsample)均数比较的检验t 检验(当方差不齐时)3 3、假设检验、假设检验(hypothesis test)(hypothesis test)t t 检验检验 亦称students t 检验,应用t检验条件:n1)单因素两水平的定量效应指标n2)要求各组正态分布n3)要求方差齐性n如不满足条件,当满足正态性而方差不齐时可进行t检验,否则需采用变换或非参数方法作统计分析 t 检验检验t 检验的类型检验的类型n主要用于下列三种情况:主要用于下列三种情况:n(1)(1)样本均数与总体均数比较;样本均数与总体

8、均数比较;n(2)(2)配对数值变量资料的比较;配对数值变量资料的比较;n(3)(3)两样本均数的比较。两样本均数的比较。例例2 2 应用克矽平治疗矽肺患者应用克矽平治疗矽肺患者1010名,名,治疗前、后血红蛋白的含量如表治疗前、后血红蛋白的含量如表3 3所示,所示,问该药是否引起血红蛋白含量的变化?问该药是否引起血红蛋白含量的变化?表表3克矽平治疗矽肺患者治疗前后克矽平治疗矽肺患者治疗前后血红蛋白含量(血红蛋白含量(g/L)编号编号治疗前治疗前治疗后治疗后 1 113 140 2 150 138 3 150 140 4 135 135 5 128 135 6 100 120 7 110 14

9、7 8 120 114 9 130 138 10 123 120 表表3克矽平治疗矽肺患者血红蛋白量(克)克矽平治疗矽肺患者血红蛋白量(克)编号编号治疗前治疗前治疗后治疗后治疗前后差数治疗前后差数1 113 140 27 2 150 138 -12 3 150 140 -10 4 135 135 0 5 128 135 7 6 100 120 20 7 110 147 37 8 120 114 -6 9 130 138 8 10 123 120 -3 解:解:.建立检验假设,确定检验水准建立检验假设,确定检验水准 0:d=0,假设该药不影响血红蛋白的变化,假设该药不影响血红蛋白的变化,即治疗前

10、后总体差数为即治疗前后总体差数为0。1:d0,假设该药影响血红蛋白的变化,假设该药影响血红蛋白的变化,即治疗前后总体差数不为即治疗前后总体差数不为0。=0.05.计算检验统计量计算检验统计量值值(1)配对配对检验检验 3确定确定P值,做出统计推断值,做出统计推断自由度自由度=n-1=10-1=9 =n-1=10-1=9,查查t t 临界值(附表临界值(附表2 2)得:)得:0.8830.883t t=1.3071.383,=1.3071.383,0.200.20 0.400.40,按按=0.05=0.05水水准准不拒绝不拒绝H H0 0,差异无统计学意义。,差异无统计学意义。根根据据目目前前资

11、资料料尚尚不不能能认认为为克克矽矽平平对对血红蛋白含量有影响。血红蛋白含量有影响。()两独立样本均数比较的()两独立样本均数比较的检验检验(two-independent sample t-test)其中:其中:=n n1 1 +n n2 2-2-2例例3 3 某克山病高发区测得11例急性克山病患者与该地13名健康人的血磷值(mg%)如表4所示,判定两组均数差异有否统计学意义。表表4 4 急急性性克克山山病病患患者者与与健健康康者者的的血血磷磷测定定值(mg%mg%)患者编号患者编号 X X1 1 健康者编号健康者编号 X X2 2 1 4.73 1 2.34 2 6.40 2 2.50 3

12、2.60 3 1.98 4 3.24 4 1.67 5 6.53 5 1.98 6 5.18 6 3.60 7 5.58 7 2.33 8 3.73 8 3.73 9 4.32 9 4.57 10 5.78 10 4.82 11 3.73 11 5.78 12 4.17 13 4.14 解:解:.建立检验假设,确定检验水准建立检验假设,确定检验水准 0 0:1 1=2 2 ,即克山病患者与当地健,即克山病患者与当地健康者的血磷值的均数相同。康者的血磷值的均数相同。1 1:1 1 2 2 ,即克山病患者与当地,即克山病患者与当地健康者的血磷值的均数不相同。健康者的血磷值的均数不相同。=0.05.

13、=0.05.计算检验统计量计算检验统计量值值计算检验统计量计算检验统计量值值 3确定确定P值,做出统计推断值,做出统计推断自由度自由度=n n1 1+n n2 2-2=11+13-2=22-2=11+13-2=22,查查t t 临界值(附表临界值(附表2 2)得:)得:t t=2.547=2.547 t t0.05,220.05,22=2.047,=2.047,0.050.05,按按=0.05=0.05水水准准拒拒绝绝H H0 0,差差异有统计学意义。异有统计学意义。根根据据目目前前资资料料可可认认为为克克山山病病患患者者与与当当地地健健康康者者的的血血磷磷值值的的均均数数不不相相同同,克克山

14、山病病患者的血磷值高于当地健康者。患者的血磷值高于当地健康者。亦称方差分析,应用亦称方差分析,应用F F检验条件:检验条件:n1 1)单因素或多因素定量效应指标)单因素或多因素定量效应指标n2 2)要求各组正态分布)要求各组正态分布n3 3)要求方差齐性)要求方差齐性n如如不不满满足足条条件件,需需采采用用变变换换或或非非参参数数方方法作统计分析法作统计分析 F 检验检验(analysis of variance)ANOVAF检验的类型检验的类型n(1)(1)完全随机设计的方差分析完全随机设计的方差分析n(2)(2)配伍组设计的方差分析配伍组设计的方差分析三种三种“变异变异”之间的关系之间的关

15、系离均差平方和离均差平方和分解分解:(1)(1)总变异:总变异:所有观察值之间的变异所有观察值之间的变异(2)(2)处理间变异:处理因素随机误差处理间变异:处理因素随机误差(3)(3)区组间变异:区组因素随机误差区组间变异:区组因素随机误差(4)(4)误差变异:误差变异:随机误差随机误差变异分解变异分解4 4、线性相关与回归、线性相关与回归(linear correlation and regression)(linear correlation and regression)相关系数相关系数r r(correlation coefficient)(correlation coefficien

16、t)r r的假设检验的假设检验线性相关线性回归回归方程回归方程 (regression equation)(regression equation)其中其中a a为截距(为截距(interceptintercept););b b为回归系数(为回归系数(coefficient coefficient of regressionof regression)n有个模块:n1、统计描述n2、区间估计n3、假设检验n4、相关与一致性分析三、三、定性资料定性资料的基本统计方法的基本统计方法1 1、统计描述、统计描述率率(rate)比比(ratio)相对数相对数百分比百分比(构成比构成比)相对比相对比 分类

17、指标的统计量分类指标的统计量n率率 用来说明随机事件发生的频率或强度大小n构成比构成比 用来说明某一事物内部构成部分的比重 n相对比相对比 两个有关指标之比 n注意应用相对数的注意事项,率与构成比的区别、率的标准化等使用相对数应注意的问题n根据需要正确选择相对数。常见错误是以构成比代率。n计算观察单位数不等的几个率的平均率时,不能将几个率直接相加求平均率。n分母应当足够大。分母小于20时可靠性较差。如果分母太小,宜用绝对数表示n要注意其内部构成是否相同。若内部构成不同的资料,应先进行率的标准化后再比n根据样本数据计算的强度相对数,要考虑抽样误差的影响 使用相对数应注意的问题2、区间估计、区间估

18、计(interval estimation)总体率的可信区间(置信区间)总体率的可信区间(置信区间)(confidence bound/confidence interval,CI)四格表资料配对四格表行行列表列表3、假设检验、假设检验(hypothesis test)检验计数资料Chi-square test基本公式专用公式校正公式确切概率法差异性一致性基本公式专用公式确切概率法卡方检验方法卡方检验方法n卡方检验在不同的条件下有不同的计算方法,常用的有Pearson卡方、校正的卡方和Fisher精确概率n当四格表中n40,但有1Tij5时,应选用校正卡方n当四格表中出现n40或Tij1两种情

19、形之一时,需用Fisher的确切概率法检验的基本公式检验的基本公式A:实际频数(实际频数(actual frequency)T:理论频数(:理论频数(theoretical frequency)TRC:第第R 行行C 列的理论频数列的理论频数nR:相应的行合计,:相应的行合计,nC:相应的列合计:相应的列合计v:自由度自由度=(行数行数-1)(列数列数-1)2检验的适用条件检验的适用条件二、配对二、配对 检验检验配对检验专用公式为:若b+cP0.05。按a=0.05检验水准,不拒绝H0,差异无统计学意义,尚不能认为男性甲状腺机能减退症患者尺骨骨矿含量与正常人有差别。4 4、相关与一致性分析、相

20、关与一致性分析、相关与一致性分析、相关与一致性分析(correlation and consistency analysis(correlation and consistency analysis)n相关:可采用spearman秩相关n适用于等级资料直线直线相关与回归分析相关与回归分析 n应用条件应用条件:研究两个定量变量间的相互关系或依存关系lyl。l。l。l。l。ll。lllXl散点图线性相关线性相关n是用相关系数r来表示两个变量X,Y间的直线关系n相关系数r没有单位,在-1+1范围内波动n其绝对值愈接近1,两个变量间的直线相关愈密切,愈接近0,线性相关愈不密切直线回归直线回归n当两变量

21、间存在着性线关系时,不仅可当两变量间存在着性线关系时,不仅可以用相关系数以用相关系数r r表示变量表示变量Y Y与与X X线性相关的线性相关的密切程度,还可以用一个二元一次方程密切程度,还可以用一个二元一次方程来表示来表示回归方程的应用回归方程的应用-预测与估计预测与估计 n应用最小二乘法最小二乘法求回归方程系数n求出回归方程后,如果方程拟合度好(决定系数R),可根据X的值来求Y预测值 统计方法选择的思路统计方法选择的思路统计方法选择的四级思维统计方法选择的四级思维 资料类型资料类型 分布类型分布类型 设计类型设计类型 具具体条件体条件统计分析的两个方面统计分析的两个方面 统计描述(统计指标与

22、图表)统计描述(统计指标与图表)统计统计推断推断资资料料资资料料类类型型数数值值变变量量正态正态 非正态非正态X,G,S,X,G,S,参考值范参考值范围围,统计图表等统计图表等线性相关与回归线性相关与回归统计推断统计推断r计算与检验计算与检验,Y=a+bX均数可信区间估计均数可信区间估计假设检验假设检验:t:t与与z z检验检验 方差分析方差分析M,QM,QU UQQL L,参考值参考值范围范围,统计图表等统计图表等秩和检验秩和检验等级相关等级相关有序有序多分多分类变类变量量构成比,中位数构成比,中位数两分两分类,类,无序无序多分多分类类二项分布二项分布率,相对比,率,相对比,构成比构成比假设

23、检验假设检验两组率比较:两组率比较:z z检验与检验与卡方检验卡方检验多组率和两组或多组构多组率和两组或多组构成比比较:卡方检验成比比较:卡方检验配对两分类资料卡方检验配对两分类资料卡方检验参数估计参数估计正态近似法正态近似法直接查表法直接查表法统计方法的流程图统计方法的流程图统计方法应用条件和适用资料统计方法应用条件和适用资料集中趋势与离散趋势的统计指标集中趋势与离散趋势的统计指标t t检验与检验与z z检验检验方差分析方差分析 2 2检验检验非参数检验非参数检验线性相关与回归线性相关与回归集中趋势与离散趋势统计指标集中趋势与离散趋势统计指标 集中趋势集中趋势 离散趋势离散趋势正态分布正态分

24、布 均数均数 方差、标准差方差、标准差对数正态对数正态 几何均数几何均数 几何标准差几何标准差偏态等偏态等 中位数中位数 四分位数间距四分位数间距变异系数:在两组或多组资料变异度比较变异系数:在两组或多组资料变异度比较组间单位不同组间单位不同组间均数相差较大组间均数相差较大t t检验与检验与z z检验的应用条件检验的应用条件两组数值变量资料比较;两组数值变量资料比较;小样本时用小样本时用t t检验,要求资料为随机样本检验,要求资料为随机样本并服从正态分布;并服从正态分布;大样本时用大样本时用z z检验,仍要求资料为随机样检验,仍要求资料为随机样本,但正态性条件可以放宽;本,但正态性条件可以放宽

25、;在两样本均数比较的在两样本均数比较的t t和和z z检验中,要求两检验中,要求两组总体方差相等,即方差齐性;组总体方差相等,即方差齐性;组间要求具有均衡可比性。组间要求具有均衡可比性。方差分析的应用条件方差分析的应用条件n多组定量资料的比较多组定量资料的比较n观察值为独立随机样本,并服从正态分观察值为独立随机样本,并服从正态分布;布;n样本较大时正态性条件可以放宽;样本较大时正态性条件可以放宽;n方差齐性方差齐性n组间可比性组间可比性 2检验的适用资料检验的适用资料两组样本率的比较;两组样本率的比较;多组样本率的比较;多组样本率的比较;两组或多组构成比的比较;两组或多组构成比的比较;配对设计

26、下两分类资料检验。配对设计下两分类资料检验。非参数检验的适用资料非参数检验的适用资料n有序多分类资料(双向有序,且分类属有序多分类资料(双向有序,且分类属性相同);性相同);n极度偏态分布;极度偏态分布;n分布不规则和未知分布资料;分布不规则和未知分布资料;n数据变异较大,方差不齐数据变异较大,方差不齐线性相关与回归的应用条件线性相关与回归的应用条件散点图有线性趋势;专业上要求分析两变量间关系密切程度 和变化方向,通过一个变量预测或控制另一变量;两变量服从双变量正态分布,或X可以精确测量的,Y服从正态分布。几个基本概念几个基本概念n样本与总体n频率(样本)与概率(总体)n资料(变量)类型n相对

27、数指标:构成比、率、相对比n统计工作步骤n假设检验的两类错误几个容易混淆的基本概念几个容易混淆的基本概念1 1、抽样误差与标准误、抽样误差与标准误抽样研究才有抽样误差抽样研究才有抽样误差抽样误差的概念抽样误差的概念标准误是衡量抽样误差大小的指标标准误是衡量抽样误差大小的指标2 2、标准差与标准误关系、标准差与标准误关系联系:离散度指标,计算上的联系联系:离散度指标,计算上的联系区别:描述对象不同,意义与应用不同区别:描述对象不同,意义与应用不同 与与n n的关系不同(的关系不同(p67p67)几个容易混淆的基本概念几个容易混淆的基本概念3 3、参考值范围与可信区间关系、参考值范围与可信区间关系

28、(p70)(p70)联系:均为一个数值范围联系:均为一个数值范围区别:意义不同,区别:意义不同,与与 同一资料两范围的不同同一资料两范围的不同4 4、假设检验的意义、假设检验的意义 是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同(不能推断差别大小)几个容易混淆的基本概念几个容易混淆的基本概念5 5、检验假设与检验结论、检验假设与检验结论(p72(p72、73)73)n无效假设与备择假设(单双侧);无效假设与备择假设(单双侧);n是对总体所作,是对总体所作,H H0 0假设总体相同或两者假设总体相同或两者无关,检验方法建立于此;无关,检验方

29、法建立于此;n对检验方法的对检验方法的H H0 0与与H H1 1作总结;作总结;n检验结论有统计结论与专业结论;检验结论有统计结论与专业结论;n是针对检验假设(总体)而作的。是针对检验假设(总体)而作的。几个容易混淆的基本概念几个容易混淆的基本概念6 6、检验水准、检验水准 与与P P值(值(p72p72)n 是预先确定的,是预先确定的,表示在拒绝表示在拒绝H H0 0时可能犯错误的最大时可能犯错误的最大概率,属于第一类错误;概率,属于第一类错误;nP P值是指如果值是指如果H H0 0成立,则抽到现有样本统计量及更极端成立,则抽到现有样本统计量及更极端值(与值(与H H0 0 相差更大)的

30、可能性,也可表示为在拒绝相差更大)的可能性,也可表示为在拒绝H H0 0时可能犯错误的实际概率大小;时可能犯错误的实际概率大小;n 与与P P值间的关系:值间的关系:P P ,接受接受H H0 0,差异无统计学意义;,差异无统计学意义;P P ,拒绝,拒绝H H0 0,接受,接受H H1 1,差异有统计学意义,差异有统计学意义几个容易混淆的基本概念几个容易混淆的基本概念7 7、多组比较问题、多组比较问题卡方检验与秩和检验中有多组比较问题卡方检验与秩和检验中有多组比较问题检验思路是先作总的比较,再作两两组检验思路是先作总的比较,再作两两组间比较;注意间比较;注意H H1 1、几个容易混淆的基本概

31、念几个容易混淆的基本概念8 8、线性相关与线性相关系数、线性相关与线性相关系数n前提是散点图有线性趋势;前提是散点图有线性趋势;n两变量线性关系密切程度和变化方向;两变量线性关系密切程度和变化方向;n检验的意义与检验的意义与 r r值的意义。值的意义。9 9、线性回归与线性回归系数、线性回归与线性回归系数n前提是散点图有线性趋势;前提是散点图有线性趋势;n配线求直线回归方程;配线求直线回归方程;n线性回归系数线性回归系数b b意义。意义。几个容易混淆的基本概念几个容易混淆的基本概念10、率、构成比与相对比(相对数、率、构成比与相对比(相对数)率与比不能相混淆总率与平均率的概念率的标准化法11、

32、方差分析中变异的拆分、方差分析中变异的拆分SS总=SS组间+SS组内 总=组间+组内SS总=SS处理+SS区组+SS误差 总=处理+区组+误差几个容易混淆的基本概念几个容易混淆的基本概念1212、完全随机设计与配对设计、完全随机设计与配对设计n完全随机设计是将研究对象随机分为两完全随机设计是将研究对象随机分为两组或多组;组或多组;n配对设计是将研究对象按一定条件配成配对设计是将研究对象按一定条件配成对子,再随机分到两组,随机区组设计对子,再随机分到两组,随机区组设计为多组;为多组;n组间均衡性与统计方法不同;组间均衡性与统计方法不同;n应用上不同。应用上不同。关于考试n 理论考试时间:2012年1月6日 下午 2:00-4:00n方式:n各自带计算器,不可考场借用1.总成绩100分:上机(20分)+理论(80分)2.题型与分值:判断题(15分)、填空题(20分)选择题(40分)、简答与计算题(25分)计算题要求:1)统计分析方法 2)给出整理的统计结果表 3)结果解释及结论 关于考试

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服