1、医学统计学医学统计学(第三版)(第三版)预防医学教研部预防医学教研部全贞玉全贞玉 某研究者探讨银屑病的发病与血型的关某研究者探讨银屑病的发病与血型的关系,对系,对64例银屑病患者的血型进行观察,例银屑病患者的血型进行观察,结果结果O型型30例,占例,占46.88%,居首位;,居首位;A型型和和B型均为型均为17例,各占例,各占26.56%;AB型型0例,例,居末。由此,研究者认为银屑病的发病与居末。由此,研究者认为银屑病的发病与血型有明显关系,血型有明显关系,O型血的人最容易患银型血的人最容易患银屑病。屑病。1)该问题存在什么缺陷?该问题存在什么缺陷?2)研究结果是否可靠?研究结果是否可靠?“
2、非常痛心地看到,因为数据分析的缺陷和错误,非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险那么多好的生物研究工作面临着被葬送的危险”。-F.YatesF.Yates,M.J.R.HealyM.J.R.Healy 为为什什么么要要学学医医学学统统计计学学?统计知识统计知识的运用的运用撰写论文:报告自己观撰写论文:报告自己观察或实验的研究结果察或实验的研究结果。阅读论文:吸收新知识,阅读论文:吸收新知识,了解学术进展。了解学术进展。1996年,有机构对申报科技成果的年,有机构对申报科技成果的4586篇科研论文分篇科研论文分析,统计方法使用率为析,统计方法使用率为7
3、6%。医学论文中统计运用错误,除了影响论文的科学性,医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。还可能导致严重的伦理学问题。60年年代代到到80年年代代,国国外外医医学学杂杂志志调调查查表表明明:20%72%的的论论文文有有统计错误。统计错误。1984年年对对中中华华医医学学杂杂志志、中中华华内内科科杂杂志志、中中华华外外科科杂杂志志、中中华华妇妇产产科科杂杂志志、中中华华儿儿科科杂杂志志595篇篇论论文文的的调调查查结结果为:果为:相相对对数数误误用用占占 11.2%,抽抽样样方方法法误误用用占占15.9%,统统计计图图表表误误用用占占11.7%1996年年对对
4、4586篇篇论论文文统统计计(中中华华医医学学会会系系列列杂杂志志占占6.9%),数数据分析方法误用达据分析方法误用达55.7%。2001年年中中华华预预防防医医学学杂杂志志:中中华华医医学学会会系系列列杂杂志志误误用用约约54%(1995)。)。为为什什么么要要学学医医学学统统计计学学?医学统计学的主要内容医学统计学的主要内容 医学统计学的主要内容包括医学研究中的医学统计学的主要内容包括医学研究中的统计设计统计设计以及以及统计分析统计分析方法的应用。方法的应用。一、统计研究设计一、统计研究设计 设计的内容设计的内容:资料的收集、整理和分析全过程总的设想资料的收集、整理和分析全过程总的设想和安
5、排。和安排。二、常用的基本统计方法二、常用的基本统计方法1.1.统计描述:统计列表和制图,定量资料和分统计描述:统计列表和制图,定量资料和分 类资料统计描述。类资料统计描述。2.2.统计推断:总体指标的估计、统计推断:总体指标的估计、t t检验、检验、u u检验、检验、方差分析、方差分析、2 2检验和秩和检验检验和秩和检验。3 3.直线回归和相关直线回归和相关:Logistic:Logistic回归模型,回归模型,MetaMeta分分 析,生存分析析,生存分析第一章第一章 绪论绪论统计学:研究数据的收集、整理和分析的科统计学:研究数据的收集、整理和分析的科学。学。医学统计学:运用统计学的原理和
6、方法,研医学统计学:运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析究医学科研中有关数据的收集、整理和分析的应用科学。的应用科学。卫生统计学:医学与卫生学领域的有关研究,卫生统计学:医学与卫生学领域的有关研究,更侧重于医学与卫生学的社会方面(健康状更侧重于医学与卫生学的社会方面(健康状况、卫生服务统计等)。况、卫生服务统计等)。生物统计学:整个生物学范畴的有关研究。生物统计学:整个生物学范畴的有关研究。第一节第一节 统计学的几个基本概念统计学的几个基本概念1.总体总体:根据研究目的确定的根据研究目的确定的同质观察单位同质观察单位的的 全体称为总体。全体称为总体。2008年延吉市
7、年延吉市7岁男童的体重岁男童的体重 2008年延吉市朝鲜族成人男性的血压年延吉市朝鲜族成人男性的血压 延边大学女研究生的身高延边大学女研究生的身高 研究某药治疗高血压患者的疗效研究某药治疗高血压患者的疗效一、总体与样本总体与样本(population and sample)分类:分类:1 1)有限总体)有限总体:理论上说,观察单位的数量理论上说,观察单位的数量是可知的、有限的。是可知的、有限的。有明确的有明确的空间、时间、人群空间、时间、人群范围范围 2 2)无限总体:)无限总体:没有时间和地点的限制没有时间和地点的限制,观,观察单位总数量是不可知的。察单位总数量是不可知的。药物治疗药物治疗-
8、高血压高血压-该药物治疗的所有高血压患者该药物治疗的所有高血压患者 治疗结果治疗结果 2.样本样本:从总体中随机抽:从总体中随机抽取部分观察单位,其实测取部分观察单位,其实测值的集合。值的集合。为了保证样本的可靠为了保证样本的可靠性和代表性,需要采用性和代表性,需要采用随随机的方法抽取样本机的方法抽取样本(在总(在总体中每个个体具有相同的体中每个个体具有相同的机会被抽到)。机会被抽到)。1)抽样方法:完全随机抽样、机械抽样、整)抽样方法:完全随机抽样、机械抽样、整 群抽样、分层抽样等群抽样、分层抽样等2)样本含量的估计)样本含量的估计同质和变异同质和变异(homogeneity and var
9、iation)1.同质同质:指观察单位或观察指标受共同因素制指观察单位或观察指标受共同因素制 约的部分。约的部分。血压血压-年龄、运动情绪、测定时间、环境温度年龄、运动情绪、测定时间、环境温度2.变异变异:在同质的基础上各观察单位(或在同质的基础上各观察单位(或个体)个体)之间的差异。之间的差异。相同条件、同一批测相同条件、同一批测-同性别的不同人血压值同性别的不同人血压值总体总体样本样本抽取部分观察单位抽取部分观察单位统计量统计量统计量统计量参参参参 数数数数推断推断1.参数:根据总体个体值参数:根据总体个体值计算出来的描述计算出来的描述总体特总体特征征的指标。用希腊字母的指标。用希腊字母表
10、示。如,表示。如,表示总体均表示总体均数,数,表示总体标准差,表示总体标准差,表示总体率表示总体率。2.统计量统计量:描述描述样本数量样本数量特征特征的统计指标。用拉的统计指标。用拉丁字母表示。例如,丁字母表示。例如,x 表表示样本均数,示样本均数,s 表示样本表示样本标准差,标准差,p表示样本率。表示样本率。总体参数是固定不变的,样本统计量随样本不同总体参数是固定不变的,样本统计量随样本不同而不同。而不同。参数和统计量参数和统计量1.变量变量:观测单位的某个特征,又称为观察指标。观测单位的某个特征,又称为观察指标。性别、年龄、身高、体重性别、年龄、身高、体重2.变量值变量值:变量的测得值或观
11、察值叫变量值,也变量的测得值或观察值叫变量值,也 叫做资料。叫做资料。3.资料类型:计量资料、计数资料、等级资料资料类型:计量资料、计数资料、等级资料二二.变量与资料变量与资料(variable and data)某医师研究中西药治疗某医师研究中西药治疗5岁儿童肺炎疗效,在进行简岁儿童肺炎疗效,在进行简单实验设计后,随机抽取单实验设计后,随机抽取5岁儿童肺炎患者岁儿童肺炎患者44人作为人作为研究对象研究对象,用随机方法将研究对象随机分成两组,用随机方法将研究对象随机分成两组,分别采用中药和西药进行治疗,两组除用药不同外,分别采用中药和西药进行治疗,两组除用药不同外,其他条件尽可能相同;观察时采
12、用盲法观察。中药组其他条件尽可能相同;观察时采用盲法观察。中药组治疗治疗22人,治愈人,治愈19人,治愈率为人,治愈率为86.4%;西药组治;西药组治疗疗22人,治愈人,治愈14人,治愈率为人,治愈率为63.6%。该医师认为。该医师认为中药治疗中药治疗5岁儿童肺炎的疗效高于西药。该医师将治岁儿童肺炎的疗效高于西药。该医师将治疗整理撰写成论文,投稿到某杂志编辑部,没有几天疗整理撰写成论文,投稿到某杂志编辑部,没有几天,该医师接到该杂志编辑部的回信:请重新做统计处,该医师接到该杂志编辑部的回信:请重新做统计处理。理。1)何种资料类型?)何种资料类型?2)何种设计方案?)何种设计方案?3)何种统计方
13、法?)何种统计方法?1.计量资料(定量资料)计量资料(定量资料)测定每个观察单位某项指标量的大小,所得测定每个观察单位某项指标量的大小,所得的资料的资料。通常具有一定的通常具有一定的度量衡单位度量衡单位。特征:特征:1)一般有度量衡单位)一般有度量衡单位 2)一般用仪器测得)一般用仪器测得 3)连续型(范围内)或离散型(取整数)连续型(范围内)或离散型(取整数)2.计数资料(定性资料、无序分类变量资料)计数资料(定性资料、无序分类变量资料)将观察单位按某种将观察单位按某种属性或类别属性或类别分组计数,分组计数,分组汇总各组观察单位数后而得到的资料。分组汇总各组观察单位数后而得到的资料。特征:特
14、征:1)用计数的方式得来;用计数的方式得来;2)无度量衡等单位;)无度量衡等单位;3)不是连续性资料)不是连续性资料分类:分类:1)二分类二分类 2)多分类)多分类:血型血型3.等级资料(半定量资料)等级资料(半定量资料)将观察单位按某种属性的不同程度分成等级将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得后分组计数,分类汇总各组观察单位数后而得到的资料。到的资料。治疗效果:治愈、显效、好转、无效治疗效果:治愈、显效、好转、无效 血清反应强度:血清反应强度:-、+、+、+、+百分比或百分率的资料有些是定性资料,有百分比或百分率的资料有些是定性资料,有些是定量资料。
15、些是定量资料。关键:关键:定性资料:每一个具体的取值是由定性资料:每一个具体的取值是由“观察观察单位个数单位个数”计算得到的,计算得到的,定量资料:每一个观察单位自身的观测结定量资料:每一个观察单位自身的观测结果计算得到的。果计算得到的。小儿皮肤血管瘤雌、孕激素受体的研究小儿皮肤血管瘤雌、孕激素受体的研究1、研究人员测量了、研究人员测量了100例患者外周血肝功能例患者外周血肝功能指标(指标(GOT、GTP等)。等)。2、某医院、某医院2009年平均住院天数。年平均住院天数。3、某医院、某医院2009年消化内科、呼吸内科、循环年消化内科、呼吸内科、循环内科、泌尿内科住院患者分别为内科、泌尿内科住
16、院患者分别为200、250、300、120名。名。4、研究人群分为营养不良、营养正常、营养、研究人群分为营养不良、营养正常、营养过剩三个部分过剩三个部分。编号编号年龄年龄身高身高体重体重住院天数住院天数性别性别职业职业文化程度文化程度治疗结果治疗结果00010001272716516571.571.55 5男男商业商业中学中学治愈治愈00020002222216016074.074.05 5女女农业农业小学小学治愈治愈00030003252515815868.068.06 6男男管理员管理员大学大学好转好转00040004232316116169.069.05 5男男农业农业中学中学无效无效0
17、0050005252515915962.062.01111男男商业商业中学中学治愈治愈00060006272715715768.068.02 2女女无无小学小学显效显效00070007202015815866.066.04 4女女干部干部大学大学治愈治愈00080008242415815870.570.53 3男男无无中学中学好转好转00090009292915415457.057.07 7男男干部干部中学中学无效无效变量转化变量转化 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压8
18、 正常血压正常血压 12 轻度高血压轻度高血压15 中度高血压中度高血压17 重度高血压重度高血压定量资料定量资料等等级级资资料料计数资料计数资料 老研式活動能力指標老研式活動能力指標 調査内容加点方法調査内容加点方法10.10.10.10.友人宅訪問友人宅訪問友人宅訪問友人宅訪問11.11.11.11.家族友人相談乗家族友人相談乗家族友人相談乗家族友人相談乗12.12.12.12.病人見舞病人見舞病人見舞病人見舞13.13.13.13.若人自分話掛若人自分話掛若人自分話掛若人自分話掛社会的社会的社会的社会的役割役割役割役割6.6.6.6.年金書籍記入年金書籍記入年金書籍記入年金書籍記入7.7
19、.7.7.新聞読新聞読新聞読新聞読8.8.8.8.本雑誌読本雑誌読本雑誌読本雑誌読9.9.9.9.健康記事番組関心健康記事番組関心健康記事番組関心健康記事番組関心知的知的知的知的能動性能動性能動性能動性0点点 1点点1.1.1.1.電車使単独外出電車使単独外出電車使単独外出電車使単独外出2.2.2.2.日用品買物日用品買物日用品買物日用品買物3.3.3.3.自分食事用意自分食事用意自分食事用意自分食事用意4.4.4.4.請求書支払請求書支払請求書支払請求書支払5.5.5.5.預貯金出入預貯金出入預貯金出入預貯金出入手段的手段的手段的手段的自立自立自立自立老老老老研研研研式式式式活活活活動動動動
20、能能能能力力力力指指指指標標標標13131313点点点点合計合計合計合計回答別加点方法回答別加点方法項目項目分類分類变量或资料的类型及其相应的分析方法变量或资料的类型及其相应的分析方法变量类型变量类型变量值表现变量值表现资料类型资料类型例子例子可选分析方法可选分析方法定量资料定量资料离散型变量离散型变量不连续的数值不连续的数值计量资料计量资料出生孩子数、死出生孩子数、死亡动物数等亡动物数等t t检验、方差分检验、方差分析、相关与回归析、相关与回归分析等分析等连续性变量连续性变量连续的数值连续的数值计量资料计量资料身高、体重、血身高、体重、血红蛋白等红蛋白等t检验、方差分检验、方差分析、相关与回
21、归析、相关与回归分析等分析等定性资料定性资料二分类二分类定性对立的两类定性对立的两类计数资料计数资料性别性别卡方检验卡方检验多分类多分类类间无程度差异类间无程度差异计数资料计数资料血型、职业等血型、职业等卡方检验卡方检验 等级资料等级资料类间有程度差异类间有程度差异等级资料等级资料文化程度、临床文化程度、临床治疗效果治疗效果秩和检验、秩和检验、RiditRidit分析分析 误差是指实测值与真值之差,即样本指标误差是指实测值与真值之差,即样本指标与总体指标之差。与总体指标之差。1)随机误差)随机误差 2)非随机误差:系统误差、非系统误差)非随机误差:系统误差、非系统误差1.随机误差:随机误差:是
22、一类不恒定的、随机变化的误是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。差,由多种尚无法控制的因素引起。实验数据实验数据 特点:没有倾向性,在大量重复测量中,具特点:没有倾向性,在大量重复测量中,具有统计规律。(多次测量计算平均值可以减小有统计规律。(多次测量计算平均值可以减小甚至消除随机测量误差。)甚至消除随机测量误差。)三、误差(三、误差(errorerror)2.系统误差系统误差 实验过程中产生的误差,它的值或恒定不实验过程中产生的误差,它的值或恒定不变或遵循一定的变化规律,其产生原因往往是变或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的。可知的或可以掌握的。周密
23、的设计和严格的技术措施加以消除或周密的设计和严格的技术措施加以消除或控制控制3.非系统误差非系统误差 在实验过程中由研究者偶然失误而造成的在实验过程中由研究者偶然失误而造成的误差。误差。仪器失灵、抄错数字、写错单位等仪器失灵、抄错数字、写错单位等1.频数频数:指落在各类别中的数据个数指落在各类别中的数据个数2.频率频率:指各类别的数据个数占数据总个数的指各类别的数据个数占数据总个数的 比例比例值值 投掷投掷硬币硬币3.随机事件随机事件:在一定条件下某一现象可能发生在一定条件下某一现象可能发生 又可能不发生的事件。又可能不发生的事件。治愈、好转、无效、死亡治愈、好转、无效、死亡四、频率和概率四、
24、频率和概率(frequency and probability)4.概率概率:描述随机事件发生可能性大小的数值。:描述随机事件发生可能性大小的数值。用大写的用大写的P 表示;取值表示;取值0,1。*概率越接近概率越接近0,表示事件发生的可能性越小;,表示事件发生的可能性越小;概率越接近概率越接近1,表示事件发生的可能性越大。,表示事件发生的可能性越大。*习惯上把习惯上把P0.05或或 P0.01为为小概率事件小概率事件,表,表示某事件发生的可能性很小。示某事件发生的可能性很小。第二节第二节医学统计工作的医学统计工作的基本步骤基本步骤1.研究设计研究设计2.收集资料收集资料3.整理资料整理资料4
25、.分析资料分析资料5.撰写论文撰写论文 研究结果的好坏取决于研究设计的好坏,研究结果的好坏取决于研究设计的好坏,设计是统计工作的基础和关键,决定着整个设计是统计工作的基础和关键,决定着整个统计工作的成败。统计工作的成败。一定的设计决定了一定的数据分析方法,一定的设计决定了一定的数据分析方法,不同设计下获得的资料常用不同的统计方法不同设计下获得的资料常用不同的统计方法来分析。来分析。一一.研究设计研究设计 设设 专业设计专业设计 计计 统计设计统计设计 观察性研究设计观察性研究设计医学科研设计医学科研设计 实验设计实验设计 临床试验设计临床试验设计 统计设计的内容包括对资料的收集、整理和统计设计
26、的内容包括对资料的收集、整理和分析全过程的设想与安排分析全过程的设想与安排研究设计的构思中,关键问题:研究设计的构思中,关键问题:1.如何进行抽样?如何安排设计所规定的如何进行抽样?如何安排设计所规定的干预措施干预措施或处理或处理?2.要达到研究目的应抽取多少个观察单位要达到研究目的应抽取多少个观察单位?3.如何在诸多的影响因素中,分离出研究如何在诸多的影响因素中,分离出研究因素对结果的效应?因素对结果的效应?就是如何设置对照就是如何设置对照 对统计资料的收集要做到完整、准确、及对统计资料的收集要做到完整、准确、及时、可靠。时、可靠。资料来源:资料来源:1)统计报表:法定传染病报告、职业病)统
27、计报表:法定传染病报告、职业病报告、医院工作报表等报告、医院工作报表等 2)经常性工作记录:健康检查记录、住)经常性工作记录:健康检查记录、住院病历等院病历等 3)专题调查或实验研究:)专题调查或实验研究:4)统计年鉴和统计数据专辑)统计年鉴和统计数据专辑二、收集资料二、收集资料 将原始数据净化、系统化和条理化,以便将原始数据净化、系统化和条理化,以便为下一步计算和分析打好基础的过程。为下一步计算和分析打好基础的过程。1.净化:原始数据的清理、检查、核对和净化:原始数据的清理、检查、核对和纠正错误等纠正错误等 2.系统化和条理化:根据研究目的,将原系统化和条理化:根据研究目的,将原始数据合理分组并归纳汇总等。始数据合理分组并归纳汇总等。三、三、整理资料整理资料统计分析统计分析 1.统计描述:统计描述:选用恰当的统计指标,选用合适的统计表与选用恰当的统计指标,选用合适的统计表与统计图,对资料的数量特征及其分布规律进行测统计图,对资料的数量特征及其分布规律进行测定和描述。定和描述。2.统计推断:统计推断:根据已知的样本信息来推断未知的总体。根据已知的样本信息来推断未知的总体。参数估计和假设检验参数估计和假设检验四、分析资料四、分析资料谢谢谢谢