1、 1第一章第一章 绪论绪论一、什么是统计学一、什么是统计学二、统计工作的步骤二、统计工作的步骤 三、统计资料的类型三、统计资料的类型四、统计学的几个基本概念四、统计学的几个基本概念 五、常用医学统计软件介绍五、常用医学统计软件介绍2统计思维进化与概念统计思维进化与概念概念 StatisticsA science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”“The science and art of dealing with variation
2、 in data through collection,classification,and analysis in such a way as to obtain reliable results”(A Dictionary of Epidemiology)3统计思维进化与概念统计思维进化与概念 统计学:是一门处理数据中变异性的科学与艺统计学:是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。的是求得可靠的结果。医疗统计学:是一门应用统计学方法和原理研医疗统计学:是一门应用统计学方法和原理研究医疗卫生服务数
3、据的收集、分析、解释和表达究医疗卫生服务数据的收集、分析、解释和表达的学科。的学科。4统计思维进化与概念统计思维进化与概念统计思维的进化(发展简史)统计思维的进化(发展简史)时期科学家发明与应用1749-1827Pierre-Simon Laplace 研究概率(probability)。1745-1826Philippe Pinel应用概率研究疗效1787-1872Louis 临床疗效,对照1822-1911 Francis Galton 分布与变异5统计思维进化与概念统计思维进化与概念时期时期科学家科学家发明与应用发明与应用1857-1936Karl Pearson现代统计学之父现代统计学
4、之父相关分析,相关分析,x21880-1949Major Greenwood抽样误差抽样误差 1879-1940Raymond Pearl医院统计,生物统医院统计,生物统计计(1890-1962 Ronald A.Fisher现代统计学奠基现代统计学奠基误差理论极大似然误差理论极大似然实验设计随机实验设计随机化做实验,化做实验,F检验检验 1897-1991 Hill 爵士爵士现代临床试验现代临床试验(clinical trial)6医学统计思维进化与概念医学统计思维进化与概念一些重要的临床试验 英国临床医学研究理事会(1946年):链霉素治疗肺结核的临床试验链霉素治疗肺结核的临床试验(随机化
5、分组、方法有链霉素加卧床休息或单纯卧床休息。独立评价X光片子结果,链霉素组病人的生存和两方面的放射学改善都有较好)7医学统计思维进化与概念医学统计思维进化与概念 美国(1954年):评价索尔克评价索尔克(SalkSalk)疫苗预防小儿麻痹或死于)疫苗预防小儿麻痹或死于脊髓灰质炎的效果脊髓灰质炎的效果(干预试验、现(干预试验、现场试验;样本:场试验;样本:180万儿童;花费:500多万美元。随机化分组,最后约有1/4参与者得到了随机化。这项试验最终肯定了索尔克疫苗的效果)8医学统计思维进化与概念医学统计思维进化与概念 德国(1960年代初),药物酞胺哌啶酮药物酞胺哌啶酮(Thalidomide,
6、又称反应停)事件(,又称反应停)事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过病例对照研究和干预研究发现危险因素是反应停)。反应停)。美国从这一事件促使有关法律文件的产生,FDA为临床试验规定了一整套制度,使之成为确定药物疗效验的标准方法。9一一、什么是统计学什么是统计学世界是物质的、物质是运动、运动是有规律的,世界是物质的、物质是运动、运动是有规律的,对规律的认识依靠一定的工具和手段对规律的认识依靠一定的工具和手段-哲学和哲学和辩证法。辩证法。科技的迅速发展,信息的大量产生。数据作为科技的迅速发展,信息的大量产生。数据作为信息的主要载体广泛存在。面对纷乱复杂的数信息的主要载体广泛存在。面
7、对纷乱复杂的数据世界我们该如何去认识,这就要借助统计学据世界我们该如何去认识,这就要借助统计学这个工具,在混沌中发现规律。这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。统计学就是研究数据及其存在规律的科学。10关于统计学关于统计学统计数字无处不在,但是真伪难辨。统计数字无处不在,但是真伪难辨。工、农、商;就业、失业(下岗)、交通事故等工、农、商;就业、失业(下岗)、交通事故等等。等。报纸、电视中经常可见医学研究报告,但往往只报纸、电视中经常可见医学研究报告,但往往只有结果,其研究的有效性不得而知。有结果,其研究的有效性不得而知。有些有些“研究研究”结论根本就是无稽之谈(纯属
8、个人意结论根本就是无稽之谈(纯属个人意见)。见)。例:胶囊使您的宝宝聪明例:胶囊使您的宝宝聪明真伪难辨的研究报道充斥着我们的日常生活,让真伪难辨的研究报道充斥着我们的日常生活,让人无所适从。人无所适从。11卫生统计学卫生统计学卫生统计学卫生统计学是运用概率论和数理统计的原理及是运用概率论和数理统计的原理及方法,研究居民健康状况以及卫生服务领域中方法,研究居民健康状况以及卫生服务领域中数据的收集、整理与分析的科学。数据的收集、整理与分析的科学。它是认识和分析医学现象中的数量特征的重要它是认识和分析医学现象中的数量特征的重要工具。工具。它是进行科学研究必须具备的素质之一。它是进行科学研究必须具备的
9、素质之一。12工作生活中常见的统计学问题工作生活中常见的统计学问题如何判断药物的疗效?如何判断药物的疗效?(假设检验假设检验)明天是否下雨?体育彩票能否中奖?明天是否下雨?体育彩票能否中奖?(概率论概率论)子女为什么象父母,其强度有多大?子女为什么象父母,其强度有多大?(相关与回归相关与回归)美国的民意测验是如何进行的?美国的民意测验是如何进行的?(设计设计,抽样抽样)中国的市场调查的可信性有多大?中国的市场调查的可信性有多大?(现现场调查场调查)统计学是对令人困惑费解的数字问题统计学是对令人困惑费解的数字问题做出设想的艺术。做出设想的艺术。13医学研究中的统计学医学研究中的统计学统计学渗透在
10、医学实践中。例如:诊断和选择治疗方统计学渗透在医学实践中。例如:诊断和选择治疗方案。从某种意义上讲,我们每个人天生就是统计学家。案。从某种意义上讲,我们每个人天生就是统计学家。但是,这些判断究竟有多大把握说它们是正确的呢?但是,这些判断究竟有多大把握说它们是正确的呢?在非典型性肺炎还不为人所熟悉时,有多少人把它当在非典型性肺炎还不为人所熟悉时,有多少人把它当作一般肺炎进行治疗的呢?作一般肺炎进行治疗的呢?医学实践需要尽量减少不确定性,医学实践需要统计医学实践需要尽量减少不确定性,医学实践需要统计学。学。为医学研究在分析、定量评估、预测方面提供有效的、为医学研究在分析、定量评估、预测方面提供有效
11、的、科学的手段。科学的手段。14为什么要学统计学?为什么要学统计学?1.1.采用统计学方法,发现生物医学领域采用统计学方法,发现生物医学领域不确定现象不确定现象背后隐藏的规率背后隐藏的规率 变异变异使得实验或观察的结果具有使得实验或观察的结果具有不确定性不确定性,如每个人的身高、,如每个人的身高、体重、血压等各有不同。体重、血压等各有不同。变异(变异(variation)是社会和生物医学中的是社会和生物医学中的普遍现象。普遍现象。15 例如:某研究者发现精神科护士的出勤例如:某研究者发现精神科护士的出勤率和妇产科护士的出勤率各不相同,那率和妇产科护士的出勤率各不相同,那么两科室出勤率真的不同吗
12、?么两科室出勤率真的不同吗?16 “阳性阳性”结果是否是虚假联系?结果是否是虚假联系?一批感冒患者用某感冒药治疗一批感冒患者用某感冒药治疗1周后,治愈率为周后,治愈率为90%,能,能否说该感冒药十分有效?否说该感冒药十分有效?“阴性阴性”结果是否是真阴性?结果是否是真阴性?有人曾对发表在有人曾对发表在Lancet,N Engl J Med,JAMA等著名医学等著名医学杂志上的杂志上的71篇阴性结果的论文作过分析,发现其中有篇阴性结果的论文作过分析,发现其中有62篇篇(93%)可能是由于)可能是由于样本含量样本含量不足造成的假阴性。不足造成的假阴性。2.用统计学思维方式考虑有关医学研究中的问题用
13、统计学思维方式考虑有关医学研究中的问题 17医学统计学的内容医学统计学的内容基本原理和方法基本原理和方法 研究设计、统计描述、统计推断、回归与研究设计、统计描述、统计推断、回归与 相关、多元统计分析等相关、多元统计分析等健康统计健康统计 医学人口统计、疾病统计、寿命表、生存医学人口统计、疾病统计、寿命表、生存分析、生长发育统计等分析、生长发育统计等医疗(卫生)服务统计医疗(卫生)服务统计 卫生资源利用、医疗保健体制改革等卫生资源利用、医疗保健体制改革等18二、统计工作的步骤二、统计工作的步骤一、研究设计(一、研究设计(design)二、收集资料(二、收集资料(collection of dat
14、a)三、整理资料(三、整理资料(sorting data)四、分析资料(四、分析资料(analysis of data)19 研究的目的研究的目的研究的研究的设计设计收集收集资料资料整理整理资料资料分析分析资料资料201.1.研究设计研究设计(research design)(research design)设计 专业设计 统计设计 统计设计 调查设计 实验设计制定计划,对整个过程进行安排。是整个工作的关键。制定计划,对整个过程进行安排。是整个工作的关键。如何进行设计?举例。背景如何进行设计?举例。背景-目的目的-方法方法-内容内容-经费预算经费预算 研究结果的好坏取决于设计研究结果的好坏取决
15、于设计统计工作的基本步骤统计工作的基本步骤21统计工作的基本步骤统计工作的基本步骤2.2.收集资料收集资料(data collection)(data collection)目的目的:取得完整准确可靠的原始数据取得完整准确可靠的原始数据统计资料的来源:日常工作记录(如病历)、统计资料的来源:日常工作记录(如病历)、统计报表(如传染病报表)、调查或实验统计报表(如传染病报表)、调查或实验收集资料的要求:完整、及时、准确;保证有收集资料的要求:完整、及时、准确;保证有足够的样本量;样本应具有代表性和可比性。足够的样本量;样本应具有代表性和可比性。22统计工作的基本步骤统计工作的基本步骤3.3.整理
16、资料整理资料(data sorting)(data sorting)目的:使原始数据系统化、条理化,便于进一目的:使原始数据系统化、条理化,便于进一步分析。步分析。对原始数据进行检查和整理对原始数据进行检查和整理 采用计算机软件对资料进行分组、汇总采用计算机软件对资料进行分组、汇总23统计工作的基本步骤统计工作的基本步骤4.4.分析资料分析资料(data analysis)(data analysis)研究总体研究总体统计描述统计描述样本样本统计推断统计推断随机抽样参数估计参数估计假设检验假设检验统计表统计表统计图统计图统计指标统计指标24 三三、统计资料的类型统计资料的类型变量变量 vari
17、able变量值变量值value of variable按变量值的性质将变量分为按变量值的性质将变量分为 定量变量定量变量和和定性变量定性变量计数资料计数资料计量资料计量资料等级资料等级资料25 三、统计资料的类型三、统计资料的类型 连续型变量连续型变量 定量变量定量变量 计量资料计量资料 (说明数量特征)(说明数量特征)离散型变量离散型变量 变量变量 分类变量分类变量(或名义变量或名义变量)计数资料计数资料 定性变量定性变量 (说明类别)(说明类别)有序变量有序变量 等级资料等级资料 261.计量资料计量资料定义:通过度量衡的方法,测量每一个观察单位定义:通过度量衡的方法,测量每一个观察单位的
18、某项研究指标的量的大小,得到的一系列数据的某项研究指标的量的大小,得到的一系列数据资料。例如:体重与身高资料。例如:体重与身高特点:有度量衡单位特点:有度量衡单位 多为连续性资料多为连续性资料 (通过测量得到)(通过测量得到)27计量资料:计量资料:计量资料:计量资料:由一群个体的数值变量值构成的资料,即一由一群个体的数值变量值构成的资料,即一群变量值。群变量值。如:长沙市如:长沙市99年年7岁男孩身高值岁男孩身高值 120.2cm,118.6cm,121.8cm28定义:将全体观测单位按照某种性质或特征分定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。组,然后再
19、分别清点各组观察单位的个数。特点:没有度量衡单位特点:没有度量衡单位 多为间断性资料多为间断性资料 (通过枚举或记数得来)(通过枚举或记数得来)2.计数资料计数资料29定义:定义:介于计量资料和计数资料之间的一种资料,介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。通过半定量方法测量得到。特点:特点:每一个观察单位没有确切值每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。各组之间有性质上的差别或程度上的不同。3.等级资料等级资料30等级资料:等级资料:一群个体按有序分类变量的级别清点每级有一群个体按有序分类变量的级别清点每级有多少个个体多少个个体,即分级个体数。即分
20、级个体数。例如:例如:某地某人群某地某人群EB病毒抗体反应:病毒抗体反应:65 +:+:+:131住院号住院号住院号住院号年龄年龄年龄年龄身高身高身高身高体重体重体重体重住院天数住院天数住院天数住院天数职业职业职业职业文化程度文化程度文化程度文化程度分娩方式分娩方式分娩方式分娩方式妊娠结局妊娠结局妊娠结局妊娠结局272716516571.571.55 5无无中学中学顺产顺产足月足月222216016074.074.05 5无无小学小学助产助产足月足月252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月232316116169.069.05 5无无中学中学剖宫产剖宫产足
21、月足月252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月272715715768.068.02 2无无小学小学顺产顺产早产早产202015815866.066.04 4无无中学中学助产助产早产早产242415815870.570.53 3无无中学中学助产助产足月足月292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月观察单位观察单位 变量变量32数据间的转化数据间的转化 例:一组例:一组20 40岁成年人的血压岁成年人的血压 单纯随机抽样单纯随机抽样系统抽样系统抽样分层抽样分层抽样(2)增加样本量增加样本量n(3)选择变异程度较小的研究指
22、标)选择变异程度较小的研究指标 减少抽样误差的方法减少抽样误差的方法:434.参数与统计量参数与统计量参数参数 parameter:描述描述总体总体特征的统计指标特征的统计指标统计量统计量 statistics:描述描述样本样本特征的统计指标特征的统计指标 参数的特点参数的特点:固定不变的固定不变的;一般用一般用希腊字母希腊字母表示,如:表示,如:、统计量的特点统计量的特点:抽取的样本不同抽取的样本不同,统计量会变化,一般用统计量会变化,一般用拉丁字拉丁字 母母或或英文字母英文字母表示,如:表示,如:、S S 总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参
23、 数数数数 推断推断inference445.概率与小概率事件概率与小概率事件抛一枚硬币,是否国徽面一定向上?明天的股市抛一枚硬币,是否国徽面一定向上?明天的股市升还是降?某患者痊愈的可能性?升还是降?某患者痊愈的可能性?概率:描述随机事件发生的可能性大小的数值,概率:描述随机事件发生的可能性大小的数值,常用常用P来表示,取值来表示,取值0,1必然事件必然事件 P=1随机事件随机事件 0 P 1不可能事件不可能事件 P=045小概率事件小概率事件 P 0.05(5)或)或P 0.01(1)小概率事件原理小概率事件原理小小概概率率事事件件发发生生的的可可能能性性很很小小,近近而而认认为为其其在在
24、一一次次抽样中不太可能发生,此即为小概率事件原理抽样中不太可能发生,此即为小概率事件原理进行统计推断的依据进行统计推断的依据 举例:举例:46频率频率:样本的实际发生率样本的实际发生率称为称为频率频率在实际工作中,当观察单位的例数足够多时,可以用在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率频率来代替概率频率是概率的估计值频率是概率的估计值频率与概率间的关系:频率与概率间的关系:样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 样本含量样本含量n越大,波动幅度越小,频率越接近概率越大,波动幅度越小,频率越接近概率47频率与概率的关系频率与概率的关系48如何学习统计学如何学
25、习统计学(特点:灵活、抽象)(特点:灵活、抽象)理解基本的统计原理理解基本的统计原理培养统计思维能力培养统计思维能力:抽象的抽象的,逻辑逻辑推理推理多练习多练习:课堂练习课堂练习,课下做习题课下做习题 (要求:上课带计算器)(要求:上课带计算器)联系实际联系实际:阅读文献阅读文献 工作和生活实际工作和生活实际49常用医学统计软件介绍常用医学统计软件介绍国外著名的统计软件国外著名的统计软件 SAS Statistical Analysis System特点:操作核心是程序驱动,编程使用特点:操作核心是程序驱动,编程使用sas语言语言网址:网址:http:/SPSS Statistical Pac
26、kage of Social Science 特点:窗口方式管理数据特点:窗口方式管理数据;菜单方式展示各种分析菜单方式展示各种分析 方方法法;对话框式操作对话框式操作 网址:网址:http:/50国外著名的统计软件国外著名的统计软件 STATA 特点:操作核心是程序驱动,编程使用相应特点:操作核心是程序驱动,编程使用相应语言语言网址:网址:http:/51国内统计软件国内统计软件 SPLM1.0 第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室 夏结来夏结来PEMS3.0四川大学华西医学院卫生统计学教研室四川大学华西医学院卫生统计学教研室 中国医学百科全书中国医学百科全书.医学统计学
27、软件包医学统计学软件包52思思 考考小结小结总体与样本之间是什么关系?总体与样本之间是什么关系?举例说明什么是计量资料、计数资料、等级资料举例说明什么是计量资料、计数资料、等级资料抽样研究的目的是什么?抽样研究的目的是什么?什么是抽样误差?它的特点是什么?什么是抽样误差?它的特点是什么?什么是小概率事件原理?什么是小概率事件原理?简述统计工作的步骤简述统计工作的步骤53案例辨析案例辨析案例案例1某研究者的论文题目为某研究者的论文题目为“大学生身心健康大学生身心健康状况及其影响因素研究状况及其影响因素研究”,以某地职业技术学院,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理理、工、
28、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了、工、文、医学生分别挑选了60、38、19和和46人,人,以问卷方式调查每位学生的一般健康状况、焦虑以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。得出的结论是:程度、抑郁程度等。得出的结论是:“大学生身大学生身心健康状况不容乐观,学业问题、就业压力、身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要体状况差、人际交往不良、社会支持不力为主要影响因素影响因素”。请问其结论合理吗?为什么?应该。请问其结论合理吗?为什么?应该如何?如何?54案例案例2两种药用于同一种病,两种药用于同一种病,
29、A药治疗药治疗5例,例,4例好转;例好转;B药治疗药治疗50例,例,36例好转。例好转。结论是:结论是:A药优于药优于B药。请问其结论合理药。请问其结论合理吗?为什么?应该如何?吗?为什么?应该如何?55案例案例3 某部队共有某部队共有1 200人,在某段时间人,在某段时间内患某病的人数有内患某病的人数有120人,其中男性人,其中男性114人,人,女性女性6人。某卫生员进行统计分析后说,人。某卫生员进行统计分析后说,经假设检验,该病的两性发病率经假设检验,该病的两性发病率(114/120=95%与与6/120=5%)之间的差别有)之间的差别有统计学意义,由此得出结论:统计学意义,由此得出结论:
30、“该病男性该病男性易得易得”。你对这个结论有何看法?若结论。你对这个结论有何看法?若结论是错误的,那么,错误的实质是什么?是错误的,那么,错误的实质是什么?正确的做法是什么?正确的做法是什么?56为了了解某地为了了解某地2029岁健康女性血红蛋白的正常岁健康女性血红蛋白的正常值范围,现随机调查了该地值范围,现随机调查了该地2000名名2029岁的健康岁的健康女性,并对其血红蛋白进行测量,请问本次调查女性,并对其血红蛋白进行测量,请问本次调查的总体是(的总体是()A该地所有该地所有2029的健康女性的健康女性 B该地所有该地所有2029的健康女性的血红蛋白测量值的健康女性的血红蛋白测量值 C抽取的这抽取的这2000名名2029岁女性岁女性 D抽取的这抽取的这2000名名2029岁女性的血红蛋白测量岁女性的血红蛋白测量值值57此课件下载可自行编辑修改,供参考!此课件下载可自行编辑修改,供参考!部分内容来源于网络,如有侵权请与我联系删除!部分内容来源于网络,如有侵权请与我联系删除!