收藏 分销(赏)

卢洁绪论研.ppt

上传人:精**** 文档编号:12504429 上传时间:2025-10-21 格式:PPT 页数:75 大小:2.32MB 下载积分:16 金币
下载 相关 举报
卢洁绪论研.ppt_第1页
第1页 / 共75页
卢洁绪论研.ppt_第2页
第2页 / 共75页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,主 讲:,卢 洁,Ph.D,E-mail,:,hanyaa800,办公室:,郑大公卫学院,A510,室,第一章 绪论,/,Chapter1 Introduction,学习医学统计学的注意事项,(,Importance of Medical Statistics),统计学与医学统计学,(,Statistics and Medical Statistics),医学统计学中的基本概念,(,Concepts in Medical Statistics),医学统计工作的基本步骤,(,Basic steps of statistical work),引 子,:,什么是卫生统计学?,为什么要学习这门学科?,学习中要注意什么?,有关的参考资料,本课程的进度与安排,统计学的起源,(,Origination of Statistics,),Singular form,statistics,“统计学,”,“统计数字,”,Plural,form,说明:早期的统计数字是官方要求,为作某种决策提供依据的信息,统计学是关于数字的学科。,state,历史上给统计学的有关界定:,A science dealing with the collection,analysis,interpretation and presentation of masses of numerical data.,-Websters International Dictionary,统计学是,“,对令人困惑费解的问题做出数字设想的艺术。,-,David Freedman,统计学是一门处理数据中变异性的科学和艺术,。,-John M.Last,A Dictionary of Epidemiology,什么是统计学?,(,Definition of statictics,),统 计 学:,处理数据中,变异性,的科学和艺术。,研究内容:,搜集,、,整理,、,解释,与,呈现,数据并作,出,推断。,。,研究方法:,概率论,和,数理统计,。,研究目的:,求得可靠结果,探索现象的本质。,现实地位:,论文审稿、科研合作,、基金申请、,药物开发与申报,、,药效评定,、,卫生决策,.,统计学的应用范围?,A knowledge of statistics is like a knowledge of foreign languages or of algebra;it may prove of use at any time under any circumstances.,A.L.Bowley,是应用,概率论,和,数理统计,的原理和方法,研究,医学研究,和,卫生事业管理,中数据,搜集,、,整理,、,分析,与,推断,的一门应用学科。,什么是卫生统计学?,(,Definition of medical statictics,),参数估计,假设检验,统计工具,描述统计学,推断统计学,理论统计学,应用统计学,统计学,统计学亚分类:,卫生统计学的研究对象:,影响人体健康的因素,人体,社会因素,环境因素,:,如污染导致的三致,致癌、致畸、致突变,生物因素,:如血吸虫病、黑热病、疟疾等,生活方式和习惯,如 旧社会:传染病、性病等,新社会:,肿瘤、心脑血管病等,卫生统计学的研究内容:,1.,医学统计学的基本原理和方法:,如定量、定性资料的统计描述;,分布、参数估计、,检验、,检验及,检验、单因素分析、多元分析等等。,2.,健康统计:,如人口统计、疾病统计等。,3.,卫生服务统计:,如卫生资源、医疗卫生服务的需求 和利用、医疗 保健制度等。,三、为什么要学习卫生统计学,某新药是否有效?对某人群治愈率如何?,吸烟对人类到底有没有危害?,假设,检验,(一)卫生研究离不开统计学,测一批药物质量合格是不是合格,要测定多少?测定哪几箱才能正确判断?,某药厂准备上种降压药,那么他们首先要作摸清此后十年间,某地区的高血压患病概率、患者用药等情况。,抽样调查,概,率,论,如果你知道某一个人的身高和体重,,你能知道这个人的手指有多粗吗?,统计推断,统计设计不周可导致研究的最终失败。,1.,某基因多态性与肥胖易感性的关系,统计设计不周,可造成人力物力的巨大浪费。,(二)统计设计是科研能否成功的关键所在,2.,实验对照的设置:谁和谁比的问题,样本量、试验平行次数的计算问题,某科研人员为了研究,A,、,B,两种药物的疗效,设计了如下实验。共设立了,4,个组,每组用小白鼠,20,只,观测指标为血小板。,第,1,组:空白对照组,第,2,组:单用,A,药组,第,3,组:,A,、,B,药联合使用组,第,4,组:第,3,组的空白对照组,案例分析:,分析与解答,本实验设立了两个对照组,用去了,40,只小鼠,是一种浪费;另外,设立了,A,、,B,药联合使用组,意味着考察,A,、,B,两药之间是否有交互作用,而要达到此目的,还必须有一个单用,B,药组,因此,该例子的正确分组应是:,第,1,组:空白对照组,第,2,组:单用,A,药组,第,3,组:单用,B,药组,第,4,组:,A,、,B,药联合使用组,60,年代到,80,年代,国外医学杂志调查结果:有统计错误的论文,20%72%,。,96,年我国对,4586,篇论文统计(中华医学会杂志占,6.9%,),数据分析方法误用达,55.7%,。,伪造统计数据,违反科学道德:,1976,年,New Science,关于科研舞弊行为进行了调查表调查:有,74%,的反映有不正当修改数据的情况;,7%,的拼凑实验结果;,7%,的凭空捏造数据;,2%,故意曲解结果。,(三)医学论文中的统计学问题:,(四)学习统计学,迎接挑战,!,在工作中,每个医务工作者都会遇到这样的问题:,如何正确理解与运用医学指标的参考值范围?,如何判断自己的治疗方案是否有效、检验是否优越?,自己提出的诊断方法不亚于现有方法?,如何总结自己在教学、科研及临床工作中的经验与成果?如何进行科研中统计的设计,?,如何在本学科谋求进一步的创新和发展?,医学研究离不开统计学,,,不具有统计思想的医务人员是危险的。,因此我们有必要用,统计学思想,武装自己的头脑,加强学习与统计学家的合作,以便在今后的工作和学习中发挥更大的作用!,二、,学习本课程的注意事项,卫生统计学的特点:,不同于纯文字学科,因为这门课有四多:,基本概念多,前提条件多,设计类型多,分析方法多,统计学不是数学,不能单纯钻理论、作习题,着重证明和推导;,应用是根本目的,学了不会应用是最大的失败;,统计学不是医学,不会要求记忆许多细节,事事眼见为实;,本课程没有内容需要背诵,,理解概念与动手实践才是根本,。,体会领悟,统计学的思维特征,(,抽象思维及逻辑推断模式,),,充分认识所作结论的,概率性,;,掌握统计学,基本概念、形成思想及应用背景;,重视所选分析方法的应用条件与范围;,应用数理统计学方法解决实际问题,,学以致用,是根本目的。,怎样学习卫生统计学?,不但会作题、还要在潜移黙化中改良我们的思想,四、,课程的进度与参考资料,教材资料,指定教材,赵耐青:,卫生统计学,参考书籍,方积乾:,生物医学研究的统计方法,统计软件,:,SAS,软件、,SPSS,软件,网络资源,1,),2,),3),4,),五、,统计学的几个基本概念,【,案例分析,】,2000,年郑州市,10,万个,12,岁健康女孩的身高情况,观察单位,:,研究目的,:,2000,年郑州,12,岁健康女孩身高情况,10,万个,2000,年郑州居住,12,岁健康女孩,观察指标,(即变量):,观察值,:,研究对象,:,个体,每个附合该条件的女孩,身高,身高的测量值,研究:,基本概念,:,同质与变异,(homogeneity/variation,),总体和样本,(population/sample),总体参数和统计量,(,parameter,/,statistic,),变量与变量值,(variable/value of variable,),误差与抽样误差,(error/sampling error),随机事件与概率,(,Probality,),一、总体与样本,举例,:,2000,年郑州市,12,岁健康女孩的身高情况,已知郑州市,00,年,12,岁女孩有,10,万人,抽样调查,随机抽取,100,个女孩,测其身高,以之推断该地,12,岁女孩身高情况。,测量这,10,万个人的身高,后统计分析,得出结论,普查,总体:,是,研究目的所确定的所有同质个体某指标实际值的集合;或说,,,总体是根据研究目的确定的所有同质观察对象的全体,。,样本:,根据随机化的原则从总体中,抽取有代表性的部分观察单位,,其变量实测值构成样本。,有限总体,定义:总体是假想的,没有时间和空间限制,观察单位数无限。,总 体,定义:限定于特定的时间与空间范围之内的有限个观察单位。,无限总体,举例:郑州市,07,年正常成年人的血压值,举例:高血压患者使用卡托普利后的血压值,Finite Population,Infinite Population,样本含量:,样本所包含个体或个体值的个数。,List of Individuals,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,随机抽样,样 本,1,9,2,3,4,5,6,7,8,11,17,16,15,13,14,12,10,Population,Sample,抽样,(,Sampling,):从总体中抽取有代表性的一部分样本的过程,称为抽样。,抽样研究,:,从确定的同质总体中随机抽取部分样本进行观察,用样本信息来推断总体特征,该研究方法叫抽样研究。,为什么要进行抽样研究?,总体太大,费时费力且难以保证测量的精度,。,抽样研究能得到精确的结果。,某些实验有破坏性,不可能对总体进行测量。,统计学的主要任务之一,是进行,统计推断,统计推断,:,以,样本的现象,推断,所研究总体的特征,。即分析样本数据,获得关于总体的知识。,统计推断的工具,:,有关概率的理论。,从样本对总体得出的是一个概率性的结论,从来不是完全肯定的或完全否定的。,推断的关键和核心是,抽样方法,、,样本的代表性,和,推断的方法,样本的,代表性:,样本必须是从总体中随机抽取的一部分,即,采用随机的抽样方法,使总体中每个个体都有,相同的机会,被抽到。,样本量必须足够大。,案例,:,2000,年郑州市,10,万个,12,岁健康女孩的身,高情况。,研究目的,:,2000,年郑州,12,岁女孩身高情况,研究对象,:,10,万个,,00,年郑州居住,12,岁女孩,观察指标,:身高,观察单位,:个体,二、同质与变异,同质与变异,同,质(,homogeneity,),:,指研究对象在一定范畴的各种可能影响主要观察指标的其它因素处于相同或非常相似的情况,即把具有相同性质的观察单位简称为同质的,(,homogeneous,),,否则称为异质的,(,heterogeneous,),。,换言之就是共性,大同小异,没有共性就构不成一个总体。,变异(,variation,):,同质基础,上的,各观察单位,间的,差异,。,换言之,就是个体间的差异,指事物的多样性,总体内没有变异就无需统计学。,统计学的根本任务:,在变异的背景上,描述同一总体的同质性,提示不同总体的异质性。,练 习:,同质,:高血压患者、用,尼群地平,治疗,2.,研究目的:某年某地健康成年女子的雌性激素水平,变异,:疗效各不相同,1.,研究目的:观察降压药尼群地平的临床疗效,同为绝经前或同为绝经后,变异,:雌性激素水平不同,同质,:同年、同地、同为女性、同为健康成年人,三、总体参数与统计量,参数,:根据总体变量值统计计算出来,描述总体特征的统计指标。,统计量,:,根据样本个体值统计计算出来,描述,特征的统计指标。,随机抽取部分观察单位,总 体,样 本,平均数,s,p,标准差,率,参数,统计量,希腊字母,拉丁字母,推断,inference,四、变量和变量值,变量,:,变异性表现为取值上的大小就是变量。,通常把观察单位的,观察指标,称为变量,如身高、体重等;统计学研究中,因观察单位(个体)之间的差异,其,观察指标的取值是不相同的,。,变量值,:,观察单位,的,观察值,叫变量值,如身高,118cm,,体重,26kg,等。,例,3.1,某市,100,名,8,岁男童的身高资料(,cm),计量资料,变 量,定义:其变量值是定量的,可经测量表现为数值的大小,多有度量衡单位。,分类资料,例:身高(,cm,)、体重(,kg,)血压(,mmHg,)、脉博(次,/,分)白细胞计数(,10,9,/L,),Measurement data,Categorical data,定义:其变量值是定性的,表现为互不相容的类别或属性。可分为无序变量和有序变量。,例:性别(男、女);,药物反应(阴、阳);,血型(,A,、,B,、,AB,、,O,);,尿糖(,、,、,+,、,+,、,+,),连续型变量,离散型变量,在一区间中可任意取值的变量,其取值范围是有限个值,或中断的数列,变 量,例:,男、女,感染、未感染,有效、无效,二分类资料,定义:,是指所分类别或属性之间无程度和顺序的差别。,定义:,是各类别之间有程度的差别,,可按等级顺序分组。,例,:,尿糖(,、,、,+,、,+,、,+,),无症状、轻、中、重度,分类资料,有序分类资料,无序分类资料,多项变量,例,:,血型(,O,、,A,、,B,、,AB,)、种族、职业、教育程度等,(0-1,资料),变量的类型:,无序变量,多项变量,变量,Variable,分类变量,Categorical Variable,数值变量,Numerical Variable,连续型,变量,:,可取实数轴上任何数值,Continuous Variable,有序变量,:,可能取值中自然存在着次序,Ordinal Variable,离散型,变量,:,只能取整数,Discrete Variable,二项变量,:,0-1,变量或假变量,Binary Variable,Unordered Variable,病例号,年龄,(,岁,),性别,身高,(cm),血型,心电图,尿,WBC,职业,RBC,10,12,/L,1,35,女,1.65,A,正常,教师,4.67,2,44,男,1.74,B,正常,工人,5.21,3,26,男,1.80,O,正常,职员,4.10,4,25,女,1.61,AB,正常,农民,3.92,5,41,男,1.71,A,异常,+,工人,3.49,6,45,女,1.58,B,正常,+,工人,5.48,7,50,女,1.60,O,异常,+,干部,6.78,8,28,男,1.76,AB,正常,+,干部,7.10,9,31,女,1.62,O,正常,军人,5.24,练习题:,判断下表中各变量的类型,变量之间的转换:,变量只能,由高级向低级转化,,不能作相反方向转化,数值变量,有序变量,无序变量,二项变量,单位为,10,12,/L,若按过低(,5.5,)整理分组,数值变量。,若按正常、异常分组,有序分类变量,例如:上表中“红细胞计数,”,无序分类中二项变量,五、误差与抽样误差,误差,:,为观察值(,X,)与实际值(,)之差。,分 类,过失误差或人为误差,:计算错误、抄错数字,系统误差或偏倚,:有一定来源且有方向性、规律性,如血压计不准。,随机误差,:排除上述两种误差后尚存在的误差,由多种无法控制的因素引起,其值无一定方向和大小,随机变化,如抽样误差。,举例,:,2007,年郑州市,7,岁健康男孩的身高情况,4,6,7,Population,:,20,万人,5,8,9,13,15,12,6,3,10,17,抽样,A,(,200,人,),抽样,B,(,200,人,),A,=119.95cm,B,=118.83cm,1,9,2,3,5,8,11,17,16,15,13,14,12,10,6,7,普查,(,20,万人),总体均数,=119.04cm,总体与样本,样本与样本,抽样,误差,抽样误差,(,sampling error,),:,由抽样造成的样本统计量和总体参数的差别、以及样本统计量之间的差别称为抽样误差。,抽样误差产生的根本原因,:研究个体间的差异,抽样误差特征,:,(,1,)不可避免。,(,2,)可通过扩大样本量等控制。,概率统计学,定 义,举 例,确定现象,在相同的条件下出现,相同,的结果。,自由落体,研究方法,经典数学,随机现象,在相同的条件下可出现不同的结果,但结果是确定的。,掷硬币、人血型,模糊数学,模糊性现象,在相同的条件下出现,不确定,的,结果,大与小、美与丑,随机现象特点:结果事先不可确定,六、随机事件与概率,随机事件,(,Radom event,),:随机试验中可能出现的各种结果,叫随机事件。即在一定条件下具有多种可能发生的结果,而究竟发生那一个结果不能肯定,又称偶然事件。,1.,有两种及两种以上的可能结果,但究竟发生哪 一种结果事先无法确定。,2.,可以在相同的条件下重复进行。,3.,有一定规律性,每次发生的可能性大小一样的。,随机事件的特点:,概率(,Probability,),:描述,随机事件,发生的,可能性大小,的一种度量,常用,P,表示。,P,=1,:表示事件必然发生,即,P,(,)=1,P,=0,:表示事件不可能发生,P,(,)=0,P,1,:,表示某事件发生的可能性越大,P,0,:,表示某事件发生的可能性越小,随机事件概率,的大小在,0,与,1,之间,即,:,0,P,(,A,),1,,常用小数或百分数表示。,小概率事件,:,当随机事件,A,的概率,P(A),,习惯上,当,=0.05,时,就称,A,为小概率事件,;,其统计学意义是小概率事件在一次随机试验中不可能发生,。,概率学原则,大数原则,:概率足够大时,例,P,=,.99,时,认为事件会发生。,小概率事件,:,P,0.05,或,P,0.01,时,,,即认为事件不可能发生。,注意,:,小概率事件的标准是人为规定的,对于可引起严重后果的事件,比如说“术中大出血”,可能规定为,P,0.01,或者更小。,小概率事件在一次随机试验中不太可能发生,小概率事件在一次随机试验中不会发生,注意:,正确理解:,小概率事件在一次随机试验中并不是不会发生的,而是指在一般的情况下不会发生,但特殊情况下也会发生。,频率,(,Frequency,),:,在,n,次试验中,若事件,A,发生的次数为,m,,则:,m,称为事件,A,在,n,次试验中的,频数,,,f,n,(,A,),称为事件,A,在,n,次试验中发生的,频率,。,该怎样估计概率?,案例,抛硬币,:,连续抛一枚硬币次,记录出现正面的次数下表列出了历史上一些科学家试验的结果:,实验者,投掷次数,发生正面向上的次数,频率,道蒙津,2046,1061,0.5186,蒲丰,4040,2048,0.5069,K.,皮尔逊,12000,6019,0.5016,K.,皮尔逊,24000,12012,0.5005,证实:,当试验次数逐渐增大时,频率值越来越稳定地接,近于某一,固定值,。,.,在一般情况下,随机事件的概率,P,是不可能准确得到的。通常以试验次数,n,充分大时随机事件,A,的频率作为该随机事件概率的近似值。,.,即,P,(,A,),=,pm/n,(,n,充分大),.,即当试验次数,n,足够大时,频率接近与概率值,可作概率使用,四、,医学统计工作的基本步骤,统计工作的全过程可分为,4,个基本步骤:,整理资料,Sorting data,统计设计,搜集资料,Statistical design,collection of data,分析资料,analysis of data,包括,一、统计设计(,Statistical design,),设计是统计工作的先导和依据,其任务是对研究的全过程有一个全面的设想。,调查设计,专业设计,统计设计,实验设计,处理因素,统计设计的内容:,研究对象,如何选?,:,随机的原则,选多少?,如何分组?,:,样本含量的估计,:,代表性,随机性,统计指标,统计报表,二、搜集资料(,Collecting data,),原则:及时、准确、完整。,任务:遵循统计学原理,按照设计要求,采取必要措施得到准确可靠的原始资料。,资料主要源:,经常性工作记录,专题调查或实验,三、整理资料(,sorting data,),归纳、分组,使其系统化、条理化,原始资料,净化原始数据,统计指标的计算和分析,目的是按照研究设计的要求,计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。,四、分析资料(,analysis of data,),分析内容,统计推断,(,inferential statistics,),统计描述,(,descriptive statistics,),统计描述,:,用统计指标、统计表、统计图等方法,对样本资料的数量特征及其分布规律进行描述,统计推断,:,指用样本信息推断总体特征,包括参数估计和假设检验。,最佳选择题,1.,下面的变量中,属于分类变量的是,_,。,A.,脉搏,B.,血型,C.,肺活量,D.,红细胞计数,E.,血压,2,下面的变量中,属于定量变量的是,_,。,A.,性别,B.,体重,C.,血型,D.,职业,E.,民族,3.,某人记录了,50,名病人体重的测定结果:小于,50Kg,的,13,人,介于,50Kg,和,70 Kg,间的,20,人,大于,70 Kg,的,17,人,此种资料属于,_,。,A.,定量资料,B.,有序资料,C.,二分类资料,D.,多项无序分类资料,4.,若要通过样本作统计推断,样本应是,_,。,A.,总体中典型的一部分,B.,总体中任一部分,C.,总体中随机抽取的一部分,D.,总体中选取的有意义的一部分,E.,总体中信息明确的一部分,5.,统计量,_,。,A.,是统计总体数据得到的量,B.,反映总体统计特征的量,C.,是根据总体中的全部数据计算出的统计指标,D.,是用参数估计出来的,E.,是由样本数据计算出的统计指标,6.,任何一个随机事件发生的概率的取值区间是,(),A.0,P,1 B.0,P,1,C.,0P1,D.-1,P,1,简答题:,1.,举例说明随机事件、概率和小概率事件的 基本含义。,2.,试说明什么是抽样误差,它产生的原因及主要特征,。,名词解释:,1.,变异,2.,样本,3.,概率,4.,统计量,5.,参数,THANK YOU!,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服