资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,大家好,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,大家好,*,第一章 绪 论,卫生统计学(,6,版),人民卫生出版社,主编 方积乾,1,大家好,学习要求,了解:,医学统计学的发展史;统计学和医学、公共卫生的关系。,熟悉:,卫生统计学的基本内容;卫生统计学学习的目标与方法。,掌握:,统计学的基本概念:总体与样本、同质与变异、变量的类型、参数与统计量。,2,大家好,第一节 概述,一、统计学、医学统计学与卫生统计学的定义,统计学,(statistics),:,统计学是处理数据中,变异性,的科学与艺术,内容包括数据的,收集,(collection),、,分析,(analysis),、,解释,(,interpretation),和,表达,(,presentation,),目的是求得可靠的结果。,统计学是帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。,3,大家好,根据,研究领域,和,研究对象,的不同,统计学又分为:数理统计、经济统计、生物统计、卫生统计、医学统计,医学统计学(,medical statistics,):,用统计学的原理和方法研究医学领域中数据的收集、整理、分析和结果正确解释与表达的一门科学。,卫生统计学(,health statistics,):,是应用统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理、分析和结果正确解释与表达的一门科学。,更侧重于社会、人群的卫生问题,。,4,大家好,二、统计学和卫生统计学的发展简史,统计学“,statistics”,一词源于国家“,state”,,拉丁语中“,statisticus”,就是治国术的意思,。,1.,早期:,早在奴隶社会,当时的统治阶级为了征兵和征税,需要了解土地、人口等数量,就有了原始的统计活动。公元前,3050,年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。,公元前,2200,年,夏禹时代,“禹平水土,还为九州”,人口数,1355,万人,土地,3431,万顷。,5,大家好,2.,近代:,19,世纪应用数学家为了解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。,19,世纪,比利时的凯特勒,(,Quetelet,17961874),,把概率论的理论引入统,计学中,使统计学的研究方法发生了,质的飞跃。被称为数理统计学派创始,人。,6,大家好,卡尔 皮尔逊(,Karl Prarson,1857-1936,),英国生物学家和统计学家,现代统计科学的创立者,公认为统计学之父,。他对统计学的最大贡献为,:,导出一般化的频数曲线体系。,包括正态分布、矩形分布、,J,型分布、,U,型分布等,13,种曲线及其方程式。,提出卡方(,2,)检验。,发展了相关和回归理论。,重视个体变异性的数量表现和变异数据的处理。,提出了“标准差”及其符号,。,7,大家好,为了推广统计在生物学上的应用,于,1901,年创立统计的元老期刊,生物统计,,他的学生,W.Gosset(1876-1937),关于,Student t,分布的著名文章于,1908,年就发表在,生物统计,上。,1747,年英国医生詹姆斯,.,林德(,James Lind,,,1716 1794,),1747,年,对坏血病进行干预研究。,1840,年法国医生皮尔,.,路易斯(,Pierre Louis,,,1787-1872,)用临床对照方法证明放血对治疗伤寒、肺炎和扁桃体咽颊炎无效,。,8,大家好,1854,年,英国医生约翰,斯诺,(,John Snow,,,1813-1858,)对,1854,年伦敦西部西敏市苏活区霍乱爆发的研究被认为是流行病学研究的先驱。,9,大家好,1948,年,英国发表了评价链霉素治疗肺结核疗效的随机对照的临床试验告,第一次用生物统计方法进行临床干预试验。,1960,年英国医生,Doll,和,Hill,发现吸烟与肺癌有关,相对危险度,RR=1.66/0.77=23.7,。,1948,年郭祖超教授(,1912-1999,,我国医学统计学主要奠基人)编著的,医学与生物统计方法,一书,是我国第一部医学统计方法的教科书。,1964,年更名为,医用数理统计方法,,由人民卫生出版社出版。,1988,年,10,月,,140,万字的,医用数理统计方法,(第三版),由人民卫生出版社出版。,10,大家好,3.,现代:,计算机和统计软件如,SAS,、,SPSS,的出现,使统计学得到突飞猛进的发展。,三、为何要学习统计学,1.,采用统计学方法,发现不确定现象背后隐藏的规律。,变异(,variation,),是个体间存在的差异,是绝对的,是社会和生物医学中的普遍现象。,变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。,11,大家好,最大值,=6.18,最小值,=3.29,极差,=2.89,12,大家好,2.,用统计学思维方式考虑有关医学研究中的问题,如试验设计是否合理?样本含量是否满足要求?不同药物间临床疗效是否不同?发病的主要因素是什么?联合用药是否效果更好?如何能延长癌症病人的生存年限?,3.,科学研究和科研论文的需要,工作生活中常见的统计学问题:,如何判断药物的疗效?,(,假设检验,),坐飞机是否安全?体育彩票能否中奖?,(,概率论,),子女为什么象父母,其强度有多大?,(,相关与回归,),美国的民意测验是如何进行的?,(,设计,抽样,),中国的市场调查的可信性有多大?,(,现场调查,),13,大家好,四、卫生统计学的主要内容:,1.,统计设计(,statistical design,),包括,实验设计,和,调查设计,,它可以合理地、科学地安排实验和调查工作,使之能较少地花费人力、物力和时间,取得较满意和可靠的结果。,Fisher,在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。,“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。”,14,大家好,2.,统计描述,(descriptive statistics),和参数估计(,parameter estimation,),通过计算各种统计指标和统计图表来描述资料的集中趋势、离散趋势和分布特征况(如正态分布或偏态分布);利用样本指标来估计总体指标的大小。,3.,假设检验,(hypothesis test),假设检验是统计学的主要内容,是通过统计检验方法(如,t,检验、,u,检验、,F,检验、,2,检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。,15,大家好,4.,相关与回归,(,correlation and regression,),医学中存在许多相互联系、相互制约的现象。如儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利用相关与回归来分析。,5.,多因素分析,(multiple analysis),如多元回归、判别分析、聚类分析、正交设计分析、主成分分析、因子分析、,logistic,回归、,Cox,比例风险回归等,都是分析医学中多因素有效的方法。这些方法计算复杂,大部分需借助计算机来完成。,16,大家好,6.,健康统计,(health statistics),研究人群健康的指标与统计方法,除了用上述的某些方法外,他还有其特有的方法,如寿命表、生存分析、死因分析、人口预测等方法。,17,大家好,第二节 统计学中的几个基本概念,一、总体与样本(,population&sample,),总体是根据研究目的确定的同质观察单位的全体。,如调查山东省,12,岁男孩生长发育情况,所有山东省,12,岁男孩,(研究对象),就组成总体,每个,12,岁男孩称为一个,观察单位(个体),,同质的基础是,同地区、同年龄、同性别,。,18,大家好,有限总体,(,finite population,),有明确的空间,范围,。,无限总体,(,infinite population,),没有明确的,空间范围,目标总体(,target population),如目标为全国,12,岁孩生长发育情况。,研究总体(,study population),实际研究山东省,12,岁男孩情况。,总体的分类:,空间范围,研究范围,19,大家好,样本是指从总体中随机抽取的部分有代表性的观察单位的全体。,对样本的研究称为,抽样研究(,sampling study),,医学研究中大部分是抽样研究,用样本研究的信息推断总体的特征。,如抽取,1,万名山东省,12,岁男孩做调查,分析各种生长发育指标,推论山东省,12,岁男孩的生长发育情况。,20,大家好,21,大家好,二、同质与变异,(,homogeneity&variation,),同质,或,同质性,是指研究对象具有的相同的状况或属性。,变异,是指同质的各观察单位,其某变量值之间的差异。,同质事物个体间的差异来源于一些,未加控制,或,无法控制,的甚至,不明原因,的因素。,变异是绝对的,同质是相对的。,从本质上说,统计学就是研究变异的科学,22,大家好,三、变量(,variable),的类型,对每个观察单位的,某项特征,进行观察和测量,这种特征称为,变量,,变量的测得值称为,变量值,(亦称观察值),全部变量值的集合也称为,资料,。,变量一般分为,定量变量,和,定性变量,两种类型。,23,大家好,1.,定量变量(,quantitative variable),定义:,定量变量亦称,计量变量(,measurement variable,),或,数值变量(,numerical variable,),,是用定量的方法测定观察单位(个体)某项指标数值的大小。其组成的资料称定量资料。,特点:,表现为,数值,大小;有度量衡,单位,;多为,连续性,资料。,统计分析:,常用,均数,、,标准差,进行,统计描述;用,t,检验,、,F,检验,进行假设检验。,24,大家好,连续型变量(,continuous variable):,在一个区,间中任意取值。如血压、身高、体重。,离散型变量(,discrete,variable):,只能取整,数。如新生儿出生数、手术病人数。,定量变量,分类,2.,定性变量(,qualitative variable),定义:,定性变量亦称计数变量(,enumeration variable,)或分类变量(,categorical variable,),是将观察单位按某种属性或类别分组,清点得到的各组的观察单位数。所得的资料称为定性资料。,25,大家好,特点:没有,度量衡,单位;,多为,间断性,资料。,统计分析,:,常用,率、构成比,进行统计描述;用,卡方检验,、,秩和检验,进行假设检验。,二分类变量,:,如男女、生死、有无 等。常,用,0,和,1,编码。,名义变量,:,如职业、地区等。常用多个,0,和,1“,假变量”编码。,等级变量,:,如优、良、中、差;检验结果,-,、,、,+,、,+,、,+,等。常用,1,,,2,,,3,,,4,,编码。,无序变量,有序变量,定性变量,26,大家好,变量转换,定量,变量,有,序,变,量,血压值,kpa,8,低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,二分类变量,单纯随机抽样,系统抽样,分层抽样,33,大家好,六、频率与概率(,frequency&probability,),频率:样本的实际发生率,称为,频率,。设在相同条件下,独立重复进行,n,次试验,事件,A,出现,m,次,则事件,A,出现的频率为,f=,m,/,n,。,概率:随机事件发生的可能性大小,,用大写的,P,表示,取值,0,,,1,,,即,0,P,1,。,34,大家好,必然事件,P,=1,随机事件,0,P,1,不可能事件,P,=0,统计学上把,P,0.05,或,P,0.01,称为,小概率事件,(,习惯,),,认为不大可能发生。,Certain,Impossible,0.5,0,1,通常我们把经常遇到的事件分为三种类型,:,35,大家好,频率与概率间的关系:,1.,样本频率总是围绕概率上下波动;,2.,样本含量,n,越大,波动幅度越小,频率越接近概率。,图 抛硬币“正面”向上的频率摆动示意图,36,大家好,第三节,学习卫生统计学应注意的问题,1.,重点掌握卫生统计学的基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事项。,学习过程中必须注意结合专业、联系实际,如在阅读医学文献时,评价其统计设计和分析方法的优缺点等。对于书中所用的统计公式,只要求了解其意义、用途、应用条件和计算方法,不必深究其数学推导。,37,大家好,2.,要培养科学的统计思维方法,提高分析问题、解决问题的能力。,例如,由于事物存在个体差异,抽样误差不可避免,但这种误差是有规律性的,据此可引出统计推断的理论;通过假设检验的逻辑推理,就能理解统计结论的概率性。,38,大家好,3.,掌握调查设计和实验设计的原则,培养搜集、整理、分析统计资料的系统工作能力。,首先要重视原始资料的完整性和准确性,对数据处理持严肃、认真、实事求是的科学态度,反对伪造和篡改统计数据。能综合评价人群的健康状况和卫生部门的工作状况,为卫生决策提供科学、正确的统计信息。,39,大家好,思考题,1.,试举例说明同质与变异、总体与样本、参数与统计量之间的关系。,2.,如何理解概率值的大小对统计推断的意义?,3.,试举例说明统计资料的类型。,4.,卫生统计学和医学科学研究的关系如何?,40,大家好,Thank You!,41,大家好,结束,42,大家好,
展开阅读全文