1、1课程安排承担单位:公共卫生学院教师:袁兆康 13576935811课时:理论课:52学时,11次 考 试:2学时 共 计:54学时2 参考书参考书:1.方积乾主编.卫生统计学.人民卫生出版社,第七版2.王燕,安琳主编.卫生统计学.北京大学医学出版社.3.余松林主编.医学统计学.人民卫生出版社.2003.33如何学习统计学建立统计思维方法理解基本统计概念和原理掌握具体统计方法认真实习多阅读文献(设计和资料处理方法)应用:分析数据、写论文6定义二:统计学是在相对有限的样本数据上,对特定的随机现象作出推断的学科。本质:部分 全体 随机现象:在一定条件下,某现象有不确定的结果,可能是这个结果,也可能
2、是其它结果。7二、统计学的分类1、数理统计学:研究、揭示随机现象数量规律性的学科,其更关注统计推断的新方法的发展,要求有较多的抽象数学知识作为工具。2、应用统计学:关心如何把数理统计方法应用到特定的领域,如经济学、心理学、公共卫生学及医学等。8统计概念统计概念-统计一词有统计一词有3种含义种含义 统计实践统计实践统计资料统计资料统计学:从事收集、显示、分析和解释被研究对象的数量统计学:从事收集、显示、分析和解释被研究对象的数量关系,籍以揭示事物真实情况的一门学问。关系,籍以揭示事物真实情况的一门学问。统计学统计学方法论方法论专门技术专门技术用数学方法证明统计学用数学方法证明统计学指收集、显示、
3、分析和指收集、显示、分析和中所用方法和公式的正确性中所用方法和公式的正确性解释数据的手段和工具,解释数据的手段和工具,目的在于获得对事物的本质目的在于获得对事物的本质认识认识9医学统计学(medical statistics )是应用统计(专业统计)的一个分支,介绍医药卫生领域常用的统计学知识,类似的学课有:卫生统计学(health statistics)生物统计学(biostatistics)10三、统计工作的基本步骤第一步第一步 研究设计研究设计(design)第二步第二步 收集资料收集资料(collection of data)第三步第三步 整理资料整理资料(sorting data)第
4、四步第四步 分析资料分析资料(analysis of data)这四个步骤包括了一个研究的全部过程。11第一步第一步 研究设计研究设计(开题报告)开题报告)意义、目的、方法、内容、对象、样本含量、主要指标、误差的控制、进度、预期结果等(文献综述基础上进行)其中有可能涉及到的统计内容是什么?12第二步第二步 收集资料收集资料(现场调查现场调查):实验记录、病例记录、工作记录、专门调查专门调查等 计划的实施和执行过程,常常是一个漫长的时间,关键是保证前后的一致性和资料的完整性13第三步第三步 整理资料整理资料(sorting data):建立数据库、过录、输入、逻辑检错等。(分析资料的基础和数据质
5、量)第四步第四步 分析资料分析资料(analysis of data):各种描述、统计检验方法、多元回归等各种描述、统计检验方法、多元回归等(选择正确的分析方法)(选择正确的分析方法)(这些是这次课程的主要内容)(这些是这次课程的主要内容)14三、几个基本的统计学概念三、几个基本的统计学概念1.总体与样本总体与样本(population and sample)2.变量变量(Variable)3.变异变异(variation)4.误差误差(error)5.概率概率(probability)总体:总体:根据研究目的确定的研究对象的全体(群体)。研究一般希望获得研究群体的特征。总体是同质的(homo
6、geneity)总体是抽象的 有限总体(finite population)无限总体(infinite population)描述总体数量特征的统计指标称为参数参数 (parameter),用希腊字母表示。样本:样本:总体中有代表性的一部分个体组成的集体。从总体中得到样本的方法称为抽样抽样(sampling)。样本所包含的个体数称为样本含量样本含量,用n表示。描述样本数量特征的统计指标称为统计量统计量(statistic),用英文或拉丁字母表示。从样本推回到总体的方法称为统计推断(统计推断(statistical inference),包括参数估计和假设检验两部分。1.总体与样本总体与样本(p
7、opulation and sample)2.变量变量(Variable)在确定了研究总体之后,研究者要对每个观察单位的某项特征进行测量和观测,这种特征称为变量变量。变量的测得值或观察值也叫做变量值变量值或资料(data)。资料分类:(资料性质不同,分析方法不同(资料性质不同,分析方法不同)计量资料、计数资料、等级资料 (1)计量资料(measurement data)定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料,又称数值变量(numerical variable)。特点:有度量衡单位 多为连续性资料分类:连续型变量(continuous data)
8、离散型变量(discrete data)(2)计数资料(enumeration data)定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单、多为间断性 资料又称分类变量(categorical variable):有序分类变量(ordinal categorical variable)无序分类变量(unordered categorical variable)(3)等级资料(ranked data)定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。20 3.变异
9、变异(variation)概念:个体(变量值)之间的差异就是 变异。变异产生的原因:处理效应、误差如何处理变异?透过偶然,发现必然!透过偶然,发现必然!4.误差误差(Error)统计上所说的误差泛指测量值与真值真值之差,样本指标与总体指标之差。主要有以下三种:过失误差、系统误差、随机误差(随机测量、随机抽样)。问题:哪类误差用统计学方法可以控制?为什么?22(1)系统误差(systematic error)概念:指在研究过程中由于某个环节的缺陷或失误,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性。23(2)随机测量误差(random measurement erro
10、r)概念:由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。24(3)随机抽样误差(sampling error)概念:样本指标与总体指标之间的差别。特点:有抽样,抽样误差就不可避免。统计上可以计算并在一定范围内控制随机抽样误差。减少抽样误差的方法:减少抽样误差的方法:(1)改进抽样方法(增加样本的代表性),误差从大到小:整群抽样单纯随机抽样系统抽样分层抽样(2)增加样本量;(3)选择变异程度较小的研究指标。26医学科学研究中的误差通常指测量值与真值之差,其中包括
11、:医学科学研究中的误差通常指测量值与真值之差,其中包括:误差误差解释解释解决办法解决办法系统误差系统误差不是偶然机遇所致,不是偶然机遇所致,尽可能避免尽可能避免,或通过周或通过周(systematic而是某种必然因素所致,而是某种必然因素所致,密的研究设计解决密的研究设计解决error)具有一定的倾向性具有一定的倾向性随机测量误差随机测量误差偶然机遇所致,是不可避免的偶然机遇所致,是不可避免的控制在一定的允许范围控制在一定的允许范围(randommeasurementerror)内,数据仍可以使用内,数据仍可以使用随机抽样误差随机抽样误差抽样研究中,即使消除了抽样研究中,即使消除了可以通过统计
12、方法估计可以通过统计方法估计(samplingerror)系统误差,控制系统误差,控制了随机测量了随机测量并减小并减小误差,样本指标和总体参数间误差,样本指标和总体参数间仍会存在差别。这是由个体变仍会存在差别。这是由个体变异造成,是抽样波动所致,异造成,是抽样波动所致,不可避免的不可避免的随机测量误差及抽样误差又同属于随机误差。随机测量误差及抽样误差又同属于随机误差。27 5 5、概、概 率率(probability)概念:描述随机事件发生可能性大小的数值,常用P来表示。大小:P的大小在0和1之间。通常一个事件的发生小于5%,就叫小概率事件小概率事件。在实际工作中,当观察单位的例数足够多时,可
13、以用频率来代替概率。频率与概率(样本与总体、事实与预测)28293031卫生统计资料的要求卫生统计资料的要求(1)资料完整、正确。资料完整、正确。完整是指调查项目填写完整无空项。完整是指调查项目填写完整无空项。(2)有足够的数量。原始数据要有一定的数量才能反映事物有足够的数量。原始数据要有一定的数量才能反映事物的规律性,但并不是越多越好,足够即可。的规律性,但并不是越多越好,足够即可。(3)具有代表性、可比性。代表性是指样本对总体要有代表具有代表性、可比性。代表性是指样本对总体要有代表性。对于有限总体,随机抽样保证样本的代表性。性。对于有限总体,随机抽样保证样本的代表性。32 33(1)原始数据的检查与核对)原始数据的检查与核对这部分检查核对应在调查现场时做这部分检查核对应在调查现场时做,以便及时更以便及时更正。正。(2)数据库中的数据检查与核对)数据库中的数据检查与核对数据的取值范围检错数据的取值范围检错数据间的逻辑关系检错数据间的逻辑关系检错34