资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Statistics,“,A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”(Websters International Dictionary),。,“,The science and art of dealing with variation in data through collection,classification,and analysis in such a way as to obtain reliable results”(John M.Last,A Dictionary of Epidemiology),。,统计学是一门处理数据中变异性的,科学与艺术,,内容包括收集、分析、解释和表达数据,目的是求得,可靠的,结果。,一、同质和变异,同质(,homogeneity:,对观察指标产生影响的因素相同,。,统计学中是指对观察指标影响较大且可以控制的主要因素尽可能相同。,例如:在研究血压时,要求将对血压影响较大的因素如年龄、运动情绪、测定的时间、环境温度等要控制在相同的条件下。,同质的基础上个体间的差异称为,变异,(,variation,)。,例如:在相同的条件下,同为男性,每个人的血压值各不相同,这种情况称为变异。,二、总体与样本,总体(,population),:,根据研究目的确定的性质相同的观察单位的全体。更确切地说,是同质的所有观察单位某项观察值(变量值)的集合。,例如:研究某地2002年正常成人白细胞数。,有限总体(,finite population),;,无限总体(,infinite population):,例如研究用某药治疗高血压患者的疗效。,从总体中随机抽取部分观察单位其某项指标的实测值组成,样本(,sample),。,目的是用样本的信息推论总体特征。,例如:从上述的某地,2002,年正常成人中随机抽取150人,这150,个,正常成人的白细胞数就是样本。,从总体中抽取部分个体的过程称为,抽样,。,抽样必须遵循,随机化原则,,即总体中每一个体有,同等的机会,被抽取,-,代表性。,三、概率,在一定条件下某一现象可能发生又可能不发生的事件叫做,随机事件,。医学研究的现象绝大多数是随机现象。,例如:用相同方法治疗某病患者,我们只知道治疗转归可能是治愈、好转、无效、死亡四种结果之一,但事先很难确定。,概率(,probability),是反映某一随机事件发生的可能性大小的量,用符号,P,表示,概率,P,的取值范围在0与1之间。,统计学上一般把,P0.05,或,P0.01,的事件称为,小概率事件,,表示某事件发生的可能性很小,在实际的一次抽样中可认为不会发生,。,四、参数与统计量,根据总体个体值计算出来的描述总体特征的指标称,参数(,parameter),。,参数一般用希腊字母表示,如总体均数,、,总体率,等。,例如:某地正常成年男子的舒张压的平均值。,根据样本个体值计算出来的描述样本特征的指标称,统计量(,statistic),。,统计量用拉丁字母表示,如样本均数、样本率,P。,总体参数一般是未知的或假设的,而样本统计量是研究者从样本中计算得到的。,五、抽样误差,抽样误差(,sampling error),是因存在个体差异、由于抽样的原因引起样本指标(统计量)与总体指标(参数)之间存在差异,以及从同一总体中抽取不同的样本时,各指标间也存在差异。,只要存在变异,抽样误差不可避免,但抽样误差的大小是有规律可循的。,一般情况下,个体间的变异程度越大,抽样误差越大;样本例数越多,抽样的误差越小。,统计资料的类型,观测单位的某个特征称为,变量(,variable),,,又称为,观察指标,。如人的年龄、体重、身高等。,变量的观察结果或测定值称为,变量值,(,value of variable),。,。,变量可分为,数值变量,和,分类变量,。,一、数值变量,(,numerical variable),数值变量,又称为连续性变量、定量变量。其变量值是用定量方法测量的,表现为数值的大小,通常具有一定的,度量衡,单位。,例如:身高(,cm)、,坐高(,cm)、,体重(,kg)、,体温(,o,C),血压(,kPa),等都是数值变量。,所得的资料称为,计量资料,。,二、分类变量,(,categorical variable,),分类变量,又称为,定性变量,,其变量值是用定性方法得到的。,通常按事物的,性质和类别分类,,然后清点个数所得到的数值,表现为互不相容的类别或属性。,根据类别是否有程度上的差别,其又可分为以下两种类型:,无序分类(,unordered categories),:,二项分类:如治疗结果按治愈和未愈,多项分类:如测量某人群的血型,结果分为,A,型、,B,型、,AB,型、,O,型,表现为多个互不相容的类别。,有序分类(,ordinal categories),有序分类的各类别之间有程度上的差别,且排列有序,有半定量的含义,又称为半定量变量。例如临床疗效按治愈、显效、好转和无效分为四级。,三、变量的转化,不同类型的变量之间可否相互转化?,如观察某人群成年女子的血红蛋白量(,g/L),,属数值变量;若按血红蛋白正常与异常分为两类,属二项分类变量;若按血红蛋白量的多少分为5个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高,又属有序分类变量。,医学统计工作的基本步骤,:,设计(,design);,收集资料(,collection of data);,整理资料(,sorting data);,分析资料(,analysis of data),。,
展开阅读全文