1、Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,医学统计学,(,Medical Statistics,),李会庆,huiqing4192,课程的目的与要求,医学统计学教学课程的主要目的:,统计分析方法的基本理论和实用条件;,单因素分析;,常用的多因素分析。,课程的局限性:,为其它统计分析方法提供基础,有些专业问题,在此基础上,由专门的统计软件解决。,例如:,循证医学,META,分析软件,多个基因多态性的单倍体
2、型分析,单倍体型,基因突变遗传方式的计算由,HAPOTYPE,等软件进行;,多关联指标的综合评价分析中的减维分析(聚类、因子、主成分分析);,基因组学、蛋白组学、代谢组学等分析软件,从诸多标志物中分析主要的标志物;,时间序列资料的,有序回归、自回归分析;,指数曲线的生存分析;,药物共同作用的交互作用分析(包括独立,相加和相乘)方法;,这些需要从本专业老师处学习解决。,要求,1,、不要缺课;,2,、每人准备高中学生用的计算器一个;,3,、每人需要做题的练习本,做题要正规;,4,、基本概念、基本理论和方法要掌握。,5,、要互相交流与讨论。,第一章 绪论,Charpter1,:,Introducti
3、on,第一节 概述统计学与医学统计学方法,统计学,是,收集,、,分析,、,解释,与,呈现,数据资料的一门科学。,Statistics,:,“,a science dealing with the,collection,analysis,interpretation,and,presentation,of masses of numerical data”,-Webster,国际大辞典,收集数据,:,实验设计、调查设计,(8,9),分析数据,:,统计学描述,(2),、统计学推断,(37;10),解释数据,:,根据专业等解释统计结果,(,穿插各个章节,),呈现结果,:,向杂志社、上级部门发表结果,
4、12),医学统计学,用统计学原理和方法研究医学问题,第二节 医学统计资料的来源与分类,1.,计量,资料,2.,计数资料,3.,等级资料,4.,三类资料间,关系,住院号,年龄,身高,体重,住院天数,职业,文化程度,分娩方式,妊娠结局,2025655,27,165,71.5,5,无,中学,顺产,足月,2025653,22,160,74.0,5,无,小学,助产,足月,2025830,25,158,68.0,6,管理员,大学,顺产,足月,2022543,23,161,69.0,5,无,中学,剖宫产,足月,2022466,25,159,62.0,11,商业,中学,剖宫产,足月,2024535,27,1
5、57,68.0,2,无,小学,顺产,早产,2025834,20,158,66.0,4,无,中学,助产,早产,2019464,24,158,70.5,3,无,中学,助产,足月,2025783,29,154,57.0,7,干部,中学,剖宫产,足月,观察单位,observations,个体,individuals,变量,variables,Quantitative data,计量资料,Qualitative data,计数资料,Units,;,elements,1.,计量资料,用仪器、工具等,测量,(measure),方法获得的数据,即为,计量资料,measurment,data,。也叫定量数据,Q
6、uantitative data,特点:,有计量单位,,如患者的身高(,cm,)、体重(,kg,)、血压(,mmHg,)、脉搏(次,/,分)、红细胞计数(,10,/L,),2.,计数资料,按某种属性分类,然后清点每类的数据,称,计数资料,(,count data,)或,enumeration data,。,也叫,定性数据,Qualitative data,特点:,无固有计量单位,,如肤色(黑、白)、血型(,ABO,)、职业(工农兵)、性别(男女),3.,等级资料,Rank data,半定性或半定量的观察结果。有大小顺序,所以也叫,有序分类资料,(,ordinal category data,)
7、癌症分期:早、中、晚。,药物疗效:治愈、好转、无效、死亡。,尿蛋白:,+,+,及以上,实例数据,1,实例数据,2,4.,三类资料间关系,例:一组,20,40,岁成年人的血压,以,12kPa,为界分为正常与异常两组,统计每组例数,8,低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,计量资料,等级资料,计数资料,第三节 统计学常用的基本概念,1.,随机变量及其分类,2.,同质与变异,3.,总体与样本,4.,参数与统计量,5.,误差,6.,概率,1.,随机变量,(random variable),简称,变量,(,variable,),统计上习惯用大写拉丁字母表示,如,
8、X,、,Y,、,Z,、,。,变量值,习惯,用小写拉丁字母表示,如性别,x,1,1,(男),、,x,2,1,(男)、,x,3,0,(女),、,。,编号(,ID,),性别(,X,),体重 (,kg,)(,Y,),疗效(,Z,),张,1,1,66,0,李,2,1,78,1,王,3,0,57,2,随机变量的分类,离散型变量,(,discrete variable,),相当于计数资料,连续性变量,(,continuous variable,),相当于计量资料,有序变量,(,ordinal variable,),相当于等级资料,2.,同质与变异,homogeneity,and,variation,同质:指
9、事物的性质、影响条件或背景相同或非常相近,;,处于同一总体的个体之间存在共性,。,变异,:指同质的个体之间的差异。,同质与变异的例子,例,1,调查,2003,年西安市,7,岁男童的身高和体重,同质,:,2003,年、西安市、,7,岁男童,变异,:身高和体重各不相同,例,2,研究某降压药的疗效,同质,:高血压患者、用某药治疗,变异,:疗效各不相同,表,1-1 120,名正常成年男子红细胞计数值,(10,12,/L),5.12,5.13,4.58,4.31,4.09,4.41,4.33,4.58,4.24,5.45,4.32,4.84,4.91,5.14,5.25,4.89,4.79,4.90,5
10、09,4.64,5.14,5.46,4.66,4.20,4.21,3.73,5.17,5.79,5.46,4.49,4.85,5.28,4.78,4.32,4.94,5.21,4.68,5.09,4.68,4.91,5.13,5.26,3.84,4.17,4.56,3.52,6.00,4.05,4.92,4.87,4.28,4.46,5.03,5.69,5.25,4.56,5.53,4.58,4.86,4.97,4.70,4.28,4.37,5.33,4.78,4.75,5.39,5.27,4.89,6.18,4.13,5.22,4.44,4.13,4.43,4.02,5.86,5.12,5
11、36,3.86,4.68,5.48,5.31,4.53,4.83,4.11,3.29,4.18,4.13,4.06,3.42,4.68,4.52,5.19,3.70,5.51,4.64,4.92,4.93,4.90,3.92,5.04,4.70,4.54,3.95,4.40,4.31,3.77,4.16,4.58,5.35,3.71,5.27,4.52,5.21,4.37,4.80,4.75,3.86,5.69,最大值,=6.18,最小值,=3.29,极差,=2.89,算术均数,=,4.72,,标准差,=0.57,3.,总体与样本,population and sample,总体,:,根据研
12、究目的确定的,同质,研究对象的,全体,(集合)。分有限总体与无限总体,样本,:从总体中随机抽取的部分观察单位,随机抽样,random,sampling,为了保证样本的,可靠性,和,代表性,,需要采用随机的抽样方法(在总体中每个个体具有,相同的机会,被抽到)。,4.,参数与统计量,parameter and statistic,参数,:,总体,的统计指标,如总体均数、标准差,采用希腊字母分别记为,、,。,固定的常数,总体,样本,抽取部分观察单位,统计量,参 数,推断,inference,统计量,:,样本,的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。,参数附近波动的随机变量,。,5.,
13、误差,error,误差,:实际,观察值,与客观,真实值,之差,(,1,)系统误差,(,2,)随机误差,(,1,)系统误差,systematic error,在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为,偏倚,(,bias,)。,特点:观察值有,系统性,、,方向性,、,周期性,的偏离真值。,可以通过严格的,实验设计,和,技术措施,消除,。,(,2,),随机误差random error,排除上述误差后尚存的误差,受多种无法控制的因素的影响。,特点:大小方向不一的随机变化。,随机测量误差,(,random measur
14、ement error,),提高操作者熟练程度可以减少这种误差,随机抽样误差,(,random,sampling error,):由抽样造成的样本统计量和总体参数间的差异。,不可避免,但有一定的分布规律,可估计。,6.,概率,probability,确定性现象,:在一定条件下,,一定,会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫,必然事件,;肯定不发生某种结果的叫,不可能事件,。,随机现象,:在同样条件下,可能,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为,随机事件,。随机事件的特征:,随机性,;,规律性,:每次发生的可能性的大小是确定的。,
15、概率:,随机事件发生的可能性大小,用大写的,P,表示;取值,0,,,1,。,必然事件,P,=1,不可能事件,P,=0,随机事件,0,P,1,P,0.05,(,5,)或,P,0.01,(,1,),称为,小概率事件,(,习惯,),,统计学上认为不大可能发生。,小概率事件,样本的实际发生率称为,频率,。设在相同条件下,独立重复进行,n,次试验,事件,A,出现,f,次,则事件,A,出现的频率为,f,/,n,。,频率与概率间的关系:,样本频率总是围绕概率上下波动,样本含量,n,越大,波动幅度越小,频率越接近概率。,频率,frequency,第四节 统计工作的,基本,步骤,1.,统计设计,:包括调查、实验
16、设计。,2.,收集资料,:取得准确可靠的原始资料,3.,整理资料,:对资料进行清理、改错,数量化,4.,分析资料,:统计描述、统计推断,统计学发展及有关问题,20,世纪,20,年代,,英国统计学家,R.A.,Fisher,爵士,(,1890-1962,)创立了,实验设计方法和统计分析,技术,奠定现代生物统计的基础。,1948,年,,英国发表了评价链霉素治疗肺结核疗效的,随机对照的临床试验,报告,第一次采用生物统计方法进行临床干预试验。,1948,年,,,郭祖超,教授(,19121999,)编著的,医学与生物统计方法,,是我国第一部医学统计方法的教科书。,1.,实例,遗传学家,F.Galton,
17、爵士(,1822-1911,)对上千家庭父亲身高和儿子身高的观察发现遗传的“回归”现象,1960,年英国医生,Doll,,,Hill,等发现吸烟与肺癌有关,2.,医学论文中的统计学问题,60,年代到,80,年代,国外医学杂志调查结果:有统计错误的论文,20%72%,。,1996,年对,4586,篇论文统计(中华医学会系列杂志占,6.9%,),数据分析方法误用达,55.7%,。,3.,伪造统计数据违反科学道德,1976,年,New Science,杂志关于科研舞弊行为的调查,(,1,),74%,的调查表反映有不正当修改数据的情况,(,2,),17%,拼凑实验结果,(,3,),7%,凭空捏造数据,
18、4,),2%,故意曲解结果,Fancy,statistical methods cannot rescue,garbage,data,Fancy statistical methods can help you gain,insight into your data,over and above what seems obvious on its face,You should always worry about whether the sampled results are representative of the population,and whether your,sample
19、 allows you to make inferences about the population,.,A Warning!,2.,某年级甲班、乙班各有男生,50,人。从两个班各抽取,10,人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?,3,用,A,,,B,两种药物分别治疗一批患者。如果,A,药的治愈率高于,B,药,,证明,A,药的疗效优于,B,药。这种说法对吗?为什么?,4,既然,观察对比,不可避免地存在偏倚,为什么不能用,干预试验,取代观察对比?,思考题,第二章 数值变量的描述性统计,Descriptive Statistics,描述分析的目
20、的,1,、以表和图的形式将原始数据进行简洁的表达,;,2,、为统计学分析,(,显著性检验,),方法的选择提供依据:,观察原始数据的资料属性和分布类型;,(1),适合某数理统计分布类型,-,进行参数检验;,(2),不符合任何数理统计分布的,-,-,进行非参数检验。,计量资料的定义,(Quantitative data),通常用仪器或尺度进行测量或衡量所取得的数据(有度量衡单位的资料)为计量资料,计量资料的统计描述,计量资料统计描述的指标,频数表与频数分布,平均指标(算术均数、几何均数、中位数、众数),变异指标(极差、百分位数与四分位间距、方差、标准差、变异系数),第一节,频数分布,(freque
21、ncy distribution),例:测得,130,名健康成年男子脉搏,(,次,/,分,),如下,做描述分析,75,82,66,60,72,81,77,69,76,80,77,67,78,70,75,68,72,82,64,75,72,66,79,65,69,67,67,75,67,75,64,70,66,69,76,73,72,71,79,69,72,73,75,79,80,63,73,66,57,64,75,66,68,77,76,81,68,74,71,69,70,74,61,63,71,58,65,79,61,76,80,64,72,70,62,78,70,68,64,80,69,6
22、4,76,70,73,65,69,74,72,60,72,72,72,77,70,78,73,77,71,70,71,69,73,76,84,66,70,73,60,76,82,73,64,65,73,73,63,80,68,76,70,79,77,64,70,66,69,73,78,76,1.,频数表的编制步骤,(,1,)求极差(,range,):即最大值与最小值之差,又称为全距。,本例极差:,R,=84 57=27,(次,/,分),(,2,)决定组数、组段和组距:根据研究目的和样本含量,n,确定。组距,=,极差,/,组数,通常分,10-15,个组,为方便计,组距参考极差的十分之一,再略加调
23、整。,本例 组距,I,=R /10=27/10=2.7 3.0,(,3,)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。,(,4,)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。,组段,(,1,),划 记,(,2,),频数,,f,(,3,),组中值,,X,(,4,),fX,(5)=(3)(4),56,1 1,2,57,114,59,11111,5,60,300,62,111111111111,12,63,756,65,111111111111111,15,66,990,68,1111111111111111111111111,25,69
24、1725,71,11111111111111111111111111,26,72,1872,74,1111111111111111111,19,75,1425,77,111111111111111,15,78,1170,80,1111111111,10,81,810,83,1,1,84,84,合计,130,9246,2.,频数表的分布特征,集中趋势,(central tendency):,变量值集中位置。本例在组段“,71,”,均数,=71.32,。,平均水平指标,离散趋势,(tendency of dispersion):,变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕
25、中心”左右对称,标准差,=5.80,。,变异水平指标,当,N,增大,组距缩小到非常小,则可以连成一曲线,第二节 集中趋势,算术均数,中位数,几何均数,第二节 集中趋势,常用几种平均值:,1.,算术均数,2.,几何均数,3.,中位数,集中位置的描述,常用,平均值,来描述。,平均值是一组数据典型,或有代表性的值。由于这样典型的值趋向于,落在根据数据大小排列的数据的中心,因此,可以用于度量集中位置(位置指标),1.,算术均数(均数),意义:一组,性质相同,的观察值在数量上的平均水平。,表示(总体)(样本),计算:直接法、间接法、计算机,应用:正态分布或近似正态分布,注意:合理分组,才能求均数,否则
26、没有意义。,特征:各观察值与总体均数或样本均数差的代数和为,0,。,算术均数的计算公式,直接法,频数表法,100,名,18,岁女大学生身高均数的计算(加权法),身高组段,(,1,),频数,f,(,2,),组中值,X,(3),fX,(4),154,2,155,310,156,4,157,628,158,11,159,1749,160,13,161,2093,162,22,163,3586,164,19,165,3135,166,15,167,2505,168,9,169,1521,170,4,171,684,172174,1,173,173,合 计,f,=100,fx,=1638,2.,几何均,
27、数,意义:,N,个数值的乘积开,N,次方即为这,N,个数的几何均数。,表示:,G,计算:直接法和频数表法,应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。,3.,中位数、第,50,百份位数,中位数:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。,将,N,个观察值从小到大依次排列,再分成,100,等份,对应于,50%,位的数值即为第,50,百分位数,即中位数,表示:,M,P,X,计算:,M,为累计频数含,50%,的组段,,L,为该组段的下限,,i,为组距,,f,m,为小于,L,的各组段的累计频数,应用:偏态资料,开口资料,众数和调和均数,众数为一组观
28、察值中出现频率最高的那个观察值;若是分组资料,众数为出现频率最高的那个组段。,调和均数为各变量值倒数的算术均数的倒数。,例,:4,个学生分别在,1,小时内解题,3,、,4,、,6,、,8,,问平均解题速度是多少?,1,小时内平均每人解几道题?,第三节 离散趋势,全局,百分位数,四分位间距,方差,标准差,变异系数,离散程度的描述,描述一组数据参差不齐的程度,全距,四分位数间距,方差,标准差,变异系数,1.,全距、四分位数间距全距,=,最大值,-,最小值(,range),四分位数间距,(Q),:上四分位数(,P,75,)与下四分位数,(,P,25,)之差,包含了全部观察值的一半。,百分位数,将,N
29、个观察值从小到大依次排列,再分成,100,等份,对应于,X%,位的数值即为第,X,百分位数。中位数是百分位的特殊形式。同样的例子还有四分位数、十分位数等。,表示:,M,、,PX,计算:,应用:偏态资料,开口资料,方差,离均差平方和,(Mean of,Squares,MS,),:每个观察值与总体均数之差的平方和,方差,(Variance),为离均差平方和的均数,总体与样本方差公式为:,2.,标准差,相关概念:离均差、离均差平方和、方差(,2,S,2,),标准差的符号:,S(,样本参数),(总体参数),标准差的意义:全面反映了一组观察值的变异程度,.(,越大说明围绕均数越离散,反之说明较集中在均
30、数周围,均数代表性越好,),标准差的应用:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围,均数和标准差的计算公式,1.,均数(,mean,),为求和符号,读成,sigma,适用条件,:资料呈正态或近似正态。,2.,标准差,标准差,(,standard deviation,)即方差的正平方根;其单位与原变量,X,的单位相同。,3.,变异系数,意义:,标准差与均数之比用百分数表示。,符号,:CV,计算,:CV=,(,S/X,),100%,无单位,应用:,单位不同的多组数据比较,均数相差悬殊的多组资料,第四节 正态分布,上述类型的频数分布图,可以用数学上的正态分布,norma
31、l distribution,的特性进行描述分析,一、正态曲线的,数学形式,二、正态曲线(,normal curve,),图形特点,:,钟型,中间高,两头低,左右对称,最高处对应于,X,轴的值就是均数,曲线下面积为,1,标准差决定曲线的形状,X,f,(,X,),m,正态分布的,2,个参数,X,f,(,X,),m,位置参数,(,均数的位置,),形状参数,(,曲线的胖瘦,),均数和标准差决定了正态曲线的形状,正态分布的重要性,正态分布是医学统计学中参数统计的最基本的理论基础,其特性必须牢固掌握,.,有关其特征下次再讲,.,均数和标准差的计算公式,1.,均数(,mean,),为求和符号,读成,sig
32、ma,适用条件,:资料呈正态或近似正态。,2.,标准差,标准差,(,standard deviation,)即方差的正平方根;其单位与原变量,X,的单位相同。,小结,测得,130,名健康成年男子脉搏,(,次,/,分,),的描述分析结果表达如下:,图,1,130,名健康成年男子脉搏分布的直方图,曲线下面积分布规律,0,-1,1,-1.96,1.96,-2.58,2.58,68.27%,95.00%,99.00%,-,+,-1.96,+1.96,-2.58,+2.58,68.27%,95.00%,99.00%,计算正态曲线下面积实例,例2-13,mmol,/L,,,试估计该地正常女子血清甘油三脂在
33、1.10,mmol,/L,以下者占正常女子血清甘油三脂总人数的百分比。,将,X=1.10,代入标准正态变量变换公式,得:,查附表,1,,在表的左侧找到,0.1,,在表的上方找到,0.04,,两者的相交处为,0.4443=44.43%,。即该地正常女子血清甘油三脂在,1.10mmol/L,以下者,估计占总人数的,44.43%,。,mmol,/L,,,实例图示,44.43,五、医学参考值的估计,步骤:,1.,从“正常人”总体中抽样:明确研究总体,2.,统一测定方法以控制系统误差。,3.,判断是否需要分组(如性别、年龄)确定。,4.,根据专业知识决定单侧还是双侧。,单侧下限,-,过低异常 单侧上限
34、过高异常 双侧,-,过高、过低均异常,单侧下限,异常,正常,单侧上限,异常,正常,异常,正常,双侧下限,双侧上限,异常,1.,正态分布法,方法:,1.,正态分布法,2.,百分位数法,双侧,100(1-)%,正常值范围:,单侧,100(1-)%,正常值范围:,双侧,95%,正常值范围:,单侧,95%,正常值范围:,2.,百分位数法,双侧,95%,正常值范围:,P,2.5,P,97.5,单侧,95%,正常值范围:,P,5,(,下限),适用于偏态分布资料,思考题,什么是计量资料?,计量资料的频数分布表如何编制?,计量资料的频数分布图与样本大小有何关系?,计量资料的频数分布图为对称形状,可以用什
35、么数学分布描述?,正态分布曲线的,2,个参数是什么?,计量资料的频数分布图为不对称形状,如何处理,?(,下次讲解内容,),第三章 分类变量的描述性统计,计数资料的数据整理,常用相对数指标,应用注意事项,计数资料的数据整理,计数资料:,按某种属性分类,然后清点每类的数据(以下是:孕妇分娩资料),住院号,年龄,职业,文化程度,分娩方式,妊娠结局,2025655,27,无,中学,顺产,足月,2025653,22,无,小学,助产,足月,2025830,25,管理人员,大学,顺产,足月,2025677,24,知识分子,中学,顺产,早产,2025647,30,管理人员,大学,顺产,足月,2025848,3
36、2,无,小学,剖宫产,足月,2019915,27,无,中学,顺产,死产,2025861,29,无,大学,剖宫产,足月,2024601,25,农民,中学,顺产,足月,2000386,26,无,小学,顺产,足月,按年龄(,2,岁一组)与职业整理,年龄,工人,管理人员,农民,商业服务,无,知识分子,总计,18,2,0,0,0,3,0,5,20,9,2,6,10,18,0,45,22,28,7,10,24,70,11,150,24,50,34,28,52,153,44,361,26,50,43,25,45,133,70,366,28,34,35,10,34,78,57,248,30,11,14,11,
37、22,39,17,114,32,14,2,3,14,24,3,60,34,4,2,5,3,12,2,28,36,2,1,1,4,5,1,14,38,3,1,1,0,2,1,8,40,0,0,2,0,0,0,2,合计,207,141,102,208,537,206,1401,第一节 常用的比例指标及其意义,率,(,rate,):,说明某现象或某事物,发生,的,频率,或,强度,。,率,=,(实际发生数,/,可能发生总数),比例基数,比例基数,:,100%,、,1000,、,10000/,万、,100000,(,1/10,万)等,如,:发病率、死亡率、发生率、阳性率、患病率等,构成比,(,propo
38、rtion,):,说明某一事物内部,各组成部分所占的,比重。,也叫百分比。,比,构成比,=,(,某,部分观察单位数,/,各,组成部分观察单位,总,数),100%,如,:教研室,16,人,中高级职称有,4,人,占,20,。,相对比,(,relative ratio,):是,A,、,B,两个有关指标之比,说明,A,是,B,的若干倍或百分之几,通常用倍数或分,数表示。,如,:男:女、医生:护士、教师:学生,率与构成比,率,构成比,概念,发生的频率或强度,各组成部分所占的比重,强调点,随机发生事件,各部分的构成,资料获得,较难,容易,特点,不一定,合计为,100,率与构成比的例子,年龄组,受检,人数,
39、白内障例数,患者年龄构成比(,%,),患病率(,%,),=(3)/(2),40,50,60,70,80,合计,560,441,296,149,22,68,129,135,97,19,15.18,28.79,30.13,21.65,4.24,12.14,29.25,45.61,65.10,86.36,1468,448,100.00,30.52,相对比,相对比为两个有关指标的比,例如:性别比,=,男性,/,女性,x100%,第二节 相对危险度与优度比,一、相对危险度(,RR,),暴露与非暴露队列资料,RR=,暴露队列发病率,/,非暴露队列发病率,二、优势与优势比(,odds,odds ratio,
40、OR),病例,-,对照资料,OR=odds1/odds0=ad/,bc,(,四格表数据),第三节 率的标准化法,直接法,间接法,第四节 动态数列,发展水平和发展速度,增长量与增长,sudu,平均发展速度与平均增长速度,发展水平的预报,(资料分布特征与不同多元回归数理模型预测),第五节 比例指标应用时的注意事项,1,、不能以构成比代替率。,2,、计算相对数的分母不宜过小。小则直接叙述。,3,、进行率的对比分析时,应注意资料可比性。如,比较疗效时,比较组间应病情轻重相同,性别影响,应按性别分组后再作比较。,4,、正确求平均率。,例:若,P,1,=,x,1,/,n,1,P,2,=,x,2,/,n,2,P,3,=,x,3,/,n,3,P,(,x,1,+,x,2,+,x,3,),/,n,1,+,n,2,+,n,3,),(,正确,),P,(,P,1,+,P,2,+,P,3,),/3,(,错误,),资料描述分析小结,定性(分类)资料描述,集中趋势统计指标:率(点值估计),离散趋势指标:标准误,分布类型:,2,分叉变量,二项分布,内部成分组成比重,百分比构成指标,






