1、卫生统计学复习笔记卫生统计学复习笔记一、 概述1、卫生统计学的概念(熟练掌握)统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。卫
2、生统计学的内容(了解):1)健康统计:医学人口统计、疾病统计和生长发育统计等;2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。2、卫生统计学的工作步骤(熟练掌握)统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究
3、工作中最关键的一环,也是指导以后工作的依据2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。经常性工作记录:如卫生监测记录、健康检查记录等。专题调查或实验。3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条
4、理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行描述;后者是指如何抽样,以及如何用样本信息推断总体特征。进行资料分析时,需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。统计工作的四个步骤紧密相连、不可分
5、割,任何一步的缺陷,都将影响整个研究结果。3、基本概念:1)、同质与变异。严格地讲,同质是指被研究指标的影响因素完全相同。但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上,客观世界充满了变异,生物医学领域更是如此。哪里有变异,哪里就需要统计学。若所研究的同质群
6、体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。2)、总体与样本任何统计研究都必须首先确定观察单位,亦称个体。观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有
7、限总体和无限总体。有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。样本是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体(山东省2002年7岁健康男孩)
8、中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。从总体中抽取样本的过程为抽样,抽样方法有多种。抽样研究的目的是用样本信息推断总体特征。统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。3)、资料与变量及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值或观察值,亦称为资料。按变量的值是定量的还是定性的,可将变量分为以下类型,变
9、量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先要分清变量类型。1)数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高(cm)、体重(kg)、血压(mmHg kPa)、脉搏(次/min)和白细胞计数(10 9 /L)等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。2)分类变量:其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类
10、:(1)无序分类变量是指所分类别或属性之间无程度和顺序的差别。它又可分为二项分类,如性别(男、女),药物反应(阴性和阳性)等;多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。(2)有序分类变量各类别之间有程度的差别。如尿糖化验结果按、分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化
11、。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。4、随机事件与概率医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种
12、结果都是一个随机事件。对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值,常用P表示。例如,投掷一枚均匀的硬币,随机事件A表示“正面向上”,用 n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发生的频率(f=m/n),0mn, 0f1。用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8, 7/20=0.35, , 249/500=0.498, 501/1000=0.501, 10001/2000=0.5000,由此看出当投掷次数n足够大时,f=m/
13、n0.5,称P(A)=0.5,或简写为:P=0.5。当n足够大时,可以用f估计P。随机事件概率的大小在0与1之间,即0P1,常用小数或百分数表示。P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。P1表示事件必然发生,P0表示事件不可能发生,它们是确定性的,不是随机事件,但可以把它们看成随机事件的特例。若随机事件A的概率P(A)a,习惯上,当a=0.05时,就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如,某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万,但大街上仍有行人,这是因为 “被撞”事件是小概率事件,所以行人认为自己上街这
14、“一次试验”中不会发生“被撞”事件。“小概率”的标准a是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定a=0.01,甚至更小。误差是指测定结果与真实结果之间的差值。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。 误差的分类 误差分为绝对误差和相对误差。也可以根据误差的来源分为系统误差(又称偏性)和随机误差(又称机会误差)。 1、绝对误差是测量值对真值偏离的绝对大小,因此它的单位与测量值的单位相同。 2、相对误差则是绝对误差与真值的比值,因此它是一个百分数。一般来说,相
15、对误差更能反映测量的可信程度。相对误差等于测量值减去真值的差的绝对值除以真值,再乘以百分之一百。 3、系统误差是由一些固有的因素(如测量方法的缺陷)产生的,理论上总是可以通过一定的手段来消除。如天平的两臂应是等长的,可实际上是不可能完全相等的;天平配置的相同质量的砝码应是一样的,可实际上它们不可能达到一样。 4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差(也称为偶然误差和不定误差)。 第二节 疾病统计常用指标一、疾病统计的意义疾病统计(morbidity statistics)从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律,为病因学研究,为
16、防治疾病和评价防治工作效果提供科学依据。二、疾病统计资料的来源包括以下三个方面:1.疾病报告和报表资料2.医疗卫生工作记录3.疾病调查资料三、疾病和死因分类疾病和死因的分类是按国际疾病和死因分类(international classification of diseases,简称ICD), 目前正在使用的版本是ICD10。见有关书籍。四、常用疾病统计指标1.反映疾病发生水平的指标(1)发病率(incidence rate)(2)患病率(prevalence rate)2.反映疾病构成情况的指标3.反映疾病危害程度和防治效果的指标(1)某病死亡率:见死因别死亡率。(2)某病病死率(case f
17、atality)(3)治愈率(cure rate)(4)有效率(5)生存率(survival rate):指病人能活到某一时点的概率。常用于对慢性病的治疗效果或预后估计。(五)、残疾统计1.残疾的定义及分级残疾是指在心理、生理、人体结构上,某种组织、功能丧失或者不正常,全部或者部分丧失以正常方式从事某种活动能力的人。分为功能、形态残疾(impairment)、丧失功能残疾( disability)和社会功能残疾(handicap)三个此次。2.残疾的常用统计指标(1)残疾患病率(2)残疾构成第一节医学人口统计常用指标一、医学人口统计资料的来源1.来源于人口普查资料2.来源于人口抽样调查资料3.
18、来源于人口抽样资料,包括生命时间登记、人口迁移变动登记、户口登记等途径。二、人口数与人口构成(一)人口总数人口总数(Population)一般指一个国家或某一特定时间的人口数,一般采用一年的中点,即7月1日零时为标准时刻统计。(二)人口构成及其分析1、基本人口学特征包括年龄、性别、文化、职业等,其中最常用的是性别和年龄,用以描述人口构成情况。2、人口年龄构成指各年龄组人口在总人口中所占的比例。在人口年龄构成的基础上,可以导出许多有用的描述人口状况的指标,比如:(1)人口系数1)老年(人口)系数:老年人口系数越大,表明人口中老年人口所占比重越大;在一定程度上反映人群的健康水平。2)少年儿童(人口
19、)系数少年儿童人口系数越大,表明人口中少年人口所占比重越大,人口越年轻。该指标主要受生育水平的影响。(2)负担系数又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比。负担系数包括三个指标:总负担系数=少年儿童负担系数=老年负担系数=(3)老少比:是划分人口类型的标准之一。老少比=3、性别比指男性人口与女性人口的比值,即性别比=4、人口金字塔是将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或年龄构成比为横轴,按左侧为男、右侧为女绘制的直方图,其形如金字塔,故称为人口金字塔。人口金字塔更形象直观地反映了人口的年龄构成,便于说明和分析人口现状、类型及发展趋势。三、生育
20、与计划生育统计(一)、生育与计划生育统计资料的来源有关原始资料包括人口、出生、死亡、结婚登记、育龄妇女资料等,可向有关部门索取,也可根据需要自行调查取得。(二)生育与计划生育统计指标1.反映生育水平的指标(1)粗出生率(crude birth rate,简记为CBR):粗出生率=上式中平均人口数的取值,若在人口普查年,可用普查所得的该地该年7月1 日零时的人口总数;在非人口普查年,则用上年末及本年末两个人口数的平均值。粗出生率的优点在于资料易获得,计算简单,但它的主要缺点是受人口的年龄、性别构成和婚姻状况的影响。粗出生率只能粗略地反映生育水平。 总生育率(general fertility r
21、ate,简记为GFR):指某地某年平均每千名妇女的活产数。 总生育率=总生育率消除了总人口中年龄性别构成不同对生育水平的影响,较粗出生率能更确切地反映生育水平。但受育龄妇女内部年龄构成的影响。(3)年龄别生育率(age-specific fertility rate,简记为ASFR):又称年龄组生育率,其算式为:某年龄组生育率=年龄别生育率消除了育龄妇女内部年龄构成不同对生育水平的影响。(4)终生生育率(life-time fertility rate,简记为LTFR)与总和生育率(total fertility rate,简记为TFR)终生生育率说明一批经历过整个生育期的同龄妇女一生的生育水
22、平,其算式为:终生生育率=总和生育率的算式为:总和生育率=n2.测量人口再生育的 统计指标(1)自然增长率(natural increase rate,简记为NIR):是粗出生率(CBR)与粗死亡率(CDR)之差,即NIR=CBR-CDR(15.13)自然增长率容易理解,计算简单,但它受人口的性别、年龄构成不同的影响,只能粗略地估计人口的一般增长趋势,不能用来预测未来人口的发展速度。(2)粗再生育率(gross reproduction rate,简记为GRR)粗再生育率是只计算女婴的总和生育率。(3)净再生育率(net reproduction rate,简记为NRR)NRR=(15.14)
23、式中ASFR为只记女婴的年龄别生育率。(4)平均世代年数(mean length of generation,简记为LG)LG=上式中NRR的计算前已述及;分子育龄妇女总人年数的计算见课本表15.1第(6)栏。3.反映计划生育工作情况的统计指标(1)避孕现用率(2)Pearl怀孕率(Pearl pregnancy rate):是评价避孕效果的指标。(3)累计失败率(cummulative failure rate):是在给定时间内,妇女用某一措施后意外怀孕的人数。能较准确地反映避孕效果。(4)人工流产率(induce abortion rate):反映育龄妇女中人工流产的强度。(5)人流活产比
24、(ratio of induced abortion and live birth):用于间接地反映计划外怀孕情况。(6)计划生育率:用于综合说明计划生育的质量。(7)节育率:反映计划生育工作质量。4与出生有关的其他常用指标(1)低出生体重百分比(proportion of low birth weight):反映居民健康水平及孕期保健的情况。(2)儿童妇女比(child-women ratio):是一个间接反映生育水平的指标,其优点在于不需要活产数,在没有生命事件登记的地区常用它间接测量生育水平。四、人口死亡统计(一)、人口死亡资料的来源我国人口死亡资料主要由公安部门负责收集,并按ICD-1
25、0中的死因分类填写。(二)、常用人口死亡统计指标1测量死亡水平的指标(1)粗死亡率(crude death rate, CDR):具有资料易获得,计算简单的优点,但受人口的年龄、性别构成情况的影响。K为比例系数,常用/千,/万,或/10万。(2)年龄别死亡率(age-specific death rate, ASDR):年龄别死亡率消除了人口的年龄构成不同对死亡水平的影响,不同地区同一年龄组的死亡率可以直接进行比较。(3)婴儿死亡率(infant mortality rate, IMR):是反映社会卫生状况和婴儿保健工作的重要的指标,不受年龄的影响,可直接比较。(4)新生儿死亡率(neonat
26、al mortality rate, NMR):是反映妇幼卫生工作质量的重要指标。(5)围生儿死亡率(perinatal mortality):是衡量孕前、孕期、产期、产后保健工作质量的敏感指标之一。(6)5岁以下儿童死亡率(child mortality under age 5):是综合反映儿童健康水平和变化的主要指标。(7)孕产妇死亡率(maternal mortality rate):这一指标不仅可以评价妇女保健工作,而且间接反映一个国家的卫生文化水平。(8)死因别死亡率(cause-specific death rate):是死因分析的重要指标,反映各类病伤死亡对居民生命的危害程度。2
27、.反映死因构成及死因顺位的指标(1)死因构成或相对死亡率(proportion of dying of a specific cause):反映各种死因的相对重要性。(2)死因顺位:是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性。第十二章统计表和统计图1掌握统计表的编制基本原则2掌握统计表的编制基本要求要求统计表和统计图是统计描述的重要方法。医学科学研究资料经过整理和计算各种统计指标后,所得结果除了用适当的文字说明外,常将统计资料及其指标以表格列出(称为统计表,statistical tables),或将统计资料形象化,利用点的位置、线断的升降、直条的长短或面积的大小等
28、形式直观表示事物间的数量关系(称为统计图,statistical graph)。统计表与统计图可以代替冗长的文字叙述,表达清楚,对比鲜明。一、常用统计表(一)统计表的结构与编制1统计表的结构统计表由标题、标目、线条和数字构成。如下表所示:表号标题横标目名称纵标目合 计横标目数字合计2列表的原则重点突出,简单明了,即一张表一般表达一个中心内容,便于分析比较;主谓分明,层次清楚,符合逻辑,明确被说明部分(主语)与说明部分(谓语)。3编制要求(1)标题要能概括表的内容,写于表的上端中央,一般应注明时间与地点。(2)标目标目是表格内的项目。以横、纵向标目分别说明主语与谓语,文字简明,层次清楚。横标目列
29、在表的左侧,一般用来表示表中被研究事物的主要标志;纵标目列在表的上端,一般用来说明横标目的各个统计指标的内容。标目内容一般应按顺序从小到大排列,小的放在上面,不同时期的资料可按年份、月份先后排列,有助于说明其规律性。(3)线条线条不易过多,常用3条线表示,谓之“三线图”。表的上下两条边线可以用较粗的横线,一般省去表内的线条,但合计可用横线隔开。表的左右两侧的边线可省去,表的左上角一般不用对角线。(4)数字以阿拉伯数字表示。表内的数字必须正确,小数的位数应一致并对齐,暂缺与无数字分别以“”、“-”表示,为“0”者记作“0”,不应有空项。为方便核实与分析,表一般应有合计。(5)说明一般不列入表内。
30、必要说明者可标“”号,于表下加以说明。(二)统计表的种类通常按分组标志多少分为简单表与组合表。 简单表(simple table)由一组横标目和一组纵标目组成,如表2-10。 表2-10 2001年某省不同地区的卫生系统反应性评分比较地区调查人数评分均值省会城市333703.63一般城市152507.15县及乡村971679.06合计1456666.73 复合表(combinative table)是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表,如表2-11。 表2-11 2001年某省不同地区、性别的卫生系统反应性评分比较地区男女调查
31、人数评分均值调查人数评分均值省会城市217706.60116698.07一般城市100517.1552487.92县及乡村371669.88600684.74合计688659.26768673.43二、常用统计图医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。 绘制统计图的基本要求 o 根据资料的性质和分析目的决定适当的图形。 o 标题应说明资料的内容、时间和地点,一般位于图的下方。 o 图的纵、横轴应注明标目及对应单位,尺度应等距或具有规律性,一般自左而右、自上而下、由小到大。 o 为使图形美观并便于比较,统计图的长宽比例一般为7:5,有时为
32、了说明问题也可加以变动。 o 比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。 常用统计图的适用条件与绘制 1条图(bar graph) 条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分.制图要求:(1)一般以横轴为基线,表示各个类别;纵轴表示其数值大小。(2)纵轴尺度必须从0开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须相等。(3) 各直条宽度应相等,各直条之间的间隙也应相等,其宽度与直条的宽度相等或为直条宽度的1/2。(4)直条的排列通常由高到底,以便比较。(5)复式条图绘
33、制方法同上,所不同的是复式条图以组为单位,1组包括2个以上直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。图2-3 2001年某省不同地区的卫生系统反应性评分比较图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较2圆图(pie graph)圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重(图2-5)。图2-5 2001年某医科大学公共卫生学院专业技术人员构成制图要求:(1)先绘制以大小适当的圆形。由于圆心角为360度,因此每1%相当于3.6度的圆周角,将各部分百分比分别
34、乘以3.6度即为各构成部分应占的圆周角度数。(2)圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制,其他置最 简单表(simple table)由一组横标目和一组纵标目组成,如表2-10。 表2-10 2001年某省不同地区的卫生系统反应性评分比较地区调查人数评分均值省会城市333703.63一般城市152507.15县及乡村971679.06合计1456666.73 复合表(combinative table)是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表,如表2-11。 表2-11 2001年某省不同地区、性别的卫生系统反
35、应性评分比较地区男女调查人数评分均值调查人数评分均值省会城市217706.60116698.07一般城市100517.1552487.92县及乡村371669.88600684.74合计688659.26768673.43二、常用统计图医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。 绘制统计图的基本要求 o 根据资料的性质和分析目的决定适当的图形。 o 标题应说明资料的内容、时间和地点,一般位于图的下方。 o 图的纵、横轴应注明标目及对应单位,尺度应等距或具有规律性,一般自左而右、自上而下、由小到大。 o 为使图形美观并便于比较,统计图的长宽
36、比例一般为7:5,有时为了说明问题也可加以变动。 o 比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。 常用统计图的适用条件与绘制 1条图(bar graph) 条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分.制图要求:(1)一般以横轴为基线,表示各个类别;纵轴表示其数值大小。(2)纵轴尺度必须从0开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须相等。(3) 各直条宽度应相等,各直条之间的间隙也应相等,其宽度与直条的宽度相等或为直条宽度的1/2。(4)直条的排列通常由高到底,以
37、便比较。(5)复式条图绘制方法同上,所不同的是复式条图以组为单位,1组包括2个以上直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。图2-3 2001年某省不同地区的卫生系统反应性评分比较图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较2圆图(pie graph)圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重(图2-5)。图2-5 2001年某医科大学公共卫生学院专业技术人员构成制图要求:(1)先绘制以大小适当的圆形。由于圆心角为360度,因此每1%相当于3.6度的圆
38、周角,将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。(2)圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制,其他置最 绘制要求(普通线图):(1)横轴表示某一连续变量(时间或年龄等);纵轴表示某种率或频数,其尺度必须等距(或具有规律性)。(2)同一图内不应有太多的曲线,通常5条,以免观察不清。(3)如有几根线,可用不同的图线(实线、虚线等)来表示,并用图例说明。(4)图线应按实际数字绘制成折线,不能任意改为光滑曲线。5直方图(histogram) 直方图用于表达连续性资料的频数分布。以不同直方形面积代表数量,各直方形面积与各组的数量成正比关系(图2-8)。图2-8 2
39、001年某地区居民受教育年限分布制图要求:(1)一般纵轴表示被观察现象的频数(或频率),横轴表示连续变量,以各矩形(宽为组距)的面积表示各组段频数。(2)直方图的各直条间不留空隙;各直条间可用直线分隔,但也可不用直线分隔。(3)组距不等时,横轴仍表示连续变量,但纵轴是每个横轴单位的频数。6散点图(scatter diagram) 散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系(图2-9)。根据点的散布情况,推测2种事物或现象有无相关,故常在对资料进行相关分析之前使用。图2-9某地区饮水氟含量与氟骨症患病率散点图制图要求:(2)一般横轴代表自变量或可进行精确测量、严格控制的变量,纵轴则代表与自变量有依存关系的因变量。(2)纵轴和横轴的尺度起点可根据需要设置。