收藏 分销(赏)

第三讲描述离散趋势的指标.ppt

上传人:快乐****生活 文档编号:2436785 上传时间:2024-05-30 格式:PPT 页数:90 大小:1.09MB
下载 相关 举报
第三讲描述离散趋势的指标.ppt_第1页
第1页 / 共90页
第三讲描述离散趋势的指标.ppt_第2页
第2页 / 共90页
第三讲描述离散趋势的指标.ppt_第3页
第3页 / 共90页
第三讲描述离散趋势的指标.ppt_第4页
第4页 / 共90页
第三讲描述离散趋势的指标.ppt_第5页
第5页 / 共90页
点击查看更多>>
资源描述

1、第三讲描述离散趋势的指标Outline 主要内容主要内容 n描述离散趋势的统计指标n描述分布形态的统计指标只用平均数描述资料的弊病甲组 2629303134均数30kg乙组 2427303336均数30kg丙组 2628303234均数30kg丙乙甲三组儿童体重的离散程度平均数与变异度平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征!均数&标准差中位数&四分位数间距 变异度小,则均数代表性好!变异度大,数据分散,则均数代表性差!描述离散趋势的指标变异度极差(Range)四分位数间距(interquartile range)方差(Variance)标准差(Stand

2、ard Deviation)变异系数(coefficient of variation)描述离散趋势的指标1:极差全距(range),极差 R=maxmin极差反映反映一组数据的变化范围极差适用于:任何分布资料计算极差:甲组 2629303134乙组 2427303336丙组 2628303234极差优点和缺点优点:简便缺点:1.只利用了两个极端值2.n大,R也会大3.不稳定描述离散趋势的指标2:四分位数间距P75、P 25分别表示上、下四分位数四分位数间距(quartilerange)Q P75 P 25四分位数间距反映数据的变异程度比极差稳定。四分位间距适用于:任何分布资料。组组 段段(1

3、)频频 数数(2)频频率率()(3)累累计频计频数数(4)累累计频计频率率()(5)610.8310.83832.5043.331065.00108.331286.671815.00141210.003025.00162016.675041.67182722.507764.17201815.009579.17221210.0010789.172486.6711595.832643.3311999.17 283010.83120100.00合合 计计120100.00描述离散趋势的指标3:方差离均差离均差离均差平方和离均差平方和离均差平方和的均数离均差平方和的均数方方 差差方差、标准差适用于:对

4、称分布的资料,尤其是正态分布资料。描述离散趋势的指标3:方差方差(variance)也也称称均均方方差差,观观察察值值的的离离均均差差平平方方和和的的算算术术均均数数。表表示示一一组组数数据据的的平平均均离离散散程程度。度。总体方差总体方差只能取正值;只能取正值;方差越大,意味着个体间变异越大;反之亦然。方差越大,意味着个体间变异越大;反之亦然。描述离散趋势的指标4:标准差标准差(standard deviation),方差的平方根方差的平方根 只能取正值;只能取正值;标准差越大,意味着个体间变异越大;反之亦然。标准差越大,意味着个体间变异越大;反之亦然。总体标准差总体标准差样本标准差样本标准

5、差描述离散趋势的指标5:变异系数变异系数(coefficientofvariation,CV)排除了平均水平的影响,并取消了单位。因此变异系数常用于:比较量纲不同的变量间变异度比较均数相差悬殊的变量间变异度。量纲不同变量间变异度的比较均数均数 标准差标准差变异系数变异系数青年男子青年男子 身高身高170 cm6 cm3.5 体重体重60 kg7 kg11.7均数差别较大的变量间变异度比较年龄组年龄组均数均数 标准差标准差变异系数变异系数33.5岁岁96.13.13.2 3035岁岁170.25.00.3不同年龄组男子身高(不同年龄组男子身高(cm)的变异度)的变异度描述分布形态的统计指标1、偏

6、度系数:coefficientofskewness2、峰度系数:coefficientofkurtosis正确应用(1)算数均数:适用于对称分布资料;几何均数:适合于对数正态分布资料;中位数和百分位数:适用于任何分布的资料;中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。正确应用(2)极差:适用于任何分布资料四分位间距:适用于任何分布资料标准差:适用于对称分布资料变异系数:常用于量纲不同的变量间或均数相差较大的变量间变异度的比较本章小结本章小结1.频数表、频率分布图:频数表、频率分布图:描述资料的分布特征(描述资料的分

7、布特征(集中趋势与离散趋势集中趋势与离散趋势)分布类型(分布类型(对称或偏峰对称或偏峰)2.描述性统计量:描述性统计量:定量地刻画统计分布的特征定量地刻画统计分布的特征。(1)集中趋势:)集中趋势:算术均数、几何均数、中位数算术均数、几何均数、中位数;(2 2)离散趋势:离散趋势:极差、四分位数间距、方差极差、四分位数间距、方差(标准差标准差)和变异系数;和变异系数;3.百分位数是一种位置参数百分位数是一种位置参数 描述集中趋势:描述集中趋势:P50;描述离散趋势描述离散趋势P75-P25课后作业与思考题课后作业与思考题:作业:作业:1、离散趋势指标的计算(书31页第1、2、3题)思考题思考题

8、1、离散趋势指标各自的适用条件是什么?2、如何对定性指标进行描述?本章结束谢谢谢谢卫生统计学卫生统计学第三章定性资料的统计描述第三章定性资料的统计描述关英辉关英辉沈阳何氏医学院管理系沈阳何氏医学院管理系第四讲第四讲 相对数指标、医学人口统计描述相对数指标、医学人口统计描述主要内容主要内容 n三类相对数指标n 医学人口统计常用的指标一、常用的相对数指标一、常用的相对数指标除了用频率分布全面反映一个定性变量外除了用频率分布全面反映一个定性变量外,有时,有时,也可用其它相对数指标从某个侧面来描述定性也可用其它相对数指标从某个侧面来描述定性变量。变量。n相对数指标大致有三种类型:频率(Frequenc

9、y)有的书称比率(Proportion)强度(intensity)有的书称速率(rate)相对比(ratio)(一一)频率型指标频率型指标频率型指标:最常见,近似地反映某一事件出现的机频率型指标:最常见,近似地反映某一事件出现的机会大小会大小,如患病概率、病如患病概率、病死概率等。死概率等。K是比例基数,取是比例基数,取100%、1000、1万万/1万和万和10万万/10万万特点:分子是分母的一部分;特点:分子是分母的一部分;无量纲,在无量纲,在01范围内取值范围内取值 (二)强度型指标(二)强度型指标 “强度强度”是流行病学、统计学术语是流行病学、统计学术语 -单位时段内某现象发生的频单位时

10、段内某现象发生的频率。如率。如例例3-3 在某医院的院内感染调查中,在某医院的院内感染调查中,5031个病人个病人共观察了共观察了127859人日(相当于人日(相当于127859人观察人观察1日)日),其中有,其中有596人在医院发生感染。人在医院发生感染。观察人年数观察人年数=10日日120人+9日240人+8日380人+3日890人+2日920人+1日1200人=127859人日 平均每天有平均每天有0.47%的病人将在医院发生感染。的病人将在医院发生感染。一般地,一般地,其中比例基数其中比例基数K同上。同上。分母含有分母含有“时间时间”,并不是一般的速率,而是单位时,并不是一般的速率,而

11、是单位时间内的频率。间内的频率。统计学和流行病学本质:频率强度或概率强度的近似统计学和流行病学本质:频率强度或概率强度的近似值。值。(三)相对比型指标(三)相对比型指标 任何两个相关联的变量任何两个相关联的变量A与与B之比之比 相对于相对于B的一个(或十个、百个、千个等)单的一个(或十个、百个、千个等)单位,位,A有多少个单位有多少个单位A和和B可以是绝对数可以是绝对数,也可是相对数也可是相对数A和和B的量纲可以不同,也可相同,但的量纲可以不同,也可相同,但A和和B互互不包含不包含(四)应用相对数应注意的事项(四)应用相对数应注意的事项1.防止概念混淆防止概念混淆 不少指标命名混乱不少指标命名

12、混乱:“某某率某某率”满天飞满天飞!某些指标,实质上只是相对比,其名称却是某些指标,实质上只是相对比,其名称却是某某率某某率;更多指标以更多指标以某某率某某率的模式命名,笼统地称的模式命名,笼统地称它它们为们为“率率”-分不清究竟是频率还是强度分不清究竟是频率还是强度人口构成及其统计指标人口构成及其统计指标发病率(发病率(incidence rate,IR):):“时期时期”通常用年或月。发病率的分母泛指一般的观察人通常用年或月。发病率的分母泛指一般的观察人年数年数,可由平均人口数可由平均人口数1年来近似。年来近似。新发病例数:新发生某种疾病,以第一次就诊为准。新发病例数:新发生某种疾病,以第

13、一次就诊为准。用于探讨疾病的危险因素,评价疾病防治效果用于探讨疾病的危险因素,评价疾病防治效果。2.计算相对数时分母应有足够数量计算相对数时分母应有足够数量 例例 甲医院治疗某类患者甲医院治疗某类患者100人,人,40人有效;人有效;乙医院治疗同类患者乙医院治疗同类患者5人,人,2人有效人有效 有效频率均为有效频率均为40%!?如果资料的总例数过少,计算得到的相对数如果资料的总例数过少,计算得到的相对数偏差可能会很大,直接报告原始数据更为可取:偏差可能会很大,直接报告原始数据更为可取:甲医院有效率甲医院有效率40%40%乙医院有效乙医院有效 2/52/53.正确地合并估计正确地合并估计例例 甲

14、医院治疗某类患者甲医院治疗某类患者100人,人,40人有效;人有效;乙医院治疗同类患者乙医院治疗同类患者90人,人,30人有效人有效如果两医院总体有效率的确相等如果两医院总体有效率的确相等,合并估计:合并估计:不可将两个频率相加除以不可将两个频率相加除以2:4.相对数间的比较要具备可比性相对数间的比较要具备可比性 注意以下几个方面:注意以下几个方面:观察对象观察对象 同质?同质?研究方法研究方法 相同?相同?观察时间观察时间 一致?一致?粗死亡率的定义式近似地写成粗死亡率的定义式近似地写成以上说明同样适用于年龄组死亡率、粗出生率和粗发以上说明同样适用于年龄组死亡率、粗出生率和粗发病率等,不再赘

15、述。病率等,不再赘述。比较不同时期或不同地区的粗死亡率,如人口比较不同时期或不同地区的粗死亡率,如人口的年龄及性别分布不一致,应按性别、年龄标的年龄及性别分布不一致,应按性别、年龄标准化后作比较准化后作比较(见第见第1414章章)。二、二、医学医学人口统计常用指标人口统计常用指标n一、医学人口统计资料的来源n二、人口数与人口构成n三、生育与计划生育统计n四、人口死亡统计课后作业与思考题课后作业与思考题作业:1、频率指标和强度型指标有什么区别?(书47页1(1)题)思考题:1、还有哪些描述定性资料的指标?本章结束谢谢谢谢第五讲第五讲 疾病统计指标、动态数列及其指标 主要内容主要内容 n疾病统计常

16、用指标n动态数列及其指标 一、疾病一、疾病统计常用指标统计常用指标n疾病统计的意义n疾病统计资料的来源n疾病和死因分类n常用疾病统计指标二、动态数列及其分析指标二、动态数列及其分析指标表表表表3-10 3-10 3-10 3-10 某大学某大学某大学某大学1992-20021992-20021992-20021992-2002年本科专业招生动态变化年本科专业招生动态变化年本科专业招生动态变化年本科专业招生动态变化 一、一、绝对增长量绝对增长量二、发展速度与增长速度二、发展速度与增长速度三、平均发展速度和平均增长速度三、平均发展速度和平均增长速度 平均发展速度平均发展速度 =环比的几何均数 平均

17、增长速度平均增长速度 =平均发展速度平均发展速度 1预测预测2004年年 前提:平均发展速度保持不变前提:平均发展速度保持不变a12满足满足 a12=1.0412 4200=6724人人根根据据该该大大学学1992-2002年年的的平平均均发发展展速速度度,如如果果今今后后保保持持这这个个速速度度,预预计计到到2004年年末末学学生生人人数数可可达达6724人。人。预测预测2040年?年?本章小结本章小结1.描述定性资料的相对数大致有三种类型:描述定性资料的相对数大致有三种类型:频率型、强度型和相对比型频率型、强度型和相对比型 2.实践中许多指标都称为实践中许多指标都称为XX率,要注意每个指标

18、的定率,要注意每个指标的定义和性质义和性质,不可简单地望文生义。不可简单地望文生义。3.动态数列指标如发展速度和增长速度可描述事物在动态数列指标如发展速度和增长速度可描述事物在不同时期的发展水平和趋势。要注意:预测的前提不同时期的发展水平和趋势。要注意:预测的前提条件是条件是“平均发展速度保持不变平均发展速度保持不变”。课后作业与思考题:课后作业与思考题:作业:1、教材47页第1(5)、(7)题思考题:1、直观的统计描述方法是什么?本章结束谢谢谢谢第六讲常用统计图表统计表(statisticaltable)与统计图(statisticalchart)是应用广泛的统计描述方法。通过统计表和统计图

19、可以对数据进行概括、对比或做直观的表达。统计表(statisticaltable)将统计数值或统计指标用将统计数值或统计指标用表格的形式列出表格的形式列出便于便于统计结果的精确统计结果的精确、简洁的、简洁的表达表达便于便于对比分析对比分析便于便于计算计算统计表统计表 1.1.统计表的结构统计表的结构 2.2.列表原则和要求列表原则和要求 3.3.统计表的种类统计表的种类 4.4.不良统计表的修改举例不良统计表的修改举例1.统计表的结构2.列表原则和要求标题:概括地指明表的内容,有时应包括时间、地点。多数场合标题应包括表的编号。标题位于统计表的最上部。标目:分为纵标目与横标目。纵标目标示相应列的

20、内容;横标目标示相应的行的内容,反映主要研究事物的标目应放在表左侧。表线:不宜太多。不允许使用竖线与斜线。表值:表中的数字一律使用阿拉伯数字。同列数据小数位要相同。表内不应空格。不详的数据可用“”填充。不存在的数据应以“”号标明。零值应用“0”表示。注释:一律列在表的下方,可用“*”号等符号标示。3.统计表的种类简单表简单表:表中只有一个分组变量,一般作为横标目,而纵标目就是统计指标名称。组合表组合表:表中包含两个或两个以上分组变量,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目上。简单表分组治愈未愈合计替硝唑25 429甲硝唑181432合计431861表表1 不同药物治

21、疗急性冠周炎效果比较不同药物治疗急性冠周炎效果比较组合表表表2-5 A、B两种药物在甲、乙两医院的疗效两种药物在甲、乙两医院的疗效药物药物甲医院甲医院乙医院乙医院总计总计有效有效无效无效合计合计有效有效无效无效合计合计A40105042850100B351550331750100合计合计752510075251002004.不良统计表的修改举例不良统计表的修改举例统计表制作是否良好,可以从以下几方面检查:统计表制作是否良好,可以从以下几方面检查:标题是否正确标目的排列是否合适,是否组合重复。表线是否过多过密。4.不良统计表的修改不良统计表的修改年龄年龄性别性别21303140415051606

22、170男男 女女男男 女女男男 女女男男 女女男男例数例数10 148 1482 37213 4922性别例数2130岁岁3140岁岁4150岁岁5160岁岁6170岁岁男1088221322女14143749表表2-1修改后的统计表修改后的统计表统计图统计图(statistical chart)将统计数值或统计指标将统计数值或统计指标用图形的方式表达用图形的方式表达作用:作用:它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形形象地象地表达出来,更直观地直观地反映出事物间的数量关系,更易于比较和理解比较和理解。统计图统计图 1.1.制图原则和要求制图原则和要求 2.2.统计图

23、的种类及绘制注意事项统计图的种类及绘制注意事项 3.3.不良统计图的修改举例不良统计图的修改举例1.制图原则和要求制图原则和要求选图选图:按照资料的性质与分析目的恰当地选用图形。标题标题:以扼要说明统计图的内容(时间、地点等),位于图的正下方。图例图例:对图中的不同事物应通过不同的图案或颜色加以区别,并附图例。图例位于图形与标题之间。坐标轴坐标轴:横轴的方向应自左至右;纵轴的方向应自下而上。横轴与纵轴均应有标目。表示量的数轴应标注合适的原点、尺度、单位;表示 分组的轴应标注组别。为美观考虑,统计图的轮廓以高:宽=5:7为宜(近似黄金分割的比例)。按照按照资料的性质与分析目的资料的性质与分析目的

24、恰当地选用图形恰当地选用图形直条图直条图:性质相似而不连续的资料,用于表达不连续指标的数值大小性质相似而不连续的资料,用于表达不连续指标的数值大小直方图直方图:连续型变量资料的频数分布连续型变量资料的频数分布百分条图百分条图:构成比资料,表示总体中各部分的比重构成比资料,表示总体中各部分的比重圆图圆图:构成比资料,表示总体中各部分的比重构成比资料,表示总体中各部分的比重线图线图:连续型变量资料,适用于表达事物之间变化幅度的比较连续型变量资料,适用于表达事物之间变化幅度的比较 半对数线图半对数线图:连续型变量资料,适用于表达事物之间相对变化速度的比较连续型变量资料,适用于表达事物之间相对变化速度

25、的比较 箱式图箱式图:连续型变量资料,用于多组数据的直观比较分析连续型变量资料,用于多组数据的直观比较分析 标题图例坐标轴2.统计图的种类及绘制注意事项统计图的种类及绘制注意事项直条图直方图百分条图圆图线图半对数线图箱式图1)直条图(bargraph)用等宽直条的长短来表示各独立指标大小。适用资料:性质相似而不连续的资料。有单式和复式两种单式直条图单式直条图:一个分组因素:一个分组因素复式直条图复式直条图:两个分组因素两个分组因素绘制要点绘制要点坐标轴:坐标轴:纵轴纵轴为数值,必须从必须从“0 0”开始开始,否则会改变各,否则会改变各对对 比组间的比例关系;比组间的比例关系;横轴为观察项目,横

26、轴各直条一般按按 统计指标统计指标由从大到小,从小到大,由从大到小,从小到大,或按时间顺序排列。或按时间顺序排列。直条:直条:应应等宽,等间距等宽,等间距。复式直条图在同一观察项目的。复式直条图在同一观察项目的 各组之间无间距。各组之间无间距。图图2-8 直条图纵坐标应从零点开始直条图纵坐标应从零点开始2)直方图(histogram)用矩形面积表示连续型变量的频数(频率)分布。适用资料:连续型变量的资料图图2-2 120例健康成年男子血清铁含量分布例健康成年男子血清铁含量分布(频率密度=频率/组距)图图2-3 某地居民某地居民238人发汞含量分布人发汞含量分布(频率密度频率密度=频率频率/组距

27、组距)绘制要点绘制要点坐标轴坐标轴 纵轴:频率密度(频率纵轴:频率密度(频率/组距),组距),尺度从尺度从0开始。开始。横轴:连续型变量的组段。横轴:连续型变量的组段。各矩形条之间各矩形条之间不留空隙不留空隙。矩形的高度为频数密度,宽度为组距。矩形的高度为频数密度,宽度为组距。以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例。适用资料:构成比资料。构成比资料。3)百分条图(percent bar graph)表2-8两种脱落牙再植效果效果嵌入性脱位牙脱落牙成功2420良好127较好1213失败410合计5250绘制要点标尺:一定要有标尺,画在图的上方或下方,起始

28、的位置、总长度和百分条图一致,并和百分条图平行。分段:按各部分所占百分比的大小排列,在图上标出百分比。图例:在图外要附图例说明。多组比较:若要比较的事物不止一个时,可以画几个平行的百分条图,以示比较。各条图的排列顺序相同,图例相同。4)圆图圆图(circle graph)(circle graph)以一个圆面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的构成比例。用途与百分条图相同。但多组数据作比较,圆图的效果不如百分条图。适用于构成比资料。适用于构成比资料。图2-10 嵌入性脱位牙的再植效果 绘制要点先绘圆,将构成比乘以3.60,即得各构成部分所占的圆心角的度数。以相当于时钟的

29、9点、12点或3点的位置为起点依次排列各个扇形。扇形内要注明简要文字和百分比。5)线图()线图(line graph)普通线图(line graph):用线段的升降表达事物之间变化幅度(绝对差)。适用资料:连续型变量资料。纵轴:算术尺度;横轴:算术尺度,连续性变量(时间、年龄等)半对数线图(semi-logarithmic line graph):表达事物之间相对变化速度的比较(相对比)。适用资料:连续型变量资料 纵轴:对数尺度;横轴:算术尺度,连续性变量(时间、年龄等)表表2-9 某地某地1975-1990年痢疾与百日咳死亡率年痢疾与百日咳死亡率年度年度痢疾痢疾百日咳百日咳197519751

30、.451.450.220.22198019800.820.820.050.05198519850.230.230.020.02199019900.140.140.010.01普通线图表表2-9 某地某地1975-1990年痢疾与百日咳死亡率年痢疾与百日咳死亡率年度年度痢疾痢疾百日咳百日咳197519751.451.450.220.22198019800.820.820.050.05198519850.230.230.020.02199019900.140.140.010.01半对数线图用于多组数据的直观比较分析,用于多组数据的直观比较分析,用于反映一用于反映一组或多组连续型定量数据分布的中心位

31、置和散布组或多组连续型定量数据分布的中心位置和散布范围。范围。一般选用五个描述统计量(最小值、一般选用五个描述统计量(最小值、P25、中位数、中位数、P75、最大值)来绘制、最大值)来绘制。适用资料:适用资料:连续型资料连续型资料6)箱式图(boxplot)图2-13 两组动物每日进食量(mg/g)比较 按照按照资料的性质与分析目的资料的性质与分析目的恰当地选用图形恰当地选用图形直条图直条图:性质相似而不连续的资料,用于表达不连续指标的数值大小性质相似而不连续的资料,用于表达不连续指标的数值大小直方图直方图:连续型变量资料的频数分布连续型变量资料的频数分布百分条图百分条图:构成比资料,表示总体

32、中各部分的比重构成比资料,表示总体中各部分的比重圆图圆图:构成比资料,表示总体中各部分的比重构成比资料,表示总体中各部分的比重线图线图:连续型变量资料,适用于表达事物之间变化幅度的比较连续型变量资料,适用于表达事物之间变化幅度的比较 半对数线图半对数线图:连续型变量资料,适用于表达事物之间相对变化速度的比较连续型变量资料,适用于表达事物之间相对变化速度的比较 箱式图箱式图:连续型变量资料,用于多组数据的直观比较分析连续型变量资料,用于多组数据的直观比较分析 3.不良统计图的修改举例不良统计图的修改举例图图2-2 某地不同年度医院门诊量比较某地不同年度医院门诊量比较总结:定量资料的统计描述图表描述:统计量描述集中趋势指标:均数、几何均数、中位数离散趋势指标:标准差、四分位数间距、变异系数、极差常见统计图表

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服