1、统计表和统计图统计表和统计图 l统计表(statistical table)和统计图(statistical graph)是重要的统计描述方法。它们具有简单、明了、易于理解和接受的优点,而且便于比较和分析。l同样的事实,用文字叙述可能需要进行长篇大论的解释,而且还受语言不同的限制,而用统计表或统计图则可一目了然。学学 习习 目目 标标 1、体会统计图表是整理、分析和表达数字资料的 重要工具。2、理解统计表的基本结构 和统计图的制作通则。3、能根据具体资料正确制作统计表和统计图。统计图表3统计表统计表 概念概念 统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
2、统计表的结构统计表的结构 统计表的基本结构包括:标题、标目、线条、数字、以及备注。统计图表4表1.甲、乙两地1980年HbsAg阳性率地区调查数阳性数阳性率(%)甲地 5000110022.0乙地 6000105017.5合计11000215019.5标题横标目纵标目数字线条表号统计图表5 标题标题是表格的总名称,如是表格的总名称,如甲、乙两地甲、乙两地19801980年年HbsAgHbsAg阳性率。阳性率。标目分为横标目和纵标目标目分为横标目和纵标目横标目说明横行数字的属性,位于表格横标目说明横行数字的属性,位于表格的左侧,例如表的左侧,例如表1中的中的“甲地、乙地、合甲地、乙地、合计计”一
3、栏;一栏;纵标目说明每一列中数字的属性,位于纵标目说明每一列中数字的属性,位于表格的第一横行,例如表表格的第一横行,例如表1中的中的“调查数、调查数、阳性数、阳性率阳性数、阳性率”。统计图表6 横、纵标目连起来可以完成对一个指标的横、纵标目连起来可以完成对一个指标的完整叙述,例如表完整叙述,例如表1中,第一个行中的数中,第一个行中的数字可以理解为字可以理解为“甲地甲地19801980年调查了年调查了50005000人,阳性人数为人,阳性人数为11001100人,阳性率为人,阳性率为22.0%22.0%”。表格中还有线条和数字,以及备注。备表格中还有线条和数字,以及备注。备注是对于表格的文字说明
4、。注是对于表格的文字说明。统计图表7统计表的绘制原则统计表的绘制原则 总原则:总原则:(1)重点突出。不要包罗万象,要使人看过后能明白表格所要表达的主要内容。(2)层次分明。避免层次过多或结构混乱。统计图表8基本要求基本要求 1标题(title)标题一般写在表格的上方,内容应包括时间、地点、主要事件,不要过于简练,要求用最少的文字说清楚。2标目(heading)横标目要按时间前后或数量大小和事情的重要性等顺序排列,纵标目有单位的要注明单位。注意标目的层次要清楚,不要太多、太复杂。3线条 统计表中只有横线,无竖线和斜线。统计图表9 4数字 一律用阿拉伯数字。同一列的小数位数应一致,且位次对齐。表
5、格中不应有空格,暂无记录或未记录用“”(点号)表示,无数据用“”表示,这两种情况都不能填“0”。5备注 不应写在表中,在数字上角用“*”号标出,文字叙述写在表的下方。基本要求基本要求统计图表10数据:小数位对齐,度量单位写在纵标目或标题内。数据按性质分为两类:基础数据:样本含量(观察人数)、阳性人基础数据:样本含量(观察人数)、阳性人数等数等统计指标:平均数和标准差(计量资料)统计指标:平均数和标准差(计量资料)率或构成比等率或构成比等 (记数资料)(记数资料)基本要求基本要求统计图表11标标题题纵纵标标目目横横标标目目合合计计数数据据基础数据基础数据统计指标统计指标简单表简单表基础数据基础数
6、据统计指标统计指标某地某地1980年传染病构成比年传染病构成比痢 疾肝 炎流 脑麻 疹其 他 3685 2111 522 847 400 7565 疾 病构成比()构成比()病例数病例数 48.7 27.9 6.9 11.2 5.3 100.0 统计图表12 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄
7、 人数人数 均数均数某地女性学龄儿童某地女性学龄儿童身高年增长值(身高年增长值(cmcm)7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.263
8、51 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.907
9、2 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296
10、 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351
11、5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72
12、5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.72131
13、3 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010
14、 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7
15、7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数 7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.
16、721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数某地男性学龄儿童某地男性学龄儿童身高年增长值(身高年增长值(cmcm)7 7 72 5.9072 5.90 8 8 198 5.88198 5.88 9 9 322 5.17322 5.171010 351 5.26351 5.261111 356 6.49356 6.491212 322 7.72322 7.721313 296 7.93296 7.931414 266 4.55266 4.55 年龄年龄 人数人数 均数均数某地学龄儿童身高年增长值(某地学龄儿童身高年增长值(
17、CMCM)男男 女女组合表由几个简单表叠加而成组合表由几个简单表叠加而成统计图表13Statistical TableStatistical Table讨论(1)1)此表格与前一表格相比,区别何 在?(表格种类;资料种类)2)表格中哪些是基础数据?在表中起什么作用?3)读出该表格给出的信息?4)组合表之“组合”体现在何处?5)体会在表格中怎样表示数据度量单位?统计图表14课堂练习(1)试制作一个反映各年级小学生近视眼患病率变化趋势的表格(框架)年级年级 调查人数调查人数 近视人数近视率()近视人数近视率()一一二二三三四四五五合计合计某年某地小学生近视眼患病情况某年某地小学生近视眼患病情况参考
18、答案参考答案统计图表15参考答案参考答案课堂练习(2)试制作一个比较缺铁性贫血患者与健康人按性别区分红细胞数量多少的表格(框架)。提示:用组合表 缺铁性贫血缺铁性贫血 健康人健康人 调查人数调查人数 平均数平均数 调查人数调查人数 平均数平均数男男女女合计合计缺铁性贫血患者与健康人红细胞数量比较缺铁性贫血患者与健康人红细胞数量比较 男男 女女 调查人数调查人数 平均数平均数 调查人数调查人数 平均数平均数 贫血患者贫血患者 健康人健康人缺铁性贫血患者与健康人红细胞数量比较缺铁性贫血患者与健康人红细胞数量比较参考答案二参考答案二统计图表16年份(1)病例数(2)存活数(3)住院期死亡总例数(4)
19、=(2)-(3)急性期死亡数(5)住院期总病死率(%)(6)=(4)/(2)急性期病死率(%)(7)=(5)/(2)19941995199619971998171315151298898857647466447.138.546.740.0 33.3341.230.840.040.033.3合计7242302741.737.5表表11-4某医院内科病房病人各年存活及死亡情况(原表)某医院内科病房病人各年存活及死亡情况(原表)问:该表存在哪些问题?如何修改?问:该表存在哪些问题?如何修改?例数少,率不稳定,直接用绝对数不必要不必要统计图表17年份(1)病例数(2)存活数(3)住院期死亡总例数(4)
20、=(2)-(3)急性期死亡数(5)住院期总病死率(%)(6)=(4)/(2)急性期病死率(%)(7)=(5)/(2)19941995199619971998171315151298898857647466447.138.546.740.0 33.3333.3341.230.840.040.033.3合计7242302741.737.5表表11-4某医院内科病房病人各年存活及某医院内科病房病人各年存活及死亡死亡情况(原表)情况(原表)重点不突出重点不突出病种?病种?小数位一致统计图表18年份病例数住院期死亡总例数急性期死亡数199419951996199719981713151512857647
21、4664合计723027表表11-4某医院内科病房某医院内科病房1994-1998年某病病人死亡情况(修改表)年某病病人死亡情况(修改表)统计图统计图 1.直条图2.百分条图、圆图4.直方图3.线图、半对数线图5.散点图6.统计地图等统计图表19统计图表20直条图直条图(bar chart)1概念:用等宽直条的长短来表示各个相互独立的指标大小的图形。2适用资料:相互独立的资料(资料有明确分组,不连续)。3分类:分为单式和复式两种。单式适用于只有一组观察资料(见图1),复式适用于有若干组观察资料 统计图表214绘制要点:坐标轴:横轴为观察项目,纵轴为数值,纵轴坐标一定要从0开始。直条的宽度:各直
22、条应等宽,等间距,间距宽度和直条相等或为其一半。复式直条图在同一观察项目的各组之间无间距。排列顺序:可以根据数值从大到小,从小到大,或按时间顺序排列。做图做图百分条图百分条图(percentage bar chart)概念:以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例 适用资料:构成比资料。统计图表24绘制要点:标尺:一定要有标尺,画在图的上方或下方,起始的位置、总长度和百分条图一致,并和百分条图平行。全长为100%,分成10格,每格10%。分段:按各部分所占百分比的大小排列,在图上标出百分比。图例:在图外要附图例说明。多组比较:若要比较的事物不止一个时,可
23、以画几个平行的百分条图,以示比较。各条图的排列顺序相同,图例相同。应用:描述各部分的百分构成。不同性别某癌三种类型的构成不同性别某癌三种类型的构成分化型癌分化型癌低分化腺癌低分化腺癌未分化型未分化型合计合计男男52.352.327.827.819.919.9100100女女30.230.218.118.151.751.7100100圆图圆图(pie chart)概念:以一个圆面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的构成比例 适用资料:构成比资料。做图做图统计图表27 绘制要点:每每3.63.6o o为为1%1%,用用3.63.6乘乘以以百百分分数数即即为为所所占占扇扇形形
24、的度数。用量角器画出。的度数。用量角器画出。从从相相当当于于时时钟钟1212点点或或9 9点点的的位位置置开开始始顺顺时时针针方方向绘图。向绘图。每每部部分分用用不不同同线线条条或或颜颜色色表表示示,并并在在图图上上标标出百分比,下附图例说明。出百分比,下附图例说明。当当比比较较不不同同资资料料的的百百分分构构成成时时,可可以以画画两两个个相相等等大大小小的的圆圆,在在每每个个圆圆的的下下面面写写明明标标题题,并并用相同的图例表示同一个构成部分。用相同的图例表示同一个构成部分。统计图表28某医院某医院19901990年和年和20002000年住院病人五种疾病死亡构成比(年住院病人五种疾病死亡构
25、成比(%)统计图表29线图线图(line diagram)概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况 适用资料:连续性资料。绘制要点:坐标轴:横轴表示时间或组段,纵轴表示频数或率。纵轴坐标可以不从0开始,因此在看图时要注意纵轴的起点坐标。统计图表30 数据点画在组段中间位置。相邻的点用直线连接,不要用平滑的曲线连接。无数据的组段用虚线连接。直线不能任意外延。同一张线图上不要画太多条曲线,否则不易分清。当有两条或两条以上曲线在同一张线图上时,须用不同颜色或不同的图形形式加以区分,并附图例加以说明。应用:反映事物的连续的动态变化规律。做图做图统计图表32直
26、方图直方图(histogram)1概念:以各矩形的面积来代表各组频数的多少。概念:以各矩形的面积来代表各组频数的多少。2适用资料:连续变量的频数分布。适用资料:连续变量的频数分布。3绘制要点绘制要点 坐坐标标轴轴:横横轴轴代代表表变变量量值值,要要用用相相等等的的距距离离表示相等的数量。纵轴坐标要从表示相等的数量。纵轴坐标要从0开始。开始。各矩形间不留空隙。各矩形间不留空隙。对对于于组组距距相相等等的的资资料料可可以以直直接接作作图图;组组距距不不等等的的资资料料先先进进行行换换算算,全全部部转转化化为为组组距距相相等等的的频频数,用转化后的频数作图。下面举例说明。数,用转化后的频数作图。下面
27、举例说明。统计图表33年龄(岁)年龄(岁)患者人数患者人数每岁患者人数每岁患者人数年龄(岁)年龄(岁)患者人数患者人数每岁患者人数每岁患者人数0123456733911232211143.03.09.011.023.022.011.014.08910203040506086361311418.06.03.61.31.10.40.1某地某年乙型病毒性脑炎患者的年龄分布某地某年乙型病毒性脑炎患者的年龄分布统计图表35箱式图(箱式图(box plot)箱式图的上下两端分别是上四分位数箱式图的上下两端分别是上四分位数p75和下和下四分位数四分位数p25,中间横线是中位数,中间横线是中位数M,两端连,两
28、端连线分别是除异常值外的最小值和最大值。另外线分别是除异常值外的最小值和最大值。另外标记可能的异常值。标记可能的异常值。反映分布特征:中心位置反映分布特征:中心位置M、分布、偏度、变、分布、偏度、变异范围、异常值展示出来;异范围、异常值展示出来;上下两端相距越长,数据变异度越大。中间横上下两端相距越长,数据变异度越大。中间横线在箱子中点表明分布对称,否则不对称。线在箱子中点表明分布对称,否则不对称。适合多组数据的分布比较。适合多组数据的分布比较。统计图表369D11CDSC12345545681079101113小白鼠接种三种不同菌型伤寒杆菌后存活日数小白鼠接种三种不同菌型伤寒杆菌后存活日数统
29、计图表37小白鼠接种三种不同菌型伤寒杆菌后存活日数箱式图小白鼠接种三种不同菌型伤寒杆菌后存活日数箱式图p179maxP75MP25min统计图表38两组小鼠生存日数分布箱式图两组小鼠生存日数分布箱式图 p177分布:实验组生存时分布:实验组生存时间为正偏态分布,第间为正偏态分布,第1010号小鼠数据可能是号小鼠数据可能是异常值;对照组中位异常值;对照组中位生存时间位于箱子中生存时间位于箱子中点,说明分布基本对点,说明分布基本对称。可以看出实验组称。可以看出实验组小鼠生存日数与对照小鼠生存日数与对照组小鼠生存日数的分组小鼠生存日数的分布位置不同。布位置不同。异常值统计图表39散点图散点图(sca
30、tter diagram)1概念:以点的密集程度和趋势来表示两种现象的相关关系。2适用资料:双变量资料。3绘制要点:横轴代表一个变量,纵轴代表另一个变量。纵横轴的坐标起点不一定要从0开始,根据资料的情况而定。4.应用:反映两事物间的相关关系,主要用于相关回归分析。做图做图统计图表41统计图表42绘制统计图的注意事项绘制统计图的注意事项 1.统计图类型。例如:独立资料用直条图;连续资料用线图或直方图;构成比资料用百分条图或圆图;双变量资料用散点图;地区性资料用统计地图等。2统计图要有合适的标题。标题写在图的下方,其要求和统计表的标题的要求一样,要能够概括图的内容3直条图与直方图纵坐标要求从0开始
31、。如果不从0开始,容易造成错觉。4比较不同事物时用不同的线条和颜色来表示,并附上图例。统计图表435直条图、线图、半对数线图和直方图的纵、横坐标上要有刻度和单位,刻度要均匀等距(半对数线图的纵坐标除外)。纵横轴长度之比为57较合适,比例太大或太小都是不合适的,见图9-7所示。图9-7的纵、横轴之比是104,把它同图9-8比较就会发现,由于纵、横轴比例不合适,使某病病死率看起来下降得很快,这不符合所要表达的内容。(7)统计地图统计地图(statistical map)统计地图统计地图(statisticalmap):用:用于表示某现于表示某现象的数量在象的数量在地域上的分地域上的分布。布。统计图
32、表47示例示例1 1)直条图:)直条图:(bar graph)(bar graph)女女调查数调查数 患病率(患病率(%)男男调查数调查数 患病率(患病率(%)职业职业某地各种职业人群高脂血症患病情况某地各种职业人群高脂血症患病情况农民农民工人工人职员职员 77 2.9 77 2.9 102 9.1 102 9.1 86 16.8 86 16.8 80 2.3 80 2.3 107 11.0 107 11.0 91 25.0 91 25.0统计图表48直条图 女女调查数调查数 患病率(患病率(%)男男调查数调查数 患病率(患病率(%)职业职业某地各种职业人群高脂血症患病情况某地各种职业人群高脂
33、血症患病情况农民农民工人工人职员职员 77 2.9 77 2.9 102 9.1 102 9.1 86 16.8 86 16.8 80 2.3 80 2.3 107 11.0 107 11.0 91 25.0 91 25.0某地各种职业人群高脂血症患病情况某地各种职业人群高脂血症患病情况患患病病率率(%)统计图表49直条图 女女调查数调查数 患病率(患病率(%)男男调查数调查数 患病率(患病率(%)职业职业某地各种职业人群高脂血症患病情况某地各种职业人群高脂血症患病情况农民农民工人工人职员职员 77 2.9 77 2.9 102 9.1 102 9.1 86 16.8 86 16.8 80 2
34、.3 80 2.3 107 11.0 107 11.0 91 25.0 91 25.0某地各种职业人群高脂血症患病情况某地各种职业人群高脂血症患病情况患患病病率率(%)统计图表50示例示例2)2)线图线图:(line graph):(line graph)某市某市1010年期间糖尿病死亡情况(年期间糖尿病死亡情况(1/1/十万)十万)1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 年年 度度城市死亡率城市死亡率郊县死亡率郊县死亡率 4.45 4.77 4.65 5.64 5.78 6.86 7.45 7.73 8.91 10.592.12 2
35、.46 2.89 3.56 3.87 4.12 4.28 4.59 5.32 6.22统计图表51线图某市城市和郊县某市城市和郊县1989-19981989-1998年糖尿病死亡率年糖尿病死亡率死亡率(死亡率(1/10 1/10 万)万)某市城市和郊县某市城市和郊县1010年间糖尿病死亡情况(年间糖尿病死亡情况(1/1/十万)十万)1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 年年 度度城市死亡率城市死亡率郊县死亡率郊县死亡率 4.45 4.77 4.65 5.64 5.78 6.86 7.45 7.73 8.91 10.592.12 2.
36、46 2.89 3.56 3.87 4.12 4.28 4.59 5.32 6.22统计图表52某市城市和郊县某市城市和郊县1989-19981989-1998年糖尿病死亡率年糖尿病死亡率死亡率(死亡率(1/10 1/10 万)万)某市城市和郊县某市城市和郊县1010年间糖尿病死亡情况(年间糖尿病死亡情况(1/1/十万)十万)1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 年年 度度城市死亡率城市死亡率郊县死亡率郊县死亡率 4.45 4.77 4.65 5.64 5.78 6.86 7.45 7.73 8.91 10.592.12 2.46
37、2.89 3.56 3.87 4.12 4.28 4.59 5.32 6.22统计图表53讨 论(2)上图是单式图还是复式图?制作成直条图为何不妥?图中纵横轴都是数轴吗?都从零开始吗?线图用于表达什么信息?能例举类似的资料吗?上述统计图符合制图通则吗?统计图表54示例示例3)构成图:以圆图(circle graph)为例。25.926.367.6415.7730.2614.05女性22.678.9612.6614.2619.5121.94男性其他高血压损伤和中毒心脏病呼吸系统疾病恶性肿瘤某年某地某年某地19961996年男女前五位的死因构成比年男女前五位的死因构成比统计图表55构成图圆图 某年
38、某地1996年男女前五位的死因构成比男性男性男性男性女性女性女性女性统计图表56构成图百分条图 某年某地1996年男女前五位的死因构成比统计图表57讨论讨论(3)单式图、复式图与简单表、组合表有什么关系?单式图、复式图与简单表、组合表有什么关系?统计图纵、横轴与统计表纵、横标目有什么关系统计图纵、横轴与统计表纵、横标目有什么关系?为何以病人数作图不合理?为何以病人数作图不合理?怎样看统计指标的独立与连续?怎样看统计指标的独立与连续?读出上述表、图给出的信息?读出上述表、图给出的信息?统计图表58讨论讨论(4)比较两地儿童急性传染病构成(病种比较两地儿童急性传染病构成(病种相同),应以何种统计表与统计图反相同),应以何种统计表与统计图反映?映?如果表格同时提供了如果表格同时提供了疾病患病率,还可作疾病患病率,还可作什么统计图?什么统计图?