资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计表(statistical table)和统计图(statistical chart)是统计描述的重要工具。医学科学研究资料经过整理和计算各种必要的统计指标后,所得结果除了用适当文字说明以外,常用统计表和统计图表达分析结果。统计表和统计图不仅便于阅读,而且便于,分析比较,。,统计表,(statistical table),是表达统计分析结果中数据和统计指标的表格形式;,统计图,(statistical graph),是用点、线、面等各种几何图形来形象化表达统计数据。,第一节 统计表,一、统计表的意义与制作原则,1统计表的意义,统计表用简明的表格形式,有条理地罗列数据,和统计量,方便阅读、比较和计算。,2制表原则:重点突出、层次清楚,3制表的基本要求,3线条:,只需要顶线、底线及纵标目下面与合,计上面的横线。,注意:,线条不宜过多,表的左上角不宜有斜线,,表内不能有纵线。,4数字:,表内数字一律用阿拉伯数字表示,同一,个指标的数字精确度应当一致,表内不宜有空格,无,数字用“”表示,数字为0,则填写0。,5排列:,表内数字排列应有一定的规则,可按照,规定的顺序、变量值的大小或时间的先后排列,具体,可根据资料的性质来定。,6备注:,表格一般不列备注或其他文字说明,如,有特殊情况需要说明时可用“*“标出,将文字说明写在,表格的下面。,(二)从内容上看,,,每张表都有主语和谓语。,主语指被研究的事物,如表122中的“年龄组(岁)”,一般置于表的左侧;谓语指说明主语的各项统计指标,如表122中的“死亡率”和“死亡百分比”,一般置于表的右侧,主语和谓语结合起来构成一个完整的句子。如表 122可读成某地1988年60岁年龄组死亡率和死亡百分比分别为19.61%和16.6。,二、统计表的种类,三、统计表的种类,根据说明事物的主要标志(主语)的复杂程度,统计表可以分成简单表和复合表。l.简单表:只有一种主要标志,即主语按一个标志分组。2.复合表:有两种或两种以上的标志,即主语按多个标志分组。在安排上可以将部分主语放在表的上方与谓语配合起来。,例10-1,表10-1列出某地进行喷昔洛韦软膏治疗颜面单纯疱疹与阿昔洛韦软膏比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。,1.简单表 统计表的主语只有一个层次,表10-1 某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较,如何完成喷昔洛韦软膏治疗颜面单纯疱疹疗效的比较分析?,2.组合表,统计表的主语有两个以上层次,例10-2,某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表10-2。该表属组合表。,表10-2 某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析,请分别指出城乡25组的发生率和构成比。,四、编制统计表的基本要求,1重点突出,简单明了。,即一张表只包括一个中心内容,表达一个主题。,2主谓分明,层次清楚,。即主谓语的位置准确,标目的安排及分组要层次清楚,符合专业逻辑。,简单表只有一个分组标志,一般作为横标目,而纵标目为统计指标名称。复合表有两个以上分组标志,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目和总标目上。,3数据准确、可靠。,五、统计表的审查与修改,统计表制作是否良好,可以从以下,几方面检查:,1标题是否正确,2主谓语的排列是否合适,标目是否,组合重复。,3表线是否过多过密。,例10-3,某地进行冠心病危险因素研究时,调查了居民的心理得分值与其它冠心病有关因素,结果列成表10-3。,表10-3 不同心理分值的冠心病危险因素水平比较,问 题,将太多的内容放在一个表里,特别是将两种不同类型资料(计量资料和计数资料)的统计量放在同一表中。,互不相容的内容分别占了不同的列,导致表中有许多空格。,纵横标目倒置。,内容较多,层次复杂,表格中数据罗列无条理,较难读懂。,表10-4 某年某地居民不同心理分值的冠心病危险因素水平比较(,X,S,),处理办法,:,将该表资料分别制成两个统计表,见表10-4和表10-5。,表10-5 某年某地居民不同心理分值的冠心病危险因素水平比较,某地1974年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如表124所示,请按照编制统计表的基本要求,检查此表编制的是否合适,如不合适,请指出并修改成正确表。,1.概念:利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料和指标.,2.作用:,它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象而生动地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。但对数量的表达较粗略,从图中不能获得确切数字。,第二节 统计图,一、概述,二、统计图的构造,统计图通常由标题、图域、标目、图例和刻度5部分组成。1标题:简明扼要地说明资料的内容、时间和地点.一般写在图的下方中央。2图域:即制图空间。除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框架表示。不同事物用不同线条(实线、虚线、点线)或颜色表示。图域的长宽比例习惯上为5:7。,3标目:分为纵标目和横标目,表示纵轴和横轴数字的意义,一般有度量衡单位。4图例:在对比关系较为复杂的统计图中,为使读者易于分辨各种图形的意义,可以设置图例。图例通常放在横标目与标题之间。5刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右,一律用等距表明。,三、统计图的种类:,根据资料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。,常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图和统计地图等,还有在数据探索性分析中应用的茎叶图、残差图、箱式图,聚类分析的谱系图等特殊分析图等。,1统计图制作的一般原则,(1)根据资料性质和分析目的正确选用适当的统计图。,(2)必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题一般 放在图的下方。,(3)统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。,(4)统计图用不同线条和颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。,四、常用统计图,1直条图(bar chart)2圆图,(pie chart),和百分比条图,(percent bar chart),3线图(line graph)4直方图(histogram),5其他特殊分析图,箱式图(box plot),茎叶图(stem-leaf plot),误差条图(error bar chart),1直条图,(bar chart),用相同宽度的直条长短表示相互独立的某统计指标值的大小。直条图按直条是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式两种。,例10-4,图10-1显示某地某年主要死因死亡率资料,不同死因是相互独立的不连续指标,因此用直条图。该图只按死因分类,为单式立式直条图。,主要死因,死亡率(1/10万),呼吸系病,130,恶性肿瘤,110,脑血管病,90,心脏病,60,传染病,40,消化系统疾病,38,损伤中毒,36,新生儿病,20,表1 某年某地主要死因的死亡率,图10-1 某年某地主要死因的死亡率(/10万),1994,1998,血压,心率,GPT,TTT,10.1,8.6,6.7,3.9,6.52,6.70,3.95,2.75,:,GPT,(麝香草分浊度试验),:,TTT,(谷丙转氨酶),表2 某省某厂1998年体检四项检测指标异常检出率,2圆图和百分比条图,圆图,(pie chart),是以圆形总面积作为,100%,,将其分割成若干个扇面表示事物内部各构成部分所占的比例。,百分比条图,(percent bar chart),是以矩形总长度作为,100%,,将其分割成不同长度的段表示各构成的比例。,圆图和百分比条图适合描述分类变量的构成比资料。,例10-5,某年某地进行婴儿死亡原因的调查,根据城市婴儿死因的构成资料绘制成图10-2。,从图10-2可见出生窒息是婴儿死亡的首位死因,出生窒息、早产和肺炎头三位死因占总死亡的60.3%,是婴儿死亡防治的重点。,某年某市城市婴儿死因构成,死因,构成(%),早产,20.5,先天异常,5.6,先天性心脏病,5.2,出生窒息,21.7,肺炎,18.1,颅内出血,6.4,其他,22.5,图,10-2,某年某地城市婴儿死因构成比,例10-6,图10-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,鼻咽癌和肝癌构成减少,肺癌明显增加。,百分比条图特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。,图10-3 20世纪70年代和80年代某地7常见恶性肿瘤发病构成比较,3线图(line graph),线图是用线段的升降来表示数值的变化,,适合于描述某统计量随另一连续性数值变量变化而变化的趋势,,最常用于描述统计量随时间变化而变化的趋势。,普通线图,:横轴和纵轴都是算术尺度。,半对数线图,:横轴是算术尺度,纵轴是对数尺度,特别适宜作不同指标变化速度的比较。,例10-7,图10-4是根据19902000年某沿海城市甲状腺功能亢进(甲亢)发病率资料绘制的普通线图。,图10-4可看出在1995年开始食盐加碘后,甲亢发病率有一突增高峰,1999年以后又逐渐下降的趋势。,图10-4 19902000年某沿海城市甲状腺功能亢进发病率变化趋势,例10-8,调查某地1997年2001年两种与性传播有关疾病艾滋病和梅毒的发病率变化趋势,资料分别绘制成普通线图和半对数线图。,普通线图显示梅毒的增长幅度较大,但半对数线图则显示艾滋病的,增长速度,更快。,图10-5 19972001年某地艾滋病和梅毒发病率的变化趋势,(a)纵轴为算术尺度;(b)纵轴为对数尺度。,4直方图(histogram),以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,,适合表示数值变量的频数分布,。直方图的横轴尺度是数值变量值,纵轴是频数。注意如各组的组距不等时,要折合成,等距,后再绘图,即将频数除以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。另一种表示数值变量资料频数分布的方式是将各组段观察频数除以总观察频数得到各组段的频率,以各组段频率除以组距得到的频率密度作为直方图高度,绘制的直方图称为频率直方图,它以各直方面积表示各组频率,其,面积的总和为1,。,例10-9,1997年某地共报告乙型病毒性脑炎104例,其年龄分布如表10-6。,图10-6 1997年某地乙型病毒性脑膜炎病例的年龄分布,箱式图(box plot),使用,5个统计量,反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。,箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除异常值外的最小值和最大值。另外标记可能的异常值。,显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。,例10-11,某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图10-8。,图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多,。,图10-8 某地不同类型化妆品厂车间粉尘数分布箱式图,谢谢大家!,
展开阅读全文