资源描述
第二十一章 统计数据的整理与显示
第一节、品质数据的整理与显示
本节学习要求:
本节具体内容:
一、分类数据的整理与显示
(一)频数与频数分布
1、频数的含义:频数也称次数,是落在各类别中的数据个数。
2、频数分布(次数分布):各个类别及其相应的频数全部列出来就是频数分布或称次数分布。
3、频数分布表:频数分布用表格的形式表现出来就是频数分布表。
4、分类数据进行整理时常用的指标如下:
(1)比例:是指在一个总体当中,各个部分的数量占总体数量的比重,通常反映整体的构成或者整体结构。各部分比例之和等于1。
【例题1--课后题第4题】比例是一个总体中各个部分的数量占总体数量的比重,各部分的比例之和( )
A。大于1 B.小于1 C.等于1 D.等于100
(2)百分比:将比例乘以100就是百分比或百分数。当分子的数值很小而分母的数值很大时,也可以用千分数来表示比例。如人口的出生率、死亡率、自然增长率等
(3)比率:各不同类别的数量的比值,可以是一个总体中各不同部分的数量对比。由于比率不是总体中部分与整体之间的对比关系,因而比值可能大于1。
为方便起见,比率可以不用1作为基数,而用100或其他便于理解的数作为基数。比如:人口的性别比就用每100名女性人口所对应的男性人口来表示。
【例题2:2004年单选题】根据第5次人口全国普查的结果,我国男性占总人口的51.63%,女性占总人口的48。37%,那么人口的性别比例应该为( ).
A。100:106.74 B。93。67:100
C。106.74:100 D。100:93。67
在经济和社会问题的研究中,经常使用比率。比如经济学中的积累和消费之比;国内生产总值中第一、二、三产业产值之比等。
比率也可以是同一现象在不同时间或空间上的数量之比。如:某年的国内生产总值与上年的国内生产总值进行对比,得出经济增长率;一个地区的国内生产总值同另一地区的国内生产总值进行对比,反映两个地区的经济发展水平差异。
【例题3:2007年单选题】计算我国国内生产总值中的第一、二、三产业产值之比,是采用了计算( )的数据整理方法。
A。比例 B。均值 C。比率 D。百分比
(二).分类数据的图示
分类数据的图示方法,包括条形图和圆形图.
(1)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。绘制时,各类别可以放在纵轴,称为条形图。各类别放在横轴,称为柱形图。
(2)圆形图也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。
【例题4:2005、2007年多选】下列各项中,适用于分类数据的整理和显示的方法有( )
A。累积频数 B.比例
C。百分比 D.比率
E。累积频率
【例题5:2004年多选题】2001年底,我国共有博物馆1458个,其中综合性博物馆769个,历史类博物馆521个,艺术类博物馆57个,自然科技类博物馆19个,其他类型博物馆92个。这一构成应通过绘制( )来显示.
A.条形图 B。累积频数分布图
C。圆形图 D。直方图
E。折线图
【例题6:课后题第9题】在对分类数据进行整理时,落在各类别中的数据个数被称为( )
A。频数 B.指数 C。次数 D。百分比 E。比例
【例题7:课后题第10题】以下指标中,( )是对分类数据进行整理时常用的指标。
A.频数 B。比例 C。极差 D。百分比 E。比率
(二)顺序数据的整理与显示
分类数据的整理和显示方法也适用于顺序数据,但适用于顺序数据的整理与显示的某些方法如累积频数和累积频率不适用于分类数据。
1。累积频数和累积频率
(1)累积频数:指各类别的频数逐级累加起来。其方法有两种:
①向上累积:从类别顺序的开始一方向类别的最后一方累加频数(数值型数据则是从变量值小的一方向变量值大的一方累加频数).
②向下累积:从类别的最后一方向开始一方累加频数(数值型数据则是从变量值大的一方向变量值小的一方累加频数)
(2)累积频率或百分比。将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。
2。顺序数据的图示
顺序数据与分类数据的图示方法基本相同。另外包括累积频数分布图。
【例题8:课后题第12题】计算累积频率的两种方法是( ).
A。加权 B。简单平均
C。向上累积 D。开方
E。向下累积
【例题9:多选题】下列各项当中,适用于顺序数据但是不适用于分类数据的方法( ).
A.累积频率 B。比例
C。百分比 D。比率
E。累积频数
第二节、数值型数据的整理与显示
学习要求:
1。掌握数据分组的方法
2.掌握组中值的作用和计算方法
3。掌握数据分组的具体步骤
4.掌握直方图与条形图的区别
具体内容:
(一)数据的分组
1。数据分组的含义:
数据分组是根据统计研究的需要,将数据按照某种标准划分成不同的组别。分组后再计算出各组中出现的次数或频数,形成一张频数分布表。
2。数据分组的方法
分组的方法有单变量值分组和组距分组两种。
(1)单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量较少的情况。
(2)组距分组是将全部的变量值,划分为若干个不同的区间.适合于连续变量或变量值较多的情况。
采用组距分组需要经过以下几个步骤:
第一步,确定分组的组数
确定分组组数时的要求:
①划分的组数既不应太多也不应太少
②组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;
③采用的分组办法,要能够充分显示客观现象本身存在的状态。
第二步,对原始资料进行排序.
第三步,求极差。
极差值=最大观察值—最小观察值
第四步,确定各组组距.
①组距=级差值/组数
根据上式计算出来的组距,可能带有小数,为了编表和计算方便,也是审美习惯使然,最好把它取成接近于5除尽的一个数。
组距与组数成反比例关系,组数越多,组距越小,组数越少,组距越大。
②组距是每组观察值的最大差,即每组的上限值与下限值之间的差。用公式表示就是:
组距=某组上限值—该组下限值
或:某组上限值=该组下限值+组距
某组下限值=该组上限值—组距
第五步,确定组限.
组限是组与组之间的界限,或者是每组观察值的变化范围.
一个组的最小值称为下限;最大值称为上限。
上限值与下限值的差值称为组距
上限值与下限值的平均数称为组中值。即:
组中值=(上限值+下限值)/2
确定组限时应注意:
①第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点.
②特别需要或不得已的情况除外,最好不要使用开口组.
③ 组限应取得美观些,按数字编好,组限值应能被5除尽,且一般要用整数表示。
第六步 确定各组观察值出现的频数
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。
第七步,制作频数分布表。
(二)数值型数据的图示
1.直方图
直方图是用矩形的宽度和高度来表示频数分布的图形。
直方图中,实际上用矩形的面积表示各组的频数分布。
直方图与条形图不同:
(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别是)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,因此其高度与宽度均有意义。
(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列.
2。折线图(也称为频数多边形图)
折线图也称频数多边形图,它是在直方图的基础上,把直方图顶部的中点用直线连接起来,再把原来的直方图抹掉就是折线图。
【例题10:2004年单选题】一批数据分别为“60~70”、“70~80"、“80~90”、“90~100"四组,按统计表分组的习惯规定,90这一数值应归在( )这一组中.
A。“60~70”
B.“70~80"
C。“80~90”
D。“90~100”
【例题11:2007年单选题】对一组数据进行分组,各组的组限依次是“10~20”、“20~30"、“30~40"、“40~50”、“50~60”、“60~70”。在以上这组数据中,50这一数值( )。
A。由于恰好等于组限,不需要分在某一组中
B。分在“50~60”一组中
C。分在“40~50”一组中
D。分在“40~50”或“50~60”任意一组中都可以
【例题12:2008年单选题】将一批数据进行分组,各组的组限依次为“100-120”、“120-130"“130-140”“140-150”“150-160”,按统计分组的规定,140这一数值( )
A。不计算在任何一组
B。分在“140-150"这一组
C.分在“130-140”这一组
D。分在“130-140”或“140-150”均可
【例题13:2006年、2008年单选题】对数据实行等距分组的情况下,组距与组数的关系是( )。
A。无任何关系
B。反比关系
C。正比关系
D.组距总是组数的5倍
【例题14:2006年多选题】直方图与条形图的区别在于( )。
A.直方图的各矩形通常是分开排列
B.直方图用面积表示各组频数的多少
C。直方图的各矩形通常是连续排列
D.直方图的矩形高度与宽度均有意义
E.直方图的矩形高度有意义而宽度无意义
【例题15:课后题第14题】组距分组适用于下列情况( )
A.离散变量B。变量值较少
C。连续变量D。变量值较多
E。分类数据
【例题16:课后题第15题】在组距分组中,确定分组组数的时候要求( )。
A。组数尽可能少
B。组数尽可能多
C.尽量保证组间资料的差异性
D。尽量保证组内资料的同质性
E组数应能被5除尽
【例题17:课后题第3题】为解决“不重”的问题,统计分组时习惯上规定( )
A。不重不漏 B.组限值应能被5除尽 C。下组限不在内 D.上组限不在内
第三节、统计表
学习要求:
1。熟悉统计表的基本构成
2。掌握统计表的设计要求
具体内容:
(一)统计表的构成
1.统计表是用于显示统计数据的基本工具
2。构成:统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加.
(1)表头应放在表的上方,它所说明的是统计表的主要内容。
(2)行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也被称为“类”。
(3)表外附加通常放在统计表的下方,主要包括资料来源、指标的注释和必要的说明等内容。
(二)统计表的设计
设计统计表时要注意以下几点:
第一,要合理安排统计表的结构。
第二,表头一般应包括表号、总标题和表中数据的单位等内容。
第三,表中的上下两条横线一般用粗线,中间的其他线要用细线。
通常情况下,统计表的左右两边不封口,列标题之间一般用竖线隔开,而行标题之间通常不必用横线隔开。总之,表中尽量少用横竖线。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。对于没有数字的表格单元,一般用“—”表示,一张填好的统计表不应出现空白单元格.
第四,在使用统计表时,必要时可在表的下方加上注释。特别要注明资料来源,以表示对他人劳动成果和知识产权的尊重.
【例题18:2004年、2005年】通常情况下,设计统计表要求( )。
A。没有数字的单元格应空白
B。左右两边应封口
C.表中数据一般是右对齐
D.列标题之间一般用竖线隔开
E.行标题之间不必用横线隔开
【例题19:2007年多选】通常情况下,设计统计表要求( )。
A.没有数字的单元格应空白
B。左右两边不封口
C。表中数据一般是右对齐
D。列标题之间一般用竖线隔开
E.行标题之间不必用横线隔开
本章讲义中例题答案如下:
例题1:答案:C
例题2:答案:C
解析:如果用1作为基数表示性别比例:51。63:48。37=1.0674:1
如果用100作为基数表示性别比例:106.74:100
例题3:答案:C 例题4:答案:BCD 例题5:答案:AC
解析:上述资料给出的是分类数据,应使用条形图或圆形图来表示。
例题6:答案:AC 例题7:答案:ABDE 例题8: 答案:CE
例题9: 答案:AE
例题10:答案:D
例题11:答案:B
解析:注意“上限不在内"的规定。
例题12:答案:B
例题13:答案:B
解析:组距=极差/组数
例题14:答案:BCD
例题15:答案:CD
例题16:答案:CD
解析:组数不能太多也不能太少;组限值应能被5除尽。所以ABE均错误.
例题17:答案:D
例题18:答案:CDE
例题19:答案:BCDE
6
展开阅读全文