收藏 分销(赏)

描述统计学.pptx

上传人:胜**** 文档编号:902963 上传时间:2024-04-03 格式:PPTX 页数:39 大小:235.47KB
下载 相关 举报
描述统计学.pptx_第1页
第1页 / 共39页
描述统计学.pptx_第2页
第2页 / 共39页
描述统计学.pptx_第3页
第3页 / 共39页
描述统计学.pptx_第4页
第4页 / 共39页
描述统计学.pptx_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、1第二章第二章 数据描述方法数据描述方法1:表格和图形方法:表格和图形方法 n学习目标n掌握质量数据和数量数据的概括方法。n学会用统计常用图表表现各类数据。n了解探索性数据和交叉列表的基本知识。第1页/共39页2n案例讨论(课后进行):n1.这个案例都告诉了我们哪些信息?n2.通过阅读这个案例你受到哪些启发?第2页/共39页3习 题1.P23-2 4.P32-182.P25-9 5.P36-22 3.P31-15 6.P41-32第3页/共39页4第一节第一节 质量数据的概括质量数据的概括 n一、频数分布一、频数分布 n频频数数分分布布(Frequency distribution)是用数据概

2、括表的形式来列示各组中每组数值出现的次数次数(频数)。n编制频数分布表的目目的的:提供更进一步了解原始数据的信息。第4页/共39页5例2-1 从表2-1观察哪种软饮料购买的数量最多?(P21)表2-2 购买软饮料的频数分布表 软饮料 频数(次)古典可乐 19 健怡可乐 8 彭伯碳酸饮料 5 百事可乐 13 雪碧 5 合 计 50第5页/共39页6二、相对频数分布和百分比频数分布二、相对频数分布和百分比频数分布n相对频数分布相对频数分布(Relative frequency distribution)是一数据集的表格汇总法,显示在若干个组别中每一组的项目总数的相对频数,即分数或比例。n计算公式:

3、(2.1)第6页/共39页7n百分比频数分布(Percent frequency distribution)是一数据集的表格汇总法,显示在若干无重叠组别中每一组的项目总数的百分率。n每组百分比频数是该组相对频数乘以100%n 教科书强调是相对频数乘以100,我强调乘以100%第7页/共39页8n表2-3 购买软饮料的相对频数和百分比频数分布表 软饮料 相对频数 百分比(%)古典可乐 0.38 38 健怡可乐 0.16 36 彭伯碳酸饮料 0.10 10 百事可乐 0.26 26 雪碧 0.10 10 合 计 1.00 100?相对频数的计量单位是什么(x/1)相对频数是否有计量单位?第8页/共

4、39页9n从表2-3我们可以获得以下有用信息:n 在种软饮料中,购买次数最多的是古典可乐,占5种软饮料购买总次数的38%。购买次数最少的是彭伯碳酸饮料和雪碧,各占总购买次数的10%。n 依购买次数多少排序依次为:古典可乐、百事可乐、健怡可乐、彭伯碳酸饮料和雪碧。n 购买次数最多的前3种软饮料占全部购买次数的比重已达80%(38%+26%+16%)。第9页/共39页10三、条形图和饼图三、条形图和饼图n 条形图条形图(Bar graph/Bar chart)是用条形的固定宽度表示变量,不同长度表示频数、相对频数或百分比频数分布的一种图示方法。第10页/共39页11图2.1 购买软饮料次数的条形图

5、第11页/共39页12n 饼图饼图(Pie chart)是用圆形及圆内扇形面积来表示数值大小的图形,它主要用于表示总体中各组成部分所占的比例。第12页/共39页13n 图2.2 软饮料购买次数图第13页/共39页14第二节第二节 数量数据的概括数量数据的概括n一、频数分布n 分组分组(Group)根据特定目的,对一组数据所进行的归类。n 利德会计师事务所提供的数据提供了该所在完成20个客户样本的年终审计所需要时间的具体数据。第14页/共39页15 表2-4 年终审计时间(天)12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13分

6、组的具体步骤:(1)确定组数 采用斯特格斯(Sturges)提出的经验公式来确定。第15页/共39页16第16页/共39页17n(2)确定组距第17页/共39页18n(3)确定组限n欧美教材处理方法:组与组之间的组限互不重叠,即每组之间的数据是断开的。n10-14,15-19,20-24,25-29,30-34n国内教材处理方法:n1 离散变量:n第一种方法:间断型组限。如:n10-14,1529,20-24第18页/共39页19n第二种方法:重叠型组限。如:n10-15,15-20,2025,2530n对于重叠型组限,为避免重复将同一数据分配到不同组,规定“上限不包括在内”。n2连续变量:n

7、强调必须做重叠型组限。n(4)将各个数据分配到相应组中去,形成一个数量数据频数分布表。第19页/共39页20n表2-5 审计时间数据频数分布 审计时间(天)频数(个)10 15 4 15 20 8 20 25 5 25 30 2 30 35 1 合 计 20教科书P27表26采用间断型分组,不如重叠型分组好。第20页/共39页21n表2-5的频数分布为我们提供了以下简单信息:n 审计时间发生最频繁的是1520天这一组。在20个审计时间中属于这一组的有8个。n 只有一次审计时间需要30或更长的时间。第21页/共39页22n二、相对频数分布和百分比频数分布n表2-6 审计时间数据的相对频数分布和百

8、分比频数分布 审计时间(天)相对频数 百分比(%)10 15 0.20 20 15 20 0.40 40 20 25 0.25 25 25 30 0.10 10 30 35 0.05 5 合 计 1.00 100第22页/共39页23n三、直方图三、直方图n 直方图直方图(Histogram)是一种通过在横轴上放置组距,在纵轴上放置频数来描述数量数据的频数分布、相对频数分布和百分比频数分布的图形。第23页/共39页24图2.4 审计时间数据直方图 (单位:天)注意:本课件的直方图与教科书(P28)直方图的区别。第24页/共39页25n四、累积频数分布四、累积频数分布n 累积频数分布累积频数分布

9、(Cumulative frequency distribution)对数量数据集的表格法汇总,显示数值小于或等于每组上限的项目数。或者显示数值大于或等于每组上限的项目数。第25页/共39页26n(一)由最小数值向最大数值累积方法(显示数值小于每组上限的项目数)表2-7 审计时间数据的累积频数分布 审计时间(天)频数(个)累积频数(个)10 15 4 4 15 20 8 12 20 25 5 17 25 30 2 19 30 35 1 20 合 计 20 -第26页/共39页27n(二)由最大数值向最大数值累积方法(显示数值大于或等于每组下限的项目数):表2-8 审计时间数据的累积频数分布 审

10、计时间(天)频数(个)累积频数(个)10 15 4 20 15 20 8 16 20 25 5 8 25 30 2 3 30 35 1 1 合 计 20 -第27页/共39页28审计时间(天)频数(个)向上累计频数(个)向下累计频数(个)1015152020252530303548521 4 12 17 19 202016 8 3 1合计20表29 审计时间累计频数表第28页/共39页29第三节第三节 探索性数据分析探索性数据分析n 探索性数据分析探索性数据分析(Exploratory data analysis)是用茎叶显示(Stem-and-leaf display)图形来反映概括性数据的

11、一种统计技术。第29页/共39页30n一、茎叶显示图的绘制方法:一、茎叶显示图的绘制方法:n第一步:把每个观察值分成茎和叶两个部分。n茎包括了除了个位数之外的所有数字,叶就是个位数字。n第二步:把茎由小到大,从上往下写成一列,并且在这一列右边画一条直线。n第三步:把每片叶子写在它所属的茎的右边,并由小到大排成一行。第30页/共39页31n例2-3 表2-10是某证券公司对应聘某一职位50人参见面试时,回答所提出的150个问题正确回答的测试结果。n表2-10 能力测试回答正确的问题数目 112 72 69 97 107 73 92 76 86 73 126 128 118 127 124 82

12、104 132 134 83 92 108 96 100 92 115 76 91 102 81 95 141 81 80 106 84 119 113 98 75 68 98 115 106 95 100 85 94 106 119第31页/共39页32 6 8 9 2 7 2 3 3 5 6 6 6 8 0 1 1 2 3 4 5 6 8 9 1 2 2 2 4 5 5 6 7 8 8 1110 0 0 2 4 6 6 6 7 8 911 2 3 5 5 8 9 9 712 4 6 7 8 413 2 4 214 1 1图2.5 能力测试回答正确问题数目茎叶显示图 第32页/共39页33n

13、二、茎叶显示图的含义二、茎叶显示图的含义n第一行:表明在回答问题正确数目在60个以上,69个及以下的人数有两个。其中一个答对了68道题,另一个答对了69道题。n第二行:表明在回答问题正确数目在70个以上,79个及以下的人数有6个。他们答对题的数目分别为:72,73,73,75,76,76。n第33页/共39页34第四节第四节 交叉分组列表和散点图交叉分组列表和散点图n一、交叉分组列表n交叉分组列表交叉分组列表(Cross tabulation)对两个数据的表格汇总。一个变量的组用行来描述,另一个变量的组用行、列来描述。第34页/共39页35n表2-11 300家洛衫矶饭店质量等级和菜肴价格交叉

14、分组列表 质量 等级 菜肴价格(美元)合计 1019 2029 3039 4049 好 42 40 2 0 84 很好 34 64 46 6 150 极好 2 14 28 22 66 合计 78 118 76 26 300第35页/共39页36n二、散点图n 散点图散点图(Scatter diagram)表示两个变量之间关系的图形方法。一个变量列在横轴上,另一个变量列在纵轴上。n 例2-4 美国旧金山某音响商店广告次数和销售额的数据如下:第36页/共39页37n表2-12 立体声音响设备商店样本资料 周 次 广告次数(x)销售额(百美元)y 1 2 50 2 5 57 3 1 41 4 3 54 5 4 54 6 1 38 7 5 63 8 3 48 9 4 59 10 2 46第37页/共39页38 图2.6 立体声音响设备商店样本资料散点图第38页/共39页39nQuestion?Questions and Comments are welcome THANKS Have a great Day!Have a great Day!第39页/共39页

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服