1、LOGO第第3 章章描述性统计学描述性统计学 Descriptive Statistics:Tabular and Graphical MethodsAdd your company slogan.Summarizing Qualitative DataSummarizing Qualitative Data Summarizing Quantitative DataSummarizing Quantitative DataExploratory Data AnalysisExploratory Data Analysis CrosstabulationsCrosstabulations an
2、d Scatter Diagrams and Scatter DiagramsContents.举重举重 射击射击 射击射击 跳水体操体操乒乓跳水体操体操乒乓球举重球举重乒乓球羽毛球举重乒乓球羽毛球乒乓球羽毛球举重乒乓球羽毛球举重举重跳水跳水跳水乒乓球举重举重跳水跳水跳水乒乓球跳水射击体操羽毛球柔道柔道跳水射击体操羽毛球柔道柔道举重田径羽毛球跆拳道举重田径羽毛球跆拳道中国体育代表团在悉尼中国体育代表团在悉尼奥运会上获金牌的项目奥运会上获金牌的项目STATSTAT统计学统计学第二章第二章 统计数据统计数据.获金牌项目获金牌项目金牌数金牌数 占总数比例占总数比例跳水枚跳水枚 0.1786举重枚举重
3、枚 0.1786乒乓球枚乒乓球枚 0.1429羽毛球枚羽毛球枚 0.1429体操枚体操枚 0.1071射击枚射击枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357品质数列品质数列STATSTAT统计学统计学第二章第二章 统计数据统计数据.获金牌项目获金牌项目金牌数金牌数 占总数比例占总数比例跳水枚跳水枚 0.1786举重枚举重枚 0.1786乒乓球枚乒乓球枚 0.1429羽毛球枚羽毛球枚 0.1429体操枚体操枚 0.1071射击枚射击枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357变量值变量值x
4、次数次数 f频率频率f/fSTATSTAT统计学统计学第二章第二章 统计数据统计数据.圆形图(饼图圆形图(饼图 Pie)STATSTAT统计学统计学第二章第二章 统计数据统计数据.STATSTAT统计学统计学第二章第二章 统计数据统计数据圆形图(饼图圆形图(饼图 Pie).STATSTAT统计学统计学第二章第二章 统计数据统计数据圆形图(饼图圆形图(饼图 Pie).vBar Charts条状图条状图Bar charts provide an alternative to pie charts.The frequency(or relative frequency)of each categor
5、y is represented by a vertical bar.vExample 2.3-continued(Excel representation)7352366428.STATSTAT统计学统计学第二章第二章 统计数据统计数据条形图条形图(Bar).田径跆拳道柔道体操射击羽毛球乒乓球跳水举重Count302826242220181614121086420Percent10090807060504030201002334455帕累托图帕累托图Pareto0-80%A类因素类因素80-90%B类因素类因素90-100%C类因素类因素.3.3数值型数据的整理与展示数值型数据的整理与展示v
6、Frequency Distribution频数分布vRelative Frequency and Percent Frequency Distributions相对频数和百分数vDot Plot打点图vHistogram直方图vCumulative Distributions累计分布图vOgive穹形图.某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5
7、167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 变量值变量值x次数次数f单值(项)数列单值(项)数列.身高身高 人数人数 比重比重 (CM)(人)(人)(%)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计总计 83 100某年级某年级83名女生身高资料名女生身高资料组距数列组距数列次数次数f频率频率f/f.某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数 (CM)(人)(人)150-155 3 155-16
8、0 11 160-165 34 165-170 24 170以上以上 11 总计总计 83组距数列组距数列上组限上组限U下组限下组限L组距组距dd=U-L如:如:160-155=5组中值组中值xx=(U+L)/2如如:(165+170)/2=167.5开口组开口组d=邻组邻组d估计上组估计上组限为限为175估计组中估计组中值为值为172.5.单值数列单值数列组距为组距为2.5的的组距数列组距数列组距为组距为4的组距数列的组距数列组距为组距为6的组距数列的组距数列.组数组数Sturges 经验公式经验公式最小最小K值法值法.组距、组上限、组下限组距、组上限、组下限.频数表频数表(用(用SPSS制
9、作)制作)有效有效数据数据频数频数频率频率有效有效频率频率累计累计频率频率约约2/3的人身高不超过的人身高不超过165cm.vRelative Frequency and Percent Frequency Distributions Relative Percent Cost($)Frequency Frequency 50-59.04 4 60-69 .2626 70-79.3232 80-89 .1414 90-99.1414 100-109 .1010 Total 1.00 100Example:Hudson Auto Repair.Dot PlotvOne of the simple
10、st graphical summaries of data is a dot plot.vA horizontal axis shows the range of data values.vThen each data value is represented by a dot placed above the axis.Example:Hudson Auto RepairvDot Plot .505050 606060 707070 808080 909090 100100100 110110110 .Cost($)Cost($).直方图直方图(Histogram).直方图直方图条形图条形
11、图.直方图直方图.研究贫富差别的基本方法:将人口按研究贫富差别的基本方法:将人口按收入水平等分为收入水平等分为 5 组,观察收入差别。组,观察收入差别。20%20%20%20%20%中国九十年代:中国九十年代:最富的最富的20家庭家庭拥有全部财富的拥有全部财富的48,最穷的最穷的20家家庭拥有全部财富的庭拥有全部财富的4。.Lorentz CurveLorentz CurveGA/(AB)ABCumulative relative percent of populationCumulative relative percent of income累计次数分布图.Exploratory Data
12、 AnalysisvThe techniques of exploratory data analysis consist of simple arithmetic and easy-to-draw pictures that can be used to summarize data quickly.vOne such technique is the stem-and-leaf display.Stem-and-Leaf DisplayvA stem-and-leaf display shows both the rank order and shape of the distributi
13、on of the data.vIt is similar to a histogram on its side,but it has the advantage of showing the actual data values.vThe first digits of each data item are arranged to the left of a vertical line.vTo the right of the vertical line we record the last digit for each item in rank order.vEach line in th
14、e display is referred to as a stem.vEach digit on a stem is a leaf.Example:Hudson Auto RepairvStem-and-Leaf Display 5 2 7 6 2 2 2 2 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 8 0 0 2 3 5 8 9 9 1 3 7 7 7 8 9 10 1 4 5 5 9.Stretched Stem-and-Leaf DisplayvIf we believe the original stem-and-lea
15、f display has condensed the data too much,we can stretch the display by using two more stems for each leading digit(s).vWhenever a stem value is stated twice,the first value corresponds to leaf values of 0-4,and the second values corresponds to values of 5-9.Example:Hudson Auto RepairvStretched Stem-and-Leaf Display 5 2 5 7 6 2 2 2 2 6 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 7 5 5 5 6 7 8 9 9 9 8 0 0 2 3 8 5 8 9 9 1 3 9 7 7 7 8 9 10 1 4 10 5 5 9.其它统计图表介绍其它统计图表介绍:象形图象形图.LOGOThe end of chapter 2.