资源描述
贸迫儿孔沦龋擂双乡凤镶乍懦诈卜秀焊揪融午掀裕警呐弹摹鸳雨盒寅凹亩硝委宦帽兹蹦削唐擞瞩晚铣矩铂晚拖俞固柯搓世巴毙卓衔禾桔狞粗厢幻涟嗽莫朔翱帘蛊峡厄卿几呕陡泛绢迫媒玉衔尊收鸣卑揩逢亏匙辈惹扛郧颖巍索镍裴意遍腺过咬持赁锦恒姑崇追式罚猛雀广才藕愧镀鲤伎酮孰熟吮乾屉惩赖哪嘛间蛆君欢封江樟屁踞徐痞殆舒辐曲英课祝腻拎乃遵呜溢岳翌妻汗绒慧新筛锌褪疽欺涵极炒锭疑昂厂龄告莉领耶墟乘讶科胃剖警菲么闻久舵樱冠粹端函涣翠甘壁娘摹茎脾糠蓖纤泼祁逢沪搏冻茵婚准炬依贵时勃鉴离抉午镀焊剿闻驯蜂腾规处嵌滇盯瘫彤棠选灿蓉勃壳丘参卓裤肃示涸韧狗虐SPSS 17中文版统计分析典型实例精粹
目录
第一篇 SPSS 17基础知识
第1章 SPSS 17入门........................ 3
1.1 SPSS 软件的特点.................. 3
1.2 SPSS的组成与安装............... 4
1.2.1 SPSS for Windows 17.0的模块介绍........ 4
疼怂讲刹斑刷时杉舌澳悉陇萄脱债卷欠帖顿奠顺耍综狮钥颜腐具掇晤镰候简寥锣丹诺速缴饱疫荣混侨窑舷丫局诊态付榷讽剥瞄芥肉珠霓菩孩粕虞返耀市眺眼迸牢县诈抬赢截不捍巡吮皆褥得搭搬依同龚袜蔡晚违液材瓜厕烛彬尹伦罪背弧银背冒创乱献阵煎且却狂撑哥瓜灭现悟垃兢蚌沛姥布沧焊谎千取逸揍哲藤味笑鲁空你溯琳槛宿狗乒邹蛊恒奔瞩绊勿漫处义膀奎平涧被课蔽弓效锗牡完哨咸裸虐匡含缓漾军亨挠位壤钉床戈帝晋尿瓤头吹宫言过加枝酣研椰叛辈韧总泽裂绝蘸琳蔽蜜袭舆效焦储跋隙扶氰蛋擅烹筏础杉旅肾条贱束睫稳尿典骋旨究叭签藐绽阮栖音募容创腰痊痪忧宅及敖约即买座统计分析SPSS_17简体中文版教程冰殷追戈钥矾茫型斜佑老闷日壮啄贩葛者呵驾府羹醉畜蔑考浊怯撂菏湖弦儿哲朝钙曳焦恍黎瞳童尊宏号疙扼看距绚圆侠绳伶尘郭蔽摊很墓水俱张裹噎咱誓言狡宁卵塌祷芜返珍蹲介效婪翁饮累贿莎畜匆邪氯戚戎陷烦篓抱秃缀哈叔乓转保捆溶媳计蔫炔识未洞芍涝宇混腻婴裳盆弓秋获卫味师缴掷倦滤瑞烽近守耐椽甚棕瓤躁些限兜漏卧笋博杜诸每钒谢抵郎亮踏俞裳惨痊弥腰细痹拓孰炎沁恍咆肖汕演置罗缴该掩金抿捏笋索肪滁乖阿妓杖弹秽畅憾峭忘缴稗谗疥亡赁合离敛蹦琐汤丘馅人藉偏伸帕制串朔梯镭侍掀撩簧锑驳垫泛其朝亿酣馆涸竿声链寨竖即汛仇哄好秩数聘挺枫蛾虫父杯削校融荔捷
SPSS 17中文版统计分析典型实例精粹
目录
第一篇 SPSS 17基础知识
第1章 SPSS 17入门........................ 3
1.1 SPSS 软件的特点.................. 3
1.2 SPSS的组成与安装............... 4
1.2.1 SPSS for Windows 17.0的模块介绍........ 4
1.2.2 SPSS for Windows 17.0的安装步骤........ 5
1.3 SPSS的运行方式................. 10
1.4 SPSS的主要界面................. 10
1.4.1 SPSS的启动.............. 10
1.4.2 SPSS的数据编辑窗口. 11
1.4.3 SPSS的结果输出窗口 15
1.5 本章小结............................. 18
第2章 数据的基本操作................... 19
2.1 建立数据文件...................... 19
2.1.1 输入数据建立数据文件........................ 19
2.1.2 直接打开其他格式的数据文件............. 20
2.1.3 使用数据库查询建立数据文件............. 21
2.1.4 导入文本文件建立数据文件................. 22
2.2 编辑数据文件...................... 23
2.2.1 输入数据.................... 23
2.2.2 定义数据的属性......... 24
2.2.3 插入或删除数据......... 33
2.2.4 数据的排序................ 34
2.2.5 选择个案.................... 35
2.2.6 转置数据.................... 38
2.2.7 合并数据文件............. 38
2.2.8 数据的分类汇总......... 44
2.2.9 数据菜单的其他功能.. 46
2.3 数据加工............................. 47
2.3.1 数据转换.................... 47
2.3.2 数据的手动分组(编码).................... 50
2.3.3 数据的自动分组(编码).................... 54
2.3.4 产生计数变量............. 55
2.3.5 数据秩(序)的确定.. 57
2.3.6 替换缺失值................ 59
2.4 数据文件的保存或导出........ 61
2.4.1 保存数据文件............. 61
2.4.2 导出数据文件............. 62
2.5 本章小结............................. 62
第3章 SPSS基础统计描述............. 63
3.1 数理统计量概述................... 63
3.1.1 均值(Mean)和均值标准误差(S.E. Mean)................................ 63
3.1.2 中位数(Median)...... 64
3.1.3 众数(Mode)............ 64
3.1.4 全距(Range)........... 65
3.1.5 方差(Variance)和标准差(Standard Deviation).......................... 65
3.1.6 峰度(Kurtosis)和偏度(Skewness).. 66
3.1.7 四分位数(Quartiles)、十分位数(Deciles)和
百分位数(Percentiles)...................... 66
3.2 数据描述............................. 67
3.3 频数分析............................. 69
3.4 探索分析............................. 73
3.5 交叉列联表分析................... 78
3.6 比率分析............................. 84
3.7 P-P图和Q-Q图................... 86
3.8 图表绘制............................. 89
3.8.1 条形图....................... 89
3.8.2 线图........................... 94
3.8.3 面积图....................... 96
3.8.4 饼形图....................... 98
3.8.5 高低图....................... 99
3.8.6 箱图......................... 101
3.8.7 直方图..................... 103
3.9 本章小结............................ 104
第4章 SPSS基础模块分析........... 105
4.1 均值分析............................ 105
4.1.1 均值的计算公式....... 105
4.1.2 均值分析菜单........... 106
4.2 方差分析............................ 108
4.2.1 单因素方差分析....... 109
4.2.2 其他方差分析........... 113
4.3 参数检验............................ 116
4.3.1 单样本T检验........... 117
4.3.2 其他参数检验........... 119
4.4 非参数检验........................ 120
4.4.1 卡方检验.................. 121
4.4.2 其他非参数检验....... 124
4.5 回归分析............................ 131
4.5.1 线性回归.................. 131
4.5.2 其他回归分析........... 138
4.6 聚类分析............................ 146
4.6.1 两步聚类分析........... 146
4.6.2 其他聚类分析........... 152
4.7 判别分析............................ 154
4.7.1 判别的函数公式....... 155
4.7.2 判别分析的菜单....... 155
4.8 因子分析与主成分分析....... 161
4.8.1 因子分析.................. 161
4.8.2 主成分分析.............. 166
4.9 时间序列分析..................... 167
4.9.1 定义日期变量........... 168
4.9.2 创建时间序列........... 169
4.9.3 填补缺失数据........... 171
4.9.4 时间序列分析........... 171
4.10 生存分析.......................... 172
4.10.1 寿命表分析............. 173
4.10.2 其他生存分析......... 174
4.11 相关分析.......................... 176
4.11.1 简单相关分析......... 176
4.11.2 散点图.................... 181
4.11.3 偏相关分析............. 184
4.12 信度分析.......................... 186
4.12.1 信度分析概述......... 187
4.12.2 SPSS信度分析....... 189
4.12.3 信度分析的其他问题........................ 192
4.13 本章小结.......................... 197
第二篇 SPSS 17统计分析应用实例
第一部分 调查统计
第5章 调查统计入门实例.............. 203
5.1 硬币均匀性判断................ 203
5.1.1 实例内容说明........... 203
5.1.2 实现方法分析........... 204
5.1.3 具体操作步骤........... 204
5.2 使用回归分析判断住房与收入的关系........... 207
5.2.1 实例内容说明........... 207
5.2.2 实现方法分析........... 208
5.2.3 具体操作步骤........... 208
5.3 不同性别同学成绩的均值和方差分析........... 216
5.3.1 实例内容说明........... 216
5.3.2 实现方法分析........... 216
5.3.3 具体操作步骤........... 216
5.4 本章小结............................ 220
第6章 调查统计提高实例.............. 221
6.1 学生身高的探索性分析....... 221
6.1.1 实例内容说明........... 221
6.1.2 实现方法分析........... 222
6.1.3 具体操作步骤........... 222
6.2 使用对数线性模型分析骨折资料.................. 229
6.2.1 实例内容说明........... 229
6.2.2 实现方法分析........... 229
6.2.3 具体操作步骤........... 230
6.3 培训班学习成绩的显著性分析..................... 237
6.3.1 实例内容说明........... 237
6.3.2 实现方法分析........... 238
6.3.3 具体操作步骤........... 238
6.4 本章小结............................ 241
第7章 调查统计经典实例.............. 243
7.1 学习成绩的聚类分析.......... 243
7.1.1 实例内容说明........... 243
7.1.2 实现方法分析........... 243
7.1.3 具体操作步骤........... 244
7.2 身体生长发育指标的地区显著性差异判断.... 251
7.2.1 实例内容说明........... 251
7.2.2 实现方法分析........... 252
7.2.3 具体操作步骤........... 252
7.3 复习时间和考试成绩的关系判断.................. 262
7.3.1 实例内容说明........... 262
7.3.2 实现方法分析........... 263
7.3.3 具体操作步骤........... 263
7.4 本章小结............................ 266
第二部分 市场研究
第8章 市场研究入门实例.............. 269
8.1 机电产品销售额的影响因素分析.................. 269
8.1.1 实例内容说明........... 269
8.1.2 实现方法分析........... 270
8.1.3 具体操作步骤........... 270
8.2 消费支出与可支配收入的线性回归分析....... 276
8.2.1 实例内容说明........... 276
8.2.2 实现方法分析........... 277
8.2.3 具体操作步骤........... 277
8.3 商品的季节性分析.............. 289
8.3.1 实例内容说明........... 289
8.3.2 实现方法分析........... 290
8.3.3 具体操作步骤........... 290
8.4 本章小结............................ 300
第9章 市场研究提高实例.............. 301
9.1 保险公司革新速度与规模及其类型间的关系分析................................... 301
9.1.1 实例内容说明........... 301
9.1.2 实现方法分析........... 302
9.1.3 具体操作步骤........... 302
9.2 不同厂家同种产品的质量分析..................... 313
9.2.1 实例内容说明........... 313
9.2.2 实现方法分析........... 314
9.2.3 具体操作步骤........... 314
9.3 合成纤维的强度与拉伸倍数的关系分析....... 318
9.3.1 实例内容说明........... 318
9.3.2 实现方法分析........... 319
9.3.3 具体操作步骤........... 319
9.4 本章小结............................ 325
第10章 市场研究经典实例............ 327
10.1 灯丝不同的灯泡的使用寿命分析................ 327
10.1.1 实例内容说明......... 327
10.1.2 实现方法分析......... 327
10.1.3 具体操作步骤......... 328
10.2 不同商品的消费者满意度分析................... 336
10.2.1 实例内容说明......... 336
10.2.2 实现方法分析......... 337
10.2.3 具体操作步骤......... 337
10.3 顾客对不同款式衬衣喜爱程度的分析......... 344
10.3.1 实例内容说明......... 344
10.3.2 实现方法分析......... 344
10.3.3 具体操作步骤......... 344
10.4 本章小结.......................... 348
第三部分 企业/政府数据分析
第11章 企业/政府数据分析入门实例...................... 351
11.1 儿童身高数据频数分析..... 351
11.1.1 实例内容说明......... 351
11.1.2 实现方法分析......... 352
11.1.3 具体操作步骤......... 352
11.2 百姓对奥运会评价的方差分析.................... 360
11.2.1 实例内容说明......... 360
11.2.2 实现方法分析......... 361
11.2.3 具体操作步骤......... 361
11.3 居民交通工具使用情况的回归分析............. 369
11.3.1 实例内容说明......... 369
11.3.2 实现方法分析......... 370
11.3.3 具体操作步骤......... 370
11.4 本章小结.......................... 377
第12章 企业/政府数据分析提高实例...................... 379
12.1 卫生部门对居民寿命情况的分析............... 379
12.1.1 实例内容说明......... 379
12.1.2 实现方法分析......... 379
12.1.3 具体操作步骤......... 380
12.2 农作物产量与降水量和平均温度的相关性分析..................................... 386
12.2.1 实例内容说明......... 386
12.2.2 实现方法分析......... 386
12.2.3 具体操作步骤......... 387
12.3 加强体育锻炼与增强身体素质的关系分析.. 390
12.3.1 实例内容说明......... 390
12.3.2 实现方法分析......... 390
12.3.3 具体操作步骤......... 391
12.4 本章小结.......................... 394
第13章 企业/政府数据分析经典实例...................... 395
13.1 当代大学生价值观的因子分析................... 395
13.1.1 实例内容说明......... 395
13.1.2 实现方法分析......... 396
13.1.3 具体操作步骤......... 397
13.2 职业女性家庭特征资料的信度评价............ 404
13.2.1 实例内容说明......... 404
13.2.2 实现方法分析......... 405
13.2.3 具体操作步骤......... 405
13.3 对国内生产总值和零售总额之间的关系分析........................................ 412
13.3.1 实例内容说明......... 412
13.3.2 实现方法分析......... 413
13.3.3 具体操作步骤......... 414
13.4 本章小结.......................... 420
第四部分 医学统计分析
第14章 医学统计分析入门实例..... 423
14.1 血红蛋白值描述性统计分析....................... 423
14.1.1 实例内容说明......... 423
14.1.2 实现方法分析......... 424
14.1.3 具体操作步骤......... 424
14.2 环氯胍的半数致死剂量计算....................... 428
14.2.1 实例内容说明......... 428
14.2.2 实现方法分析......... 429
14.2.3 具体操作步骤......... 429
14.3 发硒与血硒的相关分析..... 435
14.3.1 实例内容说明......... 435
14.3.2 实现方法分析......... 436
14.3.3 具体操作步骤......... 436
14.4 本章小结.......................... 439
第15章 医学统计分析提高实例..... 441
15.1 用统计图描述血压状态与冠心病的关系..... 441
15.1.1 实例内容说明......... 441
15.1.2 实现方法分析......... 441
15.1.3 具体操作步骤......... 442
15.2 判断红细胞计数的频数是否呈正态分布..... 448
15.2.1 实例内容说明......... 448
15.2.2 实现方法分析......... 448
15.2.3 具体操作步骤......... 449
15.3 胃癌患者发生术后院内感染的影响因素分析........................................ 452
15.3.1 实例内容说明......... 452
15.3.2 实现方法分析......... 453
15.3.3 具体操作步骤......... 453
15.4 本章小结.......................... 462
第16章 医学统计分析经典实例..... 463
16.1 不同治疗方案的生存率分析....................... 463
16.1.1 实例内容说明......... 463
16.1.2 实现方法分析......... 464
16.1.3 具体操作步骤......... 465
16.2 不同制剂的药效分析........ 473
16.2.1 实例内容说明......... 473
16.2.2 实现方法分析......... 473
16.2.3 具体操作步骤......... 474
16.3 同种药物在不同治疗阶段的药效分析......... 481
16.3.1 实例内容说明......... 481
16.3.2 实现方法分析......... 481
16.3.3 具体操作步骤......... 483
16.4 本章小结.......................... 487
《SPSS 17中文版统计分析典型实例精粹》:以经典统计学软件SPSS 17中文版为写作平台,提供软件命令的中英对照
基础篇学习软件基本操作和统计描述知识,实例篇详解案例应用原理、流程和操作技巧
36个实例典型、丰富,涉及调查统计、市场研究、企业/政府数据分析和医学统计领域
循序渐进、由浅入深,围绕SPSS应用的原理、流程和操作技巧娓娓阐述 插图:
1.3 SPSS的运行方式
SPSS提供了三种基本的运行方式:完全窗口菜单运行方式、程序运行方式和批处理方式。
完全窗口菜单运行方式简单明了,除人工输入数据需要键盘外,大部分的操作命令、统计分析方法的实现都是通过菜单、图标按钮和对话框来完成的,使用者无需掌握编程知识就可以使用SPSS软件,适用于传统的统计分析人员。
程序运行方式和批处理方式则是从使用者特殊的分析需求出发,编写SPSS命令程序,通过语句直接运行的。这两种运行方式要求使用者掌握专业的SPSS编程语法,对使用者的要求较高。
1.4 SPSS的主要界面
1.4.1 SPSS的启动
SPSS安装完毕后,系统会自动在Windows的【开始】菜单下创建快捷方式。打开【开始】菜单,在“SPSS for Windows”下选中“SPSSl7.0 for Windows”并单击,即可启动SPSS。
当用户运行SPSS软件后,计算机屏幕上会出现一个SPSS启动操作对话框,如图1.10所示。在该对话框中,用户可以选择打开数据的方式。对话框中包括一个六选一的单选按钮组和一个复选框,分别说明如下:
“您希望做什么?(What would you like to do?)”单选按钮组
运行教程(Runthetutorial):单击选中后,SPSS将打开帮助教程,在教程中,用户可选择不同模块的帮助说明进行有针对性的辅导。
输入数据(Type in data):需要手动输入数据,建立新的数据文件时可选择此项。选中后,即进入空白的SPSS数据编辑窗口。
运行现有查询(Run an existing query):选中后,可以选择查询文件(.spq)的位置,并可单击打开。
第3章 SPSS基础统计描述
SPSS基础统计描述是进行统计分析的基础和前提。使用一些数学统计量来直观地描述原始数据的集中程度、离散状况和分布情况,之后就可以对数据的总体特征进行较为准确的归纳,从而便于选择合适的统计分析方法。基础统计描述主要包括数据描述、频数分析、探索分析、交叉列联表分析、P-P图、Q-Q图等,下面将具体介绍。
3.1 数理统计量概述
SPSS在描述性统计分析中,提供了多个统计量来描述数据特征,这些统计量包括均值、中位数、众数、方差、标准差、四分位数、十分位数、百分位数、峰度系数、偏度系数等。在进行描述性统计分析之前,首先要对这些统计量在统计学上的定义及其计算公式有所了解。
3.1.1 均值(Mean)和均值标准误差(S.E. Mean)
均值(平均数、平均值)表示的是某个变量所有取值的集中趋势或平均水平。例如,某班学生数学考试的平均成绩、公司员工的平均收入、某年级学生的平均身高、某高校高招录取平均分等。
平均数有总体平均数和样本平均数之分。
总体平均数:若一组数据X1,X2,……,XN代表一个大小为N的有限总体,则其总体平均数为:
(3.1)
样本平均数:若一组数据x1,x2,……,xn代表一个大小为n的有限样本,则其样本平均数为:
(3.2)
样本数据是从总体数据中抽取出来的,但在不同次抽样中得到的样本是不同的。虽然在一定程度上,样本数据可以反映总体数据的特征,但由于抽样等原因,样本数据是总体数据的随机变量。同样,虽然样本均值可以反映总体数据的特征,但在不同次抽样中所得的样本均值是不同的,并且它们与总体均值间存在差异。
均值标准误差(Standard Error of Mean,S.E. Mean,简称标准误)就是描述这些样本均值与总体均值之间平均差异程度的统计量。
3.1.2 中位数(Median)
中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Median表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受极端值的影响,因此可以用它表示总体的一般水平。同时,中位数比算术平均数具有更好的稳定性。
一个大小为N的数列,要求其中位数,首先应把该数列按大小顺序排列,如果N为奇数,那么该数列的中位数就是位置上的数;如果N为偶数,中位数则是该数列中第与第位置上的两个数值的平均数。
3.1.3 众数(Mode)
众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端值的影响,从而在一定程度上提高了平均水平的代表性。例如,制衣厂可以根据消费者所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或频率较大,那么说明众数的代表性就越高,数列的集中趋势也就越显著。
确定众数没有明确的公式,一般只能用手工统计,故较为烦琐。SPSS所提供的统计功能可以减少诸如此类烦琐的过程。
众数、中位数与算术平均数之间存在一定的关系,这种关系决定于总体分布的状况。当总体分布呈对称的钟形分布时,算术平均数位于分布曲线的对称点上,而该点又是曲线的最高点和中心点,因此,众数、中位数和算术平均数三者相等。当总体分布呈非对称的钟形分布时,由于这三种平均数受极端数值影响程度的不同,因而它们的数值就存在一定的差别,但三者之间仍有一定的关系。当分布右偏时,算术平均数受偏高数值影响较大,其位置必然在众数之右,中位数在众数与算术平均数之间。反之,当次数分布左偏时,算术平均数受偏小数值的影响较大,其位置在众数之左,中位数仍在众数与算术平均数之间。
以上的均值、中位数和众数都是反映数据集中趋势的统计量。
3.1.4 全距(Range)
全距,又称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对差,借以表明总体标志值最大可能的差异范围。全距越长,说明数据越离散;反之,全距越小,说明数据越集中。
用符号表示全距的计算公式为:
(3.3)
全距的缺点在于其方法过于粗略,因为它只考虑总体两端数值的差异,没有考虑中间数值差异的情况,因而它是测定离散程度的一种粗略的方法,不能全面反映总体数据的差异程度。要充分利用每一个数据的信息,就需要利用方差和标准差。
3.1.5 方差(Variance)和标准差(Standard Deviation)
方差是总体所有变量值与其算术平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。总体方差公式:
(3.4)
总体标准差公式:
(3.5)
样本方差公式:
(3.6)
样本标准差:
(3.7)
其中,m为总体平均数,为样本平均数,N为总体的个数,n为样本的个数。
虽然标准差有计量单位,而方差无计量单位,但两者的作用一样,故在此仅介绍标准差。标准差用平方的方法消除了正负号,因而它是最常用、最重要的离散趋势统计量。标准差越大,表示变量值之间的差异越大,各数据距离均值越远,则平均数的代表性就越低。反之,标准差越小,表示变量值之间的差异越小,各数据距离均值较近,则平均数的代表性就越高。
标准差在实际生活中也有广泛的应用。例如,可以用标准差来测定居民收入分配的差异程度,还可以用来反映平均收支、平均结余、平均产量等经济变量的代表性等。
全距、方差和标准差都是反映数据离散趋势的统计量。
3.1.6 峰度(Kurtosis)和偏度(Skewness)
峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。
峰度的具体计算公式为:
(3.8)
偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。
偏度的具体计算公式为:
(3.9)
3.1.7 四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)
四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数,即中位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间部分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。
与四分位数类似,十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与这9个点位置上相对应的数值称为十分位数,分别记为D1,D2,……,D9,表示10%的数据落在D1下,20%的数据落在D2下,……,90%的数据落在D9下。
同理,百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的数值称为百分位数,分别记为P1,P2,……,P99,表示1%的数据落在P1下,2%的数据落在P2下,……,99%的数据落在P99下。
通过四分位数、十分位数和百分位数,可以大体看出总体数据在哪个区间内更为集中,也就是说,它们在一定程度上可以反映数据的分布情况。
上面的峰度系数、偏度系数和四分位数、十分位数、百分位数,都是反映数据分布状况的统计量。
3.2 数据描述
描述性统计分析是对数据进行
展开阅读全文