1、Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,*,*,数量方法基础,第一节 统计软件概述,1,统计软件的种类很多。,有些功能齐全,有些价格便宜,有些容易操作,有些需要更多的实践才能掌握。,还有些是专门的软件,只处理某一类统计问题。,2,SPSS:一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。对于非统计工作者是很好的选择。,3,Excel:它严格说来并不是统计软件,但作为数据表格软件,有一
2、定统计计算功能。,凡是有Microsoft Office的计算机,基本上都装有Excel。,对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。,多数专门一些的统计推断问题还需要其他专门的统计软件来处理。,4,SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。对于基本统计课程则不那么方便。,5,LISREL与 AMOS:专门用于结构方程模型的数据分析,8,其他软件:,如STATA、GAUSE等软件也是较优秀的软件。,9
3、第二节 数据文件的建立与编辑,10,一、基本步骤,启动SPSS软件,SPSS for Windows,进入Data Editor窗口,定义有关变量,输入数据,保存文件,11,二、定义新变量,单击左下方的,Variable View,标签就可以切换到变量定义界面开始定义新变量。,(以下例子使用数据文件“数据编辑1”),12,定义变量的几点说明,变量有以下几种属性:,变量名(Name),必须有,默认为var0001等,变量类型(Type),必须有,默认为数值型,变量标签(label),可不使用,缺失值(missing value),可不使用,显示格式(Coumn Format),通常不更改,13
4、变量定义,变量类型:,String-字符型,Numeric-数值型,字符/数值长度,小数位数,变量名标签,缺失值,变量值标签,变量名,14,1.变量名,以字母开头,,长度不超过8个字符,系统不区分变量名中的大小写字母,不能以SPSS保留字相同,如ALL、,AND、BY、EQ、GE等,15,2.变量的类型及长度,数值型,主要用Numeric型(还有其他4种数值型),例如Numeric 8.2 总长8个字符,2位小数,字符型 String 主要用于“名称”,16,3.变量标签,变量名标签,对变量名的注释作用,当鼠标指向该变量名时,就会显示出变量名标签,定义方法:,直接在“lable”格中输入文字
5、17,变量值标签则在Value格中定义。单击Value单元格右半部,会弹出变量值标签对话框如下:,18,例如,我们对X2变量定义变量值标签。该变量(性别)取值只有两个,1和2,分表便是“男”和“女”,可按如下方法,为变量X2定义其变量值标签,在上一个“Value”处输入“1”,在下一个“Value”处输入“男”,单击“添加”,重复上述过程,将变量值“2”定义标签,19,变量值标签作用:,当输入数值型数据后,点击,“标签”按钮后,变量值就会以标签形式显示出来。,20,定义缺失值(missing value),对X2(性别)变量,将缺失值定义为9,方法如下:,单击该变量在“missing”单元
6、格的右端,弹出下述对话框,选择中间项,并输入9,21,例:察看定义缺失值前后,X2条形图的差异:操作如下:,Analysis,Descriptive Statistics,Frequencies,打开频数分析对话框,22,23,选中X2,之后,点击箭头,使该变量进入右端框中。,24,点击“Charts”按钮,打开作图对话框,25,选中“Bar charts”(条形图),点击“continue”,返回上一对话框,点击“OK”,在输出窗口就会得到,条形图,26,27,28,29,4.显示格式(通常按默认,不更改),显示栏宽,对齐方式,左对齐,居中,右对齐,30,三、输入数据,定义完一个变量后立即输
7、入,定义完所有变量后一起输入,31,四、数据文件的修改,1.增加变量,在需要插入变量的列中任意,选择一单元格,单击Insert Variable 按钮,产生一空白列,按前述方法定义变量,并输入数据,32,2.增加观测值(Case),与增加变量方法基本相同,需要单击Insert Case 按钮,33,3.对数据进行拷贝、剪切、粘贴,可按行,也可按列进行,可选择整行(或列),也可选择,部分数据,34,五、根据已有变量建立新变量,35,例,本例使用数据文件“数据编辑2”,该文件中包含三个变量:,N-企业名称(以英文字母表示),X1流动资产,X2流动负债,要求:计算流动比率X1/X2,并将计算结果存放
8、到变量R中。,36,操作过程,打开Tansform菜单,选择Compute选项,进入Compute Variable对话框,37,输入“R”,输入表达式:“X1/X2”,点击“OK”,38,39,第三节 输出结果的保存与编辑,40,一、分析结果的保存,需要结果的时候再运行一次分析程序。,拷贝至剪切板,然后粘贴至WORD文档中。,直接保存结果文件。,在结果浏览窗口中选择菜单File,Save,保存为以.spo为扩展名的文件(可以与数据文件同名)。,41,二、分析结果的编辑,SPSS输出结果有较强的编辑功能,经过编辑后的输出结果更适合粘贴至WORD文档中,42,第四节,统计测量尺度,43,一、统计
9、测量尺度的概念与种类,44,四种计量尺度,数据的测量尺度,定类尺度,定序尺度,定距尺度,定比尺度,45,定类尺度,计量层次最低,对事物进行平行的分类,各类别可以指定数字代码表示,使用时必须符合类别穷尽和互斥的要求,数据表现为“类别”,具有,=,或,的数学特性,46,定类尺度,定类变量或指标确切的,值是以文字表述,的,可以用数值标识,但仅起标签作用。,定类变量或指标的,各类别,间是,平等,的,没有高低、大小、优劣之分。,47,性别,行业,企业所在地区,例如:,48,定序尺度,对事物分类的同时给出各类别的顺序,比定类尺度精确,未测量出类别之间的准确差值,数据表现为“类别”,但有序,具有,或,的数学
10、特性,49,定序尺度,定序变量或指标确切的,值是以文字表述,的,也可以用数值标识,也仅起标签作用。,定序变量或指标,各类别间有高低优劣之分,,不能随意排列。,50,例如:,企业规模:大、中、小,受教育程度:小学、中学、大学、研究生,51,大学生,中学生,小学生,52,定距尺度,1.对事物的准确测度,2.比定序尺度精确,3.数据表现为“数值”,4.没有绝对零点,5.具有+或-的数学特性,53,定距尺度,定距变量或指标的,值以数字表述,,有,计量单位,,可以进行,加减运算,。,定距变量或指标各类别间自然有大小之分,但,没有绝对的零点,,不能乘除计算。,54,公元2004年,公元元年,时间起点,?,
11、55,1970年出生,30岁,1985年出生,15岁,甲,乙,二人年龄 之差:19851970=15岁,或 3015=15岁,二人年龄之比:3015=2(倍),19851970=1.0076(倍),56,定比尺度,1.对事物的准确测度,2.数据表现为“数值”,3.有绝对零点,4.具有,或,的数学特性,57,定比尺度,定比变量或指标确切的,值也以数字表述,有计量单位,,可以加减,,定比变量或指标,有绝对意义上的零点,既可以加减,可以乘除运算,。,58,零高度,零重量,零体积,零面积,零人口,零产量,零资产,真正的零:,一无所有,59,Nominal,定类测量定类尺度,Ordinal,定序测量定序
12、尺度,Scale,定距定比测量尺度,实际应用中,通常将定距、定比两类合并为一类,60,二、统计测量尺度的作用,61,统计测量尺度的作用:,第一,决定数据的整理、显示方法,第二,决定数据的分析方法,第三,决定计算机的处理方法,62,定类变量,定序变量,品质变量,条形图,圆形图,63,定距变量,定比变量,茎叶图,直方图,频数表,64,典型的数据分析方法(部分),集中趋势,离散趋势,相关回归,假设检验,众数,定类变量,品质相关,Q检验,异众比,中位数,等级相关,异众比,2,检验,定序变量,均值,相关回归,标准差,t检验,定距变量,均值,相关回归,标准差,t检验,定比变量,非参数统计,参数统计,65,
13、三、测量层次与测量尺度的正确应用,66,对测量尺度层次的判断,较低层次的测量尺度,较高层次的测量尺度,低,测量精度,高,少,计算方法,多,小,信息数量,大,67,高 层次 低,定类测量,定序测量,定距测量,定比测量,68,对于不同的现象,注意准确性,性别、职业、行业、地区等方面的差异,定类测量,定序测量,定距测量,定比测量,69,对于不同的现象,注意准确性,定距以上的尺度不一定合适,对于人的主观态度,定序尺度可能是最好的方法,70,对数量差异的度量,注意层次,定序测量,定距测量,定比测量,文盲半文盲、小学、初中、高中、大专、大学本科、硕士研究生、博士研究生,(定序测量),顺序性差异,顺序性差异
14、绝对差异距离,顺序性差异、绝对差异距离、相对差异,对受教育程度的度量方法,文盲半文盲,博士研究生,71,定序测量,定距测量,定比测量,0年、6年、9年、12年、16年、19年、22年,(定距测量),顺序性差异,顺序性差异、绝对差异距离,顺序性差异、绝对差异距离、相对差异,对受教育程度的度量方法,文盲半文盲,博士研究生,72,第五节几个相关概念,73,一、统计数据类型,观测数据与试验数据;,截面数据、时间序列数据及面板数据。,74,观测数据,和,试验数据,在自然的、未被控制的条件下观测到的,称为观测数据(observational data)。,凡是在获得数据的过程中,不对被调查对象数据产生的
15、条件施加任何控制,所得到的数据称为观察数据。,75,在人工干预和操作情况下收集的数据就是试验数据(experimental data)。,凡是在获得数据的过程中,对数据产生的条件实施了控制而得到的数据,称为实验数据。,76,截面数据,某一时间内对不同对象进行观察所获得的数据,例如:2006年度所有上市公司的报表数据,时间序列,对同一对象在不同时间内连续观察所获得的数据,例如:甲企业从1999年到2004年连续6年的报表数据,面板数据,对同一组对象在不同时间中连续观察所获得的数据,例如:所有上市公司从1999年到2004年连续6年的报表数据,77,二、统计学的基本概念,78,1、统计总体和总体单位,总体:,统计研究所确定的客观对象,是具,有共同性质的许多单位组成的整体。,总体单位:组成总体的各个单位(或元素),,是各项统计数字的原始承担者。,79,2、样本,从总体中随机抽取部分单位所构成的集合。,必须取自所要研究的总体;,特点,从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异;,样本必须具有代表性;,样本必须具有客观性,也即排除主观因素的影响,80,谢 谢!,81,






