SPSS常用函数.docx_咨信网zixin.com.cn

资源描述

SPSS常用函数 SPSS函数是一个常用程序，并且利用一个或多个自变量（参数）来执行。每个SPSS函数均有一个关键名称，且绝不能写错。通常，函数的格式为:函数名称（自变量，自变量，……），*些函数可能只含有一个自变量，而有些函数则可能含有多个自变量，当一个函数含有多个自变量时，各自变量间用逗号（，）隔开，而函数的自变量通常又可分为以下三种：（1）常数，如 SQRT（1）；（2）变量名称，如 MEAN（VAR1,VAR2,VAR3）；（3）表达式，如 MIN（30,SQRT（1））。总之，SPSS函数和我们平时E*CEL里面函数格式规则并无差别。 SPSS提供了 180多种函数，共可分为十多类（SPSS 17.0中大大小小分了 18类）。和E*CEL —样，我们也不可能记住所有函数，只要知道一些常用函数，至于其他函数要用的时候再去查找也不迟，下面将列举一些常用函数： 1.ArithmeticFunction算术函数算术函数是最常用的函数，可以满足对变量进行的一般运算，算术函数主要有：函数名自变量涵义函数类型函数功能及说明 ABS(nume*pr) （算术表达式）数值型函数求绝对值，例如： ABS（Y-850）：将分别计算变量Y的每个数据与20的差的绝对值 ARSIN(nume*pr) 角度；弧度单位）数值型函数求反正弦值。 ARTAN(nume*pr) 角度；弧度单位）数值型函数，求反正切值。 COS(radians) 角度；弧度单位）数值型函数求余弦值。 E*P(nume*Pr) （算术表达式）数值型函数求e的指数幕值。例如：E*p（4）=et=54.60。注意：若函数值太大，其结果会超出SPSS的计算*围。 LGl0(nume*p) （算术表达式）数值型函数求以10为底的对数值。例如：Ln（Y）分别计算变量Y中每个数据的以10为底的对数值。 LN(nume*pr) （算术表达式）数值型函数求以e为底的对数。例如：Ln（Y）分别计算变量Y中每个数据的自然对数值。 MOD(nume*pr,modulus) 算术表达式；摸数（常数））数值型函数求算术表达式除以模数的余数。例如： Mod（10. 3）：函数值=1 SIN(radians) 角度；弧度单位）数值型函数求正弦值。 SQRT(nume*pr) 正数）数值型函数求平方根。例如： Sqrt（9）=3 RND(nume*pr) 算术表达式）数值型函数求算术表达式的值四舍五入后的整数。例如： RND（2.72） = 3 TRUNC(nume*pr) 算术表达式）数值型函数求算术表达式的值被截去小数部分的整数。例如：Trunc（2.72） 2 算术表达式也包括单值与变量名的情况。 2.StatisticalFunctic统计函数统计函数也是统计分析中常用的函数之一，主要反映变量的数据特征，时间序列的滞后期变量等，具体函数有：函数名自变量涵义函数类型函数功能与说明 CFVAR(nume*pr,nume*pr,...) （变量名，变量名，..）数值型函数求出多个变量值的变异系数标准差/均值）。例如Cfvar （数学，物理，化学）：分别计算每个学生三门成绩的变异系数。 LAG(variable) （变量名）数值型函数或字符型函数返回滞后一期的变量数据。对第一个观测量来说，将返回系统缺失值，如果指定的变量是字符型，则返回空格。 LAG(variable,ncases) （变量名,自然数 n）数值型函数返回滞后n期的变量数据。对第前n个观测量来说，将返回系统缺失值，如果指定的变量是字符型，则返回空格。求多个变量值中的最大值；例如 MA*(ivalue,value[,...]) （变量名，变量名，…）数值型函数 MA*（数学，物理，化学）：分别计算每个学生三门成绩中的最高分。变量名，变量名，…）数值型函数求多个变量值的平均值；例如 MEAN(nume*pr,nume*pr,...) MEAN（数学，物理，化学）：分别计算每个学生三门成绩的平均值。（变量名，变量名，…）数值型函数求多个变量值中的最小值；例如 MIN(value,value[,...]) Min （数学，物理，化学）：分别计算每个个案三门成绩中的最低分。 NVALID(variable, variable,.. 变量名，变量名，…）数值型函数求出变量的不包括缺失值）的数量。变量名，变量名，…）数值型函数求多个变量值的标准差；例如 SD(nume*pr,nume*pr,...) SD（数学，物理，化学）：分别计算每个学生三门成绩的标准差。 SUM(nume*pr,nume*pr,...) 变量名，变量名，…）数值型函数求多个变量值的和；例如Sum（数学，物理，化学）：分别计算每个个案三门成绩的总和。（变量数值求多个变量值的方差；例如 Variance 数学， VARIANCE((nume*pr,nume*pr,...) 名，变量名，…）型函数，物理，化学）：分别计算每个学生三门成绩的方差。 3.LogicalFunction 逻辑函数 lANY（test,valuvalue,..]）逻辑型函数，自变量为（变量名，*1,*2,…），函数功能是判断变量值是否是*1、*2…中的一个，例如:Any（数学，80，90，70）:分别对每条个案判断其数学成绩是否为80或90或70分。 lRANGE（test,lo, hi[0，hi...逻辑型函数变量必须都为数值型或都为字符型，自变量为变量名，*1，*2），其中：*1^2,函数功能是判断*变量值是否在*1至*2之间，例如：RANGE （数学，80,90）:分别对每条个案判断其数学成绩是否在80至90分之间 4.DateandTimeFunctions 日期和时间函数 lDATE.DMY （day,month,year）SPSS日期型格式的数值函数，返回与指定的日、月、年相应的日期值。要正确显示这个值，必须将变量赋予DATE格式。自变量必须为整数。day的*围在1 ~31,. month的*围在1〜12, year的*围在4位数时要大于1582, 2位数时应是该世纪的后两位年代数值。 lDATE.YRDAY(year,daynum)SPSS格式日期型数值函数，返回与指定的天数、年相应的日期值。要正确显示这个值，必须赋予其DATE格式。Daynum取值*围在1〜366。 l*DATE.DATE(datevalue)SPSS0期格式的数值型函数，从具有SPSS的日期格式的自变量数值返回一个日期，自变量数值由DATE.***函数产生或按DATEs输入格式读取。该函数用于将日期的数值格式转换为日期格式，因此要想按日期格式显示必须再在Variable Vie中定义一种日期格式，否则会按SPSS日期的数值格式显示。此函数无20年问题21世纪的日期也能正确显示。 l*DATE.HOUR(datevalue)数值型函数，从DATE.***函数产生或按一种DATE格式读入的SPSS日期格式的数值，返回一个小时数(0〜23)。 l*DATE.JDAY(datevalu数值型函数，通过 DATE.***产生或由 DATE输入格式读入SPSS日期格式的数值，返回一年的天数(1〜366)。 l*DATE.MDAY(datevalue)数值型函数，从一个SPSS日期格式的数值通过DATE.***函数产生或由DATE输入格式读入，返回一个月的天数(1〜31)。 l*DATE.MINUTE(datevalue数值型函数，通过 DATE.***产生或由DATE输入格式读入SPSS日期格式的数值，返回分钟数(0-59)。 l*DATE.MONTH(datevalue)数值型函数，通过DATE.***产生或由DATE输入格式读入SPSS日期格式的数值，返回一年中的月数(1〜12)。 l*DATE.TDAY(timevalue数值型函数，自变量是由TIME.**函数产生或由TIME输入格式读取的SPSS时间间隔格式的数值，返回整天数正整数)。 l*DATE.TIME(datevalue)SPS时间间隔格式的数值型函数，把自变量的值看作从午夜开始的秒数，返回一天中的时间小时、分、秒)。自变量是SPSS日期格式的数值，可以是由DATE.***函数产生的或由DATE输入格式读入的。由该函数建立的变量应该给定一个合适的显示格式。在VariableView中，赋予它一个时间显示格式,将变量值显示成小时和分。 l*DATE.WEEK(datevalue数值型函数。由一个SPSS日期格式数值(由DATE.***函数产生或由一种DATE输入格式读入)，返回周数(1〜53整数)。 l*DATE.WKDAY(datevalue)数值型函数，由一种通过。入丁£.***函数产生或用DATE格式读入的SPSS日期格式数值，返回的数值表示一周的星期几星期1〜星期日用1〜7之间的整数表示)。 l*DATE.YEAR(datevalu数值型函数，由 DATE.***函数产生或用 DATE格式读入的SPSS日期格式的数值，返回年数。 lYRMODA(year,month,day)数值型函数，返回一个由1582年10月 15日到自变量给定的年月曰(year month，day)之间的天数。总结：以上的日期函数分为三大类： date.SSS();*DATE.SSS(dateval；ue)YRMODA(year,month,day); 他们有各自不同的作用，其中的变量也不尽相同。其中date函数中()主要是用来返回其中*DATE函数中的(主要是用来返回具体的日期数据的。 5.RandomVariableFunctions 随机变量函数随机变量函数的一般形式为：RV.分布名参数,...)。其中圆点前是函数类名，圆点后是分布名称，圆点是半角的圆点，括号内是自变量。自变量是分布参数。如果在数据文件中建立新变量时使用这些函数，变量值的个数等于数据文件中有效观测量数。函数值为产生服从指定统计分布的随机序列。下面列出常用的分布函数的随机数。 l NORMAL(stddev)数值型函数，产生一个来自均值为0标准差为stddev的分布总体的随机数。 l RV.BERNOULLI(p数值型函数，产生一个来自伯努利分布具有指定概率参数P的随机数。 l RV.BINOM(n，p)数值型函数，产生一个来自二项式分布具有指定试验次数n和概率参数p的随机数。 l RV.CHISQ(d蹑值型函数，产生一个来自卡方分布具有指定自由度df的随机数。 l RV.E*P(shap数值型函数，产生一个来自指数分布具有指定形状参数的随机数。 l RV.F(df1df2)数值型函数，产生一个来自F分布具有指定自由度的随机数。 l RV.GEOM(p)数值型函数，产生一个来自几何分布具有指定概率参数P的随机数。 l RV.HYPER(totd sample，hits)数值型函数，产生一个来自超几何分布具有指定参数的随机数。 l RV.LOGISTIC(mean scale数值型函数，产生一个来自逻辑斯蒂分布具有指定的均数mean和标度scale参数的随机数。 l RV.LNORMAL(a，b)数值型函数，产生一个来自对数正态分布具有指定参数的随机数。 l RV.NORMAL(mean，stddev嗷值型函数，产生一个来自正态分布具有指定均值mean和标准差stddev的随机数。 l RV.PARETO(threshol，d shape)数值型函数，产生一个来自帕雷托分布具有指定临界值threshold和形状shape参数的随机数。 l RV.POISSON(mean)数值型函数，产生一个来自泊松分布具有指定均值或比率参数的随机数。 l RV.T(d数值型函数，产生一个来自学生T分布具有指定自由度的随机数。 l RV.UNIFORM(min，ma*)数值型函数，产生一个来自具有指定最大值ma*和最小值mill的均匀一致分布的随机数. l RV.WEIBULL(a,1数值型函数，产生一个来自威布尔分布具有指定参数的随机数。 l UNIFORM(ma*)数值型函数，产生一个来自一致分布的值在0和自变量给定的Ma*之间的伪随机数。自变量Ma*必须是一个数值，但可以是负数。 6.InverseDistributionFunctionS 分布函数反分布函数的一般形式为：IDF分布名(p,参数,...)。其中圆点前是函数类名，圆点后是分布名称，括号内是自变量。第一个自变量p是这个分布的累积概率，其后的自变量是指定分布的参数。函数值是相应分布的累计概率值为P的临界值。 lIDF.CHISQ( (pdf)数值型函数，产生来自卡方分布的临界值，第一个自变量为概率值P，第二个自变量为自由度df。例如：累积概率为0.95，自由度为5的卡方分布的临界值记作 IDF.CHISQ(0.95, 5)其函数值 IDF.CHISQ(0.95,5)=1.145 l IDF.E*P,(pscale数值型函数。产生一个来自指数分布的临界值，该分布具有给定行状参数shape，概率值p。 l IDF.F,(pdfl df2)数值型函数，产生一个来自F分布的值，该分布自由度为df、df2,累计概率p的临界值。例如显著性概率在0.05水平上，自由度分别为6、5的F值为IDF.F (0.95,6,5)=4.9503 l DF.LOGISTIC(probmean，scale数值型函数，产生一个均值为mean和标度参数为scale累计概率为p的逻辑斯蒂分布的临界值。 l IDF.LNORMAL(p，a，b)数值型函数，产生具有指定参数和累计概率p的对数正态分布的临界值。 l IDF.NORMAL(p，mean，stddev)数值型函数，产生来自正态分布具有指定均值和标准差的累计概率。例如，显著性水平为0.05均值为0，标准差为1的标准正态分布的临界值IDF.NORMAL(0.95，0，1)=1.645。 l IDF.PARETO(prob threshold shape)数值型函数，产生一个来自帕累托分布，累计概率为p的值，该分布的临界值为threshold尺度参数为scale l IDF.T(pr，bdf)数值型函数，产生一个自由度df，累计概率为p的来自学生T分布的临界值。 l IDF.UNIFORM(p, min，ma*)数值型函数，产生一个累计概率p的来自均匀分布的临界值，均匀分布的最大值ma*、最小值min。 l PROBIT(p数值型函数，产生累计概率为p的标准正态分布的临界值。 7.CumulativeDistributionFunction_S« 计分布函数累计分布函数的一般形式为：CDF.分布名^参数，…)，其中圆点前是函数类名，圆点后是分布名称，括号内是自变量。第一个自变量q是符合分布的数值，后面的自变量是相应分布的参数。函数值是相应分布的随机变量取值小于等于q的概率值。 l CDF.BERNOULLI(q, p)数值型函数，产生来自具有给定概率参数p的伯努利分布，变量值小于q的累计概率值。 l CDF.BETA(q shapel，shape2)数值型函数，产生来自Bate分布的变量取值小于q累计概率值，该分布具有给定的形状参数shapel、shape2。 l CDF.BINOM(q，n，p)数值型函数，产生来自二项分布的变量取值小于q的累计概率值，该分布具有给定每次实验成功的概率P，成功的实验次数是n，。当n=1时，该函数与CDF.BERNOULLI相同。 l CDF.CAUCHY(q，loc scale数值型函数，产生来自柯西分布的变量取值小于q的累计概率值，该分布具有给定的位置参数loc和标度参数scale l CDF.CHISQ(q df)数值型函数，返回来自卡方分布的变量取值小于 q的累计概率值，该分布具有给定的自由度df。 l CDF.E*P(q shape)数值型函数，产生来自指数分布的变量取值小于q的累计概率，该分布具有给定的形状参数shape。 l CDF.F(q,df1df2)数值型函数，产生来自F分布的变量取值小于q的累计概率值，该分布具有给定的自由度df、df2，累计概率值小于quanto l CDF.GAMMA(q , shape, scale数值型函数，产生来自伽玛分布的变量取值小于q的累计概率，该分布具有给定的形状参数shape和标度参数scale l CDF.GEOM(q, p)数值型函数，产生一个几何分布的变量取值小于q的累积概率，即获得一次成功的试验次数，当成功概率由p确定。 l CDF.HYPER(q total sample, hits^值型函数，产生小于 q 的累积概率，即具有指定特性的事件数q,当样品sample事件是从尺寸为total的总体中随机选择出来的情况下，其命中数hits具有指定的特性。 l CDF.LAPLACE(q mean , scale数值型函数，产生来自拉普拉斯分布的变量取值小于q的累计概率，该分布具有给定的均值mean和标度参数scale l CDF.LOGISTIC(q mean , scale数值型函数，产生来自逻辑斯蒂分布的变量取值小于q的累计概率，该分布具有给定的均值mean和标度参数scale l CDF.LNORMAL(q，a，b)数值型函数，产生具有指定参数的对数正态分布变量取值小于q的累计概率值。 l CDF.NEGBIN(q thresh p)数值型函数。产生变量取值小于q的累计概率值，即当临界参数为thresh p给出成功的概率。 l CDFNORM(zvalue)数值型函数，产生一个具有均值为0，标准差为1的随机变量的取值小于zvalue的概率。 l CDF.NORMAL(q,mean,stddev)数值型函数，产生一个正态分布的变量取值小于q的累计概率，该分布均值为mean，标准差为stddev。 l CDF.PARETO(q,threshol,d shape)数值型函数，产生一个变量取值小于q的帕雷托分布的累计概率，该分布具有指定的限值threshold和形状参数 shape。 l CDF.POISSON(q,mean)数值型函数，产生一个来自POISSON 分布的小于q的累计概率值，它具有指定的均值或率参数。 l CDF.T(q,擞值型函数，产生一个变量取值小于q的学生T分布的累计概率，该分布具有指定的自由度参数df。 l CDF.UNIFORM(q,min, ma*)数值型函数，产生一个变量取值小于q的均匀一致分布的累计概率，该分布具有指定的最小值rain和最大值ma*参数。 l CDF.WEIBULL(q,a,»值型函数，产生一个变量取值小于q的威布尔分布的累计概率，该分布具有指定的参数。 8.MissingValueFunctions 缺失值函数 l NMISS(variabl.e,数值型函数，自变量是当前工作数据文件中的变量名。计算自变量中缺失值的数目。例如：Missing数学)：分别对数学这个变量逐个判断是否为系统缺失值或用户缺失值。l表示是，0为不是。 l MISSING(variabl逻辑型函数，自变量应该是工作数据文件中的变量名。如果变量具有缺失值，返回1或者true l SYSMIS(numvar)逻辑型函数，自变量numva是工作数据文件中的一个数值型变量的变量名。如果numvar的值为系统缺失值，返回1或者true l VALUE(variabl数)值型或字符型函数，忽略用户定缺失值，即将用户缺失值看成是普通的数据，返回变量值。自变量必需是工作数据文件中的变量名。 9.StringFunction字符串函数 l CONCAT(stre*pr, stre*p字符型函数，函数中每个自变量都是一个字符串表达式。该函数值是一个字符串，是各自变量代表的字符串按括号中的顺序串接起来的。此函数要求两个或两个以上的自变量。eg:concat(woder,ful)=wonderful; l INDE*(haystack, nee(数值型函数，产生一个整数，它表明字符串needle在字符串haystack中第一次出现的起始位置。如果返回值为0,表明字符串needle不在字符串haystack中存在。例如：INDE*(ABCDEFG ”，DE”)：找到字符串 DE 在字符串 ABCDEFG中第一次出现的位置，INDE*( ABCDEFG ”，DE ”)=4 l INDE*(haystack, needle, di数|0 型函数，见前一个函数。其第三个自变量diviso是可选择的，它必须是一个整数，表明将字符串needle均匀地分为要被查询的独立字符串的字符数。 l LENGTH(stre*p＜值型函数，自变量是字符串，函数值是字符串表达式值的长度。这里获得的长度包括尾部空格。 l LPAD(stre*pr, len字符型函数，第一个自变量stre*p是字符串，第二个自变量length是正整数，其*围从1到255。函数值是字符串表达式的左侧增加空格扩展到length所规定的长度。 l LTRIM(stre*字)符型函数，返回的字符串是自变量表达式的值去除打头的空格后的字符串。 l LOWER(stre*p字符型函数，返回字符串，将字符串中的大写字母改变为小写字母。 l RINDE*(haystack,needl数l值型函数，产生一个整数，它表明字符串needle在字符串haystack中最后出现的开始位置。返回0表示字符串needle不在haystack中。 l RPAD(stre*pr,leng字h符型函数，返回字符串，其长度由length决定：在字符串表达式的右侧加空格，以达到length的长度，length的值在1到255之间。 l RPAD(stre*pr,length,char)型函数，返回字符串，见前一个函数。第三个变量char是可以选择使用的，它表示在字符串的右侧增加一个字符char。char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。 l RTRIM(stre*血符型函数，返回截取了尾部空格后的字符串。该函数通常用于大字符串表达式中，要把压缩了尾部空格的字符串赋予一个变量。 l RTRIM(stre*pr,ch字符型函数，返回截取了尾部字符char后的字符串°char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。 l STRING(nume*pr,format字符型函数，根据format所设定的格式将数值表达式转换为字符串。例如string(-1.5,F5返®字符串-1.50。第二个自变量format必需是写一个数值的格式。 l SUBSTR(stre*pr,p(字符型函数，返回字符串表达式中从pos开始到其结尾处的子字符串。 lSUBSTR(stre*pr,pos,leng字符型函数，返回字符串表达式中从pos开始长度为length的子字符串。 l UPCAS(stre*p字符型函数，返回将字符串表达式中小写字符变为大写字符串。注意：数值与数字有区别，以上所讲的数值是数，数字指的是表现为数字的字符。

展开阅读全文