资源描述
SPSS常用函数
SPSS函数是一个常用程序,并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称,且绝不能写错。通常,函数的格式为:函数名称(自变量,自变量,……),*些函数可能只含有一个自变量,而有些函数则可能含有多个自变量,当一个函数含有多个自变量时,各自变量间用逗号(,)隔开,而函数的自变量通常又可分为以下三种:
(1)常数,如 SQRT(1);
(2)变量名称,如 MEAN(VAR1,VAR2,VAR3);
(3)表达式,如 MIN(30,SQRT(1))。
总之,SPSS函数和我们平时E*CEL里面函数格式规则并无差别。
SPSS提供了 180多种函数,共可分为十多类(SPSS 17.0中大大小小分了 18类)。和E*CEL —样,我们也不可能记住所有函数,只要知道一些常用函数,至于其他函数要用的时候再去查找也不迟,下面将列举一些常用函数:
1.ArithmeticFunction算术函数
算术函数是最常用的函数,可以满足对变量进行的一般运算,算术函数主要有:
函数名
自变量涵义
函数
类型
函数功能及说明
ABS(nume*pr)
(算术表达式)
数值
型函
数
求绝对值,例如:
ABS(Y-850):将分别计算变量Y的每个数据与20的差的绝对值
ARSIN(nume*pr)
角度;弧度单位)
数值
型函
数
求反正弦值。
ARTAN(nume*pr)
角度;弧度单位)
数值
型函
数,
求反正切值。
COS(radians)
角度;弧度单位)
数值
型函
数
求余弦值。
E*P(nume*Pr)
(算术表达式)
数值
型函
数
求e的指数幕值。例如:E*p(4)=et=54.60。注意:若函数值太大,其结果会超出SPSS的计算*围。
LGl0(nume*p)
(算术表达式)
数值
型函
数
求以10为底的对数值。例如:Ln(Y)分别计算变量Y中每个数据的以10为底的对数值。
LN(nume*pr)
(算术表达式)
数值
型函
数
求以e为底的对数。例如:Ln(Y)分别计算变量Y中每个数据的自然对数值。
MOD(nume*pr,modulus)
算术表达式;摸数(常数))
数值
型函
数
求算术表达式除以模数
的余数。例如:
Mod(10. 3):函数值=1
SIN(radians)
角度;弧度单位)
数值
型函
数
求正弦值。
SQRT(nume*pr)
正数)
数值
型函
数
求平方根。例如:
Sqrt(9)=3
RND(nume*pr)
算术表达式)
数值
型函
数
求算术表达式的值四舍五入后的整数。例如:
RND(2.72) = 3
TRUNC(nume*pr)
算术表达式)
数值
型函
数
求算术表达式的值被截去小数部分的整数。例如:Trunc(2.72) 2
算术表达式也包括单值与变量名的情况。
2.StatisticalFunctic统计函数
统计函数也是统计分析中常用的函数之一,主要反映变量的数据特
征,时间序列的滞后期变量等,具体函数有:
函数名
自变量涵义
函数
类型
函数功能与说明
CFVAR(nume*pr,nume*pr,...)
(变量名,变量名,..)
数值
型函数
求出多个变量值的变异系数标准差/均值)。例如Cfvar (数学,物理,化学):分别计算每个学生三门成绩的变异系数。
LAG(variable)
(变量名)
数值型函数或字符型函数
返回滞后一期的变量数据。对第一个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格。
LAG(variable,ncases)
(变量名,自然数
n)
数值
型函数
返回滞后n期的变量数据。对第前n个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格。
求多个变量值中的最大值;例如
MA*(ivalue,value[,...])
(变量
名,变量名,…)
数值
型函数
MA*(数学,物理,化学):分别计算每个学生三门成绩中的最高分。
变量
名,变量
名,…)
数值
型函
数
求多个变量值的
平均值;例如
MEAN(nume*pr,nume*pr,...)
MEAN(数学,物理,化学):分别计算每个学生三门成绩的平均
值。
(变量
名,变量
名,…)
数值
型函
数
求多个变量值中的最小值;例如
MIN(value,value[,...])
Min (数学,物理,化学):分别计算每个个案三门成绩中的最低分。
NVALID(variable, variable,..
变量
名,变量
名,…)
数值
型函
数
求出变量的不
包括缺失值)的数量。
变量
名,变量
名,…)
数值
型函
数
求多个变量值的
标准差;例如
SD(nume*pr,nume*pr,...)
SD(数学,物理,化学):分别计算每个学生三门成绩的标准差。
SUM(nume*pr,nume*pr,...)
变量
名,变量
名,…)
数值
型函
数
求多个变量值的和;例如Sum(数学,物理,化学):分别计算每个个案三门成绩的总
和。
(变量
数值
求多个变量值的
方差;例如
Variance 数学,
VARIANCE((nume*pr,nume*pr,...)
名,变量
名,…)
型函
数,
物理,化学):分别计算每个学生三门成绩的方差。
3.LogicalFunction 逻辑函数
lANY(test,valuvalue,..])逻辑型函数,自变量为(变量名,*1,*2,…),函数功能是判断变量值是否是*1、*2…中的一个,例如:Any(数学,80,90,70):分别对每条个案判断其数学成绩是否为80或90或70分。
lRANGE(test,lo, hi[0,hi...逻辑型函数变量必须都为数值型或都为字符型,自变量为变量名,*1,*2),其中:*1^2,函数功能是判断*变量值是否在*1至*2之间,例如:RANGE (数学,80,90):分别对每条个案判断其数学成绩是否在80至90分之间
4.DateandTimeFunctions 日期和时间函数
lDATE.DMY (day,month,year)SPSS日期型格式的数值函数,返回与指定的日、月、年相应的日期值。要正确显示这个值,必须将变量赋予DATE格式。自变量必须为整数。day的*围在1 ~31,.
month的*围在1〜12, year的*围在4位数时要大于1582, 2位数时应是该世纪的后两位年代数值。
lDATE.YRDAY(year,daynum)SPSS格式日期型数值函数,返回与指定的天数、年相应的日期值。要正确显示这个值,必须赋予其DATE格式。Daynum取值*围在1〜366。
l*DATE.DATE(datevalue)SPSS0期格式的数值型函数,从具有SPSS的日期格式的自变量数值返回一个日期,自变量数值由DATE.***函数产生或按DATEs输入格式读取。该函数用于将日期的数值格式转换为日期格式,因此要想按日期格式显示必须再在Variable Vie中定义一种日期格式,否则会按SPSS日期的数值格式显示。此函数无20年问题21世纪的日期也能正确显示。
l*DATE.HOUR(datevalue)数值型函数,从DATE.***函数产生或按一种DATE格式读入的SPSS日期格式的数值,返回一个小时数(0〜23)。
l*DATE.JDAY(datevalu数 值型函数,通过 DATE.***产生或由 DATE输入格式读入SPSS日期格式的数值,返回一年的天数(1〜366)。
l*DATE.MDAY(datevalue)数值型函数,从一个SPSS日期格式的数值通过DATE.***函数产生或由DATE输入格式读入,返回一个月的天数(1〜31)。
l*DATE.MINUTE(datevalue数 值型函数,通过 DATE.***产生或由DATE输入格式读入SPSS日期格式的数值,返回分钟数(0-59)。
l*DATE.MONTH(datevalue)数值型函数,通过DATE.***产生或由DATE输入格式读入SPSS日期格式的数值,返回一年中的月数(1〜12)。
l*DATE.TDAY(timevalue数值型函数,自变量是由TIME.**函数产生或由TIME输入格式读取的SPSS时间间隔格式的数值,返回整天数正整数)。
l*DATE.TIME(datevalue)SPS时间间隔格式的数值型函数,把自变量的值看作从午夜开始的秒数,返回一天中的时间小时、分、秒)。自变量是SPSS日期格式的数值,可以是由DATE.***函数产生的或由DATE输入格式读入的。由该函数建立的变量应该给定一个合适的显示格式。在VariableView中,赋予它一个时间显示格式,将变量值显示成小时和分。
l*DATE.WEEK(datevalue数值型函数。由一个SPSS日期格式数值(由DATE.***函数产生或由一种DATE输入格式读入),返回周数(1〜53整数)。
l*DATE.WKDAY(datevalue)数值型函数,由一种通过。入丁£.***函数产生或用DATE格式读入的SPSS日期格式数值,返回的数值表示一周的星期几星期1〜星期日用1〜7之间的整数表示)。
l*DATE.YEAR(datevalu数值型函数,由 DATE.***函 数产生或用 DATE格式读入的SPSS日期格式的数值,返回年数。
lYRMODA(year,month,day)数值型函数,返回一个由1582年10月
15日到自变量给定的年月曰(year month,day)之间的天数。
总结:以上的日期函数分为三大类:
date.SSS();*DATE.SSS(dateval;ue)YRMODA(year,month,day);
他们有各自不同的作用,其中的变量也不尽相同。其中date函数中()主要是用来返回其中*DATE函数中的(主要是用来返回具体的日期数据的。
5.RandomVariableFunctions 随机变量函数
随机变量函数的一般形式为:RV.分布名参数,...)。其中圆点前是函数类名,圆点后是分布名称,圆点是半角的圆点,括号内是自变量。自变量是分布参数。如果在数据文件中建立新变量时使用这些函数,变量值的个数等于数据文件中有效观测量数。函数值为产生服从指定统计分布的随机序列。下面列出常用的分布函数的随机数。
l NORMAL(stddev)数值型函数,产生一个来自均值为0标准差为stddev的分布总体的随机数。
l RV.BERNOULLI(p数值型函数,产生一个来自伯努利分布具有指定概率参数P的随机数。
l RV.BINOM(n,p)数值型函数,产生一个来自二项式分布具有指定试验次数n和概率参数p的随机数。
l RV.CHISQ(d蹑值型函数,产生一个来自卡方分布具有指定自由度df的随机数。
l RV.E*P(shap数值型函数,产生一个来自指数分布具有指定形状参数的随机数。
l RV.F(df1df2)数值型函数,产生一个来自F分布具有指定自由度的随机数。
l RV.GEOM(p)数值型函数,产生一个来自几何分布具有指定概率参数P的随机数。
l RV.HYPER(totd sample,hits)数值型函数,产生一个来自超几何分布具有指定参数的随机数。
l RV.LOGISTIC(mean scale数值型函数,产生一个来自逻辑斯蒂分布具有指定的均数mean和标度scale参数的随机数。
l RV.LNORMAL(a,b)数值型函数,产生一个来自对数正态分布具有指定参数的随机数。
l RV.NORMAL(mean,stddev嗷值型函数,产生一个来自正态分布具有指定均值mean和标准差stddev的随机数。
l RV.PARETO(threshol,d shape)数值型函数,产生一个来自帕雷托分布具有指定临界值threshold和形状shape参数的随机数。
l RV.POISSON(mean)数值型函数,产生一个来自泊松分布具有指定均值或比率参数的随机数。
l RV.T(d数值型函数,产生一个来自学生T分布具有指定自由度的随机数。
l RV.UNIFORM(min,ma*)数值型函数,产生一个来自具有指定最大值ma*和最小值mill的均匀一致分布的随机数.
l RV.WEIBULL(a,1数值型函数,产生一个来自威布尔分布具有指定参数的随机数。
l UNIFORM(ma*)数值型函数,产生一个来自一致分布的值在0和自变量给定的Ma*之间的伪随机数。自变量Ma*必须是一个数值,但可以是负数。
6.InverseDistributionFunctionS 分布函数
反分布函数的一般形式为:IDF分布名(p,参数,...)。其中圆点前是函数类名,圆点后是分布名称,括号内是自变量。第一个自变量p是这个分布的累积概率,其后的自变量是指定分布的参数。函数值是相应分布的累计概率值为P的临界值。
lIDF.CHISQ( (pdf)数值型函数,产生来自卡方分布的临界值,第一个自变量为概率值P,第二个自变量为自由度df。例如:累积概率为0.95,自由度为5的卡方分布的临界值记作
IDF.CHISQ(0.95, 5)其函数值 IDF.CHISQ(0.95,5)=1.145
l IDF.E*P,(pscale数值型函数。产生一个来自指数分布的临界值,该分布具有给定行状参数shape,概率值p。
l IDF.F,(pdfl df2)数值型函数,产生一个来自F分布的值,该分布自由度为df、df2,累计概率p的临界值。例如显著性概率在0.05水平上,自由度分别为6、5的F值为IDF.F (0.95,6,5)=4.9503
l DF.LOGISTIC(probmean,scale数值型函数,产生一个均值为mean和标度参数为scale累计概率为p的逻辑斯蒂分布的临界值。
l IDF.LNORMAL(p,a,b)数值型函数,产生具有指定参数和累计概率p的对数正态分布的临界值。
l IDF.NORMAL(p,mean,stddev)数值型函数,产生来自正态分布具有指定均值和标准差的累计概率。例如,显著性水平为0.05均值为0,标准差为1的标准正态分布的临界值IDF.NORMAL(0.95,0,1)=1.645。
l IDF.PARETO(prob threshold shape)数值型函数,产生一个来自帕累托分布,累计概率为p的值,该分布的临界值为threshold尺度参数为scale
l IDF.T(pr,bdf)数值型函数,产生一个自由度df,累计概率为p的来自学生T分布的临界值。
l IDF.UNIFORM(p, min,ma*)数值型函数,产生一个累计概率p的来自均匀分布的临界值,均匀分布的最大值ma*、最小值min。
l PROBIT(p数值型函数,产生累计概率为p的标准正态分布的临界
值。
7.CumulativeDistributionFunction_S« 计分布函数
累计分布函数的一般形式为:CDF.分布名^参数,…),其中圆点前是函数类名,圆点后是分布名称,括号内是自变量。第一个自变量q是符合分布的数值,后面的自变量是相应分布的参数。函数值是相应分布的随机变量取值小于等于q的概率值。
l CDF.BERNOULLI(q, p)数值型函数,产生来自具有给定概率参数p的伯努利分布,变量值小于q的累计概率值。
l CDF.BETA(q shapel,shape2)数值型函数,产生来自Bate分布的变量取值小于q累计概率值,该分布具有给定的形状参数shapel、shape2。
l CDF.BINOM(q,n,p)数值型函数,产生来自二项分布的变量取值小于q的累计概率值,该分布具有给定每次实验成功的概率P,成功的实验次数是n,。当n=1时,该函数与CDF.BERNOULLI相同。
l CDF.CAUCHY(q,loc scale数值型函数,产生来自柯西分布的变量取值小于q的累计概率值,该分布具有给定的位置参数loc和标度参数scale
l CDF.CHISQ(q df)数值型函数,返回来自卡方分布的变量取值小于
q的累计概率值,该分布具有给定的自由度df。
l CDF.E*P(q shape)数值型函数,产生来自指数分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape。
l CDF.F(q,df1df2)数值型函数,产生来自F分布的变量取值小于q的累计概率值,该分布具有给定的自由度df、df2,累计概率值小于quanto
l CDF.GAMMA(q , shape, scale数值型函数,产生来自伽玛分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape和标度参数scale
l CDF.GEOM(q, p)数值型函数,产生一个几何分布的变量取值小于q的累积概率,即获得一次成功的试验次数,当成功概率由p确定。
l CDF.HYPER(q total sample, hits^值型函数,产生小于 q 的累积概率,即具有指定特性的事件数q,当样品sample事件是从尺寸为total的总体中随机选择出来的情况下,其命中数hits具有指定的特性。
l CDF.LAPLACE(q mean , scale数值型函数,产生来自拉普拉斯分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale
l CDF.LOGISTIC(q mean , scale数值型函数,产生来自逻辑斯蒂分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale
l CDF.LNORMAL(q,a,b)数值型函数,产生具有指定参数的对数正态分布变量取值小于q的累计概率值。
l CDF.NEGBIN(q thresh p)数值型函数。产生变量取值小于q的累计概率值,即当临界参数为thresh p给出成功的概率。
l CDFNORM(zvalue)数值型函数,产生一个具有均值为0,标准差为1的随机变量的取值小于zvalue的概率。
l CDF.NORMAL(q,mean,stddev)数值型函数,产生一个正态分布的变量取值小于q的累计概率,该分布均值为mean,标准差为stddev。
l CDF.PARETO(q,threshol,d shape)数值型函数,产生一个变量取值小于q的帕雷托分布的累计概率,该分布具有指定的限值threshold和形状参数 shape。
l CDF.POISSON(q,mean)数值型函数,产生一个来自POISSON 分布的小于q的累计概率值,它具有指定的均值或率参数。
l CDF.T(q,擞值型函数,产生一个变量取值小于q的学生T分布的累计概率,该分布具有指定的自由度参数df。
l CDF.UNIFORM(q,min, ma*)数值型函数,产生一个变量取值小于q的均匀一致分布的累计概率,该分布具有指定的最小值rain和最大值ma*参数。
l CDF.WEIBULL(q,a,»值型函数,产生一个变量取值小于q的威布尔分布的累计概率,该分布具有指定的参数。
8.MissingValueFunctions 缺失值函数
l NMISS(variabl.e,数值型函数,自变量是当前工作数据文件中的变量名。计算自变量中缺失值的数目。例如:Missing数学):分别对数学这个变量逐个判断是否为系统缺失值或用户缺失值。l表示是,0为不是。
l MISSING(variabl逻辑型函数,自变量应该是工作数据文件中的变量名。如果变量具有缺失值,返回1或者true
l SYSMIS(numvar)逻辑型函数,自变量numva是工作数据文件中的一个数值型变量的变量名。如果numvar的值为系统缺失值,返回1或者true
l VALUE(variabl数)值型或字符型函数,忽略用户定缺失值,即将用户缺失值看成是普通的数据,返回变量值。自变量必需是工作数据文件中的变量名。
9.StringFunction字符串函数
l CONCAT(stre*pr, stre*p字符型函数,函数中每个自变量都是一个字符串表达式。该函数值是一个字符串,是各自变量代表的字符串按括号中的顺序串接起来的。此函数要求两个或两个以上的自变量。eg:concat(woder,ful)=wonderful;
l INDE*(haystack, nee(数值型函数,产生一个整数,它表明字符串needle在字符串haystack中第一次出现的起始位置。如果返回值为0,表明字符串needle不在字符串haystack中存在。例如:INDE*(ABCDEFG ”,DE”):找到字符串 DE 在字符串 ABCDEFG中第一次出现的位置,INDE*( ABCDEFG ”,DE ”)=4
l INDE*(haystack, needle, di数|0 型函数,见前一个函数。其第三个自变量diviso是可选择的,它必须是一个整数,表明将字符串needle均匀地分为要被查询的独立字符串的字符数。
l LENGTH(stre*p<值型函数,自变量是字符串,函数值是字符串表达式值的长度。这里获得的长度包括尾部空格。
l LPAD(stre*pr, len字符型函数,第一个自变量stre*p是字符串,第二个自变量length是正整数,其*围从1到255。函数值是字符串表达式的左侧增加空格扩展到length所规定的长度。
l LTRIM(stre*字)符型函数,返回的字符串是自变量表达式的值去除打头的空格后的字符串。
l LOWER(stre*p字符型函数,返回字符串,将字符串中的大写字母改变为小写字母。
l RINDE*(haystack,needl数l值型函数,产生一个整数,它表明字符串needle在字符串haystack中最后出现的开始位置。返回0表示字符串needle不在haystack中。
l RPAD(stre*pr,leng字h符型函数,返回字符串,其长度由length决定:在字符串表达式的右侧加空格,以达到length的长度,length的值在1到255之间。
l RPAD(stre*pr,length,char)型函数,返回字符串,见前一个函数。第三个变量char是可以选择使用的,它表示在字符串的右侧增加一个字符char。char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。
l RTRIM(stre*血符型函数,返回截取了尾部空格后的字符串。该函数通常用于大字符串表达式中,要把压缩了尾部空格的字符串赋予一个变量。
l RTRIM(stre*pr,ch字符型函数,返回截取了尾部字符char后的字符串°char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。
l STRING(nume*pr,format字符型函数,根据format所设定的格式将数值表达式转换为字符串。例如string(-1.5,F5返®字符串-1.50。第二个自变量format必需是写一个数值的格式。
l SUBSTR(stre*pr,p(字符型函数,返回字符串表达式中从pos开始到其结尾处的子字符串。
lSUBSTR(stre*pr,pos,leng字符型函数,返回字符串表达式中从pos开始长度为length的子字符串。
l UPCAS(stre*p字符型函数,返回将字符串表达式中小写字符变为大写字符串。
注意:数值与数字有区别,以上所讲的数值是数,数字指的是表现为数字的字符。
展开阅读全文