计算和转化变量是数据处理分析过程中一个非常重要的过程,针对一些分析方法,原变量可能并不适合分析,此时就需要对原变量进行转化,以利于后续分析。
针对这一需求,SPSSAU提供多种计算变量的方法,三步即可生成变量,不需要再单独输入函数。
操作步骤
Step1:点击 [数据处理] 下的 [生成变量]。
Step2:点击选择具体分析题项,下拉复选框选择计算功能(如平均值、乘积等)。
Step3:填写新变量名(部分功能不需要填写),点击确认处理。
生成变量的一系列功能包括:常用函数、量纲处理、科学计算、汇总处理、其它。下面具体说明。
常用功能
常用功能
l 平均值
平均值是最常使用的,作用是将多个变量值的取平均,生成新的变量。适用场景:量表题中,将多个题目合并为一个维度进行分析等。
例如,计算每个学生各科成绩的平均值或将“我愿意向朋友推荐SPSSAU”,“我有需要会再来使用SPSSAU”,合并为“忠诚度”一个整体维度。
l 求和
求和多用于计算多个题项的总体得分,如量表总分等。
适用场景:计算每个学生各科成绩的总和(总成绩)。
l 乘积(交互项)
用于计算两个变量或多个变量的乘积值。
适用场景:计算权重与指标的乘积,或计算调节作用交互项等。
l 虚拟(哑)变量
用于将分类变量纳入模型。具体理论说明可查看spssau文章:《哑变量是什么?怎么设置?》
适用场景:研究回归分析,逐步回归,分层回归,Logistic回归,PLS回归、调节作用等这类影响关系研究的方法时,需要将分类变量作为研究变量加入模型中,需要做哑变量处理。
l 标准化(S)
标准化用于数据无量纲化处理。在多数模型研究中,都需要先对数据进行标准化处理,以消除量纲影响。
l 中心化(C)
中心化也是无量纲化处理方法之一。与标准化的区别是,标准化需要除以标准差,而中心化则没有要求。
适用场景:数据无量纲化处理,即如果原始数据不是统一量纲的,需要先进行数据标准化处理,以消除量纲(单位)不同对结果造成的影响。
l 自然对数(Ln)
l 10为底对数(Log10)
取对数是常见的数据变换处理。取对数可以缩小数据的绝对数值,方便计算。在计量研究中,经常先取对数再做回归。
适用场景:数据的数值过大不方便计算;数据呈偏态时可以通过取对数调整数据分布。(数值必须大于0)
其他常用的数据变换方式:
(1)对数变换(2)平方根变换(3)倒数变换(4)幂变换
量纲处理
量纲处理
除了上面介绍的标准化、中心化。spssau还提供了其他多种量纲处理方法,大致可分为三种类型:
极值化方法
归一化――每个变量值与变量最小值之差除以该变量取值的全距(最大值减最小值)。标准化后使各变量的取值范围限于0~1。
区间化――标准化后使各变量取值范围限于固定的区间范围内。
最大值化――每个变量值除以该变量取值的最大值。标准化后使各变量的最大取值为1。
最小值化――标准化后使各变量的最小取值为1。
极值化方法在无量纲化过程中仅与变量的最大值和最小值有关,使得该方法过分依赖极端这两个极端值。因而,最大值和最小值这两个值会对结果产生很大影响。
标准化方法
标准化――无量纲化后个变量的平均值为0,标准差为1。标准化的不足之处在于转换后消除了各变量在变异程度上的差异,如果后续分析中需要比较变量变异程度上的差异,则不适合使用标准化方法。
均值化方法
均值化――每一变量除以该变量的平均值。均值化后各变量的平均值都为1,标准差为原始变量的变异系数。均值化保留了各变量取值差异程度上的信息。
对于一般用户而言,不需要掌握这么多量纲处理方法,大多数情况下选择标准化或归一化即可。
l 正向化(MMS)
l 逆向化(NMMS)
在综合评价中,可能同时存在正向指标(数值越大评价越好)和逆向指标(数值越小评价越好)。两种指标数据方向不一致,分析时必须先将所有指标统一成一个方向。此时,可以对数据进行正向化或逆向化处理。
正向指标:(X-Min)/(Max-Min) (生成变量-正向化MMS)
逆向指标:(Max-X)/(Max-Min) (生成变量-逆向化NMMS)
除此之外,还可以通过取倒数、取负数等方式使指标一致化。
除了以上常用的计算变量方法,还有一些其它的变量处理功能。具体整理在下面表格里。
如果以上生成变量功能无法满足计算需求,可使用自主性更强的[高级公式]进行操作。
当前公式支持sin、cos、tan、exp、ln、log、sqrt、abs等函数。
其他说明
生成变量功能,标题都是直接选中即可,不需要拖拽操作。配合ctrl或者shift键同时选择多项,批量一次性操作处理。
本文来源于互联网:spss计算变量:不用记公式,一键轻松得到新变量!