SPSS Modeler 数据整理之记录处理
前面介绍了数据行处理中的记录筛选,下面介绍关于行处理(记录处理)的其他一些功能。
1. 数据排序
排序节点
案例:Demos文件下"catalog_seasfac.sav"的数据文件。实现数据流:
1.1 设置排序字段
1.2 结果
2. 数据区分
"区分"就是去重的意思,是去除数据中重复记录,modeler中通过"区分"节点实现。
案例:
2.1 记录完全相同情况
2.11 区分节点设置
2.12 结果
2.2 记录不完全相同情况
如上图,同一客户ID、姓名,在不同时间注册的时候填写的年龄不同、学历等级也不同,因此进行筛选前要定义筛选条件:
- 1)年龄:选取最大值;
- 2)银行:合并多个值;
- 3)债务:总和;
- 4)学历等级:取最高值。
2.21 区分节点设置设置选项卡:
组合选项卡:
2.22 结果
3. 数据汇总
在modeler中,数据汇总不仅仅包含SUM,还包括一些常用的统计值:合计、均值、最大、最小值、中位数、标准差、方差、四分位数等。通过"汇总"节点实现此功能。
案例:Demos文件下"telco.sav"的数据文件。
3.1 汇总节点设置
基本汇总:
结果:
汇总表达式:
对两个或更多个字段做组合汇总,使用–汇总表达式实现。
结果:
请先 后发表评论~