SPSS Modeler 数据整理之记录处理

前面介绍了数据行处理中的记录筛选,下面介绍关于行处理(记录处理)的其他一些功能。

1. 数据排序

排序节点

案例:Demos文件下"catalog_seasfac.sav"的数据文件。实现数据流:

1.1 设置排序字段

1.2 结果

2. 数据区分

"区分"就是去重的意思,是去除数据中重复记录,modeler中通过"区分"节点实现。

案例:

2.1 记录完全相同情况

2.11 区分节点设置

2.12 结果

2.2 记录不完全相同情况

如上图,同一客户ID、姓名,在不同时间注册的时候填写的年龄不同、学历等级也不同,因此进行筛选前要定义筛选条件:

  • 1)年龄:选取最大值;
  • 2)银行:合并多个值;
  • 3)债务:总和;
  • 4)学历等级:取最高值。

2.21 区分节点设置设置选项卡:

组合选项卡:

2.22 结果

3. 数据汇总

在modeler中,数据汇总不仅仅包含SUM,还包括一些常用的统计值:合计、均值、最大、最小值、中位数、标准差、方差、四分位数等。通过"汇总"节点实现此功能。

案例:Demos文件下"telco.sav"的数据文件。

3.1 汇总节点设置

基本汇总:

结果:

汇总表达式:

对两个或更多个字段做组合汇总,使用–汇总表达式实现。

结果:

举报
评论 0