3.2. 新列

数据专家中最常用的功能之一,以现有数据为基础生成一列新数据。在漫长的数据处理与分析过程中,经常会使用到若干个新列操作,如从Web日志数据的字符串中提取客户ID,或根据事务和人口统计数据创建客户生命周期值。

3.2.1. 设置

字段名: 指定要新增并添加到每条记录的字段名称。默认名称为新列N,其中 N 是截止到目前由当前流程中所有节点数。

方式: 从下拉列表中选择新列的创建类型,如“公式”、“条件”或“多条件”。对于每个类型,都会提供该类型特定的对话框。

公式方式: 用于根据表达式的结果为数据集中的每条记录创建新字段。

表达式:输入创建新列的取值表达式。单击E按钮可打开公式编辑器。

条件方式: 新列使用 If-Then-Else 语句添加新字段的值。

  • 如果(If):指定一个表达式条件,在执行时会逐一为每条记录评估该条件。如果条件为真(数值情况为非假),则会为新字段赋予下面通过 Then 表达式指定的值。
  • 则(Then):指定上述 If 语句为真(或非假)时新字段的值或表达式。
  • 否则(Else):指定上述 If 语句为假时新字段的值或表达式。

多条件方式: 新列使用一系列的 If-Then-Else 语句添加新字段的值。您可以通过按下Insert键,设置多个条件语句。

  • 条件:指定一个表达式条件,在执行时会逐一为每条记录评估该条件。如果条件为真,则会为新字段赋予对应值列的数值。单击E按钮可打开公式编辑器。
  • 值:指定上述 If 语句为真(或非假)时新字段的值或表达式。
  • 默认值:当所有If 语句为假时新字段的值。
  • 注,单击I按钮,使用文本编辑器,批量创建多个条件及值;单击G按钮,使用自动分组设置工具,为数字值型或日期型字段自动创建多个条件及值;单击C按钮,对所有条件及值进行正确核查。

类型: 为新列选择类型,如“Integer”、“Real”、“Text”等。