3.6. 打标签

根据文本内容的包含关系,给文本赋予特定的标签;文本处理的利器,可用于标识多个文档类型,以便对文档进行分类处理,同时也可为文本数据挖掘提供数据预处理的手段。

3.6.1. 设置

文本: 指定需要打标签的文本内容所在列;

输出: 指定给存放文字标签的列名;

标签内容: 定义文本标签的语法。

  • 同一个标签支持多个关键字或关键字组合,多个关键字之间以逗号间隔,关键字组合之间以&间隔,第一个出现的词为标签;

    例如:压裂设计,压裂&设计,压裂&方案;

    其中当字符串中包含“压裂设计”、或“压裂”和“设计”、或“压裂”和“方案”时,将该字符串打上“压裂设计”的标签;

  • 不同行表示不同文本标签;

注解

一个字符串的输出结果,支持多个输出标签,多个标签之间以分号间隔;