SAP BODS – 查询转换

SAP BODS – 查询转换


这是数据服务中最常用的转换,您可以执行以下功能 –

  • 从源头过滤数据
  • 连接来自多个源的数据
  • 对数据执行函数和转换
  • 从输入到输出模式的列映射
  • 分配主键
  • 添加新的列、模式和函数导致输出模式

由于查询转换是最常用的转换,因此在工具选项板中为此查询提供了快捷方式。

要添加查询转换,请按照以下步骤操作 –

步骤 1 – 单击查询转换工具面板。单击“数据流”工作区上的任意位置。将此连接到输入和输出。

连接输入输出

当您双击查询转换图标时,它会打开一个用于执行查询操作的查询编辑器。

查询转换中存在以下区域 –

  • 输入模式
  • 输出模式
  • 参数

输入和输出模式包含列、嵌套模式和函数。Schema In 和 Schema Out 显示转换中当前选择的模式。

输入输出模式

要更改输出架构,请在列表中选择架构,右键单击并选择 Make Current。

更改输出架构

数据质量转换

数据质量转换不能直接连接到包含嵌套表的上游转换。要连接这些转换,您应该在嵌套表转换和数据质量转换之间添加查询转换或 XML 管道转换。

如何使用数据质量转换?

步骤 1 – 转到对象库 → 变换选项卡

库转换选项卡

步骤 2 – 展开数据质量转换并添加要添加到数据流的转换或转换配置。

转换配置

步骤 3 – 绘制数据流连接。双击转换的名称,它会打开转换编辑器。在输入架构中,选择要映射的输入字段。

注意– 要使用关联转换,您可以将用户定义的字段添加到输入选项卡。

文本数据处理转换

文本数据处理转换允许您从大量文本中提取特定信息。您可以搜索特定于组织的事实和实体,例如客户、产品和财务事实。

此转换还检查实体之间的关系并允许提取。使用文本数据处理提取的数据可用于商业智能、报告、查询和分析。

实体提取转换

在数据服务中,文本数据处理是在实体提取的帮助下完成的,实体提取从非结构化数据中提取实体和事实。

这涉及分析和处理大量文本数据、搜索实体、将它们分配到适当的类型并以标准格式呈现元数据。

实体提取转换可以从任何文本、HTML、XML 或某些二进制格式(如 PDF)内容中提取信息并生成结构化输出。您可以根据工作流程以多种方式使用输出。您可以将其用作另一个转换的输入或写入多个输出源,例如数据库表或平面文件。输出以 UTF-16 编码生成。

实体提取转换可用于以下场景 –

  • 从大量文本中查找特定信息。

  • 从具有现有信息的非结构化文本中查找结构化信息以建立新的联系。

  • 产品质量报告和分析。

TDP 和数据清理之间的差异

文本数据处理用于从非结构化文本数据中查找相关信息。但是,数据清理用于标准化和清理结构化数据。

Parameters 文本数据处理 数据清理
Input Type 非结构化数据 结构化数据
Input Size 超过 5KB 小于 5KB
Input Scope 具有多种变化的广泛领域 变化有限
Potential Usage 来自非结构化数据的潜在有意义的信息 存储到 Repository 的数据质量
Output 以实体、类型等形式创建注释。输入不变 创建标准化字段,更改输入

觉得文章有用?

点个广告表达一下你的爱意吧 !😁