跳转至

投影

概述

在 AIR 中,投影是一种核心的查询加速数据表,旨在提升明细查询和聚合查询的性能。系统在执行查询时,会自动识别并匹配可用的投影数据,直接读取预处理结果,从而跳过部分计算过程,显著降低查询耗时。

功能入口

点击导航栏中“数据整合”下的“投影”,即可进入投影管理页面。 投影_image_1.png

功能介绍

新建投影

支持基于基础视图和逻辑视图创建投影,下文以逻辑视图为例创建投影。点击“视图”,选择单个视图后,选择“投影”tab,再点击“新建投影”

投影_image_8

新建投影包含基础配置和高级配置,具体说明见下文

投影_image_9

基础配置

基础配置包含基础信息和投影配置两部分。

投影_image_10

1)基础信息说明如下

  • 投影类型

  • 明细投影:用于加速明细查询(SELECT 明细字段)

  • 聚合投影:用于加速统计分析(GROUP BY + 聚合函数,如 SUM/COUNT/MAX/MIN)
  • 实时投影:用于加速对实时/高频更新数据的查询(数据到达后快速可查),适用于对时效性要求高的场景(如分钟级看板、实时监控、实时明细检索等)

  • 投影名称

  • 支持中英文数字下划线,长度为3~256个字符

  • 建议命名规则:业务_表名_投影类型_用途(例如:sales_order_detail_detail_list / sales_order_agg_by_day_store)

  • 创建后立即启用

  • 勾选后,新建投影默认处于启用状态,可立即参与查询加速

  • 未勾选则为未启用状态,需要后续手动启用后才生效

  • 调度方式

  • 自动更新:根据上游数据变化自动触发投影更新

  • 手动更新:手动点击按钮触发投影更新(适用于低频更新或临时验证场景)
  • 自定义:按照自定义的时间和数据变化触发更新(适用于需要特定刷新时间/频率的场景)

  • 调度周期:与基础视图的调度周期相同

  • 依赖强弱

  • 强依赖:基于该投影和上游投影的数据周期判断是否进行更新。当上游所有任务都完成目标周期(或更细粒度)的数据更新后,该任务才会执行

  • 弱依赖:不校验数据周期的一致性(只要触发条件满足即可执行)

2)“投影配置-明细投影”说明如下

投影_image_11

  • 扫描

  • 勾选字段为扫描字段,用于查询(SELECT)场景的查询加速

  • 建议勾选明细列表/导出/详情页中高频查询或展示的字段

  • 分区

  • 勾选字段为分区字段,当使用该字段进行排序或筛选时,会进行查询加速

  • 建议选择低基数字段作为分区字段,建议选择字段值数量不超过 10,000的字段

3)“投影配置-聚合投影”说明如下

投影_image_12

  • 维度

  • 勾选字段为维度字段,用于分组(GROUP BY)场景的查询加速

  • 建议勾选常用的分组字段(如日期、地区、门店、渠道、品类等)

  • 度量

  • 勾选字段为度量字段并选择聚合函数,用于聚合(SUM、COUNT…)场景的查询加速

  • 常见选择:金额/数量→SUM;记录数→COUNT;极值→MAX/MIN

  • 分区

  • 请参考“明细投影”的说明

高级配置

支持设置增量配置和下推写入配置

投影_image_13

1)增量配置说明如下:

  • 功能说明
  • 开启后,系统将根据配置的增量字段,对投影数据执行对应的 INSERT / MERGE 写入。
  • 开启前提
  • 视图上游的来源表(基础视图)中已配置增量字段
  • 投影扫描字段中勾选增量字段
  • 增量字段不包含复杂加工/转换逻辑
  • 支持范围
  • 分区视图:仅支持 INSERT
  • 逻辑视图 / 方言视图 / 通过 CREATE 语句创建的表:支持 INSERTMERGE

示例-INSERT(增量数据追加写入)

投影_image_14

  • 配置项
  • 增量类型INSERT
  • 增量字段:选择用于标识增量的字段(示例:C_CUSTKEY
  • 行为说明
  • 系统仅写入本次增量范围内的新增数据,不对历史数据做更新或删除。

示例-MERGE(合并写入)

投影_image_15

  • 配置项

  • 增量类型MERGE

  • 增量字段:选择用于标识增量的字段(示例:C_CUSTKEY
  • MERGE 条件:填写合并规则(WHEN MATCHED / WHEN NOT MATCHED 等)
  • 错误数据处理

    • 继续插入:MERGE ON 条件匹配不上时将插入数据
    • 忽略:MERGE ON 条件匹配不上时跳过此条数据
  • 填写说明(可参考示例)

    • ON 条件为主键/唯一键关联条件(示例:ON t.id = s.id)。
  • WHEN MATCHED 中的多个条件会按顺序匹配并执行

  • 可按业务需要在 WHEN MATCHED 中编写 UPDATE / DELETE 行为,在 WHEN NOT MATCHED 中编写 INSERT 行为。

2)下推写入

投影_image_16

  • 功能说明
  • 对逻辑视图生效
  • 开启后,系统将通过并行拉取、在数据源侧创建临时表等方式缩短查询时间,提高写入效率。
  • 开启前提
  • 数据源已开启下推能力。
  • 数据源已配置写账号
  • 不支持跨源场景
  • 参数说明
  • 分批字段(必填):用于分批的字段,需要从投影字段中选择。
  • 分批数量:即分多少批(最大支持 20 批

投影列表

在投影列表中,您可以执行以下操作:

  • 筛选与搜索:支持按投影名称、视图名称或投影状态进行筛选
  • 查看详情:点击可查看投影的详细信息
  • 操作投影:支持对投影进行编辑、停用、启用或删除

投影_image_2.png

投影详情

点击任一投影名称,可进入详情页面,查看其概览、更新记录等信息,也可进行编辑、停用、启用或删除操作。 请注意以下操作的区别:

  • 停用投影:清空投影数据,但保留投影定义
  • 删除投影:彻底删除投影定义及其数据
  • 更新投影:重新生成当前视图的所有下游投影数据

投影_image_3.png

概览

在概览页中,可查看投影的基本信息及其投影方案。 投影_image_4.png

更新记录

在更新记录页中,可查看投影的历史更新列表。 投影_image_5.png 点击某次更新记录旁的「详情」,可查看该次更新的执行步骤、SQL 优化信息及 SQL 翻译详情。 投影_image_6.png

任务依赖

在本页面中,可查看投影之间的依赖关系,并支持对投影进行更新操作。 投影_image_7.png