跳转至

术语解析

用户可以通过以下方式使用 Aloudata AIR:

  • 使用 DWS 界面访问和使用 AIR 中的数据内容
  • 通过 JDBC 与 AIR 建立连接,访问和使用 AIR 中的数据内容 在使用 Aloudata AIR 前,建议你了解以下几个重点概念:
概念 介绍
数据源 AIR 分析的数据内容,其源头都是来自于外部数据源。你需要先将数据源接入后,才可以进行 AIR 的分析工作。
表/文件 数据源的内容为表或文件,表和文件会存储在数据源的原始位置,不会发生拷贝和转移。使用时,通过读取表和文件的信息进行查询。
数据空间 数据空间是存放数据视图的地方,数据空间一般根据业务域和数据层级来划分创建。通常可以构建贴源层、中间层的数据空间,再配合不同业务域的集市数据空间,完成数据的分类和协作。
视图 数据视图是一段 SQL 逻辑,每次访问视图时,实时地执行视图内容,获得视图的计算结果。视图主要用于帮助理清分析思路。
关系投影 投影是 AIR 中重要的加速介质。查询发起时,系统会根据查询语句寻找适合的投影数据,替换当前查询中的部分执行逻辑,从而减少查询耗时。

重点术语解析

物理数据集(PDS)

物理数据集(Physical Dataset),对应底层物理数据集的统一抽象,底层可以是某个数据库源的表,也可以是某个文件,引入 Aloudata AIR 之后,必须统一定义为 PDS 才能被使用。

虚拟数据集(VDS)

虚拟数据集(Virtual Dataset),一个 VDS 在 Aloudata AIR 引擎中对应一个视图(View),当我们在数据整合界面中创建一个视图时,就是创建了一个虚拟数据集,也就是逻辑数据集。

关系投影(RP)

关系投影(Relational Projection),是一个视图和底层物理 ETL 作业和 ETL 作业生成数据的关联对象,用于加速数据查询。用户可以在数据整合界面中,对特定的数据视图生成关系投影,也可以在数据加速界面中查看系统中定义的所有关系投影。

工作簿

工作簿是用户通过 SQL 编辑器查询和加工数据的界面,同时可以保存用户编写过的 SQL 代码。

数据空间

数据空间是存放虚拟数据集(VDS)的地方,数据空间一般可以根据业务域和数据层级来做划分创建。例如创建 DWD、DWS、ADM 等数据空间,配合不同业务域的数据集市空间,完成数据的分类和协作。

数据源

在产品数据集成界面中,用户可以将不同的异构数据源接入平台进行连接计算、生成上层逻辑视图。目前 Aloudata AIR 支持 包括文件系统、传统 OLTP 及 OLAP 数据库、MPP 数据库、分布式文件系统、企业 API、NoSQL 数据库等40余种数据源接入。

数据服务

数据服务是用户通过 RESTful 标准接口对外提供数据的功能,用户可以在数据服务界面定义、测试、发布、上线下线数据服务。

数据目录

数据目录提供了一个集中的、可搜索的索引,可以让用户有效组织、分类和描述 Aloudata AIR 逻辑数据平台上的数据资产。