跳转至

数据导出

概述

数据导出是实现数据高效流转与集成的关键。它能够直接将“基础视图”(来自数据源模块)与“逻辑视图”(来自数据空间模块)对应的数据,无缝导出至指定的目标数据源,从而有效打破数据孤岛,促进数据价值的流动。

功能入口

点击导航栏中“数据交换”下的“数据导出”,即可进入数据导出任务的管理页面。 数据导出_image_1.png

功能介绍

新建导出任务

第一步: 点击右上角的“新建数据服务”开始创建具体的数据导出任务。 数据导出_image_2.png 第二步: 配置数据导出任务的任务信息、来源数据以及导出的目标数据信息。 数据导出_image_3.png

目标数据的写入方式支持以下两种模式:

  1. 覆盖数据:清空目标表或文件中的现有数据,再将新数据完整写入。适用于数据整体更新、历史数据无需保留或进行周期性全量替换的场景。
  2. 追加数据:保留目标表或文件中的现有内容,并将新数据添加至末尾。适用于日志持续记录、增量数据同步或需要不断补充数据的场景。

其中,还支持如下高级配置(JSON格式)

参数名 参数值 类型 说明
sep 或者 delimiter ,(默认) String 导出到文件类型数据源中的分隔符。支持一个或者多个字符
encodingCharset UTF-8(默认) String 设置文件的编码方式
header false Boolean 文件的第一行是否为标题。true表示导出的文件第一行为标题,false则不包含标题
nullValue "null"(默认) String 设置用来表示NULL值的符号
nanValue NaN String 设置用来表示非数值的符号
positiveInf Inf String 设置表示无穷大的符号
negativeInf -Inf String 设置表示负无穷大的符号
dateFormat yyyy-MM-dd String 设置日期格式
timestampFormat yyyy-MM-dd'T'HH:mm:ss[.SSS][XXX] String 设置时间戳格式,默认时区为源表的时区
timestampNTZFormat yyyy-MM-dd'T'HH:mm:ss[.SSS] String 设置非时区的时间戳格式
maxColumns 2048(默认) Integer 设置导出数据表的最大列数
emptyValue "" String 设置代表空值的字符串。
lineSep \r 或者 \n String 设置行分隔符号,如果是导出为CSV文件,则改配置不生效。
timeZone 时区值 String 设置导出到目标源的时区。默认:Asia/Shanghai

第三步: 选择字段并配置字段映射信息 数据导出_image_4.png 第四步: 配置导出任务的调度方式,支持自动更新、手动更新以及自定义三种调度方式。 数据导出_image_5.png

查看导出任务

概览

在概览页中,可查看导出任务的基础信息、来源数据、字段映射、调度配置等信息。 数据导出_image_6.png

更新记录

在更新记录中,可查看导出任务的更新记录信息。 数据导出_image_7.png

任务依赖

在本页面中,可查看导出任务的上游依赖关系。 数据导出_image_8.png