SQLFlow数据流分析工具的job功能介绍

syforacle 2021-05-23 原文

SQLFlow 血缘关系 job 数据流数据分析

SQLFlow是一款专业的数据血缘关系分析工具，在大型数据仓库中，完整的数据血缘关系可以用来进行数据溯源、表和字段变更的影响分析、数据合规性的证明、数据质量的检查等。

一、SQLFlow 是怎样工作的

从数据库、版本控制系统、文件系统中获取 SQL 脚本。
解析 SQL 脚本，分析其中的各种数据库对象关系，建立数据血缘关系。
以各种形式呈现数据血缘关系，包括交互式 UI、CSV、JSON、GRAPHML 格式。

二、SQLFlow 的组成

Backend，后台由一系列 Java 程序组成。负责 SQL 的解析、数据血缘分析、可视化元素的布局、身份认证等。
Frontend，前端由一系列 javascript、html 代码组成。负责 SQL 的递交、数据血缘关系的可视化展示。
Grabit 工具，一个 Java 程序。负责从数据库、版本控制系统、文件系统中收集 SQL 脚本，递交给后台进行数据血缘分析。
Restful API，一套完整的 API。让用户可以通过 Java、C#、Python、PHP 等编程语言与后台进行交互，完成数据血缘分析。

三、在线工具连接：https://sqlflow.gudusoft.com/?utm_source=cnblogs&utm_medium=blog&utm_campaign=my-nick-name#/

四、SQLFlow的job功能

1、job能做什么

SQLFlow的job功能是为客户提供的固定血缘追溯场景所设计的，比如你有多个固定的分析逻辑，需要在工作中反复使用，此时你只需要根据具体的分析需求进行设置job即可。该job产生的逻辑关系图属于静态的，不会虽仓库中对象结构变化而变化，这样可以更好的帮助您进行版本追溯及管理。

上图中，做数字标记的job作业，属性1是在工具右侧面板上显示job分析的逻辑关系图，属性2可以分享该job，属性3是删除该job。

2、如何创建job

如下图所示：从工具job功能导航到job list页面，点击【upload】进行Create Job；

其中，sql source的可选来源有三种：upload file、from database、upload file+from database

这里以常用的from database方式做Create Job演示：

下图中，是Create Job需要填写的相关信息，其中*为必填项，有些数据库的database属性不是必填项，所以他不属于必填项。

dbvendor:需要选择的数据库种类；

job name：一个自定义的好记的job名称

hostname：IP或机器名

port：端口号

database：catalog name，即dbname。

usename：用户名

password：密码

【test connection】可以帮助您进行连接测试。

advanced的选项如下：

extractedDbsSchemas：所提取的特定schema

excludedDbsSchemas：包含的schema

extractedStoredProcedures：所提取的存储过程名称

extractedViews：所提取的视图名称

备注：高级选项都不是必填项！

当您所有信息填写正确后，点击【OK】即可成功创建job。

谢谢！

本文链接：https://www.cnblogs.com/syforacle/p/SQLFlowJob.html

SQLFlow数据流分析工具的job功能介绍的更多相关文章

Apriori算法+FP-Growth算法

Apriori算法一、关联分析关联分析是在大规模数据集中寻找有趣关系的任务，有两种形式：频繁项集（freq […]...

Oracle job procedure 存储过程定时任务

Oracle job procedure 存储过程定时任务 Posted on 2018-07-04 17:2 […]...

从0到1打造数据可信的数据产品：解析数据治理在过程可信变革中的运作流程

摘要：本文针对“数据牵引改进，工具固化规范”这一思路在业务团队落地过程中的动作流程进行详细阐述，并明确了支撑整 […]...

数据分析——巧用ABtest，看杰伦和徐坤的流量之争

　　豆瓣的一个关于“周X伦在微博超话没有数据流量，他是不是没有蔡X坤火”的帖子引爆了Jay Chou粉丝与KU […]...

数据分析第四篇：相关分析

相关分析是数据分析的一个基本方法，可以用于发现不同变量之间的关联性，关联是指数据之间变化的相似性，这可以通过相 […]...

手把手教你学Numpy，这些api不容错过

本文始发于个人公众号：TechFlow，原创不易，求个关注今天是Numpy专题的第5篇文章，我们来继续学习N […]...

【数量技术宅|金融数据系列分享】套利策略的价差序列计算，恐怕没有你想的那么简单

更多精彩内容，欢迎关注公众号：数量技术宅。想要获取本期分享的完整策略代码，请加技术宅微信：sljsz01 价差 […]...

国产多维数据库 NeuralCube！中国人自己的大数据底层核心技术！

商业转载请联系作者获得授权，非商业转载请注明出处。提到‘数据库’，首先被想到的肯定是Oracle、DB2、S […]...

随机推荐

Linux core dump使用

什么是 core dump？ core dump是一个当进程意外终止时包含进程内存内容的文件。当程序崩溃的时候 […]...

时间序列神器之争：Prophet VS LSTM

一、需求背景我们福禄网络致力于为广大用户提供智能化充值服务，包括各类通信充值卡（比如移动、联通、电信的话费及 […]...

史上最好程序员的职业规划：五年从程序员到架构师之路！

史上最好程序员的职业规划：五年从程序员到架构师之路！第一部分：对于参加工作一年以内的同学。恭喜你，这个 […]...

windows2000 sp4下载

windows2000 sp4下载 http://www.microsoft.com/china/window […]...

以最简单的方式讲HashMap

以最简单的方式讲HashMap HashMap可以说是面试中最常出现的名词，这次头条的一面，第一个问的问题 […]...

IPv6 优于 IPv4 的十大功能

现在是 9102 年，有一个严重的问题，困扰着资深宅男二狗子。那就是偶像团体没新名了。今年开始，偶像团体 XK […]...

Eclipse 调试器(引用IT168) – JUN_IT

Eclipse 调试器(引用IT168) Eclipse 调试器：零距离接触实战技巧 2011年11月25日0 […]...

[非专业翻译] Mapster – 映射前&映射后

[非专业翻译] Mapster – 映射前&映射后系列介绍 [非专业翻译] 是对没有中文 […]...

SQLFlow数据流分析工具的job功能介绍

SQLFlow数据流分析工具的job功能介绍的更多相关文章

随机推荐

热门专题

目录导航