案例名称
基于知识图谱的全域数据资产智能管理与运营
(资料图)
案例简介
该方案通过数据资产元数据构建引擎、列算子血缘引擎、关系挖掘引擎和数据资产目录挂载引擎的部署,可快速实现金融机构数据资产的业务目录分类以及数据资产标签集合建设。通过可视化引擎管理平台的建设,实现对数据资产管理的在线运营。
创新技术/模式应用
金融行业是数据建设最早、数据最丰富的行业之一。在多年的数据建设中沉淀了丰富的数据资产,以一个中等股份制银行为例,其数据库表通常在10万量级左右。
海量的数据建设增加了管理难度,也带来了使用上的困扰。数据用户想要找到自己最需要的那张表,面对海量数据宛如大海捞针。通过数据资产目录的建设可以一定程度上解决上述数据获取问题,但是手工建设数据目录建设工作量大、成本高、周期长,且对资产的描述单一。
本方案结合通过数据资产元数据构建引擎、列算子血缘引擎、关系挖掘引擎和数据资产目录挂载引擎等关键能力,很好的解决传统数据目录建设的不足。
项目效果评估
一、大幅提升数据资产目录建设速度:使用自动化数据资产挂载引擎,相比数据资产手工挂载,目录建设速度整体可提升5-8倍;
二、精准定位数据链路、显著降低问题分析排查范围:利用列算子血缘分析技术,基于元数据知识图谱的构建,精准定位血缘链路、定位具体数据加工步骤的具体节点,有效缩小数据资产问题分析的排查范围;
三、 跨平台血缘链路识别:可通过分析相关脚本和作业等方式,分析和识别跨系统血缘关系,解决“跨系统血缘断点”的问题,真正实现数据加工的端到端加工链路分析。
项目牵头人
徐海城 高级架构师
项目团队成员
徐海城、张宁、王天振、王明、陈建欣、董凯
责任编辑:王煊