欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

元数据管理Atlas的简介

时间:2023-07-13
文章目录

Atlas 概述Atlas 架构原理Atlas2.1 特性

元数据:数据中的数据,通俗来讲是从很多个数据集当中找出最有价值的数据信息。

Atlas 概述

Apache Atlas 为组织提供开放式元数据管理和治理功能,用以构建其数据资产目录,对这些资产进行分类和管理,形成数据字典。并为数据分析师和数据治理团队,提供围绕这些数据资产的协作功能。
注:数据字典:可以查到 hive 库的释义,表的介绍以及字段的解释和说明

元数据分类支持对元数据进行分类管理,例如个人信息,敏感信息等元数据检索可按照元数据类型、元数据分类进行检索,支持全文检索血缘依赖支持表到表和字段到字段之间的血缘依赖,便于进行问题回溯和影响分析等

1)表与表之间的血缘依赖
2)字段与字段之间的血缘依赖

Atlas 架构原理


metadata Sources:目前,Atlas支持从以下来源提取和管理元数据:Hbase 、Hive、Sqoop、Storm、Kafka。

Admin UI: 该组件是一个基于Web的应用程序,允许数据管理员和科学家发现和注释元数据。这里最重要的是搜索界面和类似SQL的查询语言,可用于查询Atlas管理的元数据类型和对象。

Ranger Tag based Policies:权限管理模块。

Business Taxonomy:业务分类

Messaging: 除了API之外,用户还可以选择使用基于Kafka的消息传递接口与Atlas集成。

API: Atlas的所有功能都通过REST API向最终用户暴露,该API允许创建,更新和删除类型和实体。它也是查询和发现Atlas管理的类型和实体的主要机制。

采集/导出(Ingest/Export):采集组件允许将元数据添加到Atlas。同样,“导出”组件将Atlas检测到的元数据导出。

类型系统(Type System): 用户为他们想要管理的元数据对象定义模型。Type System称为“实体”的“类型”实例,表示受管理的实际元数据对象。

图形引擎(Graph Engine): Atlas在内部使用Graph模型持久保存它管理的元数据对象。

metadata Store:采用Hbase来存储元数据

Index Store:采用Solr来建索引

Atlas2.1 特性

1)更新了组件可以使用 Hadoop3.1、Hive3.1、Hive3.0、Hbase2.0、Solr7.5 和 Kafka2.0
2)将 JanusGraph 版本跟新为 0.3.1
3)更新了身份验证支持可信代理
4)更新了指标模块收集通知
5)支持 Atlas 增量导出元数据

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。