一、数据加载及集成包括:
1 数据加载
Gbase 8a MPP Cluster 中,集群加载功能直接集成在 Gbase 8a MPP Cluster内部,不需要额外部署外部加载工具。
2 kafka 数据集成
数据同步系统通过 Oracle Golden Gate(OGG)、Gbase RTSync 等工具复制Oracle、Gbase 8s 等数据库的业务数据,通过 kafka 同步到 Gbase 8a MPP Cluster,为了应对业务系统可能的峰值,在系统中加入 Kafka 消息队列作为缓冲区。
二、虚拟集群及镜像集群包括:
1 虚拟集群
虚拟集群以大规模集群为基础开发,一个集群中包含多个虚拟子集群(VC)。各 VC 在整个集群范围内独立运行,共享统一的入口。权限许可的情况下,各虚拟集群间可以相互访问。
2 镜像集群
虚拟集群的镜像功能有以下特点:灵活的镜像配置,数据实时同步,高可用。
三、数据安全包括:
1 数据加密
Gbase 8a MPP Cluster 数据加密是提供对数据库落地数据的加密功能,用来满足用户的安全需求,提高系统的安全性。数据加密按照数据文件中的 DC数据块为最小单位进行,可以实现表级或者列级不同粒度的加密要求。
2 数据脱敏
Gbase 8a MPP Cluster 提供动态数据脱敏的新特性,使得开发人员或者数据库管理员能够控制敏感数据的暴露程度,并且在数据库层面生成数据,大大简化了数据库应用层的安全设计和编码。
四、全文检索
Gbase 8a MPP Cluster 数据库支持全文检索,由于默认采用全单字索引方式,支持几乎所有的语种,并且可以保证 100%的查询召回率。结合 Gbase 8a MPP Cluster 独特的列存储,压缩和智能索引技术,适合面向海量数据的检索查询应用。
支持对外部存储文档建立全文索引并提供检索,支持的文档格式如 txt、doc、XML、HTML、PDF、xls 等。
五、库内挖掘
GBMLLib 是 Gbase 8a MPP Cluster 的数据挖掘和机器学习扩展库,以插件的形式添加到 Gbase 8a MPP Cluster 中。通过其提供的机器学习算法,Gbase 8aMPP Cluster 可以对用户数据进行深层次的分析和挖掘,将用户数据转化为用户价值。
GBMLLib 提供了基于 SQL 的机器学习算法,目前包括的算法有:回归算法(线性回归)、分类算法(Logistic 回归、支持向量机)和聚类算法(K-Means)。同时也提供了一些数组操作和线性代数计算的基本函数。