欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

2022年系统集成项目管理工程师考试知识点:大数据

时间:2023-06-19

很多考生在备考2022年系统集成项目管理工程师考试,为大家整理了2022年系统集成项目管理工程师考试知识点:大数据,供大家备考复习。

大数据

大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。

适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。大数据的特点5V:Volume大量、Variety多样、Value有价值、Velocity高速和Veracity真实性。

大数据关键技术:

①HDFS:能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。

②Hbase:不同于一般的关系数据库,是非结构化数据存储的数据库。

③MapReduce:一种编程模型,主要思想:概念“Map(映射)”和“Reduce(归约)”。

④Chukwa:用于监控大型分布式系统的数据收集系统。

数据仓库:数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策;

数据挖掘:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。