信息系统项目管理师综合知识真题考点:Hadoop组成
Hadoop概念:
狭义Hadoop:指的是HDFS、YARN、MAPREDUCE三大组件。
广义Hadoop:指的是hadoop一系列的生态圈
1、Hadoop Distributed File System (HDFS):是一个分布式文件系统。HDFS的文件会被分为很多的Block分散存储在不同机器上。[为海量的数据提供了存储]
(1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
(2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。
(3)Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份。
2、Yet Another Resource Negotiator(YARN):是一种通用的资源管理系统和调度平台。[另一种资源协调者,是Hadoop的资源管理器]
ResourceManager(RM):整个集群资源(内存、CPU等)的管理者
NodeManager(NM):单个节点服务器资源的管理者。
ApplicationMaster(AM):单个任务运行的管理者。
Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、CPU、磁盘、网络等。
3、MapReduce:本身就是用于并行处理大数据集的软件框架。将计算过程分为两个阶段:Map 和Reduce。[为海量的数据提供了计算]
(1)Map 阶段并行处理输入数据
(2)Reduce 阶段对Map 结果进行汇总
考点相关真题
Hadoop中,()是大规模数据集的并行计算框架。
A.DataNode
B.HDFS
C.MapReduce
D.Hive
查看答案
参考答案:C
相关阅读:信息系统项目管理师综合知识真题考点汇总
信管网订阅号
信管网视频号
信管网抖音号
温馨提示:因考试政策、内容不断变化与调整,信管网网站提供的以上信息仅供参考,如有异议,请以权威部门公布的内容为准!
信管网致力于为广大信管从业人员、爱好者、大学生提供专业、高质量的课程和服务,解决其考试证书、技能提升和就业的需求。
信管网软考课程由信管网依托10年专业软考教研倾力打造,教材和资料参编作者和资深讲师坐镇,通过深研历年考试出题规律与考试大纲,深挖核心知识与高频考点,为学员考试保驾护航。面授、直播&录播,多种班型灵活学习,满足不同学员考证需求,降低课程学习难度,使学习效果事半功倍。
发表评论 查看完整评论 | |