下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().
第1题:
A、Block是HDFS中最小的数据存储单位
B、Split是MapReduce中最小的计算单元
C、Block与Split是一一对应关系
D、Block和Split之间对应关系是任意的,可由用户控制
第2题:
关于并行数据库系统的叙述中,错误的是
A.无共享的结构是支持并行数据库系统的最好的并行结构
B.在并行处理中,许多操作是同时执行的,而不是串行处理的
C.共享主存储器系统有时又称作群机
D.并行系统通过并行的使用多个CPU和磁盘来提高处理速度
第3题:
下面哪个程序负责 HDFS 数据存储?()
ANameNode
BJobtracker
CDatanode
DsecondaryNameNode
Etasktracker
第4题:
MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。
第5题:
在将数据源经过分析挖掘到最终获得价值的大数据处理过程中,MapReduce是在( )阶段应用分布式并行处理关键技术的常用工具。
A.数据采集
B.数据管理
C.数据存储
D.数据分析与挖掘
第6题:
A.MapReduce属于共享式集群架构,容错性好
B.传统并行计算框架比MapReduce硬件更加便宜
C.传统并行计算框架适用于实时、细粒度计算
D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型
第7题:
A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节,方便使用
第8题:
在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据()。
A.存储技术
B.分析技术
C.并行分析技术
D.挖掘技术
第9题:
MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()
第10题:
MapReduce将传统的查询、分解及数据分析进行分布式处理,将处理任务分配到不同的处理(),因此具有更强的并行处理能力。