客户端模块
元数据管理模块
数据存储服务模块
数据划分模块
第1题:
A.Tachyon
B.Hive
C.Hbase
D.HDFS
第2题:
此题为判断题(对,错)。
第3题:
A.分布式
B.系统式
C.硬件式
D.虚拟式
第4题:
hadoop中的hdfs是分布式()
第5题:
此题为判断题(对,错)。
第6题:
此题为判断题(对,错)。
第7题:
此题为判断题(对,错)。
第8题:
在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据()。
A.存储技术
B.分析技术
C.并行分析技术
D.挖掘技术
第9题:
试题二(共25分)
阅读以下关于分布式存储系统设计的叙述,回答问题1至问题3。
某软件公司开发基于云计算的分布式文档协作平台( DDCP),系统部分需求如下所示:
(1)实现文档的分布式存储,客户端可随时随地上传和下载文档;
(2)支持多客户端并发编辑同一文档,某个客户端所做修改会实时显示在其他客户端;
(3)要求系统具有自我修复机制,当系统中某个节点失效时,无需人工干预能够自动实现节点替换并恢复到一致状态。
项目组经过讨论,决定采用现有的分布式文件系统作为基础架构,但在具体选用哪种设计方案时产生了分歧。王工建议采用Hadoop分布式文件系统HDFS作为系统参考架构,但张工认为Google分布式文件系统GFS更适合该系统需求。最后经过更为详细
的分析和讨论,同意了张工的建议,采用GFS作为分布式文档协作平台的文件系统架构。
【问题1】(12分)
请用300字以内的文字说明GFS和HDFS有何异同,并针对系统需求,用200字以内的文字说明选择GFS的原因。
【问题2】(8分)
针对图2-1所示DDCP基础架构,请分别说明一次数据读操作和一次并发写操作的过程。
【问题3】(5分)
请分别叙述采用GFS和HDFS架构,单点失效问题是如何解决的。
第10题:
分布式文件系统HDFS主要由哪些功能模块构成()。