模块
节点
集群
工作流
第1题:
A、大数据分析相比传统的数据仓库应用,具有查询及分析简单的特点
B、大数据的意义不在于掌握庞大的数据信息,而在于对这些数据进行专业化的处理
C、大数据主要依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术
D、大数据具有类型繁多、结构化多样、处理速度快、时效性强的特点
第2题:
以下关于大数据的叙述中,不正确的是( )。
A.大数据的意义是对数据进行专业化处理,实现数据的“增值”
B.大数据的4个特点是数据类型多、数据量大、价值密度高和处理速度快
C.大数据需要依托云计算的分布式处理、分布式数据库和云存储等
D.与传统的数据仓库应用相比,大数据分析具有数据量大、查询分析更复杂等特点
第3题:
A.蕴式并行编程模型
B.数据并行模型
C.消息传递模型
D.共享变量模型
第4题:
与传统的分布式程序设计相比,Mapreduce封装了()单而强大的接口。
第5题:
A.并行处理
B.负载均衡
C.容错处理
D.本地化计算
第6题:
分布式数据库系统中查询处理的一般过程是:由全局数据库管理系统在查询产生结点时对查询进行词法和语法分析,生成(17);(17)进行变换,查询分解,把全局查询分解成若干个子查询,确定处理子查询结果的运算次序和结点;对子查询进行优化和执行:最后是子查询结果的汇总和处理。
A.查询语句
B.子查询模式
C.全局查询树
D.查询视图
第7题:
在将数据源经过分析挖掘到最终获得价值的大数据处理过程中,MapReduce是在( )阶段应用分布式并行处理关键技术的常用工具。
A.数据采集
B.数据管理
C.数据存储
D.数据分析与挖掘
第8题:
在计算F统计量的是,需要分解和方分解,分为()
A、将总体的和方分解为处理内的各部分
B、将总体的和方分解为处理间
C、将总体的和方分解为处理内和处理间
D、将处理间的和方分解为各因素及交互作用
E、将处理内的和方分解为各因素及交互作用
第9题:
第10题:
spark的源码是由哪几种语言编写完成的()