spark中的实时计算系统是哪个()

题目

spark中的实时计算系统是哪个()

  • A、spark?core
  • B、spark?streaming
  • C、mlbase
  • D、Grophx
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

以下关于sparkstreaming说法正确的是()

  • A、spark streaming分布式微批架构
  • B、spark streaming实时存储架构
  • C、spark streaming是普通存储架构
  • D、spark streaming分布式实时计算架构

正确答案:A

第2题:

spark支持的分布式部署方式中哪个是错误的()

  • A、standalone
  • B、spark on mesos
  • C、spark on YARN
  • D、spark on local

正确答案:D

第3题:

计算机控制系统的工作原理不包括下面哪个步骤。()

A.实时数据采集

B.实时控制决策

C.实时控制输出

D.逻辑推理


参考答案:D

第4题:

spark读取hdfs数据是调用哪个技术实现的()

  • A、spark?core
  • B、spark?streaming
  • C、mapreduce
  • D、Grophx

正确答案:C

第5题:

spark中,可以运行sql脚本的框架是哪个()

  • A、spark?core
  • B、hdfs
  • C、hadoop
  • D、spark?sql

正确答案:D

第6题:

以下选项中属于spark架构中的图计算框架的是()

  • A、spark core
  • B、spark streaming
  • C、mlbase
  • D、Grophx

正确答案:D

第7题:

spark中如果想要获取hdfs中的数据,则需要使用哪个系统()

  • A、spark?core
  • B、spark?streaming
  • C、mapreduce
  • D、Grophx

正确答案:C

第8题:

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性


正确答案:正确

第9题:

spark生态圈没有能够实时计算的框架


正确答案:错误

第10题:

描述Spark集群计算中RDD的含义和作用。


正确答案:Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。