( 难度:中等)关于spark中RDD说法错误的是:A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的C.宽依赖中会有shuffle的产生D.窄依赖中会有shuffle的产生

题目
( 难度:中等)关于spark中RDD说法错误的是:
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。

A.trans

B.reduce

C.join

D.cogroup


正确答案:A

第2题:

Spark中的每个RDD一般情况下是由()个分区组成的。

A.无数

B.多

C.1

D.0


正确答案:B

第3题:

Spark只有键值对类型的RDD才能设置分区方式。()

此题为判断题(对,错)。


正确答案:正确

第4题:

interSection算子对源RDD和参数RDD求交集后返回一个新的RDD


正确答案:正确

第5题:

Dstream输出操作中foreachRDD的正确用法是使用rdd.foreachPartition方法创建一个单独的连接对象,然后使用该连接对象输出所有RDD分区中的数据到外部系统。()

此题为判断题(对,错)。


正确答案:正确

第6题:

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。

A.resetpartition

B.repartiton

C.coalesce

D.Partition


正确答案:BC

第7题:

GraphX中()是存放着Edg对象的RDD。

A.VertexRDD

B.RDD[VertexId,VD]

C.RDD[Edge]

D.EdgeRDD


正确答案:C

第8题:

RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器数组、列表等中的所有元素构成新的RDD。()

此题为判断题(对,错)。


正确答案:正确

第9题:

下面哪个不是RDD的特点()

  • A、可分区
  • B、可序列化
  • C、可修改
  • D、可持久化

正确答案:C

第10题:

map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成


正确答案:正确

更多相关问题