问题:分区是kafka消息队列的最小单位
查看答案
问题:spark框架中,机器学习库的框架是哪个()A、hadoopB、spark?streamingC、mlbaseD、RDD
问题:对于以下2个列表的操作,那些说法说法不正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(1,2,3,4,5)
问题:spark在基于客户端模式运行时,driver会在一台机器指定启动
问题:与Hadoop的MapReduce相比,Spark基于内存的运算要快100倍以上,基于硬盘的运算也要快10倍以上
问题:spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑
问题:以下关于scala语言中的函数的说法中,其中正确的是()A、一等公民B、可以独立定义C、不能独立定义D、函数不能赋值给变量
问题:使用大部分语言编写的程序都可以和kafka服务器通信
问题:以下单词不可当做变量名的是()A、varB、valC、forD、hello
问题:spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL
问题:Spark有如下特性()A、ScalaB、javaC、python
问题:下列关于Scala对于异常的处理处理正确的是:()A、Case匹配的方式处B、Throw出去C、抛插值器D、singleton=false
问题:spark中的图计算框架是()A、spark coreB、spark streamingC、mlbaseD、Grophx
问题:以下有返回值的函数有哪些()A、mapB、flatMapC、foreachD、filter
问题:以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置
问题:zookeeper数据模型是带有默认权限的
问题:spark中的foreach算子作用()A、使程序在内存中运行B、使程序触发执行C、使程序具有一致性D、使程序具有安全性
问题:在scala中的模式匹配可以匹配哪些类型()A、通配符匹配B、常量匹配C、变量匹配D、构造函数匹配等
问题:SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD
问题:只有主构造函数才可以写参数