（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS

题目

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。

A、Spark
B、Hive
C、Haystack
D、HDFS

参考答案和解析

正确答案:A

如果没有搜索结果或未解决您的问题，请直接联系老师获取答案。

相似问题和答案

第1题：

至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为()。

A.字段

B.文档

C.数据库

D.记录

参考答案：C

第2题：

下列关于分布式数据库和并行数据库的说法，正确的是（）。

A.为了满足高并发业务的需要，共享内存结构的并行数据库比较适用于如银行出纳、民航售票等OLTP应用

B.在分布式数据库的查询中，导致数据传输量大的主要原因是数据间的连接操作和选择操作

C.如果数据分布不合理，并行数据库仅仅依靠多处理器、共享硬件资源等手段是无法实现真正意义上的并行处理的，也无法使其性能最优化

D.与集中式数据库系统的事务相比，分布式数据库系统中只需要一个场地完成提交即可完成一个全局事务，这正是分布式数据库的优越之处

正确答案：C
A中的0LTP应用需要进行大量的并行事务，因此若采用共享内存结构会引起大量数据冲突；B中分布式数据库查询中，导致数据传输量大的原因主要是数据间的连接和并操作；D中分布式数据库因为不同的分片和副本，因此很多时候在一个场地完成提交不能完成全局事务，如虽完成某片数据更新，却并没有完成全局数据更新。

第3题：

数据处理系统是由( )所组成，并完成特定数据处理功能的系统。

A.设备

B.方法

C.过程

D.人

正确答案：ABCD

第4题：

安装中文操作系统和数据库时，需要将数据库的字符集设置为（）。

正确答案:ZHS16GBK

第5题：

以下哪个是Google提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?

A.Chubby

B.MapReduce

C.BigTable

D.GFS

参考答案：B

第6题：

在并行数据库中,需要将表拆分到不同的磁盘上。下列最适合整表扫描的拆分方式是( )。A.轮转法SX

在并行数据库中，需要将表拆分到不同的磁盘上。下列最适合整表扫描的拆分方式是（）。

A.轮转法

B.散列划分

C.范围划分

D.等值划分

正确答案：A
并行数据库常用的划分技术有轮转法、散列划分、范围划分。轮转法：对关系顺序扫描，将第i个元组存储到标号为Dimodn的磁盘上；该方式保证了元组在多个磁盘上均匀分布。散列划分：选定一个值域为{0，1，…，n－1}的散列函数，对关系中的元组基于划分属性进行散列。如果散列函数返回i，则将其存储到第i个磁盘。范围划分：该策按照关系中某个属性的取值范围将数据文件划分为几部分，分别存放到磁盘L。由此可见，轮转法最适合于扫描整个关系的应用，并在扫描时可以并行地从几个磁盘读取数据，负载平衡，充分发挥了并行性。

第7题：

数据处理系统是由()所组成并完成特定的数据处理功能的系统。

A.过程

B.方法

C.人

D.设备

正确答案：ABCD

第8题：

Apriori算法所面临的主要的挑战包括()。

A 会消耗大量的内存

B 会产生大量的候选项集

C 对候选项集的支持度计算非常繁琐

D 要对数据进行多次扫描

参考答案BCD

第9题：

能源互联网中大数据批量数据处理系统是针对批量数据的处理系统，一般适用于先存储后计算、实时性要求不高、数据准确性和全面性比较重要的场景。（）

答案：对

解析：

略

第10题：

MapReduce是一种编程模型，用于大规模数据集的并行运算，可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项？（）

A、实时性
B、高容错性
C、易于扩展
D、易于编程

正确答案:B,C,D

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合

题目

参考答案和解析

相似问题和答案

更多相关问题

相关内容