()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。
第1题:
A.字段
B.文档
C.数据库
D.记录
第2题:
下列关于分布式数据库和并行数据库的说法,正确的是( )。
A.为了满足高并发业务的需要,共享内存结构的并行数据库比较适用于如银行出纳、民航售票等OLTP应用
B.在分布式数据库的查询中,导致数据传输量大的主要原因是数据间的连接操作和选择操作
C.如果数据分布不合理,并行数据库仅仅依靠多处理器、共享硬件资源等手段是无法实现真正意义上的并行处理的,也无法使其性能最优化
D.与集中式数据库系统的事务相比,分布式数据库系统中只需要一个场地完成提交即可完成一个全局事务,这正是分布式数据库的优越之处
第3题:
数据处理系统是由( )所组成,并完成特定数据处理功能的系统。
A.设备
B.方法
C.过程
D.人
第4题:
安装中文操作系统和数据库时,需要将数据库的字符集设置为()。
第5题:
A.Chubby
B.MapReduce
C.BigTable
D.GFS
第6题:
在并行数据库中,需要将表拆分到不同的磁盘上。下列最适合整表扫描的拆分方式是( )。
A.轮转法
B.散列划分
C.范围划分
D.等值划分
第7题:
数据处理系统是由()所组成并完成特定的数据处理功能的系统。
A.过程
B.方法
C.人
D.设备
第8题:
Apriori算法所面临的主要的挑战包括()。
A 会消耗大量的内存
B 会产生大量的候选项集
C 对候选项集的支持度计算非常繁琐
D 要对数据进行多次扫描
第9题:
第10题:
MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()