极客技术博客
Toggle Menu
主页
在线C语言编译器
教程
Java 教程
Linux 教程
Python 算法教程
博客
博客列表
Big Data and Distributed Systems
研究 MapReduce CAP 定理 一致性模型 数据分区 以及分布式存储系统
1. 大数据的3V特性中,除了Volume(容量)和Velocity(速度)之外,第三个V是什么?
Variety(多样性)
Veracity(真实性)
Value(价值)
Viscosity(粘性)
2. 在HDFS(Hadoop分布式文件系统)中,NameNode的主要作用是什么?
存储实际数据块
管理文件系统的元数据
执行MapReduce计算任务
处理节点间的网络分区
3. 以下哪些属于Hadoop生态系统的组件?(选择所有适用项)
HDFS
MapReduce
Spark
Kafka
MySQL
4. Spark比MapReduce处理速度更快,主要原因是Spark主要在内存中处理数据。
True
False
5. HDFS的全称是什么?
6. CAP定理指出分布式系统无法同时保证三个特性,以下哪项不属于CAP定理的三个特性?
Consistency(一致性)
Availability(可用性)
Partition Tolerance(分区容错性)
Performance(性能)
7. MongoDB属于哪种类型的NoSQL数据库?
列族数据库
文档型数据库
键值数据库
图数据库
8. 以下哪些是分布式系统中常用的共识算法?(选择所有适用项)
Paxos
Raft
MapReduce
Two-Phase Commit(两阶段提交)
Kafka
9. HDFS的设计目标之一是支持低延迟的数据访问。
True
False
10. Hadoop 2中引入的集群资源管理器,用于替代JobTracker的组件名称(缩写)是什么?
11. Hadoop MapReduce的主要编程语言是什么?
Java
Python
Scala
C++
12. Spark中用于实时流数据处理的组件是什么?
Spark Core
Spark SQL
Spark Streaming
Spark MLlib
13. 除了传统的3V之外,大数据的扩展特性还包括哪些?(选择所有适用项)
Veracity(真实性)
Value(价值)
Variability(可变性)
Velocity(速度)
14. 在分布式系统中,'分区容错性(Partition Tolerance)'指的是系统能够处理节点间的网络故障。
True
False
15. 在分布式系统中,将数据分散存储在多个节点以提高性能和可扩展性的过程称为什么?(英文术语)
16. Redis是哪种类型的NoSQL数据库?
列族数据库
文档型数据库
键值数据库
图数据库
17. 以下哪些是MapReduce编程模型的特点?(选择所有适用项)
分而治之(Divide and Conquer)
内存中处理所有数据
容错性
批处理
实时分析
18. Kafka主要用于实时流处理和消息代理(Message Broker)。
True
False
19. 数据库中的SQL的全称是什么?
20. Spark中用于机器学习的组件是什么?
Spark Streaming
Spark MLlib
Spark SQL
Spark Core
Reset
Answered 0 of 0 — 0 correct