Big Data and Distributed Systems

研究 MapReduce CAP 定理 一致性模型 数据分区 以及分布式存储系统

1. 大数据的3V特性中,除了Volume(容量)和Velocity(速度)之外,第三个V是什么?
2. 在HDFS(Hadoop分布式文件系统)中,NameNode的主要作用是什么?
3. 以下哪些属于Hadoop生态系统的组件?(选择所有适用项)
4. Spark比MapReduce处理速度更快,主要原因是Spark主要在内存中处理数据。
5. HDFS的全称是什么?
6. CAP定理指出分布式系统无法同时保证三个特性,以下哪项不属于CAP定理的三个特性?
7. MongoDB属于哪种类型的NoSQL数据库?
8. 以下哪些是分布式系统中常用的共识算法?(选择所有适用项)
9. HDFS的设计目标之一是支持低延迟的数据访问。
10. Hadoop 2中引入的集群资源管理器,用于替代JobTracker的组件名称(缩写)是什么?
11. Hadoop MapReduce的主要编程语言是什么?
12. Spark中用于实时流数据处理的组件是什么?
13. 除了传统的3V之外,大数据的扩展特性还包括哪些?(选择所有适用项)
14. 在分布式系统中,'分区容错性(Partition Tolerance)'指的是系统能够处理节点间的网络故障。
15. 在分布式系统中,将数据分散存储在多个节点以提高性能和可扩展性的过程称为什么?(英文术语)
16. Redis是哪种类型的NoSQL数据库?
17. 以下哪些是MapReduce编程模型的特点?(选择所有适用项)
18. Kafka主要用于实时流处理和消息代理(Message Broker)。
19. 数据库中的SQL的全称是什么?
20. Spark中用于机器学习的组件是什么?
Answered 0 of 0 — 0 correct