大数据期末复习题目汇总

最新推荐文章于 2026-04-19 05:07:38 发布

原创

最新推荐文章于 2026-04-19 05:07:38 发布 · 1.1w 阅读

·

17

·

这篇博客汇总了大数据期末复习的关键题目，涵盖了HDFS的数据存储、Block数量、Block Size、MapReduce任务调度、调度器策略、Client上传文件流程、Hadoop主节点启动确认、MapReduce不适合的运算、键值对接口实现、非结构化数据类型、HBase的BlockCache优化、数据存放方式、Region组成、首次查询流程以及Hive数据表设计技巧。此外，还涉及了Hadoop的随机读写支持、NameNode元数据管理、input split与Block的关系、MapReduce的适用场景、MapReduce计算过程中的Mapper和Reducer数量限制。博客内容还包括大数据技术特点、Hadoop系统启动顺序、HBase技术特点、Hive的HQL查询语句以及MapReduce编程模型设计思路。

1. 下面哪个程序负责 HDFS 数据存储。（C ）

A. NameNode B.Jobtracker

C. Datanode D. secondaryNameNode

2. HDFS 中的 block 默认保存几个备份。（ A ）

A. 3 份 B. 2 份

C. 1 份 D. 不确定

3. HDFS1.0 默认 Block Size大小是多少。（ B ）

A. 32MB B. 64MB

C. 128MB D. 256MB

4. 下面哪个进程负责 MapReduce 任务调度。（ B ）

A. NameNode B. Jobtracker

C. TaskTracker D. secondaryNameNode

5. Hadoop1.0默认的调度器策略是哪个。（A ）

A. 先进先出调度器 B. 计算能力调度器

C. 公平调度器 D. 优先级调度器

6. Client 端上传文件的时候下列哪项正确？（ B ）

A. 数据经过 NameNode 传递给 DataNode

B. Client 端将文件切分为 Block，依次上传

C. Client 只上传数据到一台 DataNode，然后由 NameNode 负责 Block 复制工作

D. 以上都不正确

7. 在实验集群的master节点使用jps命令查看进程时，终端出现以下哪项能说明Hadoop主节点启动成功？（ D ）

A. Namenode,Datanode, TaskTracker

B. Namenode,Datanode, secondaryNameNode

C. Namenode,Datanode, HMaster

D. Namenode,JobTracker, secondaryNameNode

8. 若不针对MapReduce编程模型中的key和value值进行特别设置，下列哪一项是MapReduce不适宜的运算。（ D ）

A. Max B. Min

C. Count D. Average

9. MapReduce编程模型，键值对<key, value>的key必须实现哪个接口？（ A ）

A.WritableComparable B. Comparable

C. Writable D. LongWritable

10. 以下哪一项属于非结构化数据。（C）

A. 企业ERP数据 B. 财务系统数据

C. 视频监控数据 D. 日志数据

11. HBase数据库的BlockCache缓存的数据块中，哪一项不一定能提高效率。（D ）

A. –ROOT-表 B. .META.表

C. HFile index D. 普通的数据块

12. HBase是分布式列式存储系统，记录按什么集中存放。（A ）

A. 列族 B. 列

C. 行 D. 不确定

13. HBase的Region组成中，必须要有以下哪一项。 &nbs

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。