一、MapReduce定义
MapReduce 是一个分布式运行程序的编程框架,是用户开发“基于Hadoop的数据分析应用” 的核心框架
MapReduce的核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上
二、MapReduce优缺点
优点:
- MapReduce易于编程 它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量廉价的PC机器上运行。也就是说你写一个分布式程序,跟写一 个简单的串行程序是一模一样的。就是因为这个特点使得MapReduce编程变得 非常流行
本文详细介绍了Hadoop MapReduce的核心概念、优缺点,包括其分布式运行程序的框架特性、高容错性和扩展性。同时,通过WordCount示例展示了MapReduce的运行流程,并解释了如何在YARN上部署和运行MapReduce作业。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



