前言
大三开始,开设了Hadoop课(早就想跃跃欲试入大数据坑了?)。
起步学Hadoop?,Hadoop的搭建真是个坑。有三种搭建方式/运行模式,单机(不能用HDFS,这算个啥)、伪分布式(大四秋招出去面试,整个这会中?)、全分布式。OK,就是这个全分布模式了,但这也是最近遇到的的痛点。
首先,说服室友咱们别完玩LOL/NBA2K/守望先锋/斗鱼直播电脑上都同时安个Hadoop,我master,你们slave开整吧这是不可能的。所以,只能安个虚拟机Vmware/VirtualBox(无论你系统Win10还是Linux),然后安3+个linux,配好Hadoop。可鸡肋地是这样整,在虚拟机里操作起来太卡了,想想在虚拟机里的IDE里写长短长短的java代码,体验贼差。
所以,我就想寻思,看能不能找点更好的方法。
Docker,我google到了这个方法,准备试试。如果可行,我就把方案详细的整理出来,供大家参考。
Hadoop? in Docker?,参考索引
基于Docker搭建Hadoop集群之升级版 :https://kiwenlau.com/2016/06/12/160612-hadoop-cluster-docker-update/
Docker安装Hadoop : https://www.cnblogs.com/qingyunzong/p/9015603.html
Docker快速入门1 :

本文详细介绍了如何在Docker环境下搭建Hadoop全分布式集群,避免了虚拟机带来的卡顿问题。作者分享了自己的搭建过程,包括参考资源、所需注意事项及具体步骤,特别提到了Docker Desktop在Windows 10 Pro或企业版上的运行要求,并推荐使用Windows Terminal进行多标签终端操作。
2万+

被折叠的 条评论
为什么被折叠?



