Spark Install

最新推荐文章于 2025-04-25 11:00:44 发布

原创最新推荐文章于 2025-04-25 11:00:44 发布 · 447 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Hadoop 专栏收录该内容

10 篇文章

订阅专栏

本文详细介绍了Spark的安装过程，包括单机安装、Standalone模式集群配置和高可用（HA）设置，涉及到环境变量配置、文件同步、启动脚本修改等步骤，并提供了各个阶段的WebUI检查点。

1. Spark install 01

1.1下载spark-2.4.4-bin-hadoop2.7.tgz
1.2.解压 tar -zxvf spark-2.4.4-bin-hadoop2.7.tgz

1.3. mv /download/spark-2.4.4-bin-hadoop2.7 /soft

1.4. ln -s spark-2.4.4-bin-hadoop2.7 spark

1.5. 环境变量
       [/etc/profile]
       SPARK_HOME=/soft/spark
       PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
1.6.刷新变量
       $>source /etc/profile

1.7. 验证spark
       $>cd /soft/spark
       $>./spark-shell

1.8.webui
http://IP :4040/

2. Spark Standalone Install

2.1 主机s101为master, S102, S103, S104为slave.

2.2 如以上的1.1--1.6在各主机上安装spark.

2.3 在/soft/spark/conf上执行如下设定：

ln -s /soft/hadoop/etc/hadoop/core-site.xml core-site.xml
ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml hdfs-site.xml

2.4 在/soft/spark/conf中修改slaves:

s102

s103

s104

2.5在/soft/spark/conf中修改spark-en.sh

export JAVA_HOME=/soft/jdk

export SPARK_MASTER_IP=S101

export SPARK_MASTER_PORT=7077

2.6把slaves和spark-en.sh分发到其它主机

2.7 启动集群

>/soft/hadoop/sbin/start-dfs.sh

>/soft/spark/sbin/start-all.sh

2.8查看webui

http://s101:8080

3. Spark HA（zookeeper)安裝

3.1 s101为master, s102,s103,s104为worker, s105为standby

3.2 s101,s102,s103为zookeeper

3.3 针对以上2.5，把spark-en.sh中的SPARK_MASTER_IP删除，并添加如下：

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=s101,s102,s103 -Dspark.deploy.zookeeper.dir=/spark"

3.4 把更新后的spark-en.sh分发给各主机, 且把slaves分发给s105

3.5 在s101的/soft/spark/sbin上执行./start-all.sh

3.6在s105的/soft/spark/sbin上执行./start-master.sh

3.7在s101和s105上连接web，如:http://s101:8080, http://s105:8080

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。