Spark Install

本文详细介绍了Spark的安装过程,包括单机安装、Standalone模式集群配置和高可用(HA)设置,涉及到环境变量配置、文件同步、启动脚本修改等步骤,并提供了各个阶段的WebUI检查点。

1. Spark install 01

   1.1下载spark-2.4.4-bin-hadoop2.7.tgz
   1.2.解压 tar -zxvf spark-2.4.4-bin-hadoop2.7.tgz 

   1.3. mv /download/spark-2.4.4-bin-hadoop2.7 /soft

   1.4. ln -s spark-2.4.4-bin-hadoop2.7 spark

   1.5. 环境变量
        [/etc/profile]
        SPARK_HOME=/soft/spark
        PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
1.6.刷新变量
        $>source /etc/profile

1.7. 验证spark        
        $>cd /soft/spark
        $>./spark-shell

 1.8.webui
        http://IP :4040/

 

2. Spark Standalone Install

2.1 主机s101为master, S102, S103, S104为slave.

2.2 如以上的1.1--1.6在各主机上安装spark.

2.3 在/soft/spark/conf上执行如下设定:

ln -s /soft/hadoop/etc/hadoop/core-site.xml core-site.xml
ln -s /soft/hadoop/etc/hadoop/hdfs-site.xml hdfs-site.xml

2.4 在/soft/spark/conf中修改slaves:

s102

s103

s104

 

2.5在/soft/spark/conf中修改spark-en.sh

export JAVA_HOME=/soft/jdk

export SPARK_MASTER_IP=S101

export SPARK_MASTER_PORT=7077

 

2.6把slaves和spark-en.sh分发到其它主机

 

2.7 启动集群

>/soft/hadoop/sbin/start-dfs.sh

>/soft/spark/sbin/start-all.sh

 

2.8查看webui

   http://s101:8080

 

3. Spark HA(zookeeper)安裝

3.1 s101为master, s102,s103,s104为worker, s105为standby

3.2 s101,s102,s103为zookeeper

3.3 针对以上2.5, 把spark-en.sh中的SPARK_MASTER_IP删除,并添加如下:

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=s101,s102,s103 -Dspark.deploy.zookeeper.dir=/spark"

3.4 把更新后的spark-en.sh分发给各主机, 且把slaves分发给s105

3.5 在s101的/soft/spark/sbin上执行./start-all.sh

3.6在s105的/soft/spark/sbin上执行./start-master.sh

3.7在s101和s105上连接web,如:http://s101:8080, http://s105:8080

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值