Spark Standalone单机模式环境搭建

本文档详细介绍了如何在CentOS7.5系统上搭建Spark 2.4.8的Standalone单机模式。首先确保安装了JDK1.8,然后在/tools目录下解压Spark安装包。接着配置环境变量,修改spark-env.sh,设置JAVA_HOME及Spark相关参数,修改slaves文件。创建必要目录并配置spark-defaults.conf启用日志记录。最后,启动Spark和历史服务,通过http://niit-master:8080和http://niit-master:18080分别访问Spark UI和历史服务。

Spark Standalone单机模式环境搭建

一、实验环境


  1. JDK版本:jdk1.8.0_171
  2. Spark版本:2.4.8,下载地址
  3. Linux操作系统:CentOS7.5

二、准备工作


  1. JDK安装,请参考《Hadoop2.7.3环境搭建之伪分布式
  2. Spark安装包已上传至目录/tools(需事先创建)

三、安装部署


  1. 解压安装:进入tools下,执行如下命令:
    tar -zxvf spark-2.4.8-bin-hadoop2.7.tgz -C /training/

    注意:由于Spark的脚本命令和Hadoop有冲突,只需在.bash_profile中设置一个即可(不能同时设置)

  2. 修改配置文件:spark-env.sh (事先不存在需要创建或者复制得到)

    export JAVA_HOME=/training/jdk1.8.0_171
    export SPARK_MASTER_HOST=niit-master
    export SPARK_MASTER_PORT=7077
    #history 配置历史服务
    export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=30 -Dspark.history.fs.logDirectory=/training/spark-2.4.8-bin-hadoop2.7/history"
    

    注意:history目录需要事先创建

  3. 修改slaves文件,将localhost改成主机名:niit-master

  4. 复制spark-defaults.conf.template为spark-defaults.conf,并添加如下内容

    spark.eventLog.enabled           true
    spark.eventLog.dir               /training/spark-2.4.8-bin-hadoop2.7/logs
    

    注意:logs目录需要事先创建

  5. 启动Spark:进入到安装目录下的sbin目录下,执行:
    ./start-all.sh

  6. 启动Spark历史服务:进入到安装目录下的sbin目录下,执行:
    start-history-server.sh

  7. 访问SparkUI:http://niit-master:8080
    在这里插入图片描述

  8. 访问Spark历史服务:http://niit-master:18080
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

安楠的数智笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值