Spark2.4.6单机模式安装文档

本文档详细介绍了如何在单机模式下安装Spark2.4.6,包括前置条件Scala的安装、Spark下载与解压、环境变量配置、配置文件修改以及启动Spark的步骤。

Spark2.4.6单机模式安装文档

前提:安装Scala

  1. 下载安装文件
wget -P /opt/ https://downloads.lightbend.com/scala/2.11.12/scala-2.11.12.tgz
  1. 解压缩
    将Scala解压缩到/opt目录下:

    tar zxvf /opt/scala-2.11.12.tgz -C /opt/

  2. 配置环境变量

    编辑 /etc/profile 文件
    vim /etc/profile

    声明SCALA_HOME
    export SCALA_HOME=/opt/scala-2.11.12

    将SCALA_HOME添加到PATH变量中
    exprot PATH=SCALAHOME/bin:SCALA_HOME/bin:SCALAHOME/bin:PATH…

    是本次配置生效
    source /etc/profile

  3. 检查是否配置成功
    在命令行中输入scala -version,如果正确显示版本信息,则说明上述配置成功。

    Scala code runner version 2.11.12 – Copyright 2002-2017, LAMP/EPFL

1. 获取安装文件

下载spark-2.4.6

wget -P /opt/ http://mirror.bit.edu.cn/apache/spark/spark-2.4.6/spark-2.4.6-bin-hadoop2.7.tgz

2. 解压缩Spark安装文件

将Spark解压缩到/opt目录下:

tar zxvf /home/download/spark-2.4.6-bin-hadoop2.7.tgz -C /opt/

系统默认使用“spark-2.4.6-bin-hadoop2.7”作为文件夹名称,该名称过长,后续配置时使用起来不方便,因此通过下面的命令将文件夹更名为“spark”:

mv /opt/spark-2.4.6-bin-hadoop2.7 /opt/spark

3. 配置系统环境变量

编辑/etc/profile文件
vim /etc/profile

声明SPARK_HOME
export SPARK_HOME=/opt/spark

将SPARK_HOME添加到PATH变量中
exprot PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH...

是本次配置生效
source /etc/profile

4. 配置Spark的配置文件

Spark的配置文件为spark-env.sh。安装文件中默认没有该文件,仅提供了一个该文件的模板文件。配置前,需要先复制模板文件,生成正式的配置文件。命令如下:

cd /opt/spark/conf
cp spark-env.sh.template spark-env.sh

对spark-env.sh文件进行编辑:

vim spark-env.sh

该文件中默认全部是注释的内容,所以可以直接在第一行开始添加必要的配置。这里添加2项配置:

export SPARK_LOCAL_IP=192.168.56.101
export SPARK_DIST_CLASSPATH=$(/opt/hadoop-2.8.5/bin/hadoop classpath)

其中第一项是配置Spark运行的主节点的IP地址,在当前情况下,就是Linux虚拟机的ip地址。第二项配置可以使Spark将数据存储在Hadoop的分步式文件系统HDFS中,也可以从HDFS中读取数据。

5. 启动Spark

Spark提供了一个在终端中运行的交互式执行环境,可以通过在Linux终端中输入spark-shell命令来开启。spark-shell为初学者提供了一个交互的环境,使用者输入一条语句,spark-shell会马上执行并返回结果,使用者可以立即看到语句的执行结果,而不用得到整个程序运行完毕。

spark-shell支持Scala和Python。使用spark-shell命令默认会进入Scala的交互式执行环境。如果要进入Python的交互式执行环境,则需要执行pyspark命令。
在Linux终端中输入spark-shell命令,默认以单机模式进入spark-shell交互执行环境,终端会进入“scala>”命令提示符状态。

Spark提供了一个简单的本地网站(http://192.168.56.101:4040/jobs/),供使用者直观的了解当前Spark计算任务的执行状态、Spark本身的运行环境等信息。启动Spark后,使用者可以使用谷歌浏览器访问该页面。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值