欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

spark独立模式部署(Standalone)

时间:2023-05-12

系列文章:
第一章 Hadoop集群搭建的准备
第二章 Hadoop集群搭建
第三章 Zookeeper分布式集群部署(2n+1台虚拟机)
第四章 Hadoop高可用集群搭建(HA)
待更新
第九章 spark独立模式部署(Standalone)
第十章 spark配置历史服务
第十一章 搭建Spark高可用(HA)
待更新


文章目录

一、下载安装包二、上传安装包,并解压至/export/servers目录下三、修改配置文件(先进入spark-3.1.2的conf目录)

1、修改slaves文件,执行以下操作。2、修改spark-env.sh文件,执行以下操作。3、将配置好后的spark-3.1.2安装包分发到其他虚拟机。4、启动集群(hadoop和spark)。5、提交应用测试集群。


一、下载安装包

   清华镜像下载连接:https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.1.2/

二、上传安装包,并解压至/export/servers目录下

   进入/export/sofware/目录,用rz命令上传spark压缩包至虚拟机的/export/sofware/目录下。
   解压至/export/servers目录下:

tar -zxvf spark-3.1.2 -C /export/servers

三、修改配置文件(先进入spark-3.1.2的conf目录) 1、修改slaves文件,执行以下操作。

mv slaves_template slavesvim slaves

   添加以下内容:

#work节点node1node2node3

2、修改spark-env.sh文件,执行以下操作。

mv spark-env.sh.template spark-env.shvim spark-env.sh

   添加以下内容:

#添加JAVA_HOME环境变量和集群对应的master节点export JAVA_HOME=/export/servers/jdk1.8.0SPARK_MASTER_HOST=node1SPARK_MASTER_PORT=7077

注意:7077端口相当于Hadoop的内部通信的9000端口,此处的端口需要确认自己的Hadoop配置

3、将配置好后的spark-3.1.2安装包分发到其他虚拟机。

scp -r /export/servers/spark-3.1.2 node2:/export/serversscp -r /export/servers/spark-3.1.2 node3:/export/servers

4、启动集群(hadoop和spark)。

   进入/export/servers/spark-3.1.2目录,执行以下命令:

#hadoopstart-all.sh#sparksbin/start-all.sh

   查看Master资源监控Web UI界面,浏览器地址栏输入:http://node1:8080或http://192.168.1.134:8080
(Master的IP地址和端口号)

5、提交应用测试集群。

bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://node1:7077 ./examples/jars/spark-examples_2.12-3.1.2.jar 10

–class 表示要执行程序的主类。–master spark://node1:7077 表示独立部署模式,spark运行的环境。./examples/jars/spark-examples_2.12-3.1.2.jar 是运行类的jar包。数字10 表示命令行参数(程序的入口参数),这里用于设定当前的任务数量。

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。