CentOS8系统安装LSF集群管理软件

该文详细介绍了在RedHat8.3环境下如何安装和配置LSF(LoadSharingFacility)分布式集群管理系统,包括设置节点间无密码访问,配置NFS共享存储,上传和解压软件包,修改配置文件,以及处理libnsl.so.1缺失的错误问题。

一、什么是LSF?

        LSF(Load Sharing Facility)是IBM旗下的一款分布式集群管理系统软件,负责计算资源的管理和批处理作业的调度。常用的分布式集群管理系统软件有PBS、SLURM、LSF。

二、安装环境(虚拟机)

主机名

IP地址

操作系统

类型

admin(管理节点)

192.168.10.10

redhat8.3

虚拟机

node1(计算节点)

192.168.10.11

redhat8.3

虚拟机

三、配置节点间无密码访问

[root@admin ~]# ssh-key

[root@admin ~]# ssh-copy-id -i root@192.168.10.10

[root@admin ~]# ssh-copy-id -i root@192.168.10.11

四、编辑hosts文件

[root@admin ~]# vim /etc/hosts

[root@admin ~]# scp /etc/hosts root@192.168.10.11:/etc/hosts

五、配置共享存储

[root@admin ~]# rpm -ivh nfs-utils-2.3.3-35.el8.x86_64.rpm

warning: nfs-utils-2.3.3-35.el8.x86_64.rpm: Header V3 RSA/SHA256 Signature, key ID fd431d51: NOKEY

Verifying...                          ################################# [100%]

Preparing...                          ################################# [100%]

package nfs-utils-1:2.3.3-35.el8.x86_64 is already installed

[root@admin ~]# cat /etc/exports

/data 192.168.10.0/24(rw,no_root_squash)

[root@admin ~]# systemctl restart rpcbind

[root@admin ~]# systemctl restart nfs-server

[root@node1 ~]# mount -t nfs 192.168.10.10:/data /data/

[root@admin ~]# mkdir -p /data/software

[root@admin ~]# mkdir -p /data/packages

六、上传软件包

[root@admin ~]# mv lsfsce10.2.0.6-x86_64.tar.gz /data/packages/

[root@admin ~]# cd /data/packages/

[root@admin packages]# ls

lsfsce10.2.0.6-x86_64.tar.gz

[root@admin packages]# tar -xf lsfsce10.2.0.6-x86_64.tar.gz

[root@admin packages]# ls

lsfsce10.2.0.6-x86_64  lsfsce10.2.0.6-x86_64.tar.gz

[root@admin packages]# cd lsfsce10.2.0.6-x86_64/

[root@admin lsfsce10.2.0.6-x86_64]# ls

lsf  pac  pmpi

[root@admin lsfsce10.2.0.6-x86_64]# cd lsf/

[root@admin lsf]# ls

lsf10.1_linux2.6-glibc2.3-x86_64.tar.Z  lsf10.1_lsfinstall_linux_x86_64.tar.Z

[root@admin lsf]# tar -xf lsf10.1_lsfinstall_linux_x86_64.tar.Z lsf10.1_lsfinstall/

六、修改配置文件

[root@admin lsf10.1_lsfinstall]# vim install.config

[root@admin lsf10.1_lsfinstall]# cat install.config | grep -v "#"

LSF_TOP="/data/software/lsf"

LSF_ADMINS="huchh"

LSF_CLUSTER_NAME="lsf_cluster"

LSF_MASTER_LIST="admin"

LSF_TARDIR="/data/packages/lsfsce10.2.0.6-x86_64/lsf"

CONFIGURATION_TEMPLATE="DEFAULT"

LSF_ADD_SERVERS="node1"

LSF_ADD_CLIENTS="admin node1"

、安装LSF

[root@admin lsf10.1_lsfinstall]# ./lsfinstall -f install.config

 八、修改LSF配置文件

[root@admin ~]# vim /data/software/lsf/conf/lsf.conf

LSF_RSH="ssh"

九、加载LSF环境变量

[root@admin ~]# source /data/software/lsf/conf/profile.lsf
十、所有节点启动守护进程

[root@admin ~]# /data/software/lsf/10.1/install/hostsetup --top="/data/software/lsf" --boot="y"

[root@node1 ~]# /data/software/lsf/10.1/install/hostsetup --top="/data/software/lsf" --boot="y"

 十一、管理节点启动集群

[root@admin ~]# lsfstartup

十二、检查节点状态

[root@admin ~]# lsid

[root@admin ~]# lsload

[root@admin ~]# lshosts

十三、报错

报错:libnsl.so.1无法加载

 解决办法:

[root@admin ~]# rpm -ivh glibc-2.28-127.el8.x86_64.rpm

[root@admin ~]# rpm -ivh libnsl-2.28-127.el8.x86_64.rpm

 

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LonelyLinguist

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值