如何搭建SGE

  • 一、安装前准备
  • 二、安装SGE
    • 2.1安装SGE Master
    • 2.2 Install execution daemon
  • 总结

一、安装前准备

1.确认所有机器的系统至少是redhat/centos 6.5以上,且完全安装。

2.确认是否所有需要加入compute farm的机器都配置了IP 地址和机器名, 并且所有机器都在同一个子网且互相可以通过机器名访问(ping 通)。

3.指定一台机器作为SGE master (以下简称 serverA), 在serverA上指定一个目录作为SGE_ROOT 目录,且该目录需要共享给其他机器访问, 假设SGE_ROOT 为/data/sge, 在serverA上共享该目录的步骤为:

  1. 编辑 /etc/exports 文件,加入一行:
/data/sge *(rw,sync,no_root_squash)
  1. reload export
[root@serverA~]# exportfs -r
  1. 重启NFS 服务
[root@serverA ~]# service nfs restart

4.其他每台机器 (简称serverX)上mount /data/sge ( 注意serverX机器上不可以有本地目录与/data 重名)

  1. 编辑/etc/fstab, 加入一行:
    serverA:/data/sge /data/sge nfs defaults 0 0
  2. 创建目录/data/sge
[root@serverX~]# mkdir -P /data/sge
  1. 手动mount /data/sge
[root@serverX~]# mount -a

5.确定将来使用SGE提交任务的用户账号是本地账号还是NIS,如果机器较多,建议使用NIS 来管理账号,这样避免在每台机器上重复创建账号,如果使用本地账号的话,需要在每台机器上创建账号 (参考useradd的用法),且账号的名字,UID以及home 目录必须相同。

6.准备SGE-8.1.9 的安装文件,参考下载地址: https://arc.liv.ac.uk/downloads/SGE/releases/8.1.9下载所有gridengine-*8.1.9-1.el6.x86_64.rpm
在https://opsx.alibaba.com/mirror 下载dependency package:

hwloc-1.5-3.el6_5.x86_64.rpm
hwloc-devel-1.5-3.el6_5.x86_64.rpm
jemalloc-3.6.0-1.el6.x86_64.rpm
lesstif-0.95.2-1.el6.x86_64.rpm
munge-libs-0.5.10-1.el6.x86_64.rpm
openmotif22-2.2.3-19.el6.x86_64.rpm
perl-XML-Simple-2.18-6.el6.noarch.rpm

到ServerA: /data/sge/.

二、安装SGE

2.1安装SGE Master

1.Root 登录ServerA, 首先安装步骤6中下载的所有dependency package

[root@serverA ~]#  cd  /data/sge
[root@serverA ~]# rpm -ivh    hwloc-1.5-3.el6_5.x86_64.rpm  jemalloc-3.6.0-1.el6.x86_64.rpm munge-libs-0.5.10-1.el6.x86_64.rpm perl-XML-Simple-2.18-6.el6.noarch.rpm

2.安装SGE master

[root@serverA ~]# setenv SGE_ROOT /data/sge
[root@serverA ~]# cd $SGE_ROOT
[root@serverA:/data/sge]% rpm -ivh  gridengine-8.1.9-1.el6.x86_64.rpm
[root@serverA: /data/sge]% rpm -iv gridengine-qmaster-8.1.9-1.el6.x86_64.rpm•press enter at the intro screen
•press "y" and then specify root as the user id
•leave the install dir as /data/sge •You will now be asked about port configuration for the master, normally you would choose the default (2) which uses the /etc/services file •accept the sge_qmaster info •You will now be asked about port configuration for the master, normally you would choose the default accept the sge_execd info
•leave the cell name as "default"
•Enter an appropriate cluster name when requested
•leave the spool dir as is
•press "n" for no windows hosts!
•press "y" (permissions are set correctly)
•press "y" for all hosts in one domain
•If you have Java available on your Qmaster and wish to use SGE Inspect or SDM then enable the JMX MBean server and provide the requested information - probably answer "n" at this point!
•press enter to accept the directory creation notification •enter "classic" for classic spooling •press enter to accept the next notice
•enter "20000-20100" as the GID range (increase this range if you have execution nodes capable of running more than 100 concurrent jobs)
•accept the default spool dir or specify a different folder (for example if you wish to use a shared or local folder outside of SGE_ROOT •enter an email address that will be sent problem reports
•press "n" to refuse to change the parameters you have just configured
•press enter to accept the next notice
•press "y" to install the startup scripts
•press enter twice to confirm the following messages
•press "n" for a file with a list of hosts
•enter the names of your hosts who will be able to administer and submit jobs (enter alone to finish adding hosts)
•skip shadow hosts for now (press "n")
•choose "1" for normal configuration and agree with "y"
•press enter to accept the next message and "n" to refuse to see the previous screen again and then finally enter to exit the installer

3.将sgemaster service 设置为开机自动启动

[root@serverA:/data/sge]% chkconfig sgemaster.$SGE_CLUSTER_NAME on

4.检查sgemaster 进程是否正在运行,如果没有手动启动:

[root@serverA:/data/sge]% /etc/init.d/sgemaster.$SGE_CLUSTER_NAME start

2.2 Install execution daemon

  1. Root login serverX
[root@serverX ~]# setenv SGE_ROOT /data/sge
[root@serverX ~]# cd $SGE_ROOT
[root@serverX:/data/sge]% rpm -iv gridengine-execd-8.1.9-1.el6.x86_64.rpm    (全部默认选项安装完成)
  1. 设置sgeexecd 自动启动
[root@serverX:/data/sge]% /etc/init.d/sgeexecd.$SGE_CLUSTER_NAME start

总结

更多关于SGE 的配置以及使用请参考: http://www.softpanorama.org/HPC/Grid_engine/Implementations/Son_of_grid_engine/installation_of_soge818_rpms_for_master_host.shtml

LSF---【如何搭建SGE】相关推荐

  1. Node搭建静态资源服务器时后缀名与响应头映射关系的Json文件

    场景 使用Node搭建一个静态资源服务器,使其根据请求不同的文件类型设置不同的响应头. 比如: ".png":"image/png" , ".png& ...

  2. Nodejs中搭建一个静态Web服务器,通过读取文件获取响应类型

    场景 Web服务器一般指网站服务器,是指驻留于因特网上某种类型计算机的程序,可以向浏览器等Web客户端提供文档,也可以放置网站文件让全世界浏览,还可以放置数据文件,让全世界下载.目前最主流的Web服务 ...

  3. SGE:作业调度系统安装和使用简要说明

    主要有三部分: 安装:服务器端搭建,一般服务端只需要搭一次 配置:服务端和节点,后续主要是新增节点才需配置 使用:一般使用者可以忽略前两个,直接看使用说明 安装  一些参考网站 http://lino ...

  4. IBM-LSF-社区版搭建记录

    节点  master        ip 10.4.7.139 node01        ip 10.4.7.140 node02        ip 10.4.7.141 1 安装前准备(所有节点 ...

  5. 使用AFS, Active Directory和SSSD搭建用于集成电路设计的分布式存储系统 【一】

    使用AFS, Active Directory和SSSD搭建用于集成电路设计的分布式存储系统 [一] 集成电路设计环境需要怎样的存储系统? 共享性 位置无关(路径透明) 安全性 可靠性 可伸缩性 易用 ...

  6. Node.js(一)——(Node.js安装及使用,通过Node.js搭建服务器,模块化及自定义模块,npm/yarn/nvm,内置模块fs的使用,buffer及stream,新闻列表案例)

    目录 1.Node.js介绍 2.安装Node.js 3.使用Node.js实现第一个服务器 3.1初步感受Node.js 3.2Google Chrome 默认非安全端口列表,尽量避免以下端口. 3 ...

  7. 集群-大规模Linux集群部署-MPI集群搭建与MPI编程

    一.集群的概念及其相关技术 集群计算机是指利用高速通信网络将一组高档工作站或PC按某种结构连接起来,在并行程序设计甚至可视化人机交互集成开发环境支持下,统一调度,协调处理,实现高效并行处理的系统,利用 ...

  8. 实验室服务器系统,科学网—实验室服务器平台搭建流水记 - 李俏俊的博文

    因为各种原因我和实验室一位同学决定把实验室的服务器全部重新安装一边,本以为这个不是一个很困难的事情,但是却发生了许多意想不到的困难. --------- 1 服务器的安装(Linux版本的选择) 鉴于 ...

  9. 正式压力测试:locust进阶,超简单搭建生产级locust集群

    locust进阶,搭建生产级locust集群 本教程基于k8s集群搭建,使用helm作为包管理工具 通过helm安装locust

  10. 使用Docker搭建svn服务器教程

    使用Docker搭建svn服务器教程 svn简介 SVN是Subversion的简称,是一个开放源代码的版本控制系统,相较于RCS.CVS,它采用了分支管理系统,它的设计目标就是取代CVS.互联网上很 ...

最新文章

  1. 原创 | 疫情之下,这些数字经济赛道危中有机
  2. 蒸汽机器人布里茨天赋_LoL蒸汽机器人符文天赋_S10机器人辅助出装
  3. Magical Sticks 棍子拼接
  4. NGINX 配置超时时间
  5. mysql语言中有什么运算_SQL知识点,新手感悟
  6. 一篇文章搞懂前端学习方法与构建知识体系,怎么做自己的职业规划
  7. 区块链开发指南_区块链开发完全指南
  8. zabbix mysql安装配置_Zabbix安装图解教程 | 系统运维
  9. Netgear WNR2000v3刷固件记
  10. 计算机无本地安全策略,如何打开本地安全策略、如何解决“未授予用户在此计算机上的请求登录类型”...
  11. 计算机蜂鸣无法开机,计算机开机后会时常出现3声蜂鸣是什么原因
  12. 【电脑配置知识】处理器 CPU
  13. 全球多地爆发!传染性极强!鄂尔多斯人近期外出一定要注意…
  14. matplotlib绘图教程
  15. 世峰与深圳供电局就电力发展历史虚拟现实培训系统项目展开合作
  16. jQuery动画实现、each迭代器、自定义动画、json简介
  17. wow_32_64 汇编调试器/注入器/汇编指令书写神器 V1.7
  18. 为什么你的抖音号涨粉慢,粉丝上不去的关键原因
  19. 朗诵素材-《少年正是读书时》(两角色主持朗诵)
  20. 快速更新android sd卡,如何修复损坏的Android SD卡和SD卡恢复[2020更新]

热门文章

  1. 谷歌搜索语法(一)基本语法
  2. ----实现查看历史记录及清除功能的具体过程----
  3. 小程序悬浮按钮可拖动自动靠边
  4. 抗饱和积分器 matlab,抗积分饱和
  5. 03-Kubernetes中的Deployment
  6. 两篇关于区块链的最新综述论文被 IEEE ACCESS 接收
  7. git仓库创建及上传
  8. android钟表,Android打造属于自己的时间钟表
  9. 笔记本升级--老华硕的升级之路
  10. Oracle导出FSG,SQL语句 - FSG行集、列集定义导出