节点状态查看

命令:

sinfo


说明:

PARRITION:节点所在分区
AVAIL:分区状态,up 标识可用,down 标识不可用
TIMELIMIT:程序运行最大时长,infinite 表示不限制,如果限制格式为 days-houres:minutes:seconds
NODES:节点数
NODELIST:节点名列表
STATE:节点状态,可能的状态包括:allocated、alloc :已分配
completing、comp:完成中
down:宕机
drained、drain:已失去活力
fail:失效
idle:空闲
mixed:混合,节点在运行作业,但有些空闲 CPU 核,可接受新作业
reserved、resv:资源预留
unknown、unk:未知原因
如果状态带有后缀 *,表示节点没有响应

节点信息查看

命令:

scontrol show node


说明:

NodeName 节点名称
Arch    系统架构
CoresPerSocket
CPUAlloc    分配给的 CPU 核数
CPUErr  出错的 CPU 核数
CPUTot  总的 CPU 核数
CPULoad CPU 负载
AvailableFeatures   可用特性
ActiveFeatures  激活的特性
Gres    通用资源
NodeAddr    节点 IP 地址
NodeHostName    节点名
Version SLURM 版本
OS  操作系统
RealMemory  实际的物理内存,单位 GB
AllocMem    已分配的内存,单位 GB
FreeMem 可用内存,单位 GB
Sockets
Boards  主板数
State   节点状态
ThreadsPerCore  CPU 线程数
TmpDisk 临时硬盘存储大小
Weight  权重
Owner
MCS_label
Partitions
BootTime    开机实际
SlurmdStartTime SLURM 守护进程启动时间
CfgTRES
AllocTRES
CapWatts
CurrentWatts
LowestJoules
ConsumedJoules
ExtSensorsJoules
ExtSensorsWatts
ExtSensorsTemp
Reason

节点状态值

可能的状态包括:

allocated(alloc), completing(comp), down(down), drained(drain), draining(drng), fail(fail), failing(failg), future(futr), idle(idle), maint(maint), mixed(mix), perfctrs(npc), power_down(pow_dn), power_up(pow_up), reserved, and unknown(unk)。

请注意,后缀 “*” 标识当前未响应的节点。

idle   表示节点处于空闲状态alloc  表示节点所有 CPU 都被占用,新提交的作业将排队。drain 出现这个状态时,不影响正在运行的作业,但是不接受新的作业调度,可以使用命令 sinfo –R 打印节点不正常的状态产生原因节点状态值.png
mix  节点具有分配 CPU 的作业,而其他的 CPU 状态是 IDLE,新提交的作业继续运行unk  Slurm 控制器刚刚启动,节点的状态尚未确定。down 故障节点不可用。

分区信息查看

命令:

show partition


说明:

DisableRootJobs: 不允许 root 提交作业
Maxtime:最大运行时间
LLN:是否按最小负载节点调度
Maxnodes:最大节点数
Hidden:是否为隐藏分区
Default:是否为默认分区
OverSubscribe:是否允许超时
ExclusiveUser:排除的用户

作业信息查看

命令:

squeue


说明:

JOBID:作业号
PARITION:分区名
NAME:作业名
USER:用户名
ST:状态,常见的状态包括:PD、Q:排队中 ,PENDING
R:运行中 ,RUNNING
CA:已取消,CANCELLED
CG:完成中,COMPLETIONG
F:已失败,FAILED
TO:超时,TIMEOUT
NF:节点失效,NODE FAILURE
CD:已完成,COMPLETED

slurm节点,分区,作业信息说明相关推荐

  1. C语言总结项目和入门大作业——信息管理系统(多文件版)

    文章目录 八. C语言入门大作业--信息管理系统(多文件版) 一. 功能模块的划分: 二. 多文件的编写 三. 基本函数的实现(重点) 四.文件操作函数 五.函数的辅助函数 六.多文件编程和联系 七. ...

  2. 【Groovy】自定义 Xml 生成器 BuilderSupport ( 创建 XmlNode 节点 | 管理 XmlNode 节点并将根节点转为 Xml 信息 | 完整代码示例 )

    文章目录 一.创建 XmlNode 节点 二.管理 XmlNode 节点并将根节点转为 Xml 信息 三.完整代码示例 1.自定义 Xml 生成器 MyBuilderSupport 2.Xml 节点封 ...

  3. 藏在表分区统计信息背后的小秘密

    藏在表分区统计信息背后的小秘密 藏在表分区统计信息背后的小秘密 原创 2017-09-19 曾令军 数据和云 云和恩墨技术专家,8年数据库运维经验.思维敏捷,擅长于数据库开发.解决棘手的数据库故障和性 ...

  4. 获取硬盘和卷或分区相关信息(容量,ID,卷标名字等)

    1.枚举所有硬盘 这里主要借助了setup API,这些API主要是NT4.0之后提供的一些用于操作设备的API. 枚举所有硬盘借助了SetupDiGetClassDevs与SetupDiEnumDe ...

  5. linux节点状态 slurm,linux – 为什么slurm中的作业在TensorFlow脚本中无限期冻结?

    我使用slurm( http://slurm.schedmd.com/)工作负载管理器时遇到此错误.当我运行一些tensorflow python脚本时,有时会导致错误(附加).它似乎无法找到安装的c ...

  6. Slurm查看作业信息

    查看running job 资源信息 $ sstat -a --format="JobId,Pids,AveCPU,AveRSS,MaxRSS" jobID sacct 查看FIN ...

  7. SLURM 节点状态总是drained问题

    问题描述 新装的 SLURM 集群在运行了一些作业并修改一些配置项目以后,用sinfo查看信息的时候看到部分节点状态总是 drained ,但是在这个节点上并没有作业在运行,重启 slurm 服务问题 ...

  8. 无法从elasticsearch节点检索版本信息_【Elasticsearch 7 搜索之路】(一)什么是 Elasticsearch?...

    本篇文章对 Elasticsearch 做了基本介绍,在后续将通过专栏的方式持续更新,本系列以 Elasticsearch7 作为主要的讲解版本,欢迎各位大佬指正,共同学习进步涨工资! 一般涉及大型数 ...

  9. python第三周测试_第三周作业 - 作业 - 信息与计算17数31SWE - 班级博客 - 博客园...

    格式要求 请大家在作业开头添加格式描述,仿照如下 这个作业要求在哪里 我在这个课程的目标是 此作业在哪个具体方面帮我实现目标 其他参考文献 作业正文 博客作业可以给出链接 正文 ........... ...

最新文章

  1. 吴恩达团队:神经网络如何正确初始化?
  2. getDimension/getDimensionPixelSize/getDimensionPixelOffset()
  3. 您如何计算字符串中字符串(实际上是字符)的出现?
  4. 零基础可以学python吗-python零基础能学吗
  5. 聊一聊Android 6.0的运行时权限
  6. Excel单样本T检验
  7. c++小项目_编程初学者的练手小项目(Pythonamp;C/C++)
  8. java调用qq接口_用java代码怎么去请求腾讯接口并返回值
  9. Visual Studio 2010 SDK
  10. 如何使用Restic Backup Client将数据备份到对象存储服务
  11. 工厂三兄弟之简单工厂模式(三)
  12. DATAGEAR统计报表简单教学
  13. 救ANGEL出监狱BFS
  14. FileDownload文件的下载
  15. Realsense相机在linux下的配置使用,RGB与depth图像对齐
  16. html加载富文本_HTML基础
  17. 短视频脚本怎么写?6个套路
  18. 一键录屏神器——Captura
  19. stm32实现毫秒ms微秒us级延时
  20. python程序设计从基础到开发课后题答案夏敏捷_[转载] python程序设计应用教程夏敏捷答案第八章_Python程序设计:从基础到开发...

热门文章

  1. 一首献给所有程序员的诗歌——个人原创
  2. URL正则校验以及邮箱正则校验
  3. Vue路由快照实现思路及其问题
  4. python自动购买12306票_Python-12306模拟自动购票!快过年了,学起来啊!
  5. 三万字Javaweb教程
  6. 判断身份证校验位是否正确
  7. informix 插入中文显示问号
  8. 月亮网摘(2006.08.22)
  9. mac火狐浏览器快速下载,aria2设置
  10. 深入【Java】底层细节知识点