sstat

部分:Slurm 命令 (1)
更新:Slurm 命令
索引

 

名称

sstat - 显示正在运行的作业/步骤的状态信息。

 

概要

sstat [选项...]

 

描述

用于调用 Slurm 的正在运行作业的状态信息。

sstat 命令显示作业状态信息以供分析。 sstat 命令显示与 CPU、任务、节点、常驻集大小 (RSS) 和虚拟内存 (VM) 相关的信息。 您可以使用 --fields= 选项定制输出,以指定要显示的字段。

对于 root 用户,sstat 命令显示系统上任何正在运行的作业的状态数据。

对于非 root 用户,sstat 输出仅限于用户的作业。

注意sstat 命令要求安装并正常运行 jobacct_gather 插件。

注意:可用的度量依赖于使用的 jobacct_gather 插件。例如,jobacct_gather/cgroup 与 cgroup/v2 组合时,由于内核 cgroups 接口的限制,不提供虚拟内存度量,并将相关字段显示为 0。  

选项

-a, --allsteps
当未指定步骤时,打印给定作业的所有步骤。

-o, --format, --fields
以逗号分隔的字段列表。 (使用 '--helpformat' 获取可用字段的列表)。

注意:使用格式选项列出各种字段时,您可以在后面加上 %NUMBER 来指定应打印多少个字符。

即 format=name%30 将打印字段名称的 30 个字符,右对齐。-30 将打印 30 个字符,左对齐。

-h, --help
显示一般帮助信息。

-e, --helpformat
打印可以与 '--format' 选项一起指定的字段列表。

-j, --jobs
格式为 <job(.step)>。统计此作业步骤或以逗号分隔的作业步骤列表。此选项是必需的。如果未指定步骤部分,将默认使用最低编号(非批处理、外部等)正在运行的步骤,除非设置了 --allsteps 标志,在这种情况下未指定步骤将导致显示所有正在运行的步骤。 注意:步骤 ID 为 'batch' 将显示有关批处理步骤的信息。 注意:步骤 ID 为 'extern' 将显示有关外部步骤的信息。此步骤仅在使用 PrologFlags=contain 时可用。

--noconvert
不要将单位从其原始类型转换(例如,2048M 不会转换为 2G)。

-n, --noheader
输出中将不添加标题。默认操作是显示标题。

-p, --parsable
输出将以 '|' 分隔,末尾有一个 '|'。

-P, --parsable2
输出将以 '|' 分隔,末尾没有 '|'。

-i, --pidformat
预定义格式,用于列出每个作业步骤的 PID。 (JobId,Nodes,Pids)

--usage
显示命令使用摘要。

-v, --verbose
主要用于调试目的,报告处理过程中各种变量的状态。

-V, --version
打印版本。

 

作业状态字段

每个字段选项的描述如下。 请注意,Ave*、Max* 和 Min* 计费字段查看作业每个步骤的所有任务的值,并返回该作业步骤的任务的平均值、最大值或最小值。例如,对于 MaxRSS,返回的值是该步骤的任务中看到的最大内存消耗,MaxRSSTask 显示的是哪个任务。

AllocTRES
作业中所有任务的分配 TRES。

AveCPU
作业中所有任务的平均(系统 + 用户)CPU 时间。

AveCPUFreq
作业中所有任务的平均加权 CPU 频率,以 kHz 为单位。

AveDiskRead
作业中所有任务平均读取的字节数。

AveDiskWrite
作业中所有任务平均写入的字节数。

AvePages
作业中所有任务的平均页面错误数。

AveRSS
作业中所有任务的平均常驻集大小。

AveVMSize
作业中所有任务的平均虚拟内存大小。

ConsumedEnergy
作业中所有任务消耗的总能量,以焦耳为单位。 注意:仅在独占作业分配的情况下,此值反映作业的实际能耗。

JobID
作业或作业步骤的编号。 格式为: job.jobstep

MaxDiskRead
作业中所有任务读取的最大字节数。

MaxDiskReadNode
发生最大磁盘读取的节点。

MaxDiskReadTask
发生最大磁盘读取的任务 ID。

MaxDiskWrite
作业中所有任务写入的最大字节数。

MaxDiskWriteNode
发生最大磁盘写入的节点。

MaxDiskWriteTask
发生最大磁盘写入的任务 ID。

MaxPages
作业中所有任务的最大页面错误数。

MaxPagesNode
发生最大页面错误的节点。

MaxPagesTask
发生最大页面错误的任务 ID。

MaxRSS
作业中所有任务的最大常驻集大小。

MaxRSSNode
发生最大常驻集大小的节点。

MaxRSSTask
发生最大常驻集大小的任务 ID。

MaxVMSize
作业中所有任务的最大虚拟内存大小。

MaxVMSizeNode
发生最大虚拟内存大小的节点。

MaxVMSizeTask
发生最大虚拟内存大小的任务 ID。

MinCPU
作业中所有任务的最小(系统 + 用户)CPU 时间。

MinCPUNode
发生最小 CPU 的节点。

MinCPUTask
发生最小 CPU 的任务 ID。

NTasks
作业或步骤中的任务总数。

ReqCPUFreq
步骤请求的 CPU 频率,以 kHz 为单位。

TresUsageInAve
作业中所有任务的 Tres 平均使用量。 注意:如果相应的 TresUsageInMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。

TresUsageInMax
作业中所有任务的 Tres 最大使用量。 注意:如果相应的 TresUsageInMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。

TresUsageInMaxNode
每个最大 TRES 使用量发生的节点。

TresUsageInMaxTask
每个最大 TRES 使用量发生的任务。

TresUsageOutAve
作业中所有任务的 Tres 平均输出使用量。 注意:如果相应的 TresUsageOutMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。

TresUsageOutMax
作业中所有任务的 Tres 最大输出使用量。 注意:如果相应的 TresUsageOutMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。

TresUsageOutMaxNode
每个最大 TRES 输出使用量发生的节点。

TresUsageOutMaxTask
每个最大 TRES 输出使用量发生的任务。

 

性能

执行 sstat 会向 slurmctld 发送远程过程调用。如果来自 sstat 或其他向 slurmctld 守护进程发送远程过程调用的 Slurm 客户端命令的调用过于频繁,可能会导致 slurmctld 守护进程的性能下降,甚至可能导致服务拒绝。

请勿在 shell 脚本或其他程序的循环中运行 sstat 或其他向 slurmctld 发送远程过程调用的 Slurm 客户端命令。确保程序将对 sstat 的调用限制在收集信息所需的最小范围内。

 

环境变量

某些 sstat 选项可以通过环境变量设置。这些环境变量及其对应的选项如下所示。 (注意:命令行选项将始终覆盖这些设置。)

SLURM_CONF
Slurm 配置文件的位置。

SLURM_DEBUG_FLAGS
指定 sstat 使用的调试标志。有关完整的标志列表,请参见 slurm.conf(5) 手册页。环境变量优先于 slurm.conf 中的设置。

 

示例

显示作业 11 的作业步骤信息,指定字段:
$ sstat --format=AveCPU,AvePages,AveRSS,AveVMSize,JobID -j 11
25:02.000  0K         1.37M      5.93M      9.0

以可解析格式显示作业 11 的作业步骤信息,指定字段:
$ sstat -p --format=AveCPU,AvePages,AveRSS,AveVMSize,JobID -j 11
25:02.000|0K|1.37M|5.93M|9.0|

 

版权

版权所有 (C) 2009 劳伦斯利弗莫尔国家实验室。 在劳伦斯利弗莫尔国家实验室制作(参见免责声明)。
版权所有 (C) 2010-2022 SchedMD LLC。

此文件是 Slurm 的一部分,Slurm 是一个资源管理程序。 有关详细信息,请参见 <https://slurm.schedmd.com/>。

Slurm 是自由软件;您可以根据自由软件基金会发布的 GNU 通用公共许可证的条款重新分发和/或修改它;许可证的版本 2,或(根据您的选择)任何更高版本。

Slurm 的分发是希望它会有用,但不提供任何担保;甚至没有对适销性或特定用途的适用性作出暗示担保。有关更多详细信息,请参见 GNU 通用公共许可证。

 

另见

sacct(1)


 

索引

名称
概要
描述
选项
作业状态字段
性能
环境变量
示例
版权
另见

此文档由 man2html 使用手册页创建。
时间:2025年7月2日 13:21:56 GMT