sstat
部分:Slurm 命令 (1)更新:Slurm 命令
索引
名称
sstat - 显示正在运行的作业/步骤的状态信息。概要
sstat [选项...]描述
用于调用 Slurm 的正在运行作业的状态信息。
sstat 命令显示作业状态信息以供分析。 sstat 命令显示与 CPU、任务、节点、常驻集大小 (RSS) 和虚拟内存 (VM) 相关的信息。 您可以使用 --fields= 选项定制输出,以指定要显示的字段。
对于 root 用户,sstat 命令显示系统上任何正在运行的作业的状态数据。
对于非 root 用户,sstat 输出仅限于用户的作业。
注意:sstat 命令要求安装并正常运行 jobacct_gather 插件。
注意:可用的度量依赖于使用的 jobacct_gather 插件。例如,jobacct_gather/cgroup 与 cgroup/v2 组合时,由于内核 cgroups 接口的限制,不提供虚拟内存度量,并将相关字段显示为 0。
选项
- -a, --allsteps
- 当未指定步骤时,打印给定作业的所有步骤。
-
- -o, --format, --fields
- 以逗号分隔的字段列表。
(使用 '--helpformat' 获取可用字段的列表)。
注意:使用格式选项列出各种字段时,您可以在后面加上 %NUMBER 来指定应打印多少个字符。
即 format=name%30 将打印字段名称的 30 个字符,右对齐。-30 将打印 30 个字符,左对齐。
-
- -h, --help
- 显示一般帮助信息。
-
- -e, --helpformat
- 打印可以与 '--format' 选项一起指定的字段列表。
-
- -j, --jobs
- 格式为 <job(.step)>。统计此作业步骤或以逗号分隔的作业步骤列表。此选项是必需的。如果未指定步骤部分,将默认使用最低编号(非批处理、外部等)正在运行的步骤,除非设置了 --allsteps 标志,在这种情况下未指定步骤将导致显示所有正在运行的步骤。 注意:步骤 ID 为 'batch' 将显示有关批处理步骤的信息。 注意:步骤 ID 为 'extern' 将显示有关外部步骤的信息。此步骤仅在使用 PrologFlags=contain 时可用。
-
- --noconvert
- 不要将单位从其原始类型转换(例如,2048M 不会转换为 2G)。
-
- -n, --noheader
- 输出中将不添加标题。默认操作是显示标题。
-
- -p, --parsable
- 输出将以 '|' 分隔,末尾有一个 '|'。
-
- -P, --parsable2
- 输出将以 '|' 分隔,末尾没有 '|'。
-
- -i, --pidformat
- 预定义格式,用于列出每个作业步骤的 PID。 (JobId,Nodes,Pids)
-
- --usage
- 显示命令使用摘要。
-
- -v, --verbose
- 主要用于调试目的,报告处理过程中各种变量的状态。
-
- -V, --version
- 打印版本。
-
作业状态字段
每个字段选项的描述如下。 请注意,Ave*、Max* 和 Min* 计费字段查看作业每个步骤的所有任务的值,并返回该作业步骤的任务的平均值、最大值或最小值。例如,对于 MaxRSS,返回的值是该步骤的任务中看到的最大内存消耗,MaxRSSTask 显示的是哪个任务。-
- AllocTRES
- 作业中所有任务的分配 TRES。
-
- AveCPU
- 作业中所有任务的平均(系统 + 用户)CPU 时间。
-
- AveCPUFreq
- 作业中所有任务的平均加权 CPU 频率,以 kHz 为单位。
-
- AveDiskRead
- 作业中所有任务平均读取的字节数。
-
- AveDiskWrite
- 作业中所有任务平均写入的字节数。
-
- AvePages
- 作业中所有任务的平均页面错误数。
-
- AveRSS
- 作业中所有任务的平均常驻集大小。
-
- AveVMSize
- 作业中所有任务的平均虚拟内存大小。
-
- ConsumedEnergy
- 作业中所有任务消耗的总能量,以焦耳为单位。 注意:仅在独占作业分配的情况下,此值反映作业的实际能耗。
-
- JobID
- 作业或作业步骤的编号。 格式为: job.jobstep
-
- MaxDiskRead
- 作业中所有任务读取的最大字节数。
-
- MaxDiskReadNode
- 发生最大磁盘读取的节点。
-
- MaxDiskReadTask
- 发生最大磁盘读取的任务 ID。
-
- MaxDiskWrite
- 作业中所有任务写入的最大字节数。
-
- MaxDiskWriteNode
- 发生最大磁盘写入的节点。
-
- MaxDiskWriteTask
- 发生最大磁盘写入的任务 ID。
-
- MaxPages
- 作业中所有任务的最大页面错误数。
-
- MaxPagesNode
- 发生最大页面错误的节点。
-
- MaxPagesTask
- 发生最大页面错误的任务 ID。
-
- MaxRSS
- 作业中所有任务的最大常驻集大小。
-
- MaxRSSNode
- 发生最大常驻集大小的节点。
-
- MaxRSSTask
- 发生最大常驻集大小的任务 ID。
-
- MaxVMSize
- 作业中所有任务的最大虚拟内存大小。
-
- MaxVMSizeNode
- 发生最大虚拟内存大小的节点。
-
- MaxVMSizeTask
- 发生最大虚拟内存大小的任务 ID。
-
- MinCPU
- 作业中所有任务的最小(系统 + 用户)CPU 时间。
-
- MinCPUNode
- 发生最小 CPU 的节点。
-
- MinCPUTask
- 发生最小 CPU 的任务 ID。
-
- NTasks
- 作业或步骤中的任务总数。
-
- ReqCPUFreq
- 步骤请求的 CPU 频率,以 kHz 为单位。
-
- TresUsageInAve
- 作业中所有任务的 Tres 平均使用量。 注意:如果相应的 TresUsageInMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。
-
- TresUsageInMax
- 作业中所有任务的 Tres 最大使用量。 注意:如果相应的 TresUsageInMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。
-
- TresUsageInMaxNode
- 每个最大 TRES 使用量发生的节点。
-
- TresUsageInMaxTask
- 每个最大 TRES 使用量发生的任务。
-
- TresUsageOutAve
- 作业中所有任务的 Tres 平均输出使用量。 注意:如果相应的 TresUsageOutMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。
-
- TresUsageOutMax
- 作业中所有任务的 Tres 最大输出使用量。 注意:如果相应的 TresUsageOutMaxTask 为 -1,则度量是以节点为中心,而不是以任务为中心。
-
- TresUsageOutMaxNode
- 每个最大 TRES 输出使用量发生的节点。
-
- TresUsageOutMaxTask
- 每个最大 TRES 输出使用量发生的任务。
-
性能
执行 sstat 会向 slurmctld 发送远程过程调用。如果来自 sstat 或其他向 slurmctld 守护进程发送远程过程调用的 Slurm 客户端命令的调用过于频繁,可能会导致 slurmctld 守护进程的性能下降,甚至可能导致服务拒绝。
请勿在 shell 脚本或其他程序的循环中运行 sstat 或其他向 slurmctld 发送远程过程调用的 Slurm 客户端命令。确保程序将对 sstat 的调用限制在收集信息所需的最小范围内。
环境变量
某些 sstat 选项可以通过环境变量设置。这些环境变量及其对应的选项如下所示。 (注意:命令行选项将始终覆盖这些设置。)
- SLURM_CONF
- Slurm 配置文件的位置。
-
- SLURM_DEBUG_FLAGS
- 指定 sstat 使用的调试标志。有关完整的标志列表,请参见 slurm.conf(5) 手册页。环境变量优先于 slurm.conf 中的设置。
-
示例
- 显示作业 11 的作业步骤信息,指定字段:
-
$ sstat --format=AveCPU,AvePages,AveRSS,AveVMSize,JobID -j 11 25:02.000 0K 1.37M 5.93M 9.0
- 以可解析格式显示作业 11 的作业步骤信息,指定字段:
-
$ sstat -p --format=AveCPU,AvePages,AveRSS,AveVMSize,JobID -j 11 25:02.000|0K|1.37M|5.93M|9.0|
版权
版权所有 (C) 2009 劳伦斯利弗莫尔国家实验室。 在劳伦斯利弗莫尔国家实验室制作(参见免责声明)。版权所有 (C) 2010-2022 SchedMD LLC。
此文件是 Slurm 的一部分,Slurm 是一个资源管理程序。 有关详细信息,请参见 <https://slurm.schedmd.com/>。
Slurm 是自由软件;您可以根据自由软件基金会发布的 GNU 通用公共许可证的条款重新分发和/或修改它;许可证的版本 2,或(根据您的选择)任何更高版本。
Slurm 的分发是希望它会有用,但不提供任何担保;甚至没有对适销性或特定用途的适用性作出暗示担保。有关更多详细信息,请参见 GNU 通用公共许可证。
另见
sacct(1)
索引
此文档由 man2html 使用手册页创建。
时间:2025年7月2日 13:21:56 GMT