burst_buffer.conf

部分:文件格式 (5)
更新:2022年1月
索引  

名称

burst_buffer.conf - Slurm 配置文件,用于突发缓冲区管理。

 

描述

burst_buffer.conf 是一个 ASCII 文件,描述了突发缓冲区资源管理的配置。 该文件仅在头节点上需要,slurmctld 守护进程在此执行。 该文件将始终位于与 slurm.conf 相同的目录中。

参数名称不区分大小写。 在配置文件中,任何跟随在 "#" 后的文本都被视为注释,直到该行结束。 对配置文件的更改在 Slurm 守护进程重启、守护进程接收到 SIGHUP 信号或执行命令 "scontrol reconfigure" 时生效。

可用的配置参数包括:

AllowUsers
允许使用突发缓冲区的用户名和/或 ID 的逗号分隔列表。 选项 AllowUsersDenyUsers 不能同时指定。 默认情况下,所有用户都被允许使用突发缓冲区。

DefaultPool
用于资源分配的默认池名称。 默认值是突发缓冲区基础设施报告的第一个池。 此选项仅由 burst_buffer/datawarp 插件使用。

DenyUsers
被禁止使用突发缓冲区的用户名和/或 ID 的冒号分隔列表。 选项 AllowUsersDenyUsers 不能同时指定。 默认情况下,所有用户都被允许使用突发缓冲区。

Directive
作业请求突发缓冲区时必须使用的字符串。该字符串 必须紧接在一个 '#' 字符之前。目前仅由 lua 插件使用。对于 lua 插件,默认值为 "BB_LUA"。 有关更多详细信息,请参见 burst_buffer.html。

Flags
用于控制各种功能的字符串。 多个选项可以用逗号分隔。 支持的选项包括:
DisablePersistent
防止普通用户创建和销毁持久突发缓冲区。 这是默认行为,只有特权用户(Slurm 操作员和 管理员)可以创建或销毁持久突发缓冲区。

EmulateCray
使用 burst_buffer/datawarp 插件中的 dw_wlm_cli 脚本模拟 Cray DataWarp 系统。 此选项仅由 datawarp 插件使用。

EnablePersistent
允许普通用户创建和销毁持久突发缓冲区。 默认情况下,只有特权用户(Slurm 操作员和管理员)可以 创建或销毁持久突发缓冲区。 此选项仅由 datawarp 插件使用。

PrivateData
如果设置,则只有 Slurm 操作员和突发缓冲区所有者可以看到突发 缓冲区数据。

TeardownFailure
如果设置,则在文件阶段错误后拆除突发缓冲区。否则 保留突发缓冲区以便分析和手动拆除。

GetSysState
返回当前突发缓冲区状态的程序的完全限定路径名。 对于 DataWarp 插件,这应该是 dw_wlm_cli 命令的路径 其默认值为 /opt/cray/dw_wlm/default/bin/dw_wlm_cli。 此选项不适用于 lua 插件。

GetSysStatus
返回当前突发缓冲区状态的程序的完全限定路径名。 对于 DataWarp 插件,这应该是 dwstat 命令的路径 其默认值为 /opt/cray/dws/default/bin/dwstat。 此选项不适用于 lua 插件。

OtherTimeout
如果突发缓冲区操作(除了作业验证、阶段输入或阶段输出) 运行超过此秒数,则作业将被置于保持状态。 需要 Slurm 管理员释放该作业。 默认情况下,这些操作的超时时间为 300 秒(5 分钟)。 另见 StageInTimeoutStageOutTimeoutValidateTimeout 选项。 对于 lua 插件,最大超时值为 2073600 秒(24 天)。

PollInterval
此选项仅适用于 lua 插件。 如果 test_data_{in|out} 钩子返回成功和 "BUSY",则在等待指定秒数后将再次调用它们。默认 值为 15 秒。

PrivateData
如果设置为 "true",则用户将只能查看他们可以 使用的突发缓冲区。 Slurm 管理员仍然可以查看所有突发缓冲区。 默认情况下,用户可以查看所有突发缓冲区。

StageInTimeout
如果作业的文件阶段输入超过此秒数, 则将释放突发缓冲区,作业将被置于保持状态。 需要 Slurm 管理员释放该作业。 默认情况下,阶段输入过程的超时时间为一天。 对于 lua 插件,最大超时值为 2073600 秒(24 天)。

StageOutTimeout
如果作业的文件阶段输出超过此秒数, 则将释放突发缓冲区,作业将被清除。 默认情况下,阶段输出过程的超时时间为一天。 对于 lua 插件,最大超时值为 2073600 秒(24 天)。

ValidateTimeout
如果作业提交请求的验证超过此秒数,则提交将被拒绝。 ValidateTimeout 的值必须小于 slurm.conf 文件中配置的 MessageTimeout 的值,否则作业提交请求可能会因响应超时错误而失败。 默认情况下,验证操作的超时时间为 5 秒。 在 lua 插件中,由于验证操作无法被终止,因此 此选项不适用。

 

版权

版权 (C) 2014-2022 SchedMD LLC。

该文件是 Slurm 的一部分,资源管理程序。 有关详细信息,请参见 <https://slurm.schedmd.com/>。

Slurm 是自由软件;您可以根据自由软件基金会发布的 GNU 通用公共许可证的条款重新分发和/或修改它;许可证的版本 2,或(根据您的选择)任何更高版本。

Slurm 的分发是希望它会有用,但不提供任何 保证;甚至不包括对适销性或特定用途适用性的隐含保证。有关更多详细信息,请参见 GNU 通用公共许可证。

 

另见

slurm.conf(5)


 

索引

名称
描述
版权
另见

该文档由 man2html 使用手册页创建。
时间:2025年7月02日 13:21:55 GMT