slurmdbd.conf
节:Slurm 配置文件 (5)
更新:Slurm 配置文件
索引
名称
slurmdbd.conf - Slurm 数据库守护进程 (SlurmDBD) 配置文件
描述
slurmdbd.conf 是一个 ASCII 文件,描述 Slurm 数据库守护进程 (SlurmDBD) 的配置信息。
该文件将始终位于与
slurm.conf 相同的目录中。
该文件的内容不区分大小写,节点和文件的名称除外。配置文件中以 "#" 开头的任何文本都被视为注释,直到该行结束。
对配置文件的更改在重启 SlurmDBD 或守护进程接收到 SIGHUP 信号时生效,除非另有说明。
此文件应仅存在于运行 SlurmDBD 的计算机上,并且应仅对执行 SlurmDBD 的用户可读(例如 "slurm")。
如果 slurmdbd 守护进程以 root 用户身份启动并更改为其他用户 ID,则配置文件最初将作为 root 用户读取,但在接收到 SIGHUP 信号时将作为其他用户 ID 读取。
此文件应防止未经授权的访问,因为它包含数据库密码。
可用的整体配置参数包括:
- AllowNoDefAcct
- 移除用户必须拥有默认账户的要求。布尔值,yes 表示开启,no(默认)表示强制使用默认账户。
-
- AllResourcesAbsolute
- 添加资源(许可证)时,将分配/允许的计数视为绝对数字,而不是百分比数字。布尔值,yes 表示开启,no(默认)表示将数字视为百分比。
-
- ArchiveDir
- 如果未设置 ArchiveScript,slurmdbd 将生成一个文件,可以随时使用 sacctmgr load filename 读取。该目录是文件在发生清除事件后放置的地方,并且该元素的归档设置为 true。默认值为 /tmp。该文件名的格式为
$ArchiveDir/$ClusterName_$ArchiveObject_archive_$BeginTimeStamp_$endTimeStamp
我们将归档文件限制为每个文件 50000 条记录。如果在该时间段内存在超过 50000 条记录,它们将被写入新文件。在同一时间段内的后续归档文件将附加 ".<number>" 到文件名,例如 .2,数字在同一时间段内每个文件增加 1。
-
- ArchiveEvents
- 在清除事件时也归档它们。布尔值,yes 表示归档事件数据,no 表示不归档。默认值为 no。
-
- ArchiveJobs
- 在清除作业时也归档它们。布尔值,yes 表示归档作业数据,no 表示不归档。默认值为 no。
-
- ArchiveResvs
- 在清除预留时也归档它们。布尔值,yes 表示归档预留数据,no 表示不归档。默认值为 no。
-
- ArchiveScript
- 此脚本可以在每次汇总发生时执行(每小时、每天和每月),具体取决于 Purge*After 选项。此脚本用于将会计记录从数据库转移到归档中。它用于替代用于归档对象的内部过程。
该脚本在没有参数的情况下执行,并设置以下环境变量。
-
-
- SLURM_ARCHIVE_EVENTS
- 1 表示归档事件,0 表示不归档。
-
- SLURM_ARCHIVE_LAST_EVENT
- 最后一个事件开始归档的时间。
-
- SLURM_ARCHIVE_JOBS
- 1 表示归档作业,0 表示不归档。
-
- SLURM_ARCHIVE_LAST_JOB
- 最后一个作业提交到归档的时间。
-
- SLURM_ARCHIVE_STEPS
- 1 表示归档步骤,0 表示不归档。
-
- SLURM_ARCHIVE_LAST_STEP
- 最后一个步骤开始归档的时间。
-
- SLURM_ARCHIVE_SUSPEND
- 1 表示归档挂起数据,0 表示不归档。
-
- SLURM_ARCHIVE_TXN
- 1 表示归档事务数据,0 表示不归档。
-
- SLURM_ARCHIVE_USAGE
- 1 表示归档使用数据,0 表示不归档。
-
- SLURM_ARCHIVE_LAST_SUSPEND
- 最后一个挂起开始归档的时间。
ArchiveSteps在清除步骤时也归档它们。布尔值,yes 表示归档步骤数据,no 表示不归档。默认值为 no。
ArchiveSuspend在清除挂起数据时也归档它。布尔值,yes 表示归档挂起数据,no 表示不归档。默认值为 no。
ArchiveTXN在清除事务数据时也归档它。布尔值,yes 表示归档事务数据,no 表示不归档。默认值为 no。
ArchiveUsage在清除使用数据(集群、关联和 WCKey)时也归档它。布尔值,yes 表示归档事务数据,no 表示不归档。默认值为 no。
AuthAltTypes逗号分隔的替代身份验证插件列表,slurmdbd 将允许用于通信。目前可接受的值包括 auth/jwt。
注意:必须使用 AuthAltParameters 指定所需的 jwt_hs256.key 的路径。jwt_hs256.key 应仅对 SlurmUser 和 root 可见。建议不要将 jwt_hs256.key 放在除运行 slurmctld 和运行 slurmdbd 的机器之外的任何节点上。
auth/jwt 可以通过存在 SLURM_JWT 环境变量来激活。当激活时,它将覆盖默认值。
AuthAltParameters用于定义替代身份验证插件选项。多个选项可以用逗号分隔。
-
- jwks=
- JWKS 文件的绝对路径。密钥应由 SlurmUser 或 root 拥有,必须可由 SlurmUser 读取,建议权限为 0400。不得对“其他”可写。
仅支持 RS256 密钥,尽管文件中可以列出其他密钥类型。如果设置,则不会默认加载 HS256 密钥(并且禁用令牌生成),尽管可以使用 jwt_key 设置显式重新启用 HS256 密钥使用(和令牌生成)。
-
- jwt_key=
- JWT 密钥文件的绝对路径。密钥必须是 HS256。密钥应由 SlurmUser 或 root 拥有,必须可由 SlurmUser 读取,建议权限为 0400。不得对“其他”可访问。
AuthInfo用于与每个集群的 Slurm 控制守护进程(slurmctld)进行通信的身份验证的附加信息。
此选项的解释特定于配置的 AuthType。
可以在逗号分隔的列表中指定多个选项。
如果未指定,将使用默认身份验证信息。
-
- socket
- 要使用的 MUNGE 守护进程套接字的路径名(例如 "socket=/var/run/munge/munge.socket.2")。
默认值为 "/var/run/munge/munge.socket.2"。
由 auth/munge 和 cred/munge 使用。
-
- ttl
- 凭证的生命周期,以秒为单位(例如 "ttl=300")。
默认值取决于 MUNGE 安装,但通常为 300 秒。
-
- use_client_ids
- 允许 auth/slurm 插件在不依赖 LDAP 或操作系统的用户信息的情况下进行用户身份验证。
AuthType定义 Slurm 组件之间通信的身份验证方法。必须在更改 AuthType 的值之前终止 SlurmDBD,然后重新启动。此值应与 slurm.conf 中使用的 AuthType 匹配。
目前可接受的值:
-
- auth/munge
- 表示使用 MUNGE(默认)。
(有关更多信息,请参见 "https://dun.github.io/munge/")。
-
- auth/slurm
- 使用 Slurm 的内部身份验证插件。
CommitDelaySlurmctld 连接之间提交的秒数。这显著加快了对数据库的插入速度。如果您正在运行非常高吞吐量的作业,您应该考虑设置此值。在测试中,1 秒显著提高了 slurmdbd 的性能并减少了开销。然而,由于这会创建一个窗口,如果 slurmdbd 因任何原因异常退出,则未提交的数据可能会丢失。虽然这种情况应该非常少见,但确实存在极小的风险,但可能是在极重负载环境中运行的唯一方法。老实说,风险相当低,但仍然存在。
CommunicationParameters逗号分隔的选项,标识通信选项。
-
- DisableIPv4
- 禁用仅 IPv4 操作的 slurmdbd。这也应在您的 slurm.conf 文件中设置。
-
- EnableIPv6
- 启用 slurmdbd 使用 IPv6 地址。当同时使用 IPv4 和 IPv6 时,地址族的优先级将基于您的 /etc/gai.conf 文件。这也应在您的 slurm.conf 文件中设置。
-
- keepaliveinterval=#
- 指定空闲连接之间的 keepalive 探测间隔(以秒为单位)。
这影响大多数来自 slurmdbd 的出站连接(例如,主备之间,或从 slurmdbd 到 slurmctld)。
默认值为 30 秒。
-
- keepaliveprobes=#
- 指定在认为连接中断之前发送的未确认 keepalive 探测的数量。
这影响大多数来自 slurmdbd 的出站连接(例如,主备之间,或从 slurmdbd 到 slurmctld)。
默认值为 3。
-
- keepalivetime=#
- 指定连接必须空闲多长时间(以秒为单位)才能开始发送 keepalive 探测,以及延迟关闭连接以处理仍在队列中的消息的时间。
这影响大多数来自 slurmdbd 的出站连接(例如,主备之间,或从 slurmdbd 到 slurmctld)。
默认值为 30 秒。
DbdAddrDbdHost 在建立通信路径时应引用的名称。此名称将作为 getaddrinfo() 函数的参数用于识别。例如,"elx0000" 可能用于指定节点 "lx0000" 的以太网地址。默认情况下,DbdAddr 的值将与 DbdHost 相同。
DbdBackupHost备份 Slurm 数据库守护进程执行的机器的短名称或长名称(即命令 "hostname -s" 返回的名称)。
此主机必须能够访问下面提到的“存储”选项指定的相同底层数据库。
DbdHostSlurm 数据库守护进程执行的机器的短名称或长名称(即命令 "hostname -s" 返回的名称)。
此值必须指定。
DbdPortSlurm 数据库守护进程(slurmdbd)监听工作的端口号。默认值为 SLURMDBD_PORT,在系统构建时确定。如果未明确指定值,则将设置为 6819。
此值必须等于 slurm.conf 文件中的 AccountingStoragePort 参数。
DebugFlags定义应该提供更详细事件日志记录的特定子系统。
可以使用逗号分隔符指定多个子系统。
大多数 DebugFlags 将导致在 DebugLevel 为“详细”或更高时为识别的子系统生成额外的日志消息。
更多的日志记录可能会影响性能。
当前可用的有效子系统(将来可能会增加)包括:
-
- AuditRPCs
- 对于所有传入的 RPC 到 slurmdbd,在连接处理之前打印源地址、经过身份验证的用户和 RPC 类型。
-
- DB_ARCHIVE
- 处理归档和清除数据库时的 SQL 语句/查询。
-
- DB_ASSOC
- 处理数据库中关联时的 SQL 语句/查询。
-
- DB_EVENT
- 处理数据库中(节点)事件时的 SQL 语句/查询。
-
- DB_JOB
- 处理数据库中作业时的 SQL 语句/查询。
-
- DB_QOS
- 处理数据库中 QOS 时的 SQL 语句/查询。
-
- DB_QUERY
- 处理数据库中的事务等时的 SQL 语句/查询。
-
- DB_RESERVATION
- 处理数据库中预留时的 SQL 语句/查询。
-
- DB_RESOURCE
- 处理数据库中资源(如许可证)时的 SQL 语句/查询。
-
- DB_STEP
- 处理数据库中步骤时的 SQL 语句/查询。
-
- DB_TRES
- 处理数据库中可跟踪资源时的 SQL 语句/查询。
-
- DB_USAGE
- 处理数据库中使用查询和插入时的 SQL 语句/查询。
-
- DB_WCKEY
- 处理数据库中 wckeys 时的 SQL 语句/查询。
-
- FEDERATION
- 处理数据库中联邦时的 SQL 语句/查询。
-
- Network
- 网络详细信息。
-
- NetworkRaw
- 转储关键网络通信的原始十六进制值。
-
- TLS
- TLS 插件
DebugLevel提供 Slurm 数据库守护进程日志的详细程度。
默认值为 info。
-
- quiet
- 不记录任何内容
-
- fatal
- 仅记录致命错误
-
- error
- 仅记录错误
-
- info
- 记录错误和一般信息消息
-
- verbose
- 记录错误和详细信息消息
-
- debug
- 记录错误、详细信息消息和调试消息
-
- debug2
- 记录错误、详细信息消息和更多调试消息
-
- debug3
- 记录错误、详细信息消息和甚至更多调试消息
-
- debug4
- 记录错误、详细信息消息和甚至更多调试消息
-
- debug5
- 记录错误、详细信息消息和甚至更多调试消息
DebugLevelSyslogslurmdbd 守护进程将以指定的详细程度将事件记录到 syslog 文件中。如果未设置,slurmdbd 守护进程将在 fatal 级别记录到 syslog,除非没有 LogFile 并且它在后台运行,在这种情况下,它将以 DebugLevel 指定的级别记录到 syslog(如果 DebugLevel 设置为 quiet,则为 fatal),或者如果在前台运行,则将设置为安静。
-
- quiet
- 不记录任何内容
-
- fatal
- 仅记录致命错误
-
- error
- 仅记录错误
-
- info
- 记录错误和一般信息消息
-
- verbose
- 记录错误和详细信息消息
-
- debug
- 记录错误、详细信息消息和调试消息
-
- debug2
- 记录错误、详细信息消息和更多调试消息
-
- debug3
- 记录错误、详细信息消息和甚至更多调试消息
-
- debug4
- 记录错误、详细信息消息和甚至更多调试消息
-
- debug5
- 记录错误、详细信息消息和甚至更多调试消息
注意:默认情况下,Slurm 的 systemd 服务文件在前台启动守护进程,带有 -D 选项。这意味着 systemd 将捕获 stdout/stderr 输出并将其打印到 syslog,而不管 Slurm 直接打印到 syslog。要防止 systemd 这样做,请将 "StandardOutput=null" 和 "StandardError=null" 添加到各自的服务文件或覆盖文件中。
DefaultQOS添加新集群时,将使用此值作为集群的 qos,除非管理员通过创建显式设置了其他值。
DisableCoordDBD在所有 slurmdbd 交互中禁用协调员状态。
当设置此项时,协调员可能无法在 slurmdbd 中执行与其协调的账户相关的以下操作:
添加账户
添加/修改/删除关联
添加/删除协调员
添加/修改/删除用户
布尔值,yes 表示开启,no(默认)表示在所有 slurmdbd 交互中识别协调员状态。
HashPlugin标识用于网络通信的哈希插件类型。
可接受的值包括:
-
- hash/k12
- 哈希由 KangorooTwelve 加密哈希函数生成。
这是默认值。
-
- hash/sha3
- 哈希由 SHA-3 加密哈希函数生成。
注意:确保 HashPlugin 在 slurm.conf 和 slurmdbd.conf 中具有相同的值。
LogFileSlurm 数据库守护进程日志写入的文件的完全合格路径名。
默认值为无(通过 syslog 进行日志记录)。
如果指定了路径名,请参见 slurm.conf 手册页中的 LOGGING 部分。
LogTimeFormatslurmdbd 日志文件中时间戳的格式。接受的格式值包括 "iso8601", "iso8601_ms", "rfc5424", "rfc5424_ms", "rfc3339", "clock", "short" 和 "thread_id"。以 "_ms" 结尾的值与没有的值不同,因为它们打印毫秒精度的秒数。
默认值为 "iso8601_ms"。"rfc5424" 格式与 "iso8601" 格式相同,只是时区值也显示。
"clock" 格式显示使用 C 标准 clock() 函数检索的微秒时间戳。"short" 格式是短日期和时间格式。"thread_id" 格式以 C 标准 ctime() 函数的形式显示时间戳,不包括年份,但包括微秒、守护进程的进程 ID 以及当前线程名称和 ID。
MaxQueryTimeRange如果查询的时间跨度过大,则返回错误,以防止格式不正确的查询导致 SlurmDBD 内部的性能问题。
默认值为 INFINITE,允许任何查询进行。
接受的时间格式与 slurm.conf 中的 MaxTime 选项相同。
操作员和更高权限的用户不受此限制。
请注意,尝试返回超过 3GB 数据的查询仍将失败并显示 ESLURM_RESULT_TOO_LARGE。
MessageTimeout允许完成往返通信的时间(以秒为单位)。默认值为 10 秒。
Parameters包含用于更改 slurmdbd 行为的任意逗号分隔参数。
-
- PreserveCaseUser
- 定义用户时不强制转换为小写,这是默认行为。
PidFileSlurm 数据库守护进程可能写入其进程 ID 的文件的完全合格路径名。这可用于自动信号处理。
默认值为 "/var/run/slurmdbd.pid"。
PluginDir标识查找 Slurm 插件的位置。
这是一个以冒号分隔的目录列表,类似于 PATH 环境变量。
默认值为配置时给定的前缀 + "/lib/slurm"。
PrivateData控制普通用户看不到的信息类型。
默认情况下,所有信息对所有用户可见。
用户 SlurmUser、root 和 AdminLevel=Admin 的用户始终可以查看所有信息。
可以用逗号分隔符指定多个值。
可接受的值包括:
-
- accounts
- 防止用户查看任何账户定义,除非他们是该账户的协调员。
-
- events
- 防止用户查看事件信息,除非他们具有操作员状态或更高权限。
-
- jobs
- 防止用户查看属于其他用户的作业记录,除非他们是运行作业的账户的协调员。
-
- reservations
- 将获取预留信息的权限限制为具有操作员状态及以上的用户。
-
- usage
- 防止用户查看任何其他用户的使用情况。
这适用于 sreport。
-
- users
- 防止用户查看任何其他用户的信息,这也使得用户只能看到他们处理的关联。
协调员可以查看他们所协调的账户中所有用户的关联,但在列出用户时只能看到自己。
PurgeEventAfter事件在结束后经过此段时间将从数据库中清除。
这包括节点宕机时间等。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则事件记录将永远不会被清除。
PurgeJobAfter单个作业记录在结束后经过此段时间将从数据库中清除。
聚合信息将保留至 "PurgeUsageAfter"。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则作业记录将永远不会被清除。
PurgeResvAfter单个预留记录在结束后经过此段时间将从数据库中清除。
聚合信息将保留至 "PurgeUsageAfter"。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则预留记录将永远不会被清除。
PurgeStepAfter单个作业步骤记录在结束后经过此段时间将从数据库中清除。
聚合信息将保留至 "PurgeUsageAfter"。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则作业步骤记录将永远不会被清除。
PurgeSuspendAfter单个作业挂起记录在结束后经过此段时间将从数据库中清除。
聚合信息将保留至 "PurgeUsageAfter"。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则挂起记录将永远不会被清除。
PurgeTXNAfter单个事务记录在发生后经过此段时间将从数据库中清除。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则事务记录将永远不会被清除。
PurgeUsageAfter使用记录(集群、关联和WCKey)在创建或最后修改后经过此段时间将从数据库中清除。
这些表是由 sreport(1) 命令生成报告的来源。
时间为数值,单位为月。如果您想更频繁地清除,可以在数值后面加上 "小时" 或 "天" 来实现更频繁的清除(例如,值为 "12hours" 将清除所有超过12小时的记录)。
清除在每个清除间隔的开始时进行。
例如,如果清除时间为2个月,则清除将在每个月的开始进行。
如果未设置(默认),则使用记录将永远不会被清除。
SlurmUser执行 slurmdbd 守护进程的用户名称。
该用户应与所有报告给 slurmdbd 的 slurmctld 实例使用的 SlurmUser 匹配。它必须存在于执行 Slurm 数据库守护进程的机器上,并且与运行 slurmctld 的主机具有相同的 UID。
出于安全考虑,建议使用非 "root" 用户。
默认值为 "root"。
注意: 如果 slurmctld 的 SlurmUser 是 root,您仍然可以为 slurmdbd 使用非 root 的 SlurmUser(在其他情况下,两个 SlurmUser 应该匹配),通过明确将用户的 AdminLevel 设置为 Admin。在以这种方式添加用户后,您必须重启 slurmctld。
StorageBackupHost定义运行数据库的备份主机名称,以便我们存储数据。这可以视为在 StorageHost 不响应时的备份解决方案。由备份解决方案来确保两个主机之间会计信息的一致性。对于集群数据库解决方案(主动/被动高可用性),您无需使用此功能。
默认值为无。
StorageHost定义运行数据库的主机名称,以便我们存储数据。
这可以是 slurmdbd 执行的主机,但对于较大的系统,我们建议将数据库放在单独的机器上。
StorageLoc指定数据库的名称作为会计记录写入的位置。默认值为 "slurm_acct_db"。
StorageParameters以逗号分隔的键值对参数列表。目前支持的值包括建立与数据库的安全连接的选项:
-
- SSL_CERT
- 客户端公钥证书文件的路径名。
-
- SSL_CA
- 证书颁发机构(CA)证书文件的路径名。
-
- SSL_CAPATH
- 包含受信任的 SSL CA 证书文件的目录的路径名。
-
- SSL_KEY
- 客户端私钥文件的路径名。
-
- SSL_CIPHER
- SSL 加密的允许密码列表。
StoragePass定义用于访问数据库以存储作业会计数据的密码。密码中不允许使用字符 '#'。
StoragePortSlurm 数据库守护进程(slurmdbd)与数据库通信的端口号。默认值为 3306。
StorageType定义会计存储机制类型。
目前可接受的值包括 "accounting_storage/mysql"。
值 "accounting_storage/mysql" 表示会计记录应写入由 StorageLoc 参数指定的 MySQL 或 MariaDB 数据库。
此值必须被指定。
StorageUser定义我们将连接到数据库以存储作业会计数据的用户名称。
TCPTimeout允许建立 TCP 连接的时间。默认值为 2 秒。
TLSParameters以逗号分隔的选项,标识 TLS 选项。
支持的值包括:
-
- ca_cert_file=
- 证书颁发机构(CA)证书的路径。必须在所有主机上存在,并且所有 Slurm 组件都可以访问。文件权限必须为 644,并由 SlurmUser/root 拥有。
默认路径为 "ca_cert.pem",位于 Slurm 配置目录中。
-
- dbd_cert_file=
- slurmdbd 使用的证书的路径。必须与 ca_cert_file 链接。应仅存在于运行 slurmdbd 的主机上。文件权限必须为 600,并由 SlurmUser 拥有。
默认路径为 "dbd_cert.pem",位于 Slurm 配置目录中。
-
- dbd_cert_key_file=
- 与 dbd_cert_file 一起使用的私钥的路径。应仅存在于运行 slurmdbd 的主机上。文件权限必须为 600,并由 SlurmUser 拥有。
默认路径为 "dbd_cert_key.pem",位于 Slurm 配置目录中。
-
- load_system_certificates
- 加载在默认系统位置(例如 /etc/ssl)找到的证书到信任存储中。
默认情况下不加载系统证书,而仅依赖于 ca_cert_file 来建立信任。
-
- security_policy_version=
- s2n 使用的安全策略版本。有关更多详细信息,请参见 s2n 文档。
默认安全策略为 "20230317",符合 FIPS 标准,并包括 TLS 1.3。
TLSType指定将使用的 TLS 实现。
目前可接受的值:
-
- tls/s2n
- 使用 s2n TLS 插件。
TrackSlurmctldDown布尔值是或否。如果设置,当 slurmctld 断开连接或不再可达时,slurmdbd 将标记集群上所有空闲资源为宕机。默认值为否。
TrackWCKey布尔值是或否。用于设置工作负载特征键的显示和跟踪。必须设置以跟踪 wckey 使用情况。必须设置此项以生成来自 WCKeys 的汇总使用表。
注意: 如果 TrackWCKey 在此处设置而未在您的各种 slurm.conf 文件中设置,所有作业将归因于其默认 WCKey。
示例
#
# 示例 /etc/slurmdbd.conf
#
ArchiveEvents=yes
ArchiveJobs=yes
ArchiveResvs=yes
ArchiveSteps=no
ArchiveSuspend=no
ArchiveTXN=no
ArchiveUsage=no
#ArchiveScript=/usr/sbin/slurm.dbd.archive
AuthInfo=/var/run/munge/munge.socket.2
AuthType=auth/munge
DbdHost=db_host
DebugLevel=info
PurgeEventAfter=1month
PurgeJobAfter=12month
PurgeResvAfter=1month
PurgeStepAfter=1month
PurgeSuspendAfter=1month
PurgeTXNAfter=12month
PurgeUsageAfter=24month
LogFile=/var/log/slurmdbd.log
PidFile=/var/run/slurmdbd.pid
SlurmUser=slurm_mgr
StoragePass=password_to_database
StorageType=accounting_storage/mysql
StorageUser=database_mgr
版权
版权所有 (C) 2008-2010 劳伦斯利弗莫尔国家实验室。
在劳伦斯利弗莫尔国家实验室制作(参见免责声明)。
版权所有 (C) 2010-2022 SchedMD LLC。
此文件是 Slurm 的一部分,一个资源管理程序。
有关详细信息,请参见 <https://slurm.schedmd.com/>。
Slurm 是自由软件;您可以根据自由软件基金会发布的 GNU 通用公共许可证的条款重新分发和/或修改它;无论是许可证的第 2 版,还是(根据您的选择)任何更高版本。
Slurm 的分发是希望它会有用,但不提供任何担保;甚至不提供适销性或特定用途的适用性的暗示担保。有关更多详细信息,请参见 GNU 通用公共许可证。
文件
/etc/slurmdbd.conf
另见
slurm.conf(5),
slurmctld(8), slurmdbd(8)
syslog (2)
索引
- 名称
-
- 描述
-
- 示例
-
- 版权
-
- 文件
-
- 另见
-
此文档由
man2html 使用手册页创建。
时间:2025年7月2日 13:21:55 GMT