平台

操作系统

  • FreeBSD — 有限支持,未积极测试。
  • Linux — Slurm 已在大多数流行的 Linux 发行版上进行了全面测试,支持 arm64 (aarch64)、ppc64 和 x86_64 架构。一些功能仅限于最近的版本和更新的 Linux 内核版本。目前支持的发行版包括:
    • Debian 11 (Bullseye)
    • Debian 12 (Bookworm)
    • RedHat 企业 Linux 8 (RHEL8) 及其衍生版本
    • RedHat 企业 Linux 9 (RHEL9) 及其衍生版本
    • SUSE Linux 企业服务器 (SLES) 12
    • SUSE Linux 企业服务器 (SLES) 15
    • Ubuntu 20.04
    • Ubuntu 22.04
    • Ubuntu 23.04
    • Ubuntu 24.04
  • NetBSD — 有限支持,未积极测试。
  • macOS — Slurm 过去在 macOS 上运行,但目前不支持。通过对链接器和编译器标志进行一些调整,应该可以修复此问题,任何补丁都将受到欢迎。

数据库

如果在构建时找到支持的开发库,Slurm 将构建时支持 MySQL。虽然可以在较旧版本的 MySQL 上构建 Slurm,但不推荐这样做。SchedMD 建议您使用当前支持的 MySQL 或 MariaDB 版本。

进一步阅读:

加速器

Slurm 可选支持管理各种加速器卡。为以下设备开发了特定插件:

  • gres/gpu — 提供多种自动检测插件,适用于不同的供应商:
    • AutoDetect=nvml 通过其专有的 NVML 库启用 NVIDIA GPU 的自动检测。
    • AutoDetect=nvidia 也启用 NVIDIA GPU 的自动检测,但通过通用的 Linux 接口而非其专有库。此插件不检测 MIGs 或 NVlinks。
    • AutoDetect=rsmi 通过其专有的 RSMI 库启用 AMD GPU 的自动检测(在 x86_64 和 arm64 上测试)。
    • AutoDetect=oneapi 通过其专有的 oneAPI 库启用 Intel GPU 的自动检测。
    • AutoDetect=nrt 启用 AWS Trainium/Inferentia 设备的自动检测。
  • gres/mps — NVIDIA CUDA 多进程服务提供在多个计算进程之间共享 GPU 的方法
  • gres/shard — 提供在多个计算进程之间共享 GPU 的通用机制

最后修改于 2025 年 1 月 1 日