Kubernetes 指南
目录
概述
Kubernetes 正在被应用于 HPC 集群,以协调部署(例如软件、基础设施)并运行某些工作负载(例如 AI/ML 推理)。目前对将 Kubernetes 和 Slurm 集成以实现统一集群、优化资源利用和利用各系统的工作流程的兴趣不断增加。
Slurm 和 Kubernetes 处理某些类型工作负载的方式可能会随着时间而变化。此外,它们之间的交互方式也可能会变化,从而带来新的可能性。这仍然是一个不断发展的领域。
演示文稿
请注意,较旧的演示文稿可能包含过时的信息。
2023 年的演示文稿
- Slurm 和/或/vs Kubernetes,Tim Wickberg,SchedMD(SC23,2023 年 11 月)
- 再也不要使用 Slurm HA:用 Kubernetes 解决所有问题,Chris Samuel 和 Doug Jacobsen,NERSC(SLUG23,2023 年 11 月)
最后修改于 2024 年 2 月 14 日