AWS
← アップデート一覧に戻る
SageMaker2026年2月26日

Amazon SageMaker HyperPodがAPIドリブンのSlurm設定に対応しました

Amazon SageMaker HyperPod now supports API-driven Slurm configuration

概要

Amazon SageMaker HyperPodはAPI駆動のSlurm設定に対応し、クラスター作成・更新APIまたはAWSコンソールからSlurmトポロジーと共有ファイルシステム設定を直接定義できるようになりました。Managed、Overwrite、Mergeの3つのSlurmConfigStrategyオプションにより、パーティション・ノードマッピングのドリフトを自動検出・管理し、スケール操作時の設定ズレを防ぐことができます。この改善により、大規模MLクラスターの運用効率が向上し、LLMや基盤モデルのような複雑なワークロード実行時のリソース割り当てを柔軟かつ安全に制御できます。

何が変わったか

  • クラスター作成・更新APIおよびAWSコンソールを通じたSlurm設定の直接定義が可能に
  • Managed/Overwrite/Mergeの3つのSlurmConfigStrategyオプションでドリフト管理を実装
  • スケール操作時のパーティション・ノードマッピングの自動検出機能を追加

影響

Slurm設定のバージョン管理と自動検出により、大規模MLクラスターの設定ずれを削減し、LLMや基盤モデルなどの複雑なワークロードにおけるリソース割り当ての安全性と柔軟性が向上します。

対象ユーザー

MLエンジニア、MLOps エンジニア、データサイエンティスト、クラウドアーキテクト

まとめ

MLクラスター運用におけるSlurm設定管理の自動化と信頼性の強化といえます。

原文タイトル

Amazon SageMaker HyperPod now supports API-driven Slurm configuration

AWS公式アナウンスを読む →