Amazon EKS用Elastic Fabric Adapter対応のKubernetes Dynamic Resource Allocationを発表
Announcing Kubernetes Dynamic Resource Allocation for Elastic Fabric Adapter
概要
Amazon EKSがElastic Fabric Adapter(EFA)向けのDynamic Resource Allocation(DRA)をサポートしました。EFA DRAドライバーにより、AI、機械学習、HPC(High Performance Computing)ワークロード向けに高性能なノード間通信とRDAM(Remote Direct Memory Access)が簡素化されます。トポロジー対応アロケーションにより、ネットワークトラフィックが最寄りのネットワークインターフェースを通じて流れるようになります。
何が変わったか
- ・EFA DRAドライバーがKubernetes Dynamic Resource Allocationをサポート
- ・EFAインターフェースとアクセラレーターデバイスのトポロジー対応アロケーション機能
- ・同一ノード上のワークロード間でのEFAインターフェース共有に対応
- ・Kubernetes 1.34以降のEKSマネージドノードグループおよびセルフマネージドノードで対応
影響
既存のEFAデバイスプラグインはKarpenterおよびAmazon EKS Auto Modeとの併用で引き続きサポートされます。新規デプロイメントはEFA DRAドライバーの使用を推奨されます。
対象ユーザー
Amazon EKS上でAI、機械学習、HPCワークロードを実行するデータサイエンティストおよびMLエンジニア
まとめ
Amazon EKSでElastic Fabric Adapter向けKubernetes Dynamic Resource Allocationがサポートされ、AI/機械学習/HPCワークロードの高性能ノード間通信がより効率的に実現可能になった。
原文タイトル
Announcing Kubernetes Dynamic Resource Allocation for Elastic Fabric Adapter
AWS公式アナウンスを読む →