[アップデート] Amazon SageMaker HyperPod の Flexible Training Plans に P6-B200 インスタンスがサポートされました
https://dev.classmethod.jp/articles/sagemaker-hyperpod-flexible-training-plans-p6-b200-support/
[アップデート] Amazon SageMaker HyperPod の Flexible Training Plans に P6-B200 インスタンスがサポートされました
https://dev.classmethod.jp/articles/sagemaker-hyperpod-flexible-training-plans-p6-b200-support/
[アップデート] Amazon SageMaker HyperPod が Amazon EventBridge と統合され、ステータス変更イベントを配信できるようになりました
https://dev.classmethod.jp/articles/amazon-sagemaker-hyperpod-integrates-amazon-eventbridge-status-change-events/
#dev_classmethod #SageMaker_HyperPod #Amazon_EventBridge #AWS
[アップデート] Amazon SageMaker Hyperpod の Slurm オーケストレータがマルチヘッドノードをサポートしたため概要をまとめてみた
https://dev.classmethod.jp/articles/sagemaker-hyperpod-multi-head-slurm-support/
[アップデート] 東京リージョンでも Amazon SageMaker HyperPod flexible training plans が利用可能になっていました
https://dev.classmethod.jp/articles/amazon-sagemaker-hyperpod-flexible-training-plans-tokyo-region/
[アップデート] SageMaker Hyperpod の Flexible Training Plans が、即時開始と複数のオファーをサポートするようになりました
https://dev.classmethod.jp/articles/sagemaker-hyperpod-flexible-training-plans-instant-start-times-multiple-offers/
SageMaker HyperPod のスケールダウンについて整理してみた Slurm オーケストレータ編
https://dev.classmethod.jp/articles/sagemaker-hyperpod-scale-down-overview-slurm/
SageMaker HyperPod のスケールダウンについて整理してみた EKS オーケストレータ編
https://dev.classmethod.jp/articles/sagemaker-hyperpod-scale-down-overview-eks/
#dev_classmethod #SageMaker_HyperPod #Amazon_EKS #Amazon_SageMaker #AWS
Sagemaker Hyperpod で DeepSeek-R1 をFine-Tuning してみた
https://dev.classmethod.jp/articles/hyperpod-deepseek-r1-fine-tuning/
SageMaker HyperPod クラスター起動で必要な IAM 周りをまとめてみた
https://dev.classmethod.jp/articles/summarizing-iam-requirements-for-launching-sagemaker-hyperpod-cluster/
SageMaker HyperPod のタスクガバナンス機能を試してみた
https://dev.classmethod.jp/articles/sagemaker-hyperpod-task-governance/
SageMaker HyperPod のログインノードに VS Code から Remote SSH してみる
https://dev.classmethod.jp/articles/sagemaker-hyperpod-login-node-vscode-remote-ssh/
#dev_classmethod #SageMaker_HyperPod #VSCode_Visual_Studio_Code #AWS
Amazon CloudWatch Observability アドオンを利用して SageMaker HyperPod を監視してみた
https://dev.classmethod.jp/articles/monitor-sagemaker-hyperpod-cloudwatch-addon/
#dev_classmethod #SageMaker_HyperPod #Amazon_CloudWatch #AWS
EKS オーケストレータを使った SageMaker HyperPod クラスターで S3 をマウントしてみた
https://dev.classmethod.jp/articles/mountpoint-for-s3-on-sagemaker-hyperpod-with-eks-orchestrator/
EKS オーケストレータを使った SageMaker HyperPod クラスターで FSx for Lustre をマウントしてみた
https://dev.classmethod.jp/articles/mount-fsx-lustre-on-sagemaker-hyperpod-with-eks-orchestrator/
#dev_classmethod #SageMaker_HyperPod #Amazon_EKS #Amazon_FSx_for_Lustre #AWS
SageMaker HyperPod の 自動ノード復旧を試してみる
https://dev.classmethod.jp/articles/sagemaker-hyperpod-auto-node-recovery-test/
Amazon SageMaker HyperPod クラスター設定ファイルのバリデーションスクリプトを試してみた
https://dev.classmethod.jp/articles/validating-sagemaker-hyperpod-cluster-config/
SageMaker HyperPod の Deep health checks を試してみる
https://dev.classmethod.jp/articles/sagemaker-hyperpod-deep-health-checks-testing/
Amazon SageMaker HyperPod で PyTorch による分散学習を試してみた
https://dev.classmethod.jp/articles/hands-on-pytorch-distributed-learning-using-sagemaker-hyperpod/
EKS オーケストレータを使った最低限の HyperPod クラスターを作成してみる
https://dev.classmethod.jp/articles/creating-minimal-hyperpod-cluster-with-eks-orchestrator/
HyperPod in Studio のダッシュボードを眺めてみた
https://dev.classmethod.jp/articles/hyperpod-in-studio-dashboard-review/