メインコンテンツまでスキップ

Amazon SageMaker Deep Dive

1. Training Architecture

SageMaker Training Jobs là ephemeral (tạm thời).

  • Instance tự động bật lên để train.
  • Train xong tự tắt.
  • Chỉ tính tiền thời gian chạy.
Managed Spot Training

Bật tính năng Managed Spot Training để tiết kiệm tới 90% chi phí train. SageMaker tự động handle việc lưu checkpoint và resume nếu Spot instance bị thu hồi.

2. Hosting (Inference)

  • Real-time Inference: HTTP Endpoint. Luôn chạy.
  • Serverless Inference: Tự động scale về 0. Tốt cho traffic không thường xuyên.
  • Async Inference: Cho payload lớn (VD: xử lý ảnh/video) mất nhiều thời gian.

3. SageMaker Studio

IDE trên web dành cho Data Scientist. Tích hợp Jupyter Notebook, Experiment Tracking, Model Registry.