Amazon SageMaker Deep Dive
1. Training Architecture
SageMaker Training Jobs là ephemeral (tạm thời).
- Instance tự động bật lên để train.
- Train xong tự tắt.
- Chỉ tính tiền thời gian chạy.
Managed Spot Training
Bật tính năng Managed Spot Training để tiết kiệm tới 90% chi phí train. SageMaker tự động handle việc lưu checkpoint và resume nếu Spot instance bị thu hồi.
2. Hosting (Inference)
- Real-time Inference: HTTP Endpoint. Luôn chạy.
- Serverless Inference: Tự động scale về 0. Tốt cho traffic không thường xuyên.
- Async Inference: Cho payload lớn (VD: xử lý ảnh/video) mất nhiều thời gian.
3. SageMaker Studio
IDE trên web dành cho Data Scientist. Tích hợp Jupyter Notebook, Experiment Tracking, Model Registry.