Skip to main content

ECS Scaling

ECS hỗ trợ scale ở 2 tầng: Application (Task) và Infrastructure (EC2).

1. Service Auto Scaling (Task Level)

Tự động tăng giảm số lượng Task dựa trên CloudWatch Metrics.

  • Target Tracking: "Giữ CPU trung bình của Service ở mức 70%".
  • Step Scaling: "Nếu Request Count > 1000, thêm 2 tasks".
  • Scheduled Scaling: "Scale out vào 8h sáng".

2. Cluster Auto Scaling (Infrastructure Level)

Khi số lượng Task tăng lên, bạn cần thêm EC2 instances để chạy chúng.

  • Capacity Providers:
    • Quản lý việc scaling của Auto Scaling Group (ASG) thay cho bạn.
    • Managed Scaling: ECS tự động tính toán số lượng EC2 cần thiết dựa trên số lượng Task đang ở trạng thái PROVISIONING (đang chờ tài nguyên).
    • Bảo vệ instance khỏi bị terminate nếu đang chạy Task quan trọng (Managed Termination Protection).

3. Fargate Scaling

Với Fargate, bạn không cần lo về Cluster Scaling. AWS tự động cấp phát tài nguyên cho từng Task. Bạn chỉ cần quan tâm Service Auto Scaling.