오토스케일링
· 3 min read
오토스케일링 개념
- 시스템 자원 매트릭을 모니터링하여 서버 사이즈를 자동으로 조절하는 기술
- 클라우드 컴퓨팅의 온디맨드 방식을 기반으로 자원 최적화, 고가용성, 온프레미스 대비 운영의 단순화를 위해 필요
오토스케일링의 구성
Pod, 메트릭모니터링, 로드밸런서 이미지
구성요소
구분 | 기능 | 설명 |
---|---|---|
정책, 모니터링 | 메트릭 수집, 알람 전송 | - |
서버 이미지 배포 | Scale-Out, Scale-In, 서버 프로비저닝 | - |
서비스 연결 | Health-Check, 트래픽 제어 | - |
오토스케일링시 서버 추가까지 필요한 경우, Scale-Up이 비용절감의 효과를 가져올 수 있음.
비교
스케쥴기반, 부하기반
구분 | 스케쥴 기반 오토스케일링 | 부하 기반 오토스케일링 |
---|---|---|
트리거 | 예약된 시간 | 트래픽 |
수치 | 예측 가능한 부하 | 실제 사용량 기반 |
장점 | 트래픽 증가 지연 방지 | 효율적인 리소스 사용량 |
단점 | 예측을 벗어날시 리소스 낭비, 부족 | 인스턴스 배포시간으로 인한 지연 |
Scale Up, Scale Out
구분 | Auto Scale Up | Auto Scale Out |
---|---|---|
추가리소스 | CPU, Memory | 인스턴스 |
장점 | 인스턴스, NW관리 없어 간단 | 높은 확장성, 인스턴스 장애 격리 |
단점 | 물리적 한계, 고비용, 시스템 다운타임 | 복잡한 NW구성, 세션 처리 등 |
성공포인트
- maxUnavailable, maxSurge 적절히 조절
- scale down 으로 비용 절감