Otomatik Ölçekleme Nedir?

İngilizce: Auto Scaling

Otomatik ölçekleme, CPU, bellek, kuyruk veya trafik eşiklerine göre kaynak sayısını kendiliğinden artırıp azaltır.

Otomatik Ölçekleme Nedir?

Otomatik ölçekleme, uygulamanın ihtiyaç duyduğu kaynak miktarını metriklere göre dinamik olarak ayarlayan altyapı yaklaşımıdır. Trafik artınca yeni sunucu, konteyner veya pod eklenir; talep düşünce fazla kaynak kapatılır.

Nasıl Çalışır?

Ölçekleme kuralları genellikle CPU kullanımı, bellek, istek sayısı, kuyruk uzunluğu, yanıt süresi veya özel iş metriği üzerinden tanımlanır. Yatay ölçekleme aynı servisten yeni örnekler ekler; dikey ölçekleme mevcut makinenin kapasitesini artırır. Sağlık kontrolleri, minimum-maksimum sınırlar ve cooldown süreleri yanlış alarm kaynaklı dalgalanmayı azaltır.

Otomatik ölçekleme kapasite planlamasını tamamen ortadan kaldırmaz. Uygulamanın stateless tasarlanması, veritabanı bağlantı havuzları ve cache katmanı da yük artışına dayanabilmelidir.

İş Dünyasında Kullanımı

Kampanya dönemleri, haber trafiği, dönem sonu raporları ve mobil bildirim sonrası ani yoğunluklarda otomatik ölçekleme hizmet kesintisi riskini düşürür. Kubernetes Horizontal Pod Autoscaler gibi mekanizmalar sunar; AWS tarafında Auto Scaling grupları ve yönetilen servis ölçekleme seçenekleri kullanılır.

Maliyet kontrolü için ölçekleme eşikleri, rezerv kapasite, alarm kuralları ve kapanma davranışı düzenli gözden geçirilmelidir.