Yönetim düzlemi servisleri çoğu kurumda ikinci planda kalır; ama bozulduklarında etkisi büyüktür. İç DNS paneli, bastion portalı, konfigürasyon aracı veya operasyon API’si gibi servisler tekil bir IP veya tek bir sanal makineye bağlı kaldığında bakım anları gereksiz risk üretir. Tam ölçekli load balancer gerekmeyen, ama temel süreklilik isteyen durumlarda Keepalived ile VRRP failover sade ve etkili bir seçenektir.
Hangi senaryoda anlamlı?
Bu model özellikle şu tür servislerde işe yarar:
- İç erişime açık bastion veya jump servisleri
- Yönetim API’leri
- Hafif dashboard veya portal bileşenleri
- Dağıtık olmayan ama kısa kesintiye tahammülü düşük araçlar
Eğer uygulamanız aktif-aktif davranacak kadar stateless ve yatay ölçekliyse farklı çözümler gerekir. Keepalived tarafı daha çok giriş noktasını yüksek erişilebilir yapmak için uygundur.
Mimari nasıl kurulur?
En sade model iki Linux düğümünden oluşur:
node-abaşlangıçtaMASTERnode-bBACKUP- İki düğüm aynı L2 segmentte VRRP anonsu yapar
- Servis için ortak bir VIP atanır
Normal durumda trafik VIP üzerinden node-aya gelir. Sağlık kontrolü bozulduğunda Keepalived önceliği düşürür ve VIP node-bye geçer.
Basit bir yapılandırma örneği
Temel mantık şöyledir:
vrrp_script chk_mgmt {
script "/usr/local/bin/check-mgmt.sh"
interval 2
fall 2
rise 2
}
vrrp_instance VI_MGMT {
state MASTER
interface eth0
virtual_router_id 51
priority 150
advert_int 1
authentication {
auth_type PASS
auth_pass StrongSharedSecret
}
virtual_ipaddress {
10.20.30.50/24
}
track_script {
chk_mgmt
}
}
BACKUP düğümünde aynı blok daha düşük priority ile tanımlanır. Asıl kritik nokta sağlık kontrolü script’inin gerçekten servis doğrulaması yapmasıdır. Sadece proses çalışıyor kontrolü çoğu zaman yeterli değildir.
Hangi ağ ayrıntıları gözden kaçıyor?
VRRP kurulumlarında sık karşılaşılan sorunlar genellikle uygulamadan değil ağ davranışından gelir:
- Gratuitous ARP’nin switch veya güvenlik katmanı tarafından bastırılması
- Yanlış MTU veya VLAN eşleşmesi
- Aynı
virtual_router_idnin başka segmentte çakışması nopreemptdavranışının gereksinime uymaması
Bakım penceresiz operasyon istiyorsanız, failover davranışını üretim öncesi kontrollü biçimde test etmek şarttır.
Operasyon için hangi kontroller eklenmeli?
Kurulum tamamlandıktan sonra aşağıdaki sinyaller mutlaka izlenmelidir:
- VRRP durum değişimleri
- Health check başarısızlık sayısı
- VIP geçiş süresi
- Failover sonrası uygulama yanıtı
- ARP tablosu yakınsama gecikmesi
Bu metrikler olmadan “yüksek erişilebilir” yapı kurulduğunu düşünmek erken olur.
Sonuç
Keepalived ile yönetim düzlemi için VRRP failover, pahalı ve ağır bir yüksek erişilebilirlik mimarisi kurmadan giriş noktasını dayanıklı hale getirmek için pragmatik bir yöntemdir. Doğru sağlık kontrolü, ağ davranışı bilgisi ve ölçümleme ile birlikte kullanıldığında, özellikle iç operasyon servislerinde ciddi risk azaltımı sağlar.