İçeriğe Atla
Teknoloji · 12 dk okuma · görüntülenme
100%

SD-WAN’da SLA Probe ile Yol Seçimi ve Incident Triage

Latency/jitter/loss ölçen aktif probelar ile uygulama sınıfları için doğru yolu seçmek; bozulma anında hızlı teşhis ve kontrollü failover yaklaşımı.

SD-WAN overlay yollarını ölçen SLA probeları şeması

SD-WAN projelerinde en hızlı yanlış güven şudur: “2 hat var, SD-WAN zaten akıllı, otomatik geçer.” Üretimde ise problem genelde hat down değildir; hat “up” görünür ama latency/jitter/loss bozulur, uygulama kırılır ve ekipler “ISP mi, overlay mi, iç ağ mı?” diye saatler kaybeder.

Bu yazı; SD-WAN’da yol seçiminde SLA probe yaklaşımını nasıl kurguladığımı ve incident anında triage’ı nasıl hızlandırdığımı anlatır.

SD-WAN overlay yollarını ölçen SLA probeları şeması
Aktif probelar; “link up” yerine “yol kalitesi” üzerinden karar aldırır.

SLA probe neyi çözer?

SLA probe; belirli hedeflere düzenli küçük paketlerle ölçüm yaparak şunları üretir:

  • RTT / latency (p50/p95)
  • jitter (özellikle ses/video için kritik)
  • packet loss (kırılma eşikleri uygulamaya göre değişir)

Bu sayede “default route” değil; uygulama sınıfı için en iyi yol seçilir.

İlk karar: Probe hedefleri (yanlış hedef = yanlış karar)

Probe hedeflerini “internet” diye tek bir IP’ye bağlamayın. İki katman hedef seçin:

  1. Underlay hedefleri (ISP içi / edge router): hat kalitesini ölçmek için
  2. Overlay hedefleri (hub, DC, cloud edge): gerçek servis yolunu ölçmek için

Örnek hedef seti:

  • Şube → SD-WAN hub (overlay)
  • Şube → DC edge (overlay)
  • Şube → cloud region edge (overlay)
  • Şube → ISP gateway (underlay)

Uygulama sınıfları: Tek SLA eşik seti kullanmayın

Çok görülen hata: tüm trafiğe aynı eşikler.

Örnek (kurumsal pratik):

  • Voice/Video: jitter ve loss hassas (küçük bozulma bile etkiler)
  • ERP/Interactive: latency hassas
  • Bulk/Backup: loss toleranslı ama throughput önemli

Bu nedenle “application policy” şu bileşenleri içermeli:

  • DSCP sınıfı
  • SLA eşikleri (latency/jitter/loss)
  • Failover davranışı (hızlı geçiş mi, sticky mi?)
  • Geri dönüş davranışı (flap önleyici hysteresis)

Flap yönetimi: Hysteresis ve hold-down şart

SLA bozulup düzelirken yol seçim motoru “ping-pong” yaparsa, kullanıcı bunu “internet gidip geliyor” diye yaşar.

Önerdiğim minimumlar:

  • Degrade eşiği: ör. 3 ardışık kötü ölçüm
  • Recovery eşiği: ör. 10 ardışık iyi ölçüm
  • Hold-down: yol değişince X dakika sabit kal

Bu üçlü, incident sırasında “karar kaosu”nu engeller.

Operasyon: Triage runbook’u (15 dakikada sınıflandır)

Bozulma başladığında ilk hedef: “root cause” değil; bozulmayı sınıflandırmak.

1) Hangi sınıf etkileniyor?

  • Sadece voice/video mu?
  • Sadece ERP mi?
  • Tüm trafik mi?

Etkilenen sınıf; genelde root cause’a işaret eder (jitter → bufferbloat/queue, loss → fiziksel/ISP, latency → route değişimi).

2) Probe sonuçları ne diyor?

  • Underlay iyi, overlay kötü → hub/DC tarafına bak
  • Underlay kötü, overlay kötü → ISP / son mil
  • Underlay iyi, overlay iyi ama kullanıcı şikâyetçi → iç LAN/Wi-Fi/endpoint

3) Failover kararını kontrollü ver

  • “Auto failover” açıksa bile, kritik dalgalarda manuel “freeze” gerekebilir
  • Büyük bir ISP incident’ında tüm şubelerin aynı anda diğer hatta geçmesi; ikinci hattı da boğabilir

Gözlemlenebilirlik: SD-WAN telemetrisini tek yerde topla

SLA probe çıktılarını “controller ekranında” bırakmayın. Şunları merkezi izleyin:

  • Şube bazlı latency/jitter/loss trendi
  • Yol değişim olayları (path change events)
  • Uygulama sınıfı bazında tercih edilen yol

Bu veriler, vendor bağımsız olarak incident postmortem kalitesini yükseltir.

Son söz

SD-WAN’ın “akıllı” olması, sizin operasyonel refleksinizi gereksiz kılmaz. SLA probe ve doğru hedef/eşik tasarımıyla; yol seçimi gerçekten uygulama odaklı hale gelir, incident triage saatlerden dakikalara iner ve failover kararları daha kontrollü olur.

Paylaş:

Bu yazı faydalı oldu mu?

Yükleniyor...

Bu yazı nasıldı?

ME

Mustafa Erbay

Sistem Mimarisi · Network Uzmanı · Altyapı, Güvenlik ve Yazılım

2006'dan bu yana sistem mimarisi, network, sunucu altyapıları, büyük yapıların kurulumu, yazılım ve sistem güvenliği ekseninde çalışıyorum. Bu blogda sahada karşılığı olan teknik deneyimlerimi paylaşıyorum.

Kişisel Notlar

Bu notlar sadece sizde saklanır. Tarayıcınızda yerel olarak tutulur.

Hazır 0 karakter

Yorumlar

Sunucu Taraflı AI Moderasyon

Yorumlar sunucuda yapay zeka ile denetlenir ve kalıcı olarak saklanır.

?
0/2000

Sunucu taraflı AI denetim

Yeni yazılardan haberdar olun

Haftada bir yeni içerikler ve kaynaklar doğrudan e-postanıza gelsin.

Spam yok. Yalnızca yeni ve önemli içerikler için e-posta gönderilir.

Okuma İstatistikleriniz

0

Yazı Okundu

0dk

Okuma Süresi

0

Gün Serisi

-

Favori Kategori

İlgili Yazılar