İçeriğe Atla
Teknoloji · 11 dk okuma · görüntülenme
100%

Anycast DNS ile Kurumsal Edge Resolver Mimarisi

Kurum içi DNS resolver katmanını Anycast ile POP/şube yakınında konumlandırıp gecikmeyi düşüren ve işletilebilirliği artıran yaklaşım.

Anycast ile edge DNS resolver katmanını gösteren kapak görseli

Kurum ağlarında “yavaş internet” şikâyetinin arkasından çoğu zaman DNS çıkar: uygulama aynı, hat aynı; ama resolver uzakta, cache yok, upstream geç yanıtlıyor. DNS’i düzeltmek “bir sunucu daha kuralım” değil, resolver katmanını mimari bir bileşen gibi tasarlamak demektir.

Bu yazıda sahada işleyen yaklaşımı anlatıyorum: edge resolver + Anycast + BGP kontrolü + sağlık sinyali.

Anycast ile edge DNS resolver katmanını gösteren kapak görseli
Anycast, “en yakın resolver” fikrini routing düzlemine taşır; doğru kurulduğunda latency düşer, arıza alanı küçülür.

1) Önce kavramı netleştir: authoritative değil, recursive resolver

Buradaki hedef:

  • Kullanıcı/servis → kurum içi recursive resolver (Unbound/BIND/PowerDNS Recursor vb.)
  • Resolver → (gerekirse) upstream (ISP, public resolver, internal authoritative, forwarder)

Anycast’ı genelde authoritative tarafında görürüz; ama kurum içinde recursive resolver’ı Anycast yapmak, şube/POP gecikmesini belirgin azaltır ve cache verimini artırır.

2) Anycast ile ne kazanırsın (ve neyi kaybedebilirsin)?

Kazanımlar

  • Şube/POP tarafında daha düşük p95 DNS latency
  • Cache daha “yakın” çalıştığı için daha yüksek hit ratio
  • Resolver arızasında trafik doğal olarak başka node’a kayabilir (doğru sinyalle)

Riskler

  • Yanlış BGP duyurusu → yanlış yere trafik (en pahalı sınıf hata)
  • Cache ısınma dalgası (failover sonrası upstream’e yük)
  • “Nearest” her zaman “best” değildir (bazı hatlarda en kısa AS-path kötü olabilir)

3) Referans mimari: 2 katmanlı resolver

Benim kurumlarda sevdiğim sade model:

  1. Edge resolver havuzu (Anycast VIP)
    POP/şube yakınında küçük bir havuz: 2–3 node (VM/metal). VIP’yi BGP ile duyurur.
  2. Core upstream
    Veri merkezinde/merkezde daha büyük kapasite ve daha zengin politika: internal zone’lar, split-horizon, kayıt yönetimi, logging.

Edge resolver tarafında amaç “her policy burada” değil; yakın cache + hızlı cevap.

4) BGP tasarımı: güvenli varsayılanlar

Anycast resolver’ı BGP ile duyururken, “minimum güvenli set”:

  • Prefix: sadece resolver VIP /32 (IPv4) veya /128 (IPv6)
  • Scope: iBGP (aynı AS) + kontrollü eBGP (POP’lar arası)
  • Guardrail:
    • max-prefix limit
    • prefix-list + route-map ile sadece o VIP’in duyurulması
    • mümkünse RPKI/ROA ve upstream filtre disiplini

Öneri: İlk iterasyonda internet’e anycast etmeyin. Önce kurum içi yönlendirme ile olgunlaştırın.

5) Sağlık sinyali: “DNS çalışıyor mu?” sorusunu routing’e bağla

Anycast’ta kritik parça şudur: Node üzerindeki servis bozulduğunda, route çekilmezse trafik “yakın ama bozuk” node’a akmaya devam eder.

Sağlık kontrolü için pratik yaklaşım:

  • Resolver’da local health endpoint veya basit bir script
  • Şu soruların yanıtını doğrula:
    • dig @127.0.0.1 example.com A p95 < X ms
    • Internal zone (ör. corp.local) cevaplıyor mu?
    • Upstream timeouts artmış mı?
  • Sağlıksızsa:
    • BGP announcement’ı otomatik çek (BIRD/FRR + healthcheck integration)
    • veya route-map ile pref düşür (ikinci opsiyon, daha riskli)

6) Operasyon: ölçmeden Anycast işletilmez

Edge resolver’lar için izlediğim minimum metrik seti:

  • DNS latency: p50/p95/p99 (UDP/TCP ayrı)
  • RCODE dağılımı: NOERROR/NXDOMAIN/SERVFAIL/REFUSED
  • Upstream timeout oranı
  • Cache hit ratio + evictions
  • QPS + concurrency
  • Top query + top NXDOMAIN (anomaliler için)

Alarm örnekleri:

  • SERVFAIL oranı 5 dakikada %1 → %10
  • Upstream timeout artışı + latency artışı birlikte
  • Anycast havuzunda tek node kaldı (redundancy kaybı)

7) Runbook: “DNS yavaş” incident’ında 15 dakikalık triage

  1. İstemci tarafı: aynı anda kaç POP etkileniyor?
  2. Resolver katmanı: Anycast VIP’e giden POP’lar aynı mı?
  3. Resolver node sağlık: dig @vip ve dig @node-ip kıyasla
  4. Upstream: timeout/latency artışı var mı?
  5. Müdahale seçenekleri:
    • En hızlı: problemli node’un BGP ilanını çek
    • Orta: resolver cache parametrelerini (serve-stale vb.) devreye al
    • Kalıcı: upstream/topoloji iyileştirme

8) Son söz

Anycast DNS, kurum içinde “DNS’i büyütmek” değil; DNS’i yönetilebilir bir platform katmanı haline getirmektir. Routing, observability ve runbook disiplinini birlikte kurduğunuzda; kullanıcı şikâyeti azalır, incident süresi kısalır, altyapı daha sakin çalışır.

Paylaş:

Bu yazı faydalı oldu mu?

Yükleniyor...

Bu yazı nasıldı?

ME

Mustafa Erbay

Sistem Mimarisi · Network Uzmanı · Altyapı, Güvenlik ve Yazılım

2006'dan bu yana sistem mimarisi, network, sunucu altyapıları, büyük yapıların kurulumu, yazılım ve sistem güvenliği ekseninde çalışıyorum. Bu blogda sahada karşılığı olan teknik deneyimlerimi paylaşıyorum.

Kişisel Notlar

Bu notlar sadece sizde saklanır. Tarayıcınızda yerel olarak tutulur.

Hazır 0 karakter

Yorumlar

Sunucu Taraflı AI Moderasyon

Yorumlar sunucuda yapay zeka ile denetlenir ve kalıcı olarak saklanır.

?
0/2000

Sunucu taraflı AI denetim

Yeni yazılardan haberdar olun

Haftada bir yeni içerikler ve kaynaklar doğrudan e-postanıza gelsin.

Spam yok. Yalnızca yeni ve önemli içerikler için e-posta gönderilir.

Okuma İstatistikleriniz

0

Yazı Okundu

0dk

Okuma Süresi

0

Gün Serisi

-

Favori Kategori

İlgili Yazılar