İçeriğe Atla
Kariyer · 7 dk okuma · görüntülenme
100%

Değişiklik Öncesi Pre‑mortem ile Risk Haritalama

Üretime çıkmadan önce arızayı zihinde yaşayıp önlem üretmek: pre‑mortem ritmi, şablon, karar noktaları ve operasyonel liderlik pratiği.

Pre-mortem toplantısında risk haritası ve karar noktalarını gösteren kapak görseli

Bir değişiklik planı ne kadar iyi görünürse görünsün, üretimde her şey “planlandığı gibi” gitmez. Asıl sorun, değişiklikten sonra çıkan hatalar değil; hata çıktığında ekibin ne kadar hızlı ve doğru tepki verdiğidir. Bu yüzden ben kritik değişikliklerde “postmortem” kadar “pre‑mortem” disiplinini de önemserim.

Pre‑mortem’in amacı basit: “Değişiklik başarısız oldu” varsayımıyla, hatayı ve etkisini önceden zihinde yaşayıp riskleri görünür kılmak.

Pre‑mortem ne zaman yapılmalı?

Her deploy için toplantı yapmak sürdürülemez. Pre‑mortem’i şu tip değişikliklerde kullan:

  • Hata alanı geniş: platform, ağ, kimlik, loglama, DNS gibi ortak katmanlar
  • Geri dönüş zor: veri şeması, stateful servis, güvenlik politikası
  • İlk kez yapılıyor: yeni teknoloji/sağlayıcı/operasyon modeli
  • Üretim erişimi / yetki değişimi içeriyor

30 dakikalık pratik akış

Ben pre‑mortem’i 30 dakikaya sığdırmaya çalışırım:

  1. Hedef (3 dk): Bu değişiklik hangi iş etkisini hedefliyor?
  2. “Başarısız oldu” senaryosu (10 dk): Hangi 3 şekilde kötü biter?
  3. Erken sinyaller (7 dk): Hangi metrik/log/alert bunu ilk yakalar?
  4. Geri dönüş (7 dk): 1) otomatik 2) manuel 3) “dur ve izole et”
  5. Karar noktaları (3 dk): Hangi eşikte rollback zorunlu?

Şablon: her değişiklik için aynı sorular

Ben şu soruları sabit kullanırım:

  • Blast radius: En kötü durumda etki alanı ne?
  • Bağımlılıklar: Hangi servis/katman sessizce etkilenir?
  • Gözlem: Başarıyı ve bozulmayı hangi sinyal gösterir?
  • Yetki: Kim rollback yapabilir? Break-glass var mı?
  • Veri: Geri dönüşte veri tutarlılığı riski var mı?
  • Zaman: Süreçte clock skew / TTL / cache etkisi var mı?
  • İletişim: Kimin hangi kanalda bilgilendirileceği net mi?

Bu sorular “doküman üretmek” için değil, kararları hızlandırmak için vardır.

Pre‑mortem çıktısı nasıl kullanılmalı?

En iyi çıktılar:

  • Değişiklik RFC’sine eklenen “risk ve geri dönüş” bölümü
  • Runbook’a eklenen karar noktaları (eşik + aksiyon)
  • Alarm/observability eksiklerinin kapatılması (deploy öncesi)

En kötü çıktı: toplantı yapıp hiçbir yere yazmamak.

Liderlik tarafı: pre‑mortem bir güven inşasıdır

Pre‑mortem, “ekibe güvenmiyorum” mesajı değildir; aksine ekip üzerinde baskı kurmadan güvenli hız üretmenin yoludur. İyi bir lider; riskleri saklamaz, görünür kılar. Çünkü üretimde asıl hız, hatayı erken yakalayıp doğru geri dönebilme kabiliyetidir.

Kapanış

Üretimde mükemmel plan yoktur; ama iyi hazırlanmış geri dönüş vardır. Pre‑mortem; değişiklik öncesi küçük bir yatırım, değişiklik sonrası büyük bir zaman kazancıdır. Disiplinli uygulandığında ekip “cesur” değil, kontrollü olur.

Paylaş:

Bu yazı faydalı oldu mu?

Yükleniyor...

Bu yazı nasıldı?

ME

Mustafa Erbay

Sistem Mimarisi · Network Uzmanı · Altyapı, Güvenlik ve Yazılım

2006'dan bu yana sistem mimarisi, network, sunucu altyapıları, büyük yapıların kurulumu, yazılım ve sistem güvenliği ekseninde çalışıyorum. Bu blogda sahada karşılığı olan teknik deneyimlerimi paylaşıyorum.

Kişisel Notlar

Bu notlar sadece sizde saklanır. Tarayıcınızda yerel olarak tutulur.

Hazır 0 karakter

Yorumlar

Sunucu Taraflı AI Moderasyon

Yorumlar sunucuda yapay zeka ile denetlenir ve kalıcı olarak saklanır.

?
0/2000

Sunucu taraflı AI denetim

Yeni yazılardan haberdar olun

Haftada bir yeni içerikler ve kaynaklar doğrudan e-postanıza gelsin.

Spam yok. Yalnızca yeni ve önemli içerikler için e-posta gönderilir.

Okuma İstatistikleriniz

0

Yazı Okundu

0dk

Okuma Süresi

0

Gün Serisi

-

Favori Kategori

İlgili Yazılar