İçeriğe Atla
Kariyer · 8 dk okuma · görüntülenme
100%

Kıdemli Mühendisler İçin Runbook Borcu Yönetimi

Operasyonel hafızayı kişilere değil sisteme taşıyan runbook borcu yönetimi için teknik liderlik yaklaşımı.

Runbook borcu, incident akışı ve ekip hafızasını gösteren teknik kapak görseli

Kıdemli mühendislik pratiğinde en pahalı borç türlerinden biri kod borcu değil, runbook borcudur. Sistem ayakta görünürken ekip yalnızca birkaç kişinin kafasında yaşayan operasyon bilgisine yaslanıyorsa, ilk büyük incident anında bunun bedeli ortaya çıkar. Runbook borcu yönetimi, operasyonel hafızayı kahramanlıktan çıkarıp tekrar edilebilir mühendislik pratiğine dönüştürür.

Runbook borcu yönetim şeması

Runbook borcu neden görünmez kalır?

Birçok ekip runbook eksikliğini dokümantasyon problemi gibi görür. Oysa sorun yalnızca belge yazmamak değildir; karar akışlarının, geri dönüş adımlarının ve gözlem sinyallerinin sistematik biçimde dışsallaştırılmamasıdır. Bu nedenle görünürde süreç işler, fakat bilgi yükü sessizce belirli kıdemli kişilere yığılır.

Runbook borcu genelde şu belirtilerle kendini gösterir:

  • Aynı tip incident için her seferinde farklı müdahale sırası izlenir.
  • Nöbetçi mühendis bir işi çözmek için belirli bir kişiye mesaj atmak zorunda kalır.
  • Değişiklik sonrası geri dönüş kararı ölçüme değil tecrübeli kişinin hissine dayanır.
  • Yeni katılan mühendisler üretim sistemine yaklaşırken gereğinden fazla çekingen davranır.

Bu tablo, organizasyonun teknik olgunluğunu olduğundan yüksek gösterir. Çünkü bilgi vardır, ama taşınabilir değildir.

Runbook yazmak değil, runbook portföyü yönetmek gerekir

Kıdemli mühendisler çoğu zaman “bir runbook yazarız” yaklaşımına düşer. Problem burada ölçeklenmez. Doğru yaklaşım, runbook’ları yaşayan bir operasyon portföyü olarak ele almaktır. Her runbook bir belge değil; bir risk sınıfı, bir karar ağacı ve bir gözlem bağlamı taşır.

Benim pratikte verimli bulduğum ayrım şu şekildedir:

  1. Müdahale runbook’ları: Incident sırasında ilk 15 dakikayı standardize eder.
  2. Değişiklik runbook’ları: Yayın, rollback ve doğrulama adımlarını açıklar.
  3. Bakım runbook’ları: Düzenli operasyon işlerini kişiden bağımsızlaştırır.
  4. Tanı runbook’ları: Belirtiye göre hangi sinyale bakılacağını tanımlar.

Bu sınıflandırma olmadan bütün operasyon bilgisi tek tip belgeye dönüşür ve arama kolay görünse de kullanımı zorlaşır.

İyi bir runbook hangi soruları cevaplamalı?

Runbook metni uzun olmak zorunda değildir. Ama karar kalitesini artıracak kadar net olmalıdır. Özellikle şu sorular cevapsız kalmamalı:

  • Bu runbook hangi alarm, belirti veya değişiklik türü için geçerli?
  • İlk üç kontrol noktası nedir?
  • Hangi metrik, log veya dashboard müdahale kararını etkiler?
  • Ne zaman rollback yapılır, ne zaman escalation açılır?
  • Etki alanı hangi servislerle sınırlıdır?

Runbook yalnızca adım listesi olursa hız kazandırır ama muhakeme üretmez. Adımların yanında karar eşiği de tarif edilirse ekip kalitesi tutarlı hâle gelir.

Borcu nasıl ölçeriz?

Runbook borcu görünmez kaldığında öncelik alamaz. Bu yüzden teknik liderin görevi, belge saymak değil operasyonel açıklığı ölçmektir. Aşağıdaki sinyaller pratikte işe yarar:

  • Son üç incident’ta manuel bilgi aktarımı kaç kez gerekti?
  • İlk müdahale süresi kişi bazında ciddi değişiyor mu?
  • Aynı iş için farklı ekip üyeleri farklı dashboard’lara mı gidiyor?
  • Rollback kararı açık eşiklere bağlı mı, yoksa yoruma mı kalıyor?

Bu veriler sayesinde runbook çalışması “dokümantasyon temizliği” gibi değil, doğrudan incident performansı yatırımı gibi görülür.

Runbook borcunu kapatırken sık yapılan hata

En yaygın hata, kıdemli mühendislerin incident sonrasında tek başına belge yazmasıdır. Bu yöntem kısa vadede hızlı görünür; fakat runbook gerçek kullanıcıların diline ve akışına temas etmez. Sonuçta belge vardır ama nöbetçi ekip yine kişiye döner.

Daha sağlam model şudur:

  1. Incident veya değişiklik sonrası taslak akışı çıkarın.
  2. İlk kullanımını belgeyi hiç yazmamış bir mühendis yapsın.
  3. Eksik kalan karar eşiklerini kullanım sırasında düzeltin.
  4. Runbook’u ilgili alarm, dashboard ve repo referanslarıyla bağlayın.

Böylece runbook statik wiki sayfası değil, operasyon yüzeyinin gerçek parçası olur.

Teknik liderin rolü nedir?

Runbook borcu yönetimi yalnızca SRE veya operasyon ekibine bırakılmamalıdır. Teknik lider, hangi bilgilerin kurumsal hafızaya dönüşmesi gerektiğini seçen kişidir. Her şeyi belgelemek doğru olmadığı gibi, kritik karar yollarını kişide bırakmak da kabul edilemez.

Kıdemli mühendislik burada üç sorumluluk taşır:

  • En yüksek etkiye sahip runbook boşluklarını önceliklendirmek
  • Runbook kalitesini gerçek kullanım üzerinden değerlendirmek
  • Yeni mühendisleri belge tüketicisi değil belge geliştiricisi yapmak

Bu yaklaşım, mentorlukla operasyon disiplinini aynı hatta taşır.

Sonuç

Kıdemli mühendisler için runbook borcu yönetimi, belge üretiminden çok sistematik hafıza tasarımı işidir. Operasyon bilgisi kişiden sisteme taşındığında nöbet yükü daha adil dağılır, incident müdahalesi daha öngörülebilir olur ve ekip kıdemi kurumsal çarpana dönüşür. Sağlam mühendislik kültürü, yalnızca iyi çalışan sistemlerle değil; gerektiğinde herkesin aynı netlikle müdahale edebildiği sistemlerle kurulur.

Paylaş:

Bu yazı faydalı oldu mu?

Yükleniyor...

Bu yazı nasıldı?

ME

Mustafa Erbay

Sistem Mimarisi · Network Uzmanı · Altyapı, Güvenlik ve Yazılım

2006'dan bu yana sistem mimarisi, network, sunucu altyapıları, büyük yapıların kurulumu, yazılım ve sistem güvenliği ekseninde çalışıyorum. Bu blogda sahada karşılığı olan teknik deneyimlerimi paylaşıyorum.

Kişisel Notlar

Bu notlar sadece sizde saklanır. Tarayıcınızda yerel olarak tutulur.

Hazır 0 karakter

Yorumlar

Sunucu Taraflı AI Moderasyon

Yorumlar sunucuda yapay zeka ile denetlenir ve kalıcı olarak saklanır.

?
0/2000

Sunucu taraflı AI denetim

Yeni yazılardan haberdar olun

Haftada bir yeni içerikler ve kaynaklar doğrudan e-postanıza gelsin.

Spam yok. Yalnızca yeni ve önemli içerikler için e-posta gönderilir.

Okuma İstatistikleriniz

0

Yazı Okundu

0dk

Okuma Süresi

0

Gün Serisi

-

Favori Kategori

İlgili Yazılar