Linux yönetimi “komut ezberi” değil; doğru sırayla bakabilmektir. Üretimde bir servis çöktüğünde, 10 dakikada sinyali daraltamıyorsanız incident büyür.
Bu yazı, temel triage akışını cheat‑sheet şeklinde toplar: CPU/memory, systemd/journald, disk ve network.
1) CPU / Process
uptime
top
ps aux --sort=-%cpu | head
2) Memory / OOM
free -h
dmesg -T | tail -n 200 | rg -n \"oom|killed\" || true
3) systemd / logs
systemctl status my-service --no-pager
journalctl -u my-service -n 200 --no-pager
4) Disk / IO
df -h
du -sh /var/log/* 2>/dev/null | sort -h | tail
5) Network / DNS
ss -lntp
ip route
resolvectl status 2>/dev/null || cat /etc/resolv.conf
Sonuç
Linux triage’ın sırrı basit: önce problemi sınıflandır, sonra doğru metrik/log ile daralt. Bu, incident süresini dramatik düşürür.