Bir Gece Depolama Sistemi Öldü ve Ben Yazılıma Bakışımı Değiştirdim
Bir gece depolama sistemi öldü; fark ettim ki sorun disk değil, hiçbir şeyin bozulmayacağını sanmaktı. Varsayımlar, güven ve sistemlerin gerçek karakteri.
9 yazı bulundu.
Bir gece depolama sistemi öldü; fark ettim ki sorun disk değil, hiçbir şeyin bozulmayacağını sanmaktı. Varsayımlar, güven ve sistemlerin gerçek karakteri.
1 GB RAM'li bir VPS üzerinde 13 container koştururken yaşadığım OOM (Out of Memory) krizini, kcompactd0'ın CPU'yu nasıl esir aldığını ve çözüm yollarını…
Blog otomasyonum başka projenin build'iyle çakıştı. RAM tükendi, sshd reset etti. Hard reboot + flock ile global build mutex çözümü.
VPS'imde RAM tükendi, swap doldu, sshd connection reset etti. Astro build OOM'u tetikleyince katmanlı pipeline savunmasını kurmaya karar verdim.
Disk-cleanup.timer'ım runner'ın _work/_temp dizinlerini silmiş. 16 saat boyunca tüm cron'lar 'Missing file: set_output_*' ile patladı. Kazaya itirafım.
Kritik bir incident sırasında takımlar arası gerilimin nedenlerini, sonuçlarını ve bu durumu yönetmek için atılması gereken adımları keşfedin. Etkili liderlik…
Hatalardan öğrenmek zorlu bir süreçtir. Post-mortem kültürünün ardındaki kişisel bedelleri, suçlama kültüründen öğrenme kültürüne geçişi ve bireysel…
AI içerik pipeline'ım üç farklı format quirk'iyle patladı: slash'lı tag, tırnaklı tarih, dotted-i karakter. Tek normalizer ile çözüm.
Büyük kesintiler sonrası post-mortem süreçleri sadece teknik bir inceleme değildir; mühendislerin üzerindeki psikolojik ve görünmez yükü anlamak ve yönetmek,…