İçeriğe Atla
Mustafa Erbay
Teknoloji · 4 dk okuma · görüntülenme Read in English
100%

BGP RTBH ve FlowSpec ile DDoS Müdahale Runbook’u

Operasyon sırasında RTBH/FlowSpec karar ağacı, doğrulama adımları ve geri dönüş planı ile DDoS etkisini kontrollü azaltma yaklaşımı.

BGP RTBH ve FlowSpec ile DDoS Müdahale Runbook’u — kapak görseli

DDoS olaylarında en büyük hata, teknik çözümü “tek hamle” sanmaktır. Gerçekte iyi bir müdahale; karar ağacı, doğrulama ve geri dönüş adımlarının birlikte çalışmasıdır. RTBH (Remote Triggered Black Hole) ve BGP FlowSpec, doğru tasarlanırsa olay anında çok hızlı etki eder; yanlış tasarlanırsa da yanlış trafiği keserek ikinci bir incident üretir.

Bu yazı, ISP seviyesinde “büyük anlatı” yerine; kurumsal ağlarda ve edge katmanında sahada uygulanan pratik bir runbook yaklaşımını anlatır.

Ön şart: topoloji ve sorumluluk sınırı net olmalı

RTBH ve FlowSpec’i konuşmadan önce şu üç sorunun cevabı yazılı olmalı:

  1. BGP’yi kim konuşuyor? (Edge router mı, transit/peering cihazı mı, cloud router mı?)
  2. Kara delik nereye? (Null route cihaz içinde mi, scrubbing center mı, upstream blackhole mu?)
  3. Kim karar veriyor? (NOC, NetOps, SecOps, Incident Commander?)

Bu sorular net değilse, olay anında “komutu kim atacak?” tartışması süreyi öldürür.

Karar ağacı: RTBH mi, FlowSpec mi?

Sahada en pratik ayrım şu:

  • Hedef servis tamamen batıyorsa ve “kapat daha iyi” noktasına geldiyse → RTBH
  • Trafiğin bir kısmı kötü ve filtreyle ayıklanabiliyorsa → FlowSpec

Bu karar için hızlı metrikler:

SinyalRTBH lehineFlowSpec lehine
L7 tamamen çökükEvetHayır
Saldırı tek hedef IPEvetEvet
Saldırı belirli port/protoKısmenEvet
Yanlış pozitif riskiDüşükOrta/Yüksek
Uygulama toleransı“Kapat” kabul“Devam” hedef

RTBH: minimum güvenli uygulama şablonu

RTBH’de amaç, hedef prefix’e özel bir route’u “blackhole next-hop” ile yayıp trafiği upstream’de düşürmektir. Üç kontrol öneriyorum:

  1. Sadece belirli community ile tetikle
  2. Sadece belirli prefix boyutlarını kabul et (/32 gibi dar hedefler)
  3. TTL (süre) gibi operasyonel geri dönüş standardı koy

Doğrulama adımları

RTBH sonrası doğrulama, sadece “trafik düştü” değil:

  • Edge router’da ilgili prefix’in blackhole’a gittiğini doğrula
  • Upstream/IX tarafında route’un yayıldığını doğrula (varsa looking glass)
  • Hedef serviste CPU/conntrack/interrupt baskısının gerçekten düştüğünü ölç
  • Monitoring’de alarm fırtınasını “beklenen” hale getir (susturma değil, etiketleme)

FlowSpec: cerrahi filtreleme, cerrahi risk

FlowSpec çok güçlüdür çünkü “port/proto/flags” gibi alanlara göre filtre yazarsın. Ama risk şudur: yanlış kural yazarsan üretim trafiğini de kesersin.

Sahadaki iki güvenli kullanım biçimi:

  • Rate-limit (drop yerine “yavaşlat”)
  • Sadece dar bir eşleşme (tek hedef IP + tek port + kısa süre)

Doğrulama adımları

FlowSpec uyguladıktan sonra aşağıdaki iki metriği birlikte izle:

  • Hizmet metrikleri: hata oranı, latency, saturasyon
  • Ağ metrikleri: PPS/BPS düşüşü, drop counters, policer counters

Sadece ağ metriği düşüp hizmet metriği düzelmiyorsa, yanlış yerde müdahale ediyorsun demektir (ör. L7 saldırı, application layer).

Operasyonel runbook: adım adım

Olay anında “kimin ne yapacağı” kısa ve net olmalı:

  1. Triage (5 dk): saldırı vektörü, hedef(ler), etkilenme (SLO), karar (RTBH/FlowSpec/diğer)
  2. Change kaydı (2 dk): kim, ne zaman, hangi kural/prefix, hedef süre
  3. Uygulama (1–3 dk): kural/prefix push
  4. Doğrulama (5 dk): hizmet + ağ metrikleri
  5. Geri dönüş (planlı): süre dolunca kaldır, postmortem için delil topla

Postmortem: DDoS sonrası gerçek iyileştirme listesi

RTBH/FlowSpec başarılı olsa bile olaydan sonra yapılacaklar çok nettir:

  • Edge kapasitesi: PPS/BPS, conntrack, interrupt tuning
  • Uygulama dayanıklılığı: caching, queue, circuit breaker
  • Gözlemlenebilirlik: netflow/sflow, WAF log’ları, upstream telemetry
  • Proses: kural şablonları, on-call yetki matrisi, tatbikat

Sonuç

RTBH ve FlowSpec, doğru tasarlandığında DDoS olaylarında zaman kazandırır; yanlış tasarlandığında ise üretim trafiğine zarar verir. Bu yüzden teknik komutlar kadar, karar ağacı ve geri dönüş standardı da runbook’un parçası olmalıdır. Operasyonel liderlik tarafında en büyük kazanım, panik anında “hangi aracı seçelim?” sorusunu değil, “hangi koşulda hangi aracı devreye alırız?” kararını önceden vermektir.

Paylaş:

Bu yazı faydalı oldu mu?

Yükleniyor...

Bu yazı nasıldı?

ME

Mustafa Erbay

Sistem Mimarisi · Network Uzmanı · Altyapı, Güvenlik ve Yazılım

2006'dan bu yana sistem mimarisi, network, sunucu altyapıları, büyük yapıların kurulumu, yazılım ve sistem güvenliği ekseninde çalışıyorum. Bu blogda sahada karşılığı olan teknik deneyimlerimi paylaşıyorum.

Kişisel Notlar

Bu notlar sadece sizde saklanır. Tarayıcınızda yerel olarak tutulur.

Hazır 0 karakter

Yorumlar

Sunucu Taraflı AI Moderasyon

Yorumlar sunucuda yapay zeka ile denetlenir ve kalıcı olarak saklanır.

?
0/2000

Sunucu taraflı AI denetim

✉️ Ücretsiz · Spam yok · İstediğin an çık

Haftalık özet — AI değil, bizzat ben seçiyorum

Haftada bir mail: o haftanın en önemli yazısı, perde arkası notları, ve "bu hafta gerçekten kullandığım araç" bölümü. Az gürültü, çok sinyal.

  • 📌
    Haftanın en iyisi Sadece okumaya değer tek yazı
  • 🔧
    Alet çantası Bu hafta kullandığım araçlar
  • 🧠
    Perde arkası Blog'a girmeyen notlar

Spam yapmıyoruz. İstediğiniz zaman ayrılabilirsiniz. · Sadece Umami (self-hosted, Google yok) ile takip.

Okuma İstatistikleriniz

0

Yazı Okundu

0dk

Okuma Süresi

0

Gün Serisi

-

Favori Kategori

İlgili Yazılar