Downtime: necə minimallaşdırılır və ölçülür?

Downtime - saytın əlçatmaz olduğu vaxt. Hər dəqiqə pul itkisidir - WooCommerce mağaza üçün 10 dəqiqə downtime = yüzlərlə manat itki. Düzgün strategiya ilə downtime sıfıra yaxın çatdırıla bilər.

Uptime və SLA

9-larla ölçü

  • 99% (two nines): aylıq 7 saat 18 dəqiqə downtime
  • 99.9% (three nines): aylıq 43 dəqiqə
  • 99.99% (four nines): aylıq 4 dəqiqə
  • 99.999% (five nines): aylıq 26 saniyə

Hostinq.az SLA

99.9% uptime garantisi - aylıq maksimum 43 dəqiqə.

Downtime səbəbləri

1. Hardware failure

Server disk, RAM, motherboard pozulur. Hosting cluster-də backup server avtomatik dəyişir.

2. Network issues

İSP problem, BGP routing pozuluşu. Multi-homed serverler daha çox müqavimət göstərir.

3. DDoS hücumu

Saatlarla davam edə bilər. Cloudflare WAF qoruyur.

4. Software bug

WordPress, plagin, custom kod - infinite loop, memory leak, DB lock.

5. Plagin update

"White screen of death" - sayt tamamilə qırılır. Backup-dan restore.

6. DB corruption

MySQL crash, file system pozulması. Repair və ya restore.

7. Sertifikat expire

SSL sertifikat vaxtı keçəndə sayt "Not Secure" və brauzer açmır.

8. DNS dəyişdirmək

Yanlış DNS dəyişikliyi - sayt 24-48 saat işləməyə bilər.

9. Disk dolması

Log faylları, backup yer dolduranda yeni yazma alınmır - sayt çökür.

10. Resource limit

CPU/RAM limit aşılır - hosting suspended.

Downtime monitoring

UptimeRobot

Pulsuz - hər 5 dəqiqədə HTTP check. Downtime olarsa email/SMS.

Pingdom

$10/ay - hər 1 dəqiqədə. Daha sürətli notification.

StatusCake

Pulsuz versiya geniş - HTTP, ping, SSL, DNS yoxlamalar.

Status page

Statuspage.io

Public status page - müştərilər real-time görür. "Sayt çalışmır?" suallarını azaldır.

High Availability (HA)

Load balancer + 2 server

Eyni vaxtda 2 server. Biri çökərsə digəri trafiki davam edir. Heç downtime yox.

Database replication

Master-slave MySQL - master çökərsə slave master olur.

Plan downtime

Maintenance window

Az trafikli vaxtda (gecə 3-4) plan edin. Maintenance plagini ilə "Tezliklə qayıdacağıq" göstərin.

503 Service Unavailable

Status code 503 + Retry-After header - Google indexing-ə zərər vermir.

Downtime maliyyə təsiri

Hesablamaq

  • Aylıq gəlir / 30 / 24 = saatlıq gəlir
  • x downtime saatları = düşməyən gəlir
  • + brand reputation itkisi

Disaster Recovery (DR)

RTO və RPO

  • RTO: Recovery Time Objective - nə qədər vaxtda bərpa
  • RPO: Recovery Point Objective - data itkisi nə qədər

DR strategiyaları

  • Cold standby - yeni server lazım olanda quraşdırılır
  • Warm standby - hazır server, lakin trafik almır
  • Hot standby - eyni anda hər iki server trafik alır

Backup + restore

Fast restore

JetBackup ilə tam sayt 10 dəqiqədə restore. RTO 30 dəqiqədir.

Failure modes

Cascading failure

DB serveri çökür → cache miss → bütün istəklər DB-yə gedir → DB daha çox çökür. Sistemi əvvəlcədən test etmək lazımdır.

Chaos engineering

Netflix Chaos Monkey

Production-da random server-ləri söndürür - sistemin failure-ları idarə edə bilməsi yoxlanılır.

Post-mortem analysis

Hər downtime-dan sonra

  • Nə baş verdi?
  • Nə vaxt başladı/bitdi?
  • Müştəri necə təsirləndi?
  • Niyə baş verdi?
  • Necə qarşısı alına bilərdi?
  • Action items nələrdir?

Hostinq.az 99.9% SLA

Hardware redundancy

Hot-swap RAID, redundant PSU, məcburi network adapter.

24/7 monitoring

Texniki komanda durmadan monitor edir - problem dərhal həll olunur.

Hostinq.az hosting - 99.9% uptime garantisi.

Paylaş: