當系統崩潰或災難發生,每一分鐘的停機都意味著真實的商業損失。DRP(Disaster Recovery Plan)是企業應對重大中斷事件的正式復原藍圖,核心在於以最快速度、最小資料損失回到正常運作。
什麼是 RTO 與 RPO?
DRP 的設計核心圍繞兩個關鍵指標。RTO(Recovery Time Objective,復原時間目標)定義系統從災難發生到恢復正常運作的最大可容忍時間,例如「4 小時內必須恢復服務」。RPO(Recovery Point Objective,復原點目標)則定義資料損失的最大容忍範圍,例如「最多接受遺失 1 小時內的資料」。兩者共同決定備份頻率、備援架構與復原策略的設計方向。RTO 越短,需要越高的基礎設施投入;RPO 越小,備份機制必須越即時。企業需在成本與風險之間找到平衡點,而非一律追求最低數值。
DRP 的四大復原策略層級
DRP 策略依成本與復原速度分為四個層級。冷備援(Cold Standby):備援環境僅預留硬體,需手動啟動,RTO 通常以天計算,成本最低。暖備援(Warm Standby):備援系統定期同步資料並保持待機狀態,RTO 縮短至數小時。熱備援(Hot Standby):雙系統即時同步,可在分鐘內切換,RPO 趨近於零。多活架構(Active-Active):多個節點同時承載流量,故障時無縫切換,RTO 與 RPO 皆可達秒級。選擇哪個層級,取決於業務對中斷的敏感度與可投入的預算規模。
💡 DRP 核心重點整理
- RTO 決定速度:系統必須在目標時間內恢復,否則造成不可接受的業務損失。
- RPO 決定備份頻率:RPO 為 1 小時,則備份間隔不得超過 1 小時。
- DRP 必須定期演練:未經測試的計畫等同於沒有計畫,建議每半年執行一次完整演練。
- 文件化是關鍵:復原步驟、聯絡清單與決策樹必須完整記錄並持續更新。
DRP 不是一份靜態文件,而是需要持續維護與演練的動態機制。制定明確的 RTO 與 RPO 目標,並選擇對應的備援策略,才能在災難發生時真正保障企業的 IT 韌性與業務連續性。
留言
張貼留言