Contact
Line : comsiam
Contact
Line : comsiam

Disaster Recovery Plan หรือ
DR Plan
คือแผนที่กำหนดว่า
องค์กรจะฟื้นฟู
กลับมาได้อย่างไร
เมื่อเกิดเหตุการณ์ร้ายแรง
เช่น
หลายองค์กรมี
DR Document
แต่ไม่เคยทดสอบ
เมื่อเกิดเหตุจริง
จึงพบว่า
❌ ขั้นตอนผิด
❌ ข้อมูลไม่ครบ
❌ ติดต่อทีมงานไม่ได้
❌ Recovery ใช้เวลานาน
❌ Restore ไม่สำเร็จ
ดังนั้น
DR Plan ที่ไม่เคยทดสอบ
อาจไม่มีค่าในวันที่ต้องใช้งานจริง
การทดสอบควรตอบคำถามได้ว่า
✅ กู้คืนได้จริงหรือไม่
✅ ใช้เวลานานเท่าไร
✅ RTO ผ่านหรือไม่
✅ RPO ผ่านหรือไม่
✅ ทีมงานทำตามขั้นตอนได้หรือไม่
RTO
หรือ
Recovery Time Objective
คือ
ระยะเวลาที่องค์กรยอมให้ระบบหยุดทำงานได้
ตัวอย่าง
30 Minutes
4 Hours
24 Hours
RPO
คือ
ปริมาณข้อมูลที่องค์กรยอมสูญเสียได้
ตัวอย่าง
15 Minutes
1 Hour
24 Hours
สิ่งนี้เป็นตัวกำหนดรูปแบบ Backup และ Replication
มีหลายระดับ
ตั้งแต่
Tabletop Exercise
จนถึง
Full Failover Test
องค์กรควรเริ่มจากระดับง่ายก่อน
แล้วค่อยเพิ่มความซับซ้อน
เป็นการจำลองเหตุการณ์
ผ่านการประชุม
ตัวอย่าง
Data Center Fire
หรือ
Ransomware Attack
ให้ทีมงานอธิบายขั้นตอนการตอบสนอง
โดยไม่กระทบระบบจริง
ระดับถัดมา
คือ
Walkthrough
ทุกฝ่ายจะเดินตามขั้นตอนใน DR Plan
และตรวจสอบว่า
ข้อมูล
ผู้รับผิดชอบ
และเอกสาร
ถูกต้องหรือไม่
ควรทดสอบ
Restore
เป็นประจำ
เพราะ Backup ที่ Restore ไม่ได้
ไม่ถือว่าเป็น Backup ที่ใช้งานได้จริง
ควรทดสอบ
ไม่เฉพาะไฟล์
แต่รวมถึง
✅ Database
✅ Application
✅ Authentication
✅ Network
เพื่อให้มั่นใจว่าระบบทำงานได้ครบ
เป็นการย้ายระบบ
ไปยัง
DR Site
หรือ
Secondary Site
เพื่อตรวจสอบว่าระบบสามารถทำงานได้จริง
เมื่อ Site หลักล่ม
ระดับสูงสุด
คือ
Full Simulation
จำลองเหตุการณ์จริง
ทั้งระบบ
โดยมีทีมงานทุกฝ่ายเข้าร่วม
มักทำปีละ 1–2 ครั้ง
ในองค์กรขนาดใหญ่
ระบบที่มักถูกลืม
คือ
Active Directory
แต่หากกู้คืน AD ไม่ได้
หลายระบบจะไม่สามารถทำงานได้
ดังนั้นควรทดสอบ AD Recovery แยกต่างหาก
ควรตรวจสอบว่า
✅ VM เปิดได้
✅ Network ใช้งานได้
✅ Storage ทำงานได้
✅ Application เชื่อมต่อได้
หลังการกู้คืน
ควรทดสอบ
Backup Server Failure
Backup Repository Failure
และ
Backup Corruption
เพื่อประเมินความพร้อมของระบบสำรอง
ทุกครั้งที่ทดสอบ
ควรบันทึก
✅ ปัญหาที่พบ
✅ เวลาที่ใช้จริง
✅ ขั้นตอนที่ต้องปรับปรุง
✅ ผู้รับผิดชอบ
เพื่อพัฒนา DR Plan อย่างต่อเนื่อง
❌ ไม่เคยทดสอบ DR
❌ ทดสอบเฉพาะ Backup
❌ ไม่ทดสอบ Application
❌ ไม่มี DR Runbook
❌ ไม่มีผู้รับผิดชอบชัดเจน
❌ ไม่วัด RTO/RPO
❌ ไม่มีการปรับปรุงแผน
องค์กรระดับ Enterprise
มักใช้
Tabletop Exercise
Restore Test
Failover Test
Full Simulation
ร่วมกัน
เพื่อประเมินความพร้อมขององค์กร
ทุกปี
✅ Backup Restore
✅ Active Directory Recovery
✅ Database Recovery
✅ Hyper-V Recovery
✅ Network Recovery
✅ DR Site Failover
✅ Documentation Review
✅ RTO Verification
✅ RPO Verification
Disaster Recovery Plan จะมีคุณค่าได้ก็ต่อเมื่อได้รับการทดสอบอย่างสม่ำเสมอ เพราะในโลกความเป็นจริง ปัญหาส่วนใหญ่มักไม่ได้เกิดจากการไม่มีแผน แต่เกิดจากแผนที่ไม่เคยถูกนำมาทดลองใช้ การทดสอบอย่างต่อเนื่องจะช่วยให้องค์กรค้นพบจุดอ่อนและปรับปรุงกระบวนการก่อนเกิดเหตุการณ์จริง
จากประสบการณ์ของ comsiam หลายองค์กรมั่นใจว่าตนเองมี DR Plan ที่ดี จนกระทั่งถึงวันที่ต้องใช้งานจริงและพบว่า RTO ที่วางไว้ไม่สามารถทำได้ตามเป้าหมาย และ comsiam มักแนะนำให้ทำ Restore Test รายไตรมาส และ Full DR Simulation อย่างน้อยปีละ 1 ครั้ง เพื่อให้มั่นใจว่าทุกระบบพร้อมใช้งานเมื่อเกิดวิกฤต
หาก Data Center หลักขององค์กรหยุดทำงานในคืนนี้ คุณรู้หรือไม่ว่าต้องใช้เวลากี่ชั่วโมงกว่าระบบทั้งหมดจะกลับมาให้บริการได้จริง และตัวเลขนั้นตรงกับ RTO ที่ผู้บริหารคาดหวังหรือไม่?