วางแผน AD Disaster Recovery ก่อนเกิดเหตุจริง

① ทำไม Active Directory ต้องมี Disaster Recovery Plan

Active Directory คือระบบที่ผู้ใช้ส่วนใหญ่มองไม่เห็น

แต่แทบทุกระบบในองค์กรต้องพึ่งพา

เช่น

  • Login Windows
  • File Server
  • Microsoft 365 Hybrid
  • VPN
  • Wi-Fi Authentication
  • ERP
  • Database
  • Application ต่าง ๆ

หาก Active Directory หยุดทำงาน

ผลกระทบอาจลุกลามไปทั้งองค์กรภายในไม่กี่นาที

ดังนั้นองค์กรที่ใช้ Windows Server 2025 จึงควรมี Disaster Recovery Plan (DR Plan) สำหรับ Active Directory โดยเฉพาะ


② Disaster Recovery กับ Backup ต่างกันอย่างไร

หลายองค์กรเข้าใจผิดว่า

มี Backup = มี Disaster Recovery

แต่จริง ๆ แล้วไม่ใช่

Backup คือ

การเก็บข้อมูล

Disaster Recovery คือ

แผนการกู้คืนระบบ

รวมถึง

  • ขั้นตอน
  • ผู้รับผิดชอบ
  • ลำดับการทำงาน
  • เวลาที่ใช้กู้คืน

องค์กรที่มี Backup แต่ไม่มี DR Plan ยังถือว่ามีความเสี่ยงสูง


③ ความเสียหายที่อาจเกิดขึ้นกับ Active Directory

ตัวอย่างเหตุการณ์จริง

❌ Ransomware

❌ Domain Controller เสีย

❌ Storage เสียหาย

❌ ลบ OU ผิด

❌ ลบ User ผิด

❌ ลบ GPO ผิด

❌ Replication พัง

❌ Human Error

❌ Data Center ไฟดับ

❌ Cyber Attack

ทุกเหตุการณ์เหล่านี้สามารถทำให้ Active Directory ใช้งานไม่ได้


④ กำหนด Recovery Objective

ก่อนสร้าง DR Plan

ต้องกำหนดเป้าหมาย

RTO

Recovery Time Objective

กี่ชั่วโมงถึงต้องกลับมาใช้งานได้

ตัวอย่าง

4 ชั่วโมง

RPO

Recovery Point Objective

ยอมสูญเสียข้อมูลได้กี่ชั่วโมง

ตัวอย่าง

1 ชั่วโมง

ค่าเหล่านี้เป็นตัวกำหนดรูปแบบของ DR ทั้งหมด


⑤ สำรองข้อมูล Domain Controller อย่างถูกต้อง

หัวใจสำคัญคือ

System State Backup

ซึ่งประกอบด้วย

  • Active Directory Database
  • SYSVOL
  • Registry
  • Boot Files
  • Certificate Services

เป็นข้อมูลที่จำเป็นต่อการกู้คืน Domain Controller


⑥ สำรอง FSMO Role Holder

ควรทราบว่า

FSMO Roles อยู่ที่เครื่องใด

ตรวจสอบด้วย

netdom query fsmo

และจัดเก็บข้อมูลไว้ใน Documentation

หากเกิดเหตุ

จะสามารถวางแผน Recovery ได้รวดเร็วขึ้น


⑦ ใช้ Active Directory Recycle Bin

หนึ่งในฟีเจอร์สำคัญที่สุด

คือ

Active Directory Recycle Bin

ช่วยกู้คืน

  • User
  • Group
  • OU

ได้อย่างรวดเร็ว

โดยไม่ต้อง Restore Backup ทั้งระบบ

องค์กรยุคใหม่ควรเปิดใช้งานเสมอ


⑧ เตรียม Domain Controller สำรอง

Best Practice

อย่างน้อย 2 Domain Controller

ต่อ Domain

เพื่อหลีกเลี่ยง

Single Point of Failure

หาก DC ตัวหนึ่งเสีย

อีกตัวสามารถทำงานต่อได้ทันที


⑨ แยก Domain Controller คนละ Location

องค์กรขนาดใหญ่ควรใช้

Primary Site

และ

Secondary Site

ตัวอย่าง

Bangkok

KhonKaen

หรือ

Primary DC

Disaster Recovery DC

เพื่อลดความเสี่ยงจากภัยพิบัติระดับพื้นที่


⑩ วางแผน Forest Recovery

เหตุการณ์ร้ายแรงที่สุด

คือ

Forest-Wide Failure

เช่น

  • Ransomware ทั้ง Forest
  • Schema Corruption
  • Enterprise Admin ถูกโจมตี

กรณีนี้

อาจต้องใช้

Forest Recovery

ซึ่งมีขั้นตอนซับซ้อนกว่าการ Restore ปกติหลายเท่า


⑪ สร้าง Recovery Runbook

Runbook คือเอกสารขั้นตอนการกู้คืน

ตัวอย่าง

Step 1
ตรวจสอบเหตุการณ์
Step 2
ระบุ Domain Controller ที่เสีย
Step 3
เลือก Backup
Step 4
เริ่ม Recovery
Step 5
ตรวจสอบ Replication

ทุกองค์กรควรมี Runbook เป็นลายลักษณ์อักษร


⑫ ทดสอบ Restore จริง

ข้อผิดพลาดที่พบบ่อย

คือ

Backup สำเร็จ

แต่

Restore ไม่เคยทดสอบ

องค์กรควรมี

Recovery Testing

อย่างน้อยปีละ 1–2 ครั้ง

เพื่อยืนยันว่า Backup ใช้งานได้จริง


⑬ จัดเก็บ Backup อย่างปลอดภัย

แนวทางที่นิยม

3-2-1 Rule

คือ

  • 3 Copies
  • 2 Storage Types
  • 1 Offsite Copy

ช่วยลดความเสี่ยงจาก

  • Hardware Failure
  • Ransomware
  • Human Error

⑭ Disaster Recovery Team

ควรกำหนดบทบาทชัดเจน

ตัวอย่าง

AD Administrator
Backup Administrator
Network Engineer
Security Team

เมื่อเกิดเหตุจริง

ทุกคนจะทราบหน้าที่ของตัวเองทันที


⑮ Monitoring และ Early Warning

องค์กรระดับ Enterprise มักติดตาม

✅ Replication

✅ DNS

✅ SYSVOL

✅ Backup

✅ Event Log

✅ Storage

เพื่อค้นหาสัญญาณปัญหาก่อนเกิด Disaster


⑯ ข้อผิดพลาดที่พบบ่อย

❌ มี Backup แต่ไม่มี DR Plan

❌ มี DR Plan แต่ไม่เคยทดสอบ

❌ มี Domain Controller เพียงเครื่องเดียว

❌ ไม่มี Runbook

❌ ไม่รู้ว่า FSMO อยู่ที่ไหน

❌ ไม่มี Recycle Bin

❌ ไม่มี Offsite Backup

❌ ไม่มีทีมรับผิดชอบ

ข้อผิดพลาดเหล่านี้มักทำให้ Recovery ใช้เวลานานกว่าที่ควร


⑰ แนวทางที่องค์กรระดับโลกนิยมใช้

องค์กรขนาดใหญ่ส่วนมากใช้

Multiple Domain Controllers

ร่วมกับ

System State Backup
AD Recycle Bin
Offsite Backup
Regular Recovery Testing

เพื่อให้สามารถกู้คืน Active Directory ได้ในเวลาที่กำหนด


⑱ สรุป

Disaster Recovery สำหรับ Active Directory ไม่ใช่เรื่องของการสำรองข้อมูลเพียงอย่างเดียว แต่เป็นเรื่องของการเตรียมความพร้อมทั้งด้านเทคนิค บุคลากร และกระบวนการทำงาน เพื่อให้องค์กรสามารถกลับมาให้บริการได้เร็วที่สุดเมื่อเกิดเหตุการณ์ไม่คาดคิด

จากประสบการณ์ของ comsiam องค์กรจำนวนมากลงทุนกับ Backup เป็นอย่างดี แต่ไม่เคยทดสอบ Recovery จริง ทำให้พบปัญหาเมื่อเกิดเหตุการณ์จริง และ comsiam มักแนะนำให้จัดทำ Runbook และทดสอบ Disaster Recovery อย่างน้อยปีละ 2 ครั้งสำหรับระบบ Active Directory ที่สำคัญ

คำถามชวนคิด

หาก Domain Controller หลักและ Backup Server ขององค์กรหยุดทำงานพร้อมกันในวันนี้ คุณมีแผนที่ผ่านการทดสอบแล้วจริง ๆ หรือกำลังหวังว่าระบบจะกลับมาเอง?