Cluster Quorum คืออะไร? หัวใจสำคัญที่ป้องกัน Failover Cluster ล่มทั้งระบบ

หลายคนสามารถสร้าง Failover Cluster ได้สำเร็จ แต่กลับไม่เข้าใจว่า Cluster Quorum คืออะไร ทั้งที่ Quorum เป็นหนึ่งในองค์ประกอบสำคัญที่สุดของ Windows Server Cluster

ในหลายเหตุการณ์ที่ Cluster หยุดทำงานพร้อมกันทุก Node สาเหตุไม่ได้มาจาก Hardware เสีย หรือ Storage มีปัญหา แต่เกิดจากการสูญเสีย Quorum ซึ่งทำให้ Cluster ตัดสินใจหยุดบริการทั้งหมดเพื่อป้องกันความเสียหายของข้อมูล

หากคุณกำลังใช้งาน Windows Server 2025 การเข้าใจ Quorum ถือเป็นเรื่องที่สำคัญอย่างยิ่งสำหรับการออกแบบระบบ High Availability ระดับองค์กร

① Cluster Quorum คืออะไร

Cluster Quorum คือกลไกการโหวต (Voting Mechanism) ที่ใช้ตัดสินว่า Cluster ยังสามารถทำงานต่อได้หรือไม่

Quorum ถูกออกแบบมาเพื่อป้องกันปัญหาที่เรียกว่า

Split Brain

ซึ่งเป็นสถานการณ์ที่ Node หลายฝั่งคิดว่าตัวเองเป็นเจ้าของ Resource พร้อมกัน

หากเกิดเหตุการณ์นี้

  • ข้อมูลอาจเสียหาย
  • Database อาจไม่ตรงกัน
  • File System อาจเกิด Corruption

Microsoft จึงใช้ Quorum เพื่อให้ Cluster สามารถตัดสินใจได้อย่างถูกต้อง

② Quorum ทำงานอย่างไร

ทุก Node จะมี Vote

ตัวอย่าง

Cluster มี

  • Node01
  • Node02
  • Node03

รวมทั้งหมด

3 Votes

Cluster จะต้องมีเสียงเกินครึ่ง

หรือ

Majority

จึงจะสามารถทำงานต่อได้

③ ตัวอย่างการทำงานของ Quorum

Cluster 3 Node

  • Node01 = 1 Vote
  • Node02 = 1 Vote
  • Node03 = 1 Vote

รวม

3 Votes

ต้องมีอย่างน้อย

2 Votes

Cluster จึงจะ Online

หากเหลือเพียง 1 Vote

Cluster จะหยุดทำงาน

④ Split Brain คืออะไร

Split Brain คือเหตุการณ์ที่ Node แต่ละฝั่งไม่สามารถสื่อสารกันได้

ตัวอย่าง

Node01 คิดว่าตัวเองยัง Online

Node02 คิดว่าตัวเองยัง Online

ทั้งคู่พยายามให้บริการ Storage เดียวกัน

ผลลัพธ์คือ

❌ ข้อมูลเสียหาย

❌ Database เสียหาย

❌ VM อาจ Corrupt

Quorum ถูกสร้างขึ้นมาเพื่อป้องกันเหตุการณ์นี้

⑤ ประเภทของ Quorum ใน Windows Server 2025

Windows Server 2025 รองรับหลายรูปแบบ

ได้แก่

  • Node Majority
  • Node and Disk Majority
  • Node and File Share Majority
  • Cloud Witness

ผู้ดูแลระบบควรเลือกให้เหมาะกับขนาดขององค์กร

⑥ Node Majority

ใช้สำหรับ Cluster ที่มีจำนวน Node เป็นเลขคี่

ตัวอย่าง

  • 3 Nodes
  • 5 Nodes
  • 7 Nodes

ทุก Node มี Vote

ไม่มี Witness

ข้อดี

✅ เรียบง่าย

✅ ดูแลง่าย

ข้อจำกัด

❌ เหมาะกับจำนวน Node คี่เท่านั้น

⑦ Node and Disk Majority

ใช้ Disk พิเศษเป็น Witness

ตัวอย่าง

  • Node01
  • Node02
  • Witness Disk

รวมเป็น

3 Votes

ข้อดี

✅ เหมาะกับ 2 Node Cluster

ข้อจำกัด

❌ ต้องมี Shared Storage

⑧ Node and File Share Majority

ใช้ Shared Folder เป็น Witness

ตัวอย่าง

  • Node01
  • Node02
  • File Share Witness

รวม

3 Votes

ข้อดี

✅ ไม่ต้องใช้ Shared Disk

✅ นิยมในองค์กรทั่วไป

ข้อจำกัด

❌ ต้องมี Server สำหรับ File Share

⑨ Cloud Witness

Cloud Witness ใช้บริการ Storage บน Azure

ตัวอย่าง

  • Node01
  • Node02
  • Azure Storage

ข้อดี

✅ ไม่ต้องมี Witness Server

✅ เหมาะกับหลาย Site

✅ รองรับ Disaster Recovery

ข้อจำกัด

❌ ต้องมี Azure Account

⑩ วิธีตรวจสอบ Quorum ปัจจุบัน

เปิด PowerShell

รันคำสั่ง

Get-ClusterQuorum

ตัวอย่าง

QuorumResource
--------------
File Share Witness

หรือ

Cloud Witness

⑪ วิธีดู Vote ของ Node

รัน

Get-ClusterNode | ft NodeName,State

ตรวจสอบว่า Node ทุกตัวทำงานได้ปกติ

⑫ Dynamic Quorum คืออะไร

Windows Server รุ่นใหม่รองรับ

Dynamic Quorum

ระบบจะปรับ Vote อัตโนมัติ

เมื่อ Node บางเครื่อง Offline

ช่วยเพิ่มความยืดหยุ่นให้ Cluster

ลดโอกาสสูญเสีย Quorum

⑬ Dynamic Witness คืออะไร

Windows Server 2025 รองรับ

Dynamic Witness

ระบบจะเพิ่มหรือลด Vote ของ Witness อัตโนมัติ

ทำให้การคำนวณ Majority มีประสิทธิภาพมากขึ้น

⑭ จะเกิดอะไรขึ้นหากสูญเสีย Quorum

เมื่อเสียงโหวตไม่ถึง Majority

Cluster จะ

  • หยุด Resource
  • หยุด Failover
  • ปิดบริการบางส่วน
  • ป้องกัน Split Brain

นี่เป็นพฤติกรรมปกติของระบบ

⑮ ตัวอย่างการออกแบบ Quorum

2 Node Cluster

แนะนำ

Node and File Share Majority

3 Node Cluster

แนะนำ

Node Majority

Multi Site Cluster

แนะนำ

Cloud Witness

⑯ ข้อผิดพลาดที่พบบ่อย

ลืมตั้ง Witness

ทำให้ Cluster สูญเสีย Quorum ได้ง่าย

Witness อยู่ Site เดียวกัน

หาก Site ล่มทั้งหมด

Witness จะหายไปพร้อมกัน

File Share Witness ไม่เสถียร

ส่งผลต่อการโหวต

Azure Storage ไม่พร้อมใช้งาน

กระทบ Cloud Witness

⑰ Best Practice

✅ ใช้ Dynamic Quorum

✅ ใช้ Dynamic Witness

✅ วาง Witness แยกจาก Node หลัก

✅ ทดสอบ Failover เป็นประจำ

✅ ตรวจสอบ Quorum หลังเปลี่ยนแปลงระบบ

✅ บันทึก Topology ของ Cluster ทุกครั้ง

หลายองค์กรที่ออกแบบ Infrastructure ระดับ Enterprise ร่วมกับ comsiam มักกำหนด Quorum Design เป็นหนึ่งในเอกสารสำคัญก่อนนำ Cluster ขึ้น Production เพื่อป้องกันความเสี่ยงจากการสูญเสียบริการโดยไม่คาดคิด

⑱ Quorum สำคัญกับ Hyper-V Cluster อย่างไร

Hyper-V Cluster อาศัย Quorum ในการตัดสินใจ

  • VM จะอยู่ที่ Node ใด
  • VM จะ Failover ไปที่ไหน
  • Node ใดมีสิทธิ์ควบคุม Resource

หาก Quorum มีปัญหา

VM จำนวนมากอาจหยุดทำงานพร้อมกัน

⑲ สรุป

Cluster Quorum คือกลไกการโหวตที่ใช้กำหนดว่า Failover Cluster จะสามารถทำงานต่อได้หรือไม่ โดยมีหน้าที่สำคัญในการป้องกัน Split Brain และช่วยให้ Cluster ตัดสินใจได้อย่างถูกต้องเมื่อเกิดปัญหาด้าน Network หรือ Node Failure

Windows Server 2025 รองรับ Quorum หลายรูปแบบ เช่น Node Majority, Disk Witness, File Share Witness และ Cloud Witness ซึ่งแต่ละแบบเหมาะกับสถานการณ์ที่แตกต่างกัน ผู้ดูแลระบบควรเลือกใช้งานให้เหมาะสมกับสถาปัตยกรรมขององค์กร และวางแผน Quorum ตั้งแต่ช่วงออกแบบระบบ ซึ่งเป็นแนวทางที่ผู้เชี่ยวชาญจาก comsiam และองค์กรระดับ Enterprise ทั่วโลกใช้กันอย่างแพร่หลาย

⑳ คำถามชวนคิด

หาก Node หลักของ Cluster คุณหยุดทำงานพร้อมกับ Network บางส่วนในวันนี้ คุณมั่นใจหรือไม่ว่าระบบ Quorum ที่ใช้อยู่ยังสามารถรักษาการทำงานของ Cluster ได้ต่อไป?