โทรศัพท์ดับทั้งระบบพร้อมกัน เกิดจากอะไร

คู่มือวิเคราะห์เหตุระบบ IP PBX ล่มพร้อมกันจากไฟฟ้า Core Network ถึง Server แบบช่างโทรศัพท์สำนักงาน


① 🔍 บทนำ: อาการที่น่ากลัวที่สุดของระบบโทรศัพท์สำนักงาน

อาการ โทรศัพท์ดับทั้งระบบพร้อมกัน (ทุกเครื่องดับ/หลุด/ใช้งานไม่ได้พร้อมกัน)
เป็นสัญญาณว่าเกิดปัญหาที่ โครงสร้างหลัก (Core) ไม่ใช่เครื่องปลายทาง

สิ่งที่หลายองค์กรทำพลาดคือ

  • รีบโทษ IP PBX
  • รีบสั่งซื้ออุปกรณ์ใหม่
    ทั้งที่ปัญหาแท้จริงมักอยู่ที่ ไฟฟ้า, Core Network หรือการออกแบบระบบ

② 🔍 ลักษณะอาการที่เข้าข่าย “ดับทั้งระบบ”

  • โทรศัพท์ทุกเครื่องดับพร้อมกัน
  • ทุกเครื่องขึ้น Offline/Not Registered
  • โทรภายใน–ภายนอกใช้ไม่ได้ทั้งหมด
  • ระบบกลับมาเองหลังรีสตาร์ตอุปกรณ์กลาง

ถ้า “ทุกเครื่องเป็นพร้อมกัน” → มองที่ จุดร่วม


③ 🌐 ภาพรวมจุดร่วมที่ทำให้ดับพร้อมกัน

จากหน้างานจริง จุดร่วมหลักมี 5 กลุ่ม:

  1. ไฟฟ้า/UPS
  2. PoE Switch/Core Switch
  3. Network Core (Router/Firewall)
  4. Server IP PBX
  5. ระบบบริหารจัดการ (License/Monitoring)

④ ⚡ ไฟฟ้า: ตัวการอันดับหนึ่ง

ไฟตก/ไฟกระชาก/ไฟดับสั้น ๆ
ทำให้

  • Switch รีบูต
  • Router หลุด
  • IP PBX รีสตาร์ต

ผลคือ โทรศัพท์ดับทั้งระบบในพริบตา


⑤ ⚡ UPS ไม่มี หรือ UPS ไม่พร้อมใช้งาน

ปัญหาที่พบบ่อย:

  • ไม่มี UPS ที่อุปกรณ์หลัก
  • UPS เสื่อม แบตหมด
  • ต่อโหลดเกินกำลัง

UPS ที่ไม่พร้อม = มีเท่ากับไม่มี


⑥ ⚡ ไฟไม่สะอาด (Dirty Power)

ไฟที่มี

  • Ripple
  • Noise
  • ไฟแกว่ง

จะทำให้อุปกรณ์

  • ค้าง
  • รีสตาร์ตเอง
  • ดับเป็นช่วง

อาการมักเกิด พร้อมกันทั้งระบบ


⑦ 🔌 PoE Switch ดับ = โทรศัพท์ดับหมด

ถ้าใช้ PoE Switch ตัวเดียว เลี้ยงทุกเครื่อง

  • PoE Switch ดับ → ทุกเครื่องดับทันที

สาเหตุ:

  • Power Supply เสีย
  • Power Budget เต็ม
  • Overheat

⑧ 🔌 Power Budget เต็มโดยไม่รู้ตัว

เพิ่ม IP Phone ทีละเครื่อง
จน PoE รวมเกินที่ Switch รองรับ

อาการ:

  • เครื่องดับพร้อมกันเป็นช่วง
  • ดับเฉพาะเวลายุ่ง (Busy Hour)

⑨ 🔌 Core Switch ล่ม

Core Switch เป็นศูนย์กลางของ

  • VLAN
  • Routing
  • PoE (บางระบบ)

ถ้า Core ล่ม → ทุก Segment เสียพร้อมกัน


⑩ 🌐 Router / Firewall หลุด

ถ้า Router หรือ Firewall

  • รีบูต
  • ค้าง
  • CPU เต็ม

ผลคือ

  • SIP หลุดทั้งหมด
  • โทรศัพท์ Offline พร้อมกัน

⑪ 🌐 Internet ล่ม แต่ระบบภายในควรยังใช้ได้ (หรือไม่?)

ถ้า

  • ระบบออกแบบดี → โทรภายในยังได้
  • ระบบพึ่ง Internet ทั้งหมด → ดับพร้อมกัน

การออกแบบมีผลมาก


⑫ 🌐 NAT / Session Table เต็ม

Router ขนาดเล็ก

  • Session เต็ม
  • NAT Table ล้น

อาการ:

  • ทุก SIP หลุดพร้อมกัน
  • กลับมาได้หลังรีบูต

⑬ 🌐 Firmware Bug ของอุปกรณ์ Core

Firmware Bug ที่พบจริง:

  • Router บางรุ่นหลุดเมื่อ SIP เยอะ
  • Switch ค้างเมื่อ PoE เต็ม

อาการจะเกิด “พร้อมกันทุกเครื่อง”


⑭ 🖥️ Server IP PBX ล่ม

กรณี Server:

  • CPU/RAM เต็ม
  • Disk เต็ม
  • Service ค้าง

โทรศัพท์ทุกเครื่องจะ

  • Unregister
  • Offline

⑮ 🖥️ Virtualization ตั้งค่าไม่เหมาะสม

IP PBX บน VM:

  • ไม่ Reserve CPU/RAM
  • Host โหลดหนัก

ผลคือ VM หยุดตอบสนอง → ดับทั้งระบบ


⑯ 🔒 License / Service หมดอายุ

บางระบบ

  • License หมด
  • Service หยุดทำงาน

อาการจะเกิดพร้อมกันทั้งหมด และแก้ไม่หายจน Renew


⑰ 🛠️ วิธีไล่แก้แบบช่าง (เรียงจากเร็วไปช้า)

  1. ตรวจไฟ / UPS
  2. ตรวจ PoE Switch
  3. ตรวจ Core Switch
  4. ตรวจ Router/Firewall
  5. ตรวจ Server IP PBX
  6. ดู Log ย้อนหลัง

⑱ 🛠️ ตรวจ Log หา “ช่วงเวลาที่ดับ”

Log ที่ต้องดู:

  • Power Event
  • PoE Event
  • System Reboot
  • SIP Mass Unregister

เวลาที่ตรงกัน = ตัวการ


⑲ 🛠️ ทดสอบแยกส่วน (Isolation Test)

  • ปิด Internet → โทรภายในได้ไหม
  • ปิด PoE บาง Segment → ดับเฉพาะส่วนนั้นไหม
  • ย้าย Server ไปเครื่องอื่นชั่วคราว

⑳ 📋 Checklist แก้ปัญหาแบบเร่งด่วน

  • UPS ทำงานจริง
  • PoE Budget เหลือ
  • Core ไม่ Overheat
  • Server Resource ว่าง

㉑ 📋 Checklist สำหรับผู้ดูแลระบบ

  • มี Diagram โครงสร้าง
  • Core มี Redundant หรือไม่
  • UPS แยกอุปกรณ์หลัก
  • มี Monitoring แจ้งเตือน

㉒ ⚠️ ข้อผิดพลาดที่องค์กรทำบ่อย

  • มี PoE Switch ตัวเดียว
  • ไม่มี UPS ที่ Core
  • ไม่มี Monitoring

ความเสี่ยงสูงมาก


㉓ 🧠 บทเรียนจากหน้างานจริง

หลายองค์กร:

โทรศัพท์ดับทั้งออฟฟิศ
สุดท้ายจบที่ “UPS แบตเสื่อม”


㉔ 🛠️ เมื่อไหร่ควรออกแบบระบบใหม่

ถ้า

  • ดับซ้ำ
  • ไม่มี Redundancy
  • องค์กรพึ่งโทรศัพท์สูง

ควร Re-Design ไม่ใช่แค่ซ่อม


㉕ 🔒 ป้องกันไม่ให้เกิดซ้ำ

  • แยก PoE เป็นหลายตัว
  • มี UPS คุณภาพ
  • ทำ Monitoring 24/7
  • ทดสอบไฟดับจำลอง

㉖ 🌐 Cloud PBX ช่วยได้ไหม

Cloud ช่วยลดภาระ Server
แต่ ไฟฟ้า + Network ภายใน ยังสำคัญเหมือนเดิม


㉗ 📌 สรุปสำหรับผู้บริหาร

ปัญหา “ดับทั้งระบบ”

  • คือความเสี่ยงระดับองค์กร
  • ต้องแก้ที่โครงสร้าง ไม่ใช่เครื่องปลายทาง

㉘ ✅ บทสรุป

ถ้าโทรศัพท์ดับทั้งระบบพร้อมกัน
ให้มองที่

ไฟฟ้า → PoE/Core → Router → Server
ก่อนเปลี่ยนอุปกรณ์ใด ๆ


㉙ 💬 คำถามชวนคิดและชวนคอมเมนต์

ระบบของคุณเคยดับทั้งชุดเพราะ
ไฟฟ้า หรือ PoE Switch มากกว่ากัน?