อังคาร. ต.ค. 26th, 2021

หลังจากเมื่อคืนวันก่อนที่หลาย ๆ คนพูดกันเป็นเสียงเดียวกันว่าไม่สามารถใช้งานโซเชียลมีเดียอย่าง Facebook ได้ และยังรวมไปถึงบริการอื่น ๆ ของเฟซบุ๊ก (Facebook) ด้วยเช่นกัน เช่น Instagram, WhatsApp, และบริการต่าง ๆ ที่ใช้บริการการล็อกอินด้วย Facebook ทำให้ไม่สามารถเข้าถึงบริการได้

ล่าสุดเฟซบุ๊กได้ออกมาให้รายละเอีียดเพิ่มเติมผ่านทางบล็อกเผยว่า เหตุการณ์ดังกล่าวนั้นเกิดขึ้นในระหว่างการซ่อมบำรุงที่ทำกันเป็นปกติอยู่แล้ว มีคำสั่งหนึ่งที่เป็นคำสั่งตายหลุดเล็ดรอดเข้าไป โดยปกติแล้วจะมีระบบตรวจจับคำสั่งที่ผิดปกติ เพื่อป้องกันการผิดพลาด แต่ดันติดบั๊กทำให้ไม่มีการแจ้งเตือนเพื่อยืนยันการรันคำสั่ง นั่นจึงเป็นสาเหตุที่ทำให้เฟซบุ๊กล่มทั้งเครือข่ายนั่นเอง

เท่านั้นยังไม่พอ การรันคำสั่งตายนี้ นอกจากจะสั่งตัดการเชื่อมต่อจากเซิร์ฟเวอร์สู่โลกภายนอกซึ่งทำให้ Domain Name Server ไม่สามารถเข้าถึงได้ ยังทำให้ Facebook ถูกลบไปจากการประกาศเส้นทางบน Border Gateway Protocol (BGP) ที่ทำหน้าที่เป็นตัวประกาศเส้นทางสู่บริการต่าง ๆ ของเฟซบุ๊กนั่นเอง ก็เท่ากับว่าในวันนั้น บริการต่าง ๆ ของเฟซบุ๊ก ถูกลบจากอินเทอร์เน็ต ไม่สามารถเข้าถึงได้เลย ไม่ว่าจะด้วยวิธีใด ๆ ด้วยทั้งหมดนี้ ทำให้การที่วิศวกรของเฟซบุ๊กจะเข้าไปแก้ไขก็เป็นเรื่องที่ลำบากมากยิ่งขึ้น เพราะแม้กระทั่งพนักงาน หรือวิศวกรของเฟซบุ๊กเอง ก็ไม่สามารถเข้าถึงหลังบ้านของเฟซบุ๊ก เพื่อทำการมอนิเตอร์หรือแก้ไขทางไกลได้ มีวิธีเดียวคือไปแก้ไขที่ตัวศูนย์ข้อมูลเท่านั้น

สำหรับศูนย์ข้อมูลของเฟซบุ๊กจะมีด้วยกันหลายประเภท ประเภทที่เป็นศูนย์ข้อมูลขนาดใหญ่สำหรับการคำนวณและเก็บข้อมูลที่มีอุปกรณ์อยู่หลายล้านตัวเพื่อการให้บริการแพลตฟอร์มที่รองรับผู้ใช้จำนวนมาก และศูนย์ข้อมูลขนาดเล็กที่จะเป็นจุดเชื่อมต่อบริการเฟซบุ๊กเข้าด้วยกันง่ายมากขึ้นและขยายการเข้าถึงบริการสู่ผู้ใช้จำนวนมากขึ้น เมื่อวิศวกรเข้าไปแก้ไขการตั้งค่าที่ศูนย์ข้อมูลเสร็จเรียบร้อยแล้วนั้น ถึงอย่างไรระบบก็ยังไม่สามารถเปิดทำการแบบเต็มรูปแบบได้ในทันทีเนื่องจากระหว่างการล่มนั้นในศูนย์ข้อมูลต่าง ๆ มีการใช้พลังงานลดลงไปถึง 10 เมกะวัตต์ ซึ่งการที่เปิดใช้งานแบบเต็มรูปแบบในทันทีนั้น อาจจะส่งผลให้สถานการณ์แย่กว่าเดิม

โชคดีที่เฟซบุ๊กมีการเตรียมตัวสำหรับการรับมือกับสถานการณ์เช่นนี้อยู่แล้ว ก่อนหน้านี้เฟซบุ๊กก็ได้มีการจำลองและซ้อมเพื่อรับมือกับพายุ ในกรณีที่ต้องมีศูนย์ข้อมูลหนึ่ง หรือทั้งภูมิภาค ปิดระบบลงไป​ ซึ่งเหตุการณ์ในครั้งนี้จะเป็นอีกหนึ่งบทเรียนสำคัญสำหรับเฟซบุ๊กในการป้องกันเหตุการณ์เช่นเดียวกันนี้ในอนาคต