Tin Công Nghệ
Những lý do phổ biến gây “sập” Data Center
Sập Data Center hay nói cách khác là trung tâm dữ liệu bị mất điện ngoài ý muốn là vấn đề thường gặp của bất kỳ tổ chức/doanh nghiệp nào. Do đó, việc biết trước các lý do phổ biến gây sập Data Center là điều vô cùng quan trọng để phòng ngừa các sự cố bất ngờ. Trong bài viết này, ITNow sẽ cung cấp cho bạn các lý do phổ biến gây sập Data Center nhé!
Mục lục
Hệ thống điện dự phòng không thể hoạt động hay bị cấu hình sai
Một trong những lý do phổ biến nhất gây trung tâm dữ liệu bị ngưng hoạt động chính là mất điện và vấn đề này phụ thuộc vào kinh nghiệm của đội ngũ vận hành trung tâm dữ liệu của bạn. Mỗi trung tâm dữ liệu đều có một hay rất nhiều nguồn năng lượng dự phòng. Tuy nhiên, nếu hệ thống pin dự trữ bị hỏng học mà lại không được kiểm tra và phát hiện kịp thời sẽ gây nên rủi ro không đáng có.
Bên cạnh đó, những quản trị viên lại không phòng ngừa trường hợp bị mất điện, các thao tác giải quyết vấn đề mất điện sẽ phức tạp hơn hẳn. Và bạn nên biết rằng việc cắt điện tại nơi được đặt trung tâm dữ liệu sẽ được địa phương thông báo trước.
Hệ thống làm mát bị lỗi
Hệ thống làm mát chính là nguyên nhân thứ hai mà các doanh nghiệp cần lưu ý đối với Data Center của mình. Bình thường, khi bạn bước vào trung tâm dữ liệu thì bạn sẽ cảm thấy giống như đang trong “thùng nước đá” vậy. Tuy nhiên, bạn sẽ thấy nó như một cái lò thiệu khi hệ thống làm mát gặp vấn đề và ngưng hoạt động chỉ trong 1 phút. Do đó, các quản trị viên vẫn luôn chuẩn bị giải pháp khi hệ thống làm mát bị lỗi, ngay cả khi trong trung tâm dữ liệu có đặt cảm biến nhiệt độ cho mọi ngóc ngách đi nữa. Hơn nữa, để dự phòng các trường hợp đáng tiếc xảy ra đối với Data Center, một trung tâm dữ liệu nên có nhiều hệ thống làm mát và nhiều nguồn điện để dự phòng.
>> Có thể bạn muốn biết Nhiệt độ phòng ảnh hưởng sự vận hành của server không?
Quy trình chuyển đổi hệ thống tự động không hoạt động
Những nhà cung cấp dịch vụ thường sẽ trang bị một hay nhiều trung tâm dữ liệu dự phòng để ngừa trường hợp trung tâm chính bị mất điện. Khi đó, tất cả lưu lượng truy cập sẽ được chuyển tự động tới cơ sở dự phòng. Người dùng cuối sẽ không nhận ra bất cứ sự chậm trễ nào trong quá trình chuyển tự động này nếu như nó được thực hiện đúng cách.
Tuy nhiên, nếu quản trị viên không thường xuyên kiểm tra từ những thay đổi nhỏ của hệ thống máy chủ thì quá trình chuyển đổi tự động này có thể sẽ xảy ra lỗi.
Quá nhiều thay đổi cùng lúc trong thời gian bảo trì
Các quản trị viên thường sẽ tận dụng việc bảo trì hệ thống để thực hiện nhiều thay đổi cùng một lúc. Nhưng việc thay đổi quá nhiều cài đặt trong một khung thời gian sẽ gây ra hàng loạt lỗi dây chuyền, khó tìm ra nguyên nhân thật sự và càng làm mất nhiều thời gian sửa chữa hơn.
Ủy quyền hệ thống không đúng cách
Một vấn đề nữa chính là ủy quyền hệ thống không đúng cách gây ra lỗi không đáng có. Các quản trị viên truy cập hoặc thay đổi bất cứ thứ gì nên được theo dõi, kiểm soát chặt chẽ bởi vì chỉ một vài cú nhấp chuột hoặc vài dòng code sai sẽ khiến toàn hệ thống bị lỗi ngay lập tức.
Vào năm 2014, quản trị viên của công ty dữ liệu Joyent cập nhật từ xa để khởi động các máy chủ mới tại Data Center ở phía Đông Mỹ của công ty. Một sự cố bất ngờ xảy ra khi anh vô tình khởi động lại tất cả các server trong trung tâm dữ liệu và hệ thống bị quá tải. Do đó, công ty mất hàng giờ liền để giải quyết vấn đề này và thậm chí là phải bồi thường cho khách hàng của họ. Do đó, số lượng quản trị viên có thể truy cập tất cả hệ thống nên được hạn chế để tránh trường hợp tương tự.
>> Có thể bạn quan tâm đến Tất tần tật về Dedicated server
Phần cứng cũ
Phần cứng của máy chủ chính là những linh kiện quan trọng, quyết định khả năng vận hành cũng như độ ổn định của máy chủ. Tuy nhiên, nếu phần cứng quá cũ thì trường hợp đồng loạt phần cứng “chết” hết sau sự cố mất điện là hoàn toàn có thể xảy ra. Mặc dù các quản trị viên đều biết điều này nhưng lại nghĩ rằng việc thay đổi phần cứng mới là điều tiêu tốn nhiều kinh phí và chưa tận dụng hết giá trị của phần cứng.
Hệ thống cáp quang gặp sự cố
Cuối cùng, hệ thống cáp quang cũng chính là một nguyên nhân khiến cho Data Center gặp sự cố. Một trung tâm dữ liệu thường sẽ có một cáp quang chính và nhiều cáp quang dự phòng. Tuy nhiên, các quản trị viên thường hay chủ quan rằng cáp quang chính hoạt động ổn định nên không kiểm tra các cáp quang dự phòng. Do đó, khi cáp quang chính gặp sự cố nào đó thì các quang phụ có thể không thể hoạt động được hay không thể tải đến hệ thống.
Trên đây chính là các lý do thường gặp gây tình trạng “sập” Data Center mà bạn nên biết và phòng ngừa. ITNow hy vọng những kiến thức trên hữu ích cho bạn và giúp bạn vận hành tốt trung tâm dữ liệu của mình nhé!
Có thể bạn quan tâm