Icon Icon Icon
Giải pháp lưu trữ hiện đại PowerScale - Scale-Out NAS

Tin Công Nghệ

Giải pháp lưu trữ hiện đại PowerScale – Scale-Out NAS

198 14/04/2022

Giải pháp lưu trữ hiện đại PowerScale – Scale-Out NAS của Dell EMC cung cấp đến các doanh nghiệp, giúp mang đến khả năng giải quyết các vấn đề của kiến trúc Hadoop truyền thống.

Bài toán lưu trữ dữ liệu của doanh nghiệp

Giải pháp lưu trữ hiện đại PowerScale - Scale-Out NAS

Dữ liệu phi cấu trúc đã và đang tăng trưởng cùng với tốc độ chóng mặt, góp phần quan trọng trong việc phát triển các doanh nghiệp. Bài toán đặt ra cho các doanh nghiệp hiện nay chính là làm sao để tận dụng nguồn dữ liệu khổng lồ chưa được khai thác của mình, mang lại những quyết định thông minh, sáng tạo và mới mẻ hơn trong việc phát triển sản phẩm dịch vụ cho khách hàng cũng như tối ưu hóa quá trình hoạt động nội bộ. Một trong những câu trả lời cho bài toán này chính là việc ứng dụng những công nghệ phân tích dữ liệu lớn (big data analytics) và hồ dữ liệu (data lake).

Mỗi doanh nghiệp đều có nhiều loại dữ liệu khác nhau, từ những cơ sở dữ liệu có cấu trúc, những dữ liệu về thông tin và hành vi khách hàng, những dữ liệu video được ghi lại từ hệ thống camera cho đến những dữ liệu thô như log file sinh ra từ những thiết bị trong cơ sở hạ tầng CNTT và truyền dẫn. Tất cả những dữ liệu này đều có thể đem đến những thông tin mới mẻ cho doanh nghiệp khi kết hợp chúng với nhau.

Tuy nhiên, những dữ liệu này thường nằm rải rác nhiều nơi trên nhiều hệ thống khác nhau, dẫn đến việc doanh nghiệp khó có thể kết hợp và tìm ra được những thông tin mới từ các hệ thống rời rạc này. Không những vậy, những dữ liệu này thường được sinh ra với tốc độ cao trong khi năng lực của từng hệ thống đơn lẻ lại có giới hạn, dẫn đến tổ chức/doanh nghiệp phải bỏ đi rất nhiều dữ liệu mà chưa kịp khai thác.

Data Lake

Giải pháp lưu trữ hiện đại PowerScale - Scale-Out NAS

Data lake sẽ là lời giải cho vấn đề trên của các doanh nghiệp. Data lake là một nơi tập trung lưu trữ tất cả các loại dữ liệu của doanh nghiệp ở định dạng gốc; từ đó, các giải pháp và kỹ thuật phân tích sẽ có thể truy cập tất cả những dữ liệu này mà không cần truy cập rải rác các hệ thống khác nhau. Data lake mang đến khả năng mở rộng với dung lượng lớn, nhanh chóng. Doanh nghiệp sẽ không lãng phí những dữ liệu chưa kịp khai thác, việc lưu trữ được dữ liệu với định dạng gốc sẽ giúp bỏ lỡ những thông tin ẩn giấu bên trong những dữ liệu đó.

Hiện nay, các giải pháp phân tích dữ liệu và data lake trên thế giới và Việt Nam thường được triển khai trên nền tảng dữ liệu phân tán Hadoop. Trước đây, với mô hình triển khai truyền thống của Hadoop là sử dụng hạ tầng server (máy chủ) cho tất cả các tác vụ của hệ thống gồm tính toán (compute), lưu trữ (storage), hệ thống này thường gặp một số điều bất cập như:

  • Hadoop cluster chỉ có thể giao tiếp qua giao thức HDFS nên phải có thêm một hệ thống trung gian tiếp nhận dữ liệu nguồn từ các giao thức khác nhau trước khi lưu vào HDFS data lake.
  • Do sử dụng cả 2 khối chức năng tính toán và lưu trữ trên cùng một thiết bị server nên hệ thống thường không tối ưu được tài nguyên, khi muốn mở rộng dung lượng lưu trữ thì bắt buộc phải mở rộng năng lực tính toán (mặc dù hệ thống không có nhu cầu) thông qua việc bổ sung cả một thiết bị server.
  • Tỷ lệ lưu trữ dữ liệu khả dụng thấp, khoảng 30% so với dung lượng thô (raw).

>> Bật mí Giải pháp hệ thống CNTT hiệu quả cho doanh nghiệp

Giải pháp lưu trữ PowerScale – Scale-Out NAS

Giải pháp lưu trữ hiện đại PowerScale - Scale-Out NAS

Để giải quyết những vấn đề bất cập nêu trên, Dell EMC cung cấp đến doanh nghiệp giải pháp lưu trữ PowerScale – Scale-Out NAS. PowerScale giúp giải quyết tất cả vấn đề của kiến trúc Hadoop truyền thống nhờ những khả năng sau đây:

  • Tích hợp sẵn tính năng HDFS, giúp giảm tải phần storage hoàn toàn lên PowerScale, Hadoop cluster chỉ còn đóng vai trò compute. Hai thành phần compute và storage có thể mở rộng độc lập, không gây tình trạng lãng phí như trước.
  • Hỗ trợ đa giao thức, một dữ liệu có thể được truy cập đồng thời qua các giao thức NAS và HDFS, không cần phải có hệ thống trung gian như kiến trúc truyền thống.
  • PowerScale cung cấp cùng một mức độ bảo vệ dữ liệu, thậm chí là cao hơn mức bảo vệ truyền thống với một tỷ lệ dữ liệu khả dụng cao hơn nhiều, lên tận 85% dữ liệu thô.
  • Khả năng mở rộng dung lượng rất lớn và các thao tác mở rộng dễ dàng.
  • Tương thích với hầu hết các phiên bản Hadoop, đặc biệt được chứng nhận tương thích với giải pháp Cloudera CDP.

Thông qua việc kết hợp Hadoop với Dell EMC PowerScale, các doanh nghiệp không còn lo lắng về việc lưu trữ dữ liệu trong data lake của mình mà chỉ cần tập trung vào phát triển ứng dụng phân tích dữ liệu, tạo những giá trị mới từ chính những dữ liệu của mình.

Trên đây là thông tin về Giải pháp lưu trữ hiện đại PowerScale – Scale-Out NAS. ITNow hy vọng thông tin phía trên hữu ích cho bạn. ITNow chúc bạn luôn thành công!

CHIA SẺ BÀI VIẾT

Icon Icon Icon

Có thể bạn quan tâm

Đề nghị báo giá ngay
Chat qua zalo
Chat qua Facebook
Gọi ngay: