CÔNG NGHỆ LƯU TRỮ CEPH
GIẢI PHÁP, VAI TRÒ VÀ TƯƠNG LAI
1/ Giới thiệu
- Ceph là nền tảng lưu trữ mã nguồn mở (Open-Source Software Storage Platform), là giải pháp lưu trữ dữ liệu (Data Storage) với khả năng cung cấp lưu trữ phân tán mạnh mẽ, tính mở rộng, hiệu năng và khả năng chịu lỗi cao. Xuất phát từ mục tiêu, Ceph được thiết kế với khả năng mở rộng cao, hỗ trợ lưu trữ đạt đếnmức Exabyte cùng với tính tương thích cao so với các phần cứng có sẵn.
- Ceph nổi bật khi ngành công nghiệp lưu trữ phát triển và mở rộng (thuật ngữ “Storage” sẽ được gọi xuyên suốt trong bài viết này). Hiện nay, các nền tảng hạ tầng đám mây Public, Private, Hybrid Cloud dần trở nên phổ biến và phát triển rộng lớn, và Ceph cũng trở thành giải pháp nổi bật để giải quyết cho các vấn đề lưu trữ hiện nay đang gặp phải.
- Phần cứng là yếu tố thành phần quan trọng trong quyết định hạ tầng đám mây (Cloud), trong đó Ceph đáp ứng và giải quyết các vấn đề đang gặp phải là cung cấp một hệ thống lưu trữ mạnh mẽ và có độ tin cậy cao.
2/ Một số nguyên tắc cơ bản của Ceph
- Khả năng mở rộng tất cả thành phần.
- Tính chịu lỗi cao.
- Giải pháp dựa trên phần mềm, hoàn toàn mở và tính thích nghi cao.
- Tương thích với mọi phần cứng.
3/ Ceph và tương lai của hệ thống lưu trữ
- Theo thống kê, khối lượng dữ liệu lưu trữ tăng lên nhiều lần theo hàng năm từ 40% đến 60% và có thời điểm lên tới gấp đôi. Từ đó, sinh ra nhiều vấn đề cần quan tâm như: tính thống nhất, tính phân tán, hiệu năng và sự mở rộng.
- Ceph là giải pháp nổi bật cho vấn đề tăng trưởng dữ liệu toàn cầu hiện nay, với các đặc điểm nổi bật như tính thống nhất, phân phối, chí phí đầu tư hợp lý, tiềm năng cho hiên tại và tương lai. Do được tích hợp với bộ lõi (Kernel), đây chính là đặc điểm giúp cho Ceph vượt trội hơn so với các giải pháp Storage hiện nay.
4/ Ceph – Giải pháp Cloud Storage
- Thành phần quan trọng để phát triển hạ tầng cung cấp nền tảng lưu trữ trên môi trường đám mây (Cloud) chính là Storage và môi trường đám mây thì luôn cần Storage để phát triển, đồng thời các giải pháp lưu trữ truyền thống đã dần tới giới hạn (kiến trúc, tính mở rộng, vận hành, chí phí, …), còn đối với Ceph có thể nói, nó dần đã trở thành giải pháp thay thế để giải quyết các vấn để mà chúng ta đang gặp phải nhằm đáp ứng nhu cầu của môi trường đám mây đang cần, hỗ trợ tốt cho các nền tảng môi trường đám mây nổi bật như: OpenStack, CloudStack, OpenNebula và Eucalyptus.
- Hiện nay, các đội ngũ nghiên cứu và phát triển (R&D) cùng cộng tác với Ceph, bao gồm: Canonical, RedHat, Ubuntu, SUSE, … họ đều là những nhà cung cấp công nghệ lớn trên thế giới, luôn trau chuốt và hoàn thiện Ceph, đó là lý do khiến cho sản phẩm này luôn đi trước, bắt kịp thời đại, cũng vì có tương thích cao với hệ điều hành Linux (RedHat/ Ubuntu/ Suse/ …) nên Ceph dần đã trở thành một trong những hệ thống lưu trữ được ưu chuộng để xây dựng một Storage Backend.
5/ Ceph – Giải pháp Software-Defined
- Software-defined Storage – SDS là gì? Là hệ thống lưu trữ và quản lý dữ liệu dựa trên phần mềm và không phụ thuộc vào lớp phần cứng lưu trữ vật lý bên dưới.
- Dùng giải pháp SDS là để tiết kiệm chi phí đầu tư, tập trung dành cho những tổ chức, doanh nghiệp lớn và đã có sẵn hạ tầng lớn với mong muốn là giảm đầu tư chi phí hàng năm và chính nó cũng mang đến các lợi thế đảm bảo như: Low cost, Reliability và Scalability.
6/ Ceph – Giải pháp lưu trữ thống nhất
- Ceph mang đến giải pháp xây dựng lưu trữ thống nhất, bao gồm: File-based và Block-based Access truy cập duy nhất thông qua một nền tảng, đáp ứng tốt sự tăng trưởng dữ liệu hiện tại và cho cả trong tương lai, Ceph xây dựng “True Unified Storage Solution” với Object, Block, File Storage và đồng bộ thông qua nền tảng dựa trên kỹ thuật bằng phần mềm, hỗ trợ lưu trữ các luồng dữ liệu lớn và phi cấu trúc. Tận dụng ngayđiểm mạnh này của Ceph, toàn bộ Block hay File Storage đều được lưu trữ dưới dạng đối tượng và được quản trị bởi Ceph Cluster.
- Ceph quản lý Object, hỗ trợ Block và File Storage dưới kiến trúc của riêng mình. Trong đó, tổ chức của Object trong Ceph được quản trị, lưu trữ riêng biệt và hỗ trợ mở rộng không giới hạn bằng cách lược bỏ Metadata, để làm được điều đó, Ceph sử dụng rất nhiều thuật toán động để tính toán, lưu trữ, tìm kiếm dữ liệu và sắp xếp.
7/ Kết luận
- Trong những năm gần đây, có thể nói Ceph gần như dẫn dầu trong các công nghệ Storage mới và được thiết kế để vượt qua giới hạn mà Storage đang gặp phải như hiện nay.
- Là một giải pháp mở, Software-Defined Storage (SDS) có tính tương thích với nhiều phần cứng khác nhau, bên cạnh đó, nó cũng cung cấp nhiều giao diện cho người dùng nhằm tăng tính linh hoạt trong quá trình sử dụng và vận hành.
- Ceph mạnh mẽ hơn công nghệ RAID hiện tại, vượt qua các giới hạn của RAID, mỗi thành phần trong Ceph đều được bảo đảm và hỗ trợ tính sẵn sàng cao (HA). Có thể nói, điểm mạnh nhất của Ceph là tính thống nhất, cung cấp giải pháp toàn diện Block, File và Object Storage, nó phù hợp lưu trữ cho cả file kích thước nhỏvà lớn (small & big file) mà không có bất cứ trục trặc về hiệu suất.
- Ceph là hệ thống lưu trữ phân tán hỗ trợ Client có thể tiếp cận nhanh, nó không tuân theo phương pháp truyền thống, ứng dụng với các kỹ thuật mới, cho phép Client tính toán động và tăng tốc nâng cao hiệu năng cho Client.
- Dữ liệu được lưu trữ trong Ceph Cluster được tổ chức rõ ràng và tự động, cả Client và Admin đều không phải lo lắng về sự cố, Ceph được thiết kế để tự quản trị và sửa lỗi. Một khi xảy ra sự cố, Ceph vượt qua với sự đảm bảo tốt nhất, nó phát hiện và sửa lỗi tất cả sự cố trên Disk, Node, Network, Rack, Data Center Row, Data Center, và thậm chí các vùng địa lý khác nhau (Geographies).
HONEYNET