DỮ LIỆU LỚN VÀ ỨNG DỤNG
1/ Dữ liệu lớn là gì?
– Dữ liệu có dung lượng lớn cần được lưu trữ và xử lý đến hàng Perabyte, Zerabyte.
– Dữ liệu lớn dùng để chỉ một tập hợp về dữ liệu rất lớn & rất phức tạp (có cấu trúc, bán cấu trúc, phi cấu trúc, …) và đến từ nhiều nguồn (cơ sở dữ liệu, nhật ký, thiết bị đo, tin tức, …). Các phần mềm, công cụ thông thường không thể phân tích, đánh giá & thực hiện được và dữ liệu lớn là tập hợp dữ liệu với rất nhiều các định dạng khác nhau có cấu trúc và phi cấu trúc (text, image, audio/video và các loại bài viết).
– Dữ liệu lớn bao gồm rất nhiều thông tin hữu ích nếu việc phân tích, gút trích và đánh giá đúng thì nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, hỗ trợ ra quyết định, … cho chúng ta rất nhiều.
2/ Lợi ích
– Theo tập đoàn SAS nói vấn đề thật sự không nằm ở việc là chúng ta thu thập dữ liệu mà thay vào đó là chúng ta dùng dữ liệu lớn để làm gì. Với 04 lợi ích mà dữ liệu lớn có thể mang lại:
- Cắt giảm chi phí;
- Giảm thời gian;
- Tăng thời gian phát triển và tối ưu hóa sản phẩm;
- Hỗ trợ để đưa ra những quyết định đúng và hợp lý hơn.
– Một số lợi ích khác cho các marketer, tổ chức và doanh nghiệp, nó còn có nhiều lợi ích khác như giúp các tổ chức chính phủ tiên đoán được tỷ lệ thất nghiệp, sự cắt giảm chi tiêu hay sự bùng phát dịch bệnh để từ đó xác định được xu hướng cũng như ngăn ngừa các vấn đề có thể xảy ra hoặc về phía người tiêu dùng thì dữ liệu lớn sẽ mang lại nhiều trải nghiệm mua hàng hơn.
3/ Thách thức
- Khả năng lưu trữ vượt quá năng lực theo thiết kế ban đầu của DataCenter hoặc nhóm DataCenter (ví dụ: với dữ liệu ban đầu 10TB, tốc độ tăng trưởng dữ liệu 10%/tháng thì chỉ cần sau 2 năm, dữ liệu sẽ đạt đến 100TB).
- Tốc độ truy xuất và xử lý ngày càng chậm hoặc trở nên đến một lúc nào đó là không thể thực thi theo các phương pháp truyền thống.
- Ảnh hưởng đến năng lưc xử lý và vận hành của hạ tầng CNTT (lưu trữ, dự phòng, đường truyền, chia sẻ, …)khi dữ liệu phình to trở nên cồng kềnh và kém hiệu quả khi hiệu suất sử dụng thấp trong khi chi phí đầu tư vận hành và bảo trì ngày càng tăng.
4/ Cơ hội
- Giải quyết được vấn đề lưu trữ và xử lý dữ liệu lớn sẽ khai thông nút thắt về dung lượng và mở ra tiềm năng khai thác to lớn của dữ liệu lớn: dự báo xu thế, hỗ trợ ra quyết định, chia sẻ/dùng chung để tối ưu hóa chi phí …
- Mang lại lợi thế cạnh tranh vượt trội so với các đối thủ/đơn vị khác.
- Đầu tư càng sớm sẽ càng giảm thiểu rủi ro về chi phí cơ hội trong tương lai.
5/ Ứng dụng
- Trong giao thông. Ước lượng các luồng/tuyến giao thông trong thành phố vào giờ cao điểm, từ đó kế hoạch phân luồng giao thông chi tiết, hợp lý giúp giảm kẹt xe.
- Trong dự báo thời tiết và môi trường. Phân tích số liệu khổng lồ thu thập từ các thiết bị đo lường, viễn thám, … qua thời gian sẽ giúp nâng cao tính chính xác trong dự báo thời tiết và môi trường.
- Trong y tế. Dựa vào số liệu trong các bệnh án để đưa ra dự đoán về nguy cơ mắc bệnh.
- Trong tài chính. Thông qua các giao dịch và lịch sử hành vi tương tác của khách hàng để phân tích, xếp loại, quản lý rủi ro và chăm sóc khách hàng.
6/ Kết luận
– Dữ liệu lớn không chỉ là cơ hội giúp cho các tổ chức, nghiên cứu khoa học, giáo dục, doanh nghiệp tìm kiếm những thông tin cần thiết, hữu ích cho mình mà còn là chiến lược để đảm bảo cho công việc phát triển, nghiên cứu, kinh doanh, điều hành, … một cách bền vững mà dữ liệu lớn cung cấp. Tuy nhiên, do lĩnh vực này vẫn còn rất mới vì vậy việc khai thác chúng sao cho hiệu quả chắc chắn còn một chặng đường khá dài & thách thức cho chúng ta để sở hữu được nguồn tài nguyên quý giá này.
HONEYNET