Please enable JavaScript.
Coggle requires JavaScript to display documents.
hadoop digital ocean - Coggle Diagram
hadoop digital ocean
-
Cài đặt
Hadoop 2.7 bao gồm bốn lớp chính:Hadoop Common, HDFS, YARN, MapReduce
-
HDFS , viết tắt của Hadoop Distributed File System, chịu trách nhiệm lưu trữ dữ liệu vào đĩa.
YARN , viết tắt của Yet Another Resource Negotiator, là “hệ điều hành” cho HDFS.
MapReduce là mô hình xử lý ban đầu cho các cụm Hadoop. Nó phân phối công việc trong cụm hoặc bản đồ, sau đó tổ chức và giảm kết quả từ các nút thành phản hồi cho một truy vấn. Nhiều mô hình xử lý khác có sẵn cho phiên bản 2.x của Hadoop.
-
Tổng quan
Apache Hadoop là một trong những công cụ mã nguồn mở sớm nhất và có ảnh hưởng nhất để lưu trữ và xử lý một lượng lớn dữ liệu kỹ thuật số sẵn có
Hệ thống dữ liệu
Dự án này nằm ở phần cuối nhỏ của quang phổ. Một máy tính duy nhất có thể lưu trữ, phân tích và hiển thị các phép đo mực nước hàng ngày của một con lạch. Về phía đầu kia của quang phổ, tất cả nội dung trên tất cả các trang web trên thế giới tạo thành một tập dữ liệu lớn hơn nhiều. Về cơ bản, đây là dữ liệu lớn: quá nhiều thông tin mà nó không thể phù hợp trên một máy tính.
-