Please enable JavaScript.
Coggle requires JavaScript to display documents.
KHOA HỌC DỮ LIỆU - Data Science - Coggle Diagram
KHOA HỌC DỮ LIỆU - Data Science
Dữ liệu ( data )
Dữ liệu (data)
• Công ty lớn Facebook, Google thu thập được lượng lớn dữ liệu người dùng
• Khai thác nguồn dữ liệu này phục vụ các chiến lược kinh doanh
Dữ liệu có ở khắp nơi
• Dữ liệu web, dữ liệu thương mại điện tử
• Dữ liệu giao dịch ngân hàng
• Dữ liệu mạng xã hội
Hình dung độ lớn của dữ liệu
Google xử lý khoảng 20 PB / ngày
Facebook có thêm khoảng 60 PB dữ liệu mỗi ngày
eBay có 6.5 PB dữ liệu người dùng mỗi ngày
Dữ liệu lớn (Big data)
Là lượng lớn dữ liệu khó có thể quản lý và trích xuất các giá trị
Lớn từ các khía cạnh
Dung lượng lớn
Kích thước lớn
Sự đa dạng và phức tạp của cấu trúc, định dạng, chất lượng,…
Công dụng của dữ liệu lớn
Tổng hợp và phân tích dữ liệu
Sử dụng kho dữ liệu và OLAP
Đánh chỉ mục, tìm kiếm, và truy vấn
• Tìm kiếm theo từ khóa
• Tìm kiếm theo đối sánh mẫu
Khai phá tri thức
• Khai phá dữ liệu
• Mô hình hóa thống kê
Khoa học dữ liệu (DS)
Là lĩnh vực nghiên cứu các phương pháp quản lý, trích xuất, và diễn giảicác tri thức từ một lượng khổng lồ dữ liệu
Là lĩnh vực nghiên cứu đa ngành, nhằm mục tiêu giải quyết các vấn đềthách thức trong dữ liệu lớn
Sử dụng các lý thuyết và kỹ thuật từ nhiều lĩnh vực nghiên cứu khác nhau để
• Điều tra và phân tích lượng lớn dữ liệu
• Giúp con người ra quyết định
• Ứng dụng trong nhiều ngành khác nhau: khoa học, kỹ thuật, kinh tế, chính trị, tài chính và giáo dục
Các lĩnh vực liên quan mật thiết
• Khoa học máy tính
• Toán học
• Thống kê
Một số ứng dụng của DS
E-commerce
Manufacturing
Banking
Healthcare
Trasport
Finance
Nhà khoa học dữ liệu (data scientist)
Đây là nghề của thế kỷ 21, rất nhiều cơ hội và thách thức
Cần chuẩn bị các kiến thức
• Toán học và toán học ứng dụng
• Thống kê và Phân tích dữ liệu
• Kỹ năng lập trình (R, Python,…)
• Khai phá dữ liệu
• Học máy