Please enable JavaScript.
Coggle requires JavaScript to display documents.
Kho dữ liệu và khai phá dữ liệu, Bài toán phân cụm, Data Mining, Một cách…
Kho dữ liệu và khai phá dữ liệu
kiến thức hỗ trợ
Toán rời rạc
Cấu trúc dữ liệu và gt
Cơ sở dl
Python
Phân biệt với Cơ sở dữ liệu
ĐỊNH NGHĨA
DATA MINING
những thứ cần quyết định khi làm mining
Chọn cơ sở dữ liệu
Biểu diễn tri thức
Cần sử dụng kỹ thuật khai phá nào
cài đặt/xây dựng ứng dụng nào
Nhiệm vụ của khai phá dl
Khai phá dữ liệu dưới dạng mô tả
Khai phá dưới dạng tiên đoán
Các bài toán
Classification
Định nghĩa
Ứng dụng
Direct Marketing
Fraud Detection
Clustering
Định nghĩa
Ứng dụng
Marketing Segmentation
Document Clustering
Association Rule Discovery
Định nghĩa
Ứng dụng
Recomended
Các bài toán khó hơn
Deviation/Anomaly Detection
Nguyên lý của datamining
Suy diễn theo kiểu diễn giải
Suy diễn theo kiểu qui nạp
KDD là mining???
Phân biệt data mining và Business Intelligence
Kho dữ liệu
Data Source
XML
Định nghĩa
Rules Naming
XML element
3 types of tags
empty element
Phân biệt chữ thường chữ hoa
root tag
Bài toán phân cụm
Phân cụm phân cấp
Cure
Birch
Phân cụm phân hoạch
K-mean
Phân cụm dựa vào mật độ
DBScan
Data Mining
Data
Phân loại
Nominal
Ordinal
Interval
Ratio
Các kiểu data sets
Record
Matrix
Document
Transaction
Multi-Relational
Start or snowflake schema
Grap data
world wide web
Molecular structures
Ordered
Spatial
Temporal data
Sequential data
Đặc tính của dữ liệu
Số chiều của dữ liệu
Độ thưa thớt của dữ liệu
Độ phân giải/ phạm vi giá trị/Miền giá trị (Resolution)
Chất lượng của dữ liệu
Dữ liệu có nhiễu hay không?
Dữ liệu có thành phần ngoại lai hay không?
Giá trị bị mất (Mising values)
Dữ liệu bị lặp lại
Các bước mining
Một cách phân loại khác
Rời rạc
Liên tục
Tiền xử lý dữ liệu