Please enable JavaScript.
Coggle requires JavaScript to display documents.
MODULE 4
DATA ANALYTICS, INTERPRETATION AND VISUALISATION - Coggle Diagram
MODULE 4
DATA ANALYTICS, INTERPRETATION AND VISUALISATION
-
B.
EXTRACTION, CONSOLIDATION AND DESIGN OF DATA STRATEGY
-
-
-
C.
DATA ANALYTICS
-
-
4.10 Risk, Warning and Challenges in Data Analytics
-
-
-
-
-
-
4.11 Applying AI to analytics: Benefits, risks and examples
Benefits
-
-
Finding
Unknown patterns
Unsupervised ML allows the discovery of patterns, trends, collections and correlations in the data
Real-time
monitoring
AI can monitor continuous, real-time events
quickly detect and highlight anomalous events
-
-
-
Machine Learning
Supervised learning
Definition: thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước
Input data + Output data tương ứng (label) = Algorithms
thể hiện quan hệ giữa input data và output data
-
Unsupervised learning
Only have input data, no label
Sử dụng phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimension reduction)
để thuận tiện trong việc lưu trữ và tính toán.
-
-
Semi-supervised learning
-
Giai đoạn đầu: dùng cặp data- label có sẵn để tạo algorithms
Giai đoạn sau: sử dụng algorithms tạo thành để đào tạo unlabeled data ra các predicted outcome
rồi sử dụng cặp mới tạo thành (data - pseudo-labelled) tiếp tục update algorithms
-
Useful ML Algorithms
-
Support Vector Machines
Used in supervised learning, mostly classification
Support Vector Machine là bài toán đi tìm mặt phân cách sao cho margin tìm được là lớn nhất, đồng nghĩa với việc các điểm dữ liệu an toàn nhất so với mặt phân cách.
-
D.
Data Interpretation
4.13 Data Interpretation
-
Domain knowledge
kiến thức về một chuyên ngành hoặc
lĩnh vực cụ thể, chuyên biệt,
different với general knowledge
-
-
-
Overcome cognition bias
Cognition bias
(Bias trong tư duy)
- prejudice influences
our decisions or thinking
Types
-
-
-
Optimism Bias
khuynh hướng lạc quan thái quá,
phóng đại xác suất thành công và xem nhẹ rủi ro
Extrapolation Bias
khuynh hướng xem một số sự kiện dễ dự đoán
dựa vào simple analysis, dù nhiều variables liên quan
-
-
Correlation
-
-
Correlation coefficient
-
Formula
Cov(x, y)
−−−−−−−
(σx * σy)
Causation
-
-
-
Proving causation
Random Experiments
Chỉ định một đối tượng thử nghiệm một cách ngẫu nhiên
cho treatment group (bị ảnh hưởng bởi hypothesised causal factor)
or control group (không bị ảnh hưởng bởi hypothesised causal factor)
A/B Testing
Một đối tượng thử nghiệm được chỉ định ngẫu nhiên vào
một trong các nhóm biến thể để so sánh xem nhóm biến thể nào hiệu quả hơn
Observational Studies
Đối tượng thử nghiệm chỉ được quan sát thụ động
đo lường các biến quan tâm và xác định các mẫu hoặc mối quan hệ giữa chúng
-
-
-
-
-
-