Please enable JavaScript.
Coggle requires JavaScript to display documents.
PCA, Độ tương quan giá trị dữ liệu ((SS1)/(n-1)) = Variation for PC1 -…
PCA
Biểu diễn PCA
Cách vẽ đường PC2: Vẽ một đường thẳng đi qua gốc O và vuông góc với đường PC1.
Cách vẽ đường PC1: Vẽ 1 đường thẳng đi qua tâm O đồng thời có thể đi qua dữ liệu nhiều nhất có thể.
Tính toán tọa độ của điểm tương quan bằng cách tính trung bình của 2 chiều cho trước
Dời điểm tương quan này về gốc tọa độ
Ví dụ
PCA với gene ở chuột
Biểu thị cùng lúc nhiều kiểu gene ở 6 con chuột
Biểu diễn PCA từ 2 chiều
Dời điểm này về gốc (0:0)
Vẽ đường thẳng qua gốc tọa độ sao cho SS (tổng bình phương khoảng cách của các điểm biểu diễn tới đường thẳng qua tâm) là lớn nhất
Tính giá trị trung bình của kiểu gen 1 (trục x) và kiểu gen 2 (trục y) cho ra tọa độ của 1 điểm
Tìm hệ số góc của đường thẳng phù hợp nhất => Tìm được PC1
Dựng đường vuông gốc với PC! và đi qua gốc tọa độ => Tìm được PC2
Xoay ngang PC1 và PC2 theo phương ngang => PCA
Rút gọn thông tin từ đa chiều thành đơn giản hơn
Biểu diễn từ 3 chiều trở lên
Ta tìm PC1 tương tự như bài toán PCA 2 biến nhưng lúc này PC1 sẽ có 3 thành phần
Sau đó tìm được PC2 vuông góc với PC1
Cuối cùng tìm được PC3 qua gốc tọa độ và vuông góc với PC1 và PC2
Trong ví dụ, PC1 với PC2 chiếm 94% tương quan giá trị dữ liệu => có thể biểu thị ở dạng 3 chiều hoặc rút gọn thành 2 chiều và lượt bỏ PC3
Tương tự với việc tăng dữ liệu gene, ta tính độ tương quan giá trị dữ liệu và biểu diễn PCA
Định nghĩa
Rút gọn nhiều dữ liệu giống nhau về bản chất thành một nhóm.
Thay đổi góc nhìn của một dữ liệu từ đa chiều sang đơn giản hơn
Principle Component Analysis (PCA)
Độ tương quan giá trị dữ liệu
((SS1)/(n-1)) = Variation for PC1