Please enable JavaScript.
Coggle requires JavaScript to display documents.
Machine Learning (Phân loại theo phương thức học (Học có giám sát…
Machine Learning
Phân loại theo phương thức học
Học có giám sát Supersived Learning
Ví dụ:
Nhận dạng chữ viết tay: ta có ảnh của hàng nghìn ví dụ của mỗi chữ số được viết bởi nhiều người khác nhau. Chúng ta đưa các bức ảnh ảnh này vào trong một só thuật toán và chỉ cho nó biết mỗi bức ảnh tương ứng với chữ số nào. Sau khi thuật toán tạo ra (sau khi học) một mô hìn, tức mộ hàm số mà đầu vào là một bức ảnh và đầu ra là một chữu số khi nhận được một bức ảnh mới mà đầu vào là một búc ảnh và đầu ra là một chữ số, khi nhận được một bức ảnh mới mà mô hình chưa nhìn thấy bao giờ nó sẽ dự đoán đc bức ảnh đó chứa chữ số nào
Thuật toán nhận diện khuôn mặt, thời gian đầu fb sử dụng thuật toán này để chỉ ra các khuôn mặt trong một bức ảnh và yêu cầu người dùng tag friends - tức gán nhãn cho mỗi khuôn mặt. Số lượng (khuôn mặt, tên người) càn lớn độ chính xác ở những lần tự động tag tiếp theo sẽ càng lớn.
Định nghĩa
Dự đoán đầu ra outcome của một dữ liệu mới (input new) dựa trên các cặp (input, outcome) đã được biết từ trước. Cặp dữ liệu này còn được gọi là (data, label) tức (dữ liệu, nhãn). Là thuật toán phổ biết nhất trong các thuật toán ML
khi chúng ta có một tập hợp biến đầu vào x = {x1, x2, ...xn} và tập hợp nhãn tương ứng y = {y1, y2, ..yn} trong đó xi và yi là các vector. Các cặp dữ liệu biết trước dc gọi là traning data. Từ tập traning data chúng ta cần tạo ra một số ánh xạ mội phần tử từ tập X sang một phần tử (xấp xỉ) tương ứng của tập Y.
Mục đích của hàm xấp xỉ hàm số f thật tốt để khi có một dữ liệu x mới chúng ta có thể tính được nhãn tương ứng của nó y = f(x)
Phân loại
Classification Phân loại:
Một bài toán được gọi là classification nếu các label của input data được chia thành hữu hạn nhóm. Ví dụ gmail xác định email có phải spam hay không, các hãng tín dụng xác định khách hàng có khả năng thhanh toán nợ hay không.
Hồi quy: Regression
Nếu label không đươc chia thành các nhóm mà ạ một giá trị thực cụ thể. Ví dụ một căn nhà rộng x m2, có y phòng ngủ và cách trung tâm thành phố z km sẽ có giá bao nhiêu
Hệ thống ứng dụng đoán tuổi và giới tính của microsoft
Học không giám sát Unsupersived Learning
Định nghĩa: trong thuật toán này ta khôn biết được outcome hay nhãn mà chỉ có dữ liệu đầu vào. Thật toán này sẽ dựa vào cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm clustering hoặc giảm số chiều của dữ liệu dimension reduction để thuận tiện trong việc lưu trữ và tính toán.
Một cách toán học Unspervised learning là khi chúng ta chỉ có dữ liệu vào X mà không biết nhãn Y tương ứng
Phân loại
Clustering phân nhóm
Một bài toán phân nhom toàn bộ dữ iệu X thành các nhóm nhỏ dựa trên sự lieenquan giữa các dữ liệu trong nhóm. Ví dụ phân nhóm khách hàng dựa trên hành vi mua hàng. Điều này cũng giuống nhưu việc ta đưa cho một đứa trẻ rất nhiều mảnh ghép hình tròn hình vuông với nhieeufu màu sắc không rõ chúng sẽ phân nhóm theo hình hay theo màu sắc
Association
Là bài toán khi chúng ta muốn khám phá ra một quy luật dựa trên nhiều dữ iệu cho turoruowcss. Ví dụ những khách hàng nam mua quần áo thường có xu hướng mua thêm đồng hồ hoặc thắt lưng, những khán giả xem spider man có xu hướng xem thêm bat man, dựa vào đó xây dựng hệ thống gợi ý khách hàng recommandation system thúc đẩy nhu cầu mua sắm
Học bám giám sát Semi-supersived learning
Định nghĩa: khi chúng ta có một số lượng lớn X nhưng chỉ một phần trong số chúng được gán nhãn gọi là semi-supervised learning. Những bài toán thuộc nhóm này nằm giữa hai nhóm được nêu trên
Ví dụ: chỉ có một phần ảnh hoặc văn bản được gán nhãn ví dụ bứa ảnh về người , động vật hoặc các văn bản khoa học, chính trị) và phần lớn các văn bản chưa được gán nhãn đượcc thu thập từ internet. Thực tế cho thấy rất nhiều bài toán machine learning thuộc vào nhóm này vì việc thu thập dữ liệu có nhãn tốn rất nhiều time và chi phí cao. Rất nhiều loại dữ liệu thậm chí cần phải có chuyên gia mới gán nhãn đc, ảnh y học. Ngược lại dữ iệu chưa có nhãn có thể thu thập từ internet
Học củng cố Reinforcement Learning
Học cũng cố là các bài toán gúp cho một hệ thống tự động xác định hành vi dựa trên hoàn cảnh để đạt được lợi ích cao nhất maximizing the performance. Hiện tại, Reinforcement learing chủ yếu được áp dụng vào lsy thuyết chò trò chơi, xác định nước đi để đạt được điểm số cao nhất
Ví dụ
Alpha Go
huấn luyện cho máy tính chơi game mario
Phân nhóm dựa theo chức năng
Regression Algorithms
Linear Regression
Logistic Regression
Stepwise Regression
Classification Algorithms
Linear Classifier
Support Vector Machine SVM
Kernel SVM
Sparse Representation- based classification SRC
Instance-based Algorithms
k-Nearrest Neighbor(kNN)
Learning Vector Quantixation (LVQ0
Regularization Algorithms
Ridge Regression
Least Absolute Shrinkage Selection Operator (LASSO)
Least-Angle Regression LARS