Machine Learning
Một số thuật ngữ cơ bản
Supervised machine learning
(học có giám sát)
Từ các dữ liệu đầu vào =>
dự đoán ra output mới toanh
Label - là dữ liệu ra(output, y)
VD: con vật trong ảnh là con gì?
clip này nói về cái gì?
Features - dữ liệu đầu vào(input, x)
Có thể có nhiều input:
=> x là 1 véc tơ
VD về hệ thống phân loại email rác
Features gồm:
- địa chỉ người gửi
- Thời gian gửi
- Chứa ký tự lạ
Mẫu(Example) là 1 cặp (x, y)
hoặc (x, ko có y)
Example ko có y gọi là "unlabeled model",
ngược lại là "labeled model"
Mô hình(Model) = quan hệ giữa x và y
Training = tạo ra model + cho model học
Inference = suy luận = prediction = dự đoán
= Cho Model tự học và tìm ra y trong các Example chưa có y
Có 2 loại Models
Regression Model - Mô hình hồi quy
Dữ liệu đầu ra liên tục.VD:
Xác suất một user bấm vào ads:
0.0; 0.1; 0.2;....1.0
Classification Model - Mô hình phân loại
Dữ liệu đầu ra rời rạc. VD:
"Nam" hoặc "Nữ"
ảnh này là "dog" hay "cat"
Hồi quy tuyến tính-Linear Regression
Phương trình tổng quát:
y = mx + b
m là độ dốc,
b là giao điểm của đường thẳng với trục y
Nếu x là 1 véc tơ:
w1, w2,.. là trọng lượng của x1, x2,..
Giảm thiểu mất mát bằng cách tăng dần w lên rồi kiểm tra giá trị loss
Giảm thiểu mất mát bằng cách nào?
Name: Nguyen Duc Hoang
Youtube: https://www.youtube.com/c/nguyenduchoang