Machine Learning

Một số thuật ngữ cơ bản

Supervised machine learning
(học có giám sát)

Từ các dữ liệu đầu vào =>
dự đoán ra output mới toanh

Label - là dữ liệu ra(output, y)

VD: con vật trong ảnh là con gì?
clip này nói về cái gì?

Features - dữ liệu đầu vào(input, x)

Có thể có nhiều input:
Screen Shot 2019-08-01 at 11.23.06 PM
=> x là 1 véc tơ

VD về hệ thống phân loại email rác

Features gồm:

  • địa chỉ người gửi
  • Thời gian gửi
  • Chứa ký tự lạ

Mẫu(Example) là 1 cặp (x, y)
hoặc (x, ko có y)

Example ko có y gọi là "unlabeled model",
ngược lại là "labeled model"

Mô hình(Model) = quan hệ giữa x và y

Training = tạo ra model + cho model học

Inference = suy luận = prediction = dự đoán
= Cho Model tự học và tìm ra y trong các Example chưa có y

Có 2 loại Models

Regression Model - Mô hình hồi quy

Dữ liệu đầu ra liên tục.VD:
Xác suất một user bấm vào ads:
0.0; 0.1; 0.2;....1.0

Classification Model - Mô hình phân loại

Dữ liệu đầu ra rời rạc. VD:
"Nam" hoặc "Nữ"
ảnh này là "dog" hay "cat"

Hồi quy tuyến tính-Linear Regression

Phương trình tổng quát:
y = mx + b
m là độ dốc,
b là giao điểm của đường thẳng với trục y

Nếu x là 1 véc tơ:
Screen Shot 2019-08-02 at 5.16.11 PM
w1, w2,.. là trọng lượng của x1, x2,..
Giảm thiểu mất mát bằng cách tăng dần w lên rồi kiểm tra giá trị loss

Giảm thiểu mất mát bằng cách nào?

Name: Nguyen Duc Hoang
Youtube: https://www.youtube.com/c/nguyenduchoang