Please enable JavaScript.
Coggle requires JavaScript to display documents.
Học có giám sát - Coggle Diagram
Học có giám sát
Bộ phân loại Naive Bayes
-
Các mô hình Naive Bayes thường cung cấp hiệu suất tổng quát hóa kém hơn một chút so với các bộ phân loại tuyến tính như LogisticRegression và LinearSVC.
Học các tham số bằng cách xem xét từng đặc trưng riêng lẻ và thu thập số liệu thống kê đơn giản cho mỗi lớp từ mỗi đặc trưng.
-
-
-
Điểm mạnh, điểm yếu và thông số
alpha, kiểm soát độ phức tạp của mô hình.
Một alpha lớn có nghĩa là làm trơn tru hơn, dẫn đến các mô hình ít phức tạp hơn.
Cài đặt alpha không quan trọng để có hiệu suất tốt. Tuy nhiên, điều chỉnh nó thường cải thiện độ chính xác phần nào.
-
Mô hình Naive Bayes là mô hình cơ sở tuyệt vời và thường được sử dụng trên các tập dữ liệu rất lớn, nơi mà việc training thậm chí một mô hình tuyến tính có thể mất quá nhiều thời gian.
Xác thực chéo
-
Sử dụng nhiều train-test split, không chỉ một phần
-
Xác thực chéo phân tầng
Mỗi folds được phân tầng chứa một tỷ lệ các lớp phù hợp với tập dữ liệu tổng thể. Bây giờ, tất cả các lớp sẽ được đại diện công bằng trong tập thử nghiệm.
-
Điểm mạnh, điểm yếu và thông số
Tham số chính của mô hình tuyến tính là tham số chính quy hóa, được gọi là alpha trong mô hình hồi quy và C trong LinearSVC và LogisticRegression.
Mô hình tuyến tính rất nhanh để train và cũng nhanh để dự đoán. Chúng mở rộng quy mô thành tập dữ liệu rất lớn và hoạt động tốt với dữ liệu thưa thớt.
Tương đối dễ hiểu cách thực hiện một dự đoán, bằng cách sử dụng các công thức.
-
-