Please enable JavaScript.

Coggle requires JavaScript to display documents.

Artificial Neurol Network, Tổng quan về Deep Learning :: - Coggle Diagram

- - - - "Quán tính" để tăng tốc quá trình hội tụ
      - Để tăng tốc quá trình hội tụ, đặc biệt trong các bề mặt hàm mất mát có dạng thung lũng hẹp.
  - - - Cập nhật tham số theo hướng ngược lại của gradient tại vị trí hiện tại, nhằm giảm giá trị của hàm mất mát.
      - Hiệu quả khi bề mặt hàm mất mát đơn giản, không có nhiều local minima.
- - - - Mô hình học quá chi tiết từ dữ liệu huấn luyện
  - - - Mô hình không đủ phức tạp để học được các mẫu
- - - - B: bias
      - x: input vector
      - W: weight
  - - - Update: all training dataset
    - - Update: subset of training set
    - - Update: each training example
  - - - Adjust weight
- - - - điều chỉnh siêu tham số và đánh giá hiệu suất learning rate, số lớp ẩn, số nơ-ron, tỷ lệ dropout
  - - - Đánh giá mô hình
  - - - tính toán và tối ưu các tham số
- - - - Average Pooling
        
        Đặt kernel vào một vùng ảnh, tỉnh giá trị trung bình các giá trị trong vùng ảnh đó
      - Max Pooling
        
        Đặt kernel vào một vùng ảnh, lấy giá trị lớn nhất trong vùng ảnh đó
  - - - Tính toán: lần lượt trượt kernel này đi hết bức ảnh và tính các tích võ hướng
      - Một vị trí trong activation map sẽ
        được tính bằng cách lấy tổng giá trị khi đặt 3 layer vào 3 kênh màu của ảnh -> trừ bias -> qua hàm kích hoat
      - Là một cửa số trượt như các filter
    - - Nếu sau lớp tích chập là các lớp fully connected thì các activation mạp được biến đổi thành dạng one-hot vector
      - -
        Là kết quả tính toán khi trượt 1 kernel đi hết các bức ảnh có K kernel thì có K activation map
  - - - Các kernel ở lớp thứ 2 phải có số layer bằng số activation map thu được ở lớp thứ nhất
      - Lúc này, một vị trí trong activation map ở lớp thứ 2 sẽ bằng tổng loạt các tích vô hướng.
- - - - Tổng hợp giọng nói
      - Nhận diện chuỗi hành động trong video.
      - Sáng tác nhạc.
  - - - Xử lý tốt dữ liệu chuỗi, có tính thời gian.
      - Lưu giữ thông tin ngữ cảnh từ dữ liệu trước đó.
    - - Gặp vấn đề vanishing gradient → khó học khi chuỗi quá dài.
        
        Long short term memory (LSTM) ra đời
  - - - Dựa vào hai thông tin này, nó tính ra trạng thái ẩn hiện tại (ht) và đầu ra (yt).
    - - ht = tanh(Whh ht-1 + Wxh xt + bh)
    - - yt = softmax(Why * ht + by)