Please enable JavaScript.

Coggle requires JavaScript to display documents.

AI-book-2-Chapter-6 - Coggle Diagram

- - - - Length of Chain = Depth of Model
  - - - Criteria
        
        Activation Function
        
        Architecture
  - - - Hybrid
        
        Use human knowledge to constraint
  - - - Due to Non-Linearity
    - - Initialization
        
        Sensitive to Initialization
        
        Initialize to small random values
    - - When dataset is too large
  - - - Probability
      - Actual Value
    - - Minimize Cross-Entropy
        
        No Minimum
      - KL Divergence
      - Log Likelihood
    - - Weight Decay
    - - Large Predictable Gradient
      - Avoid Saturation