Please enable JavaScript.

Coggle requires JavaScript to display documents.

Stanford CS231N - Training neural networkd 1 - Coggle Diagram

- - - - Problèmes :
        
        Peu tuer le gradient (pour des valeur de sortie très négative, le gradient se rapprochera fortement de 0, même chose pour des valeurs très positives, les endroits ou la courbe de la fonction d'activation est plate)
        
        n'est pas centré sur 0, la mise à jour du gradient ne sera pas efficace car il ne peut bouger que dans certaines directions (toujours positif ou toujours négatif)
        
        contient un exponentiel, couteux en ressources de calcul.
  - - - Légèrement mieux que la sigmoïde mais tuera tout de même le gradient sur des valeurs très négatives ou très positives (endroits plats)
  - - - Problèmes :
        
        n'est pas centré sur zéro
        
        dead relu, le gradient ne fait plus rien évoluer, car rien n'est activé.
  - - - efficace en terme de calcul
        ne sature pas (ni en négatif ni en positif)
  - - - plus robuste au bruit
- - - - Inutile pour des images, les échelles sont déjà relatives pour les valeurs des pixels