Please enable JavaScript.

Coggle requires JavaScript to display documents.

Stanford CS231N - Convolutional Neural Networks - Coggle Diagram

- - - - Chaque filtre retire des information particulière dans l'image et plus on stack de filtre les uns à la suite des autres, plus l'information retenue dans les dernières couches sera complexe
      - Output size = (N - F) / stride + 1
        avec F la taille du filtre
        N le nombre de pixels
        Sride le slide choisi
        exemple :
        N = 7, F = 3 output size = (7 - 3) / 1+1 = 5
      - On peut ajouter un "padding", qui correspond à ajouter des zéros autour de la matrice représentant l'image afin d'en adapter la taille à la convolution sans ajouter d'information
        
        Par convention :
        si pour une convolution de FxF,
        si F = 3, zero pad with 1,
        si F = 5, zero pad with 2,
        si F = 9, zero pad with 3
  - - - max pooling
        
        applique un filtre de taille choisie (exemple 2x2) et ne récupère que la valeur maximale dans ce filtre pour construire la représentation d'après (la valeur maximale dans cette petite matrice représente normalement l'information la plus importante à la compréhension de cette partie de l'image)
      - average pooling
        
        pareil avec la valeur moyenne du filtre, mais moins efficace
- - - - AlexNet