Please enable JavaScript.

Coggle requires JavaScript to display documents.

NLP (Rappresentazione parole, Task) - Coggle Diagram

- - - - enorme
    - - Stemming & Lemmatizzazione
      - Rimuovere Stop words
      - Tokenizzazione
      - Bow-representation
  - - - vettori parole casuali sistemati per massimizzare probabilità
      - self supervised training
    - - abbandonati con l'utilizzo dei transformers
  - - - si ottengono frasi sintatticamente corrette, ma senza senso
        
        manca una semantica che collega tutto
    - - si continua ad ignorare le cose fuori dalla finestra
        
        problema dimensione finestra
    - - meglio delle n-gram, ma ancora troppo limitate
    - - campiono k token
        
        calcolo probabilità
        
        per ognuna di queste genero k token
        
        le scelgo le migliori ad ogni passo
    - - encoder= semantica
        decoder= generare testi
    - - ad ogni istante possiamo accedere a diverse parti dell'input
        
        rappresentazione input dinamica
      - $$ e_i = h_i^T h_t $$
        similarità tra decoder hidden state e l'i-th hidden state
      - Attention distribution
        
        $$ Att(q,(k_i,v_i)_{i=1}^N)=\sum_{i=1}^N softmax(q^T k_i)v_i $$
        
        base dei TRANFORMERS
      - Vantaggi
        
        migliora NMT performance
        
        human-like model
        
        risolve il bottleneck problem
        
        aiuta il vanishing gradient problem
        
        permette interpretabilità
      - Transformers
        primo modello pure attention
        
        self attention (query, chiave, valore)
        
        no recurrence
        
        evoluzione di GNMT
        
        SotA inNMT, NLP in generale
        
        usa multi-head attention
        
        usa molteplici layers
        
        usa encoding posizionale per ricordare l'oridne
        
        Vantaggi
        
        n° operazioni non parallelizzabili non aumenta la lunghezza della sequenza
        
        ogni parola interagisce con l'altra
        
        sparisce il problema dell'esplosione del gradiente
        
        Cons
        
        non c'è rappresentazione di concetti
        
        non definibile intelligente
        
        facile che abbia allucinazioni
        
        masked self attention
        
        si tolgono tutti i collegamenti dal futuro al passato