Please enable JavaScript.

Coggle requires JavaScript to display documents.

Support Vector Machine - Coggle Diagram

- - - - M è il margine
      - Rewriting
        yi(w^T xi +b)>=1 con M=2/||w||
        
        min 1/2 ||w||^2
        subject to yi(w^T xi + b) >= 1
    - - Lagrangian multiplier
        Df(x°)= SUM lambda t Dh_t (x°)
        
        (x°,lambda°) è un punto di sella della funzione
        f(x) - SUM (lambda_t h_t (x))
      - L(w,b,lambda) =
        1/2 ||w||^2 - SUM (lambda_i (yi (w^T xi +b) - 1)
        
        mininum (w°,b°) con derivata 0
        
        delta_w L(w,b,lambda) = w- SUM lambda_i yi xi
        delta_b L(w,b,lambda) = - SUM lambda_i yi
        
        w° = SUM lambda_i yi xi
        SUM lambda_i yi = 0
  - - - KKT
        Karush Kuhn Tucker conditions
        
        se la funzione obiettivo è convessa, la KKT è soddisfatta dalla soluzione (x°,lambda°) del problema primale e Duale
        
        Primale
        min f(x)
        soggetto a g_t(x)<=0 t=1,...,T
        
        Duale
        max_lambda inf_x (f(x) + SUM lambda_t g_t(x) )
        soggetto a lambda_t >=0 t=1,..,T
      - max_lambda (SUM lambdai - 1/2 SUM SUM lambdai lambdaj yj yi xi^T xj)
        soggetta a lambda>=0 sum lambda yi=0
        
        matricialmente:
        max (1^T LAMBDA - 1/2 LAMBDA^T Q LAMBDA)
        Qij =(yi xi)^T (yj xj)
        
        Quadratic Programming Problem
        un sacco di metodi per risolverli
        
        interior point
        
        active set
        
        conjugate gradient
        
        gradient projection
        
        KKT condition
        lambda°i [yi (xi^T w° + b°) - 1 ] = 0
        per ogni i € [1, Ntr]
        
        lambda°i > 0
        -->
        yi (xi^T w° +b°)=1
        
        l'i-esimo training point è sul margine
        
        lambda°i =0
        -->
        yi(xi^T w° + b°) > 1
        
        l'i-esimo training point non è sul margine
  - - - w° = SUM lambda_i° yi xi
        b° = 1 - yi xi^T w° i€SV
- - - - SLACK = 0
        Come sopra
      - SLACK > 0
        il punto di train può finire nella regione sbagliata
  - - - C=0 non ci importa di SLACK i
        possiamo misclassificare tutti i punti
      - C= inf
        SLACK i deve essere 0, otteniamo un SVM normale
    - - sempre un quadratic programing problem
      - KKT condition
        lambda°_i (yi (xi^T w° + b°) -(1- SLACK°_i)) =0
        (C-lambda°_i)SLACK°_i =0
        
        lambda°_i>0
        
        slack°_i>0 lambda°_i =C
        
        slack°_i =0 0<lambda°_i<C
        
        lambda°_i =0
        il training point non è un vettore di supporto
- - - - n^T(a-b) = 0
        n= w/||w||
    - - distL(x)=||v||cos(theta)= 1/ ||w|| (w^Tx+b)