Please enable JavaScript.

Coggle requires JavaScript to display documents.

Lez. 43 - Regressione multipla, introduzione e coefficienti - Coggle…

- - - - Tutte le variabili indipendenti ritenute rilevanti vengono inserite nello stesso modello, così da stimare il contributo specifico di ciascuna nel predire la variabile dipendente
      - Questo consente di valutare l'effetto di ciascun predittore controllando al tempo stesso l'influenza degli altri, ottenendo una rappresentazione più realistica della complessità dei dati
      - Esempio concreto: l'attenzione sostenuta di uno studente durante una lezione potrebbe dipendere dall'ora del giorno, dalle ore di sonno, dalla distanza dal pranzo, dal lavoro che svolge, dalla vicinanza di altri esami, e così via — nessuno di questi fattori da solo basta a spiegare il fenomeno
  - - - In questo modo viene trascurato il contributo simultaneo e combinato delle diverse variabili predittive, che invece la regressione multipla riesce ad analizzare e quantificare in modo appropriato
- - - - Ogni coefficiente indica quanto varia la variabile dipendente per ogni unità di variazione del predittore corrispondente, mantenendo costanti tutti gli altri predittori
      - Questi coefficienti vengono chiamati effetti parziali o coefficienti parziali, proprio perché riflettono l'influenza di un singolo predittore sulla variabile dipendente al netto degli altri fattori inclusi nel modello
  - - - Si interpreta come: il cambiamento atteso nella variabile dipendente y per ogni unità in più della variabile indipendente x, tenendo costanti le altre variabili indipendenti
      - Questo concetto può essere espresso in diversi modi equivalenti, tutti corretti:
        
        l'effetto di x su y è calcolato al netto dell'effetto di w
        
        l'effetto di x su y è calcolato come se w fosse costante
        
        l'effetto di x su y è calcolato dopo aver rimosso l'effetto di w
        
        l'effetto di x su y è calcolato dopo aver parzializzato w
        
        l'effetto di x su y è calcolato dopo aver covariato w
  - - - Il coefficiente associato alle ore di studio rappresenta il coefficiente angolare del piano di regressione rispetto all'asse delle ore di studio
      - Il coefficiente associato agli appelli rappresenta il coefficiente angolare del piano rispetto all'asse degli appelli
      - Ogni coefficiente descrive quindi l'inclinazione del piano in una direzione specifica, isolando il contributo di quella variabile
- - - - I coefficienti non standardizzati (b) indicano il cambiamento nella variabile dipendente per ogni unità di variazione del predittore, nelle unità di misura originali delle variabili
      - I coefficienti standardizzati Beta (β) si ottengono eseguendo il modello dopo aver trasformato tutte le variabili in punteggi z (standardizzazione rispetto a media e deviazione standard)
        
        Ogni coefficiente Beta indica quanto varia, in deviazioni standard, la variabile dipendente quando la variabile indipendente considerata aumenta di una deviazione standard, mantenendo costanti gli altri predittori
        
        Il grande vantaggio è che i Beta rendono confrontabili tra loro i diversi predittori, indipendentemente dalle unità di misura originali: si può così capire quale predittore ha l'impatto relativo maggiore
  - - - Nella regressione semplice indica il punto in cui la retta incontra l'asse y quando il predittore vale zero
      - Nella regressione multipla rappresenta il valore atteso della variabile dipendente quando tutte le variabili indipendenti assumono simultaneamente il valore zero — ovvero il punto di partenza della superficie di regressione
  - - - Dal punto di vista algebrico la derivazione è complessa, soprattutto con più predittori, a causa delle interazioni e delle covarianze tra le variabili indipendenti
      - Per semplificare l'interpretazione si parte spesso dai coefficienti standardizzati
      - Esiste un'analogia utile con la correlazione semiparziale: così come quest'ultima misura l'influenza unica di un predittore sulla variabile dipendente controllando gli altri, anche i Beta indicano l'effetto parziale di ciascun predittore all'interno del modello multiplo
- - - - In altre parole, indica quanto il modello è efficace nel riprodurre i dati osservati
      - Il suo complementare, 1 − R², detto coefficiente di alienazione, misura invece la proporzione di variabilità che il modello non riesce a spiegare, ovvero ciò che rimane attribuibile a fattori non inclusi nel modello o al caso
  - - - Queste componenti possono essere rappresentate concettualmente come aree di sovrapposizione:
        
        a: varianza spiegata esclusivamente dal predittore X
        
        b: varianza spiegata esclusivamente dal predittore W (contributo unico della nuova variabile aggiunta)
        
        c: varianza spiegata da entrambi i predittori in comune (sovrapposizione o condivisione di effetto tra i predittori)
        
        e: varianza della dipendente non spiegata da nessun predittore
      - L'R² complessivo è dato dalla somma (a + b + c) divisa per la varianza totale della dipendente (a + b + c + e)
  - - - In termini matematici corrisponde a: a / (a + b + c + e)
      - Può essere interpretato come l'incremento di R² che si ottiene aggiungendo quella specifica variabile indipendente al modello
  - - - Questa procedura è concettualmente errata perché trascura la componente di varianza condivisa tra i predittori (la componente c), portando a una stima incompleta o fuorviante dell'effetto complessivo
      - Una strategia corretta per comprendere il contributo relativo di un predittore consiste nel partire da una regressione bivariata (che stima la componente a + c) e poi aggiungere il contributo di b — ma questa strategia è applicabile solo con due predittori e rappresenta un caso limite