Please enable JavaScript.

Coggle requires JavaScript to display documents.

Lez. 42 - Altre correlazioni - Coggle Diagram

- - - - Un esempio classico è la relazione tra età e altezza nei bambini: all'aumentare dell'età, tende ad aumentare anche l'altezza
      - È fondamentale ricordare però che correlazione non significa causalità: il fatto che due variabili siano correlate non implica che una causi l'altra
  - - - Può anche verificarsi per puro caso, soprattutto quando si analizzano molti dati senza le dovute precauzioni statistiche
  - - - Se la relazione non è lineare, anche con dati perfettamente normali, Pearson rischia di sottostimare o distorcere l'associazione reale
      - Quando però si vuole testare la significatività statistica, si usa il test t di Student, che richiede l'assunzione di normalità bivariata
        
        Se questa condizione non è rispettata, il coefficiente si può comunque calcolare, ma la significatività è meno affidabile nei campioni piccoli
        
        Con campioni grandi, il Teorema del Limite Centrale riduce l'impatto della non normalità, rendendo i risultati comunque interpretabili
      - La normalità delle variabili non è un requisito obbligatorio per il calcolo del coefficiente: ciò che conta davvero è che la relazione tra le variabili sia di tipo lineare
  - - - Pearson: entrambe le variabili continue → misura la relazione lineare → esempio: altezza e peso
      - Spearman: variabili ordinali o continue con relazione monotona → misura la relazione monotona → esempio: questionario QoL e test cognitivi
      - Punto-biseriale: una variabile dicotomica e una continua → misura quanto la variabile continua differisce tra i due gruppi → esempio: sesso e punteggio a un test cognitivo
      - Phi (Φ): entrambe le variabili dicotomiche → misura la correlazione tra due variabili a due valori → esempio: presenza/assenza di sintomo e esito positivo/negativo di un test
      - ICC: misure ripetute sulla stessa unità → valuta la consistenza o affidabilità tra osservazioni multiple → esempio: due psicologi che valutano lo stesso comportamento
- - - - A differenza di Pearson, che cattura relazioni lineari, Spearman coglie legami monotoni: situazioni in cui all'aumentare di una variabile corrisponde sempre un aumento o una diminuzione dell'altra, indipendentemente dalla forma della curva
      - È particolarmente utile quando i dati violano la normalità o quando si lavora con scale ordinali
  - - - In alternativa, esiste una formula che calcola il coefficiente a partire dalle differenze tra i ranghi (Di) assegnati alle due variabili per ogni osservazione, misurando direttamente quanto i due ordinamenti coincidono o divergono
  - - - Si usa la statistica t, esattamente come per Pearson: si confronta il valore con la distribuzione della t di Student e si decide se rifiutare l'ipotesi nulla di assenza di correlazione
  - - - È particolarmente robusta nei campioni di piccole dimensioni: da preferire a Spearman quando n < 10
- - - - La dicotomia può essere naturale: il genere biologico, l'esito vero/falso di un test
      - Oppure può essere artificiale: si prende una variabile continua e la si divide in due categorie
        
        Questa operazione non è consigliabile, perché comporta una perdita di informazione e riduce la potenza statistica
        
        Quando si procede comunque, la nuova variabile viene interpretata come se riflettesse un continuum sottostante, di cui la divisione in due gruppi è solo una semplificazione
  - - - Se la variabile è codificata con etichette testuali, va ricodificata prima di procedere
  - - - Se il gruppo con la media più alta sulla variabile continua è codificato come 1, la correlazione sarà positiva
      - Se quel gruppo è codificato come 0, la correlazione sarà negativa
      - In sintesi: M₁ > M₀ → rpb positivo; M₁ < M₀ → rpb negativo
- - - - Si basa sulle tabelle di contingenza 2×2, che organizzano le frequenze congiunte delle due variabili
      - Non è un test inferenziale, ma un indice di effetto: non verifica se l'associazione esiste, ma indica quanto è forte
        
        Si affianca al chi-quadrato, che invece verifica la significatività statistica: phi e chi-quadrato forniscono informazioni complementari
        
        Permette di confrontare l'intensità del legame tra diverse coppie di variabili dicotomiche
  - - - Questa normalizzazione produce un indice standardizzato che varia tra -1 e +1, rappresentando intensità e direzione dell'associazione
    - - Mentre il chi-quadrato verifica l'esistenza dell'associazione, phi ne misura la forza: quantifica quanto le osservazioni sono concentrate lungo le diagonali rispetto a quanto ci si aspetterebbe per caso