Analisi bivariata
Relazioni tra variabili
Simmetrica
Asimmetrica
La simmetria indica che le due variabili sono in relazione tra loro, ma non specifica una direzione o una causalità della relazione
Un'asimmetria indica una relazione di causalità tra le variabili. Ad esempio A influenza B
Causalità
L'esistenza di un'associazione o relazione tra variabili non indica che vi sia una relazione causale di nessun tipo. La causalità tra fenomeni non può essere provata con metodi statistici
Affinché tra due variabili si possa ipotizzare una relazione causale, è necessario che
Esista un ordine temporale tra le variabili: il cambiamento nella presunta variabile predittiva deve precedere il cambiamento nella presunta variabile dipendente
Vi sia genuinità dell'associazione, ovvero l'associazione tra le variabili interessata non sia il prodotto dell'effetto sulle variabili considerate di una terza variabile
Esista covariazione tra le variabili interessate alla relazione
Misurare l'associazione tra variabili
Scala di misura
Tre aspetti da considerare
Variabili qualitative (sconnesse o ordinali)
Variabili quantitative
Forza della relazione
Significato o forma della relazione
Significatività della relazione
Test del x²
Tabelle di frequenze
A una via, a un'entrata
A due vie, a due entrate
Si applica a tabelle di contingenza, cioè tabelle che riportano i conteggi
Non si può utilitari con variabili quantitative
Verifica se c'è indipendenza tra due variabili categoriali
Idea di base: se le variabili fossero indipendenti, tutte le distribuzioni condizionate dovrebbero essere uguali
H0: nessuna relazione tra le variabili
H1: esiste relazioni tra le variabili
Le celle avrebbero valori attesi
Vogliamo costruire questa tabella teorica nell'ipotesi di indipendenza e confrontarla con quella che abbiamo osservato
Una volta ottenuta la tabella con le frequenze teoriche, dobbiamo misurare la sua “distanza” da quella osservata: se le due tabelle sono abbastanza vicine possiamo pensare vi sia indipendenza, se sono lontane c’è associazione
La misura che usiamo per stabilire questa distanza è il test statistico del x², poi confrontato con distribuzione x²