Analisi bivariata

Relazioni tra variabili

Simmetrica

Asimmetrica

La simmetria indica che le due variabili sono in relazione tra loro, ma non specifica una direzione o una causalità della relazione

Un'asimmetria indica una relazione di causalità tra le variabili. Ad esempio A influenza B

Causalità

L'esistenza di un'associazione o relazione tra variabili non indica che vi sia una relazione causale di nessun tipo. La causalità tra fenomeni non può essere provata con metodi statistici

Affinché tra due variabili si possa ipotizzare una relazione causale, è necessario che

Esista un ordine temporale tra le variabili: il cambiamento nella presunta variabile predittiva deve precedere il cambiamento nella presunta variabile dipendente

Vi sia genuinità dell'associazione, ovvero l'associazione tra le variabili interessata non sia il prodotto dell'effetto sulle variabili considerate di una terza variabile

Esista covariazione tra le variabili interessate alla relazione

Misurare l'associazione tra variabili

Scala di misura

Tre aspetti da considerare

Variabili qualitative (sconnesse o ordinali)

Variabili quantitative

Forza della relazione

Significato o forma della relazione

Significatività della relazione

Test del x²

Tabelle di frequenze

A una via, a un'entrata

A due vie, a due entrate

Si applica a tabelle di contingenza, cioè tabelle che riportano i conteggi

Non si può utilitari con variabili quantitative

Verifica se c'è indipendenza tra due variabili categoriali

Idea di base: se le variabili fossero indipendenti, tutte le distribuzioni condizionate dovrebbero essere uguali

H0: nessuna relazione tra le variabili

H1: esiste relazioni tra le variabili

Le celle avrebbero valori attesi

Vogliamo costruire questa tabella teorica nell'ipotesi di indipendenza e confrontarla con quella che abbiamo osservato

Una volta ottenuta la tabella con le frequenze teoriche, dobbiamo misurare la sua “distanza” da quella osservata: se le due tabelle sono abbastanza vicine possiamo pensare vi sia indipendenza, se sono lontane c’è associazione

La misura che usiamo per stabilire questa distanza è il test statistico del x², poi confrontato con distribuzione x²