bivariata
Descrivere come si organizza il risultato della rilevazione congiunta di una coppia di fenomeni statistici e discutere le distribuzioni di frequenza leggibili sulla tabella a doppia entrata.
I risultati di una rilevazione congiunta di due fenomeni X e Y su U sono organizzati in una tabella a doppia entrata. Sulla variabile statistica bivariata si leggono informazioni sia sul comportamento dei singoli fenomeni sia sul loro comportamento congiunto
Definire e interpretare le frequenze marginali e le frequenze condizionate descrivendone il ruolo nella definizione di indipendenza statistica.
Le frequenze marginali fi. e f.j sono le frequenze che riguardano i due fenomeni oggetto di studio singolarmente e separatamente. Corrispondono alle frequenze monovariate. Le frequenze condizionate informano sul comportamento di un fenomeno condizionatamente
X e Y sono statisticamente indipendenti se tra i due fenomeni non vi è alcuna relazione statistica. Per capire se due fenomeni sono statisticamente indipendenti bisogna confrontare le frequenze condizionati e marginali
Dopo aver esposto il concetto di Connessione fra due fenomeni statistici, descrivere e discutere la costruzione dell’indice di connessione χ2
La connessione statistica è la relazione che lega due fenomeni che non sono statisticamente indipendenti. Se i due fenomeni non sono statisticamente indipendenti allora le frequenze congiunte sono diverse dalle frequenze teoriche di indipendenza statistica
Definire e interpretare i concetti di medie e varianze marginali e condizionate.
Se i due fenomeni X e Y sono quantitativi, le loro distribuzioni di frequenza monovariate (marginali) sono sintetizzabili con medie e varianze.
Se consideriamo X come variabile indipendente e Y come variabile dipendente è possibile calcolare media e varianza di Y│xi che sintetizzano la distribuziohne di frequenza di Y condizionata da X
Anche la varianza condizionata, così come la varianza, è una misura assoluta, né valutabile né confrontabile, a questo scopo si può calcolare il coefficiente di variazione condizionato
Definire e interpretare la scomposizione della varianza marginale in varianza “nei” e “fra” gruppi
Le due componenti σ2 FRA e σ2 NEI sono entrambe varianze e informano su aspetti della relazione tra X e Y
è la media delle varianze condizionate, è la varianza “nei” gruppi, all’interno delle sotto-popolazioni di U che esprimono la stessa xi; è la parte di σ2y che non dipende da X
è la varianza delle medie condizionate, sintetizza la variabilità tra le varie sottopopolazioni. È la parte di σ2y che dipende da X
Dopo aver esposto il concetto di indipendenza in media, fornirne la condizione discutendone il significato.
L’indipendenza in media si ha quando dati due fenomeni connessi (non statisticamente indipendenti) le medie condizionate Y│xi non variano condizionatamente al variare di X e sono quindi uguali tra loro e uguali alla media marginale y̅
Descrivere la costruzione del Diagramma a Dispersione. Discuterne l’utilità per l’individuazione dell’eventuale relazione statistica fra i due fenomeni.
Il diagramma a dispersione è una rappresentazione grafica della relazione tra due fenomeni quantitativi o comunque rilevati con scale quantitative.
Sui due assi cartesiani sono rappresentate le modalità dei due fenomeni e le coppie di valori osservati (xi, yj) sono rappresentate come punti sul diagramma cartesiano.
L’insieme delle coppie (xi, yj) forma, sul grafico, una nuvola di punti che appare strutturata se tra i fenomeni esiste una relazione statistica.
Dopo aver esposto il concetto di Correlazione, definire il coefficiente di correlazione lineare ρ e discuterne i valori
Per correlazione lineare si intende una relazione statistica di tipo lineare tra due fenomeni X ed Y. La misura della correlazione è basata sulla covarianza.
Esporre e discutere il criterio dei Minimi Quadrati per la determinazione della Retta di Regressione
Discutere concetto e utilità della modellizzazione della relazione statistica fra 2 fenomeni quantitativi; quindi definire e interpretare i parametri della retta di regressione.
significa dare una formulazione matematica che ne colga, semplificando, l’andamento di fondo. Costruire un modello ha inoltre lo scopo di prevedere il comportamento della variabile dipendente, simulandone i valori non osservati.
Nel modello di regressione lineare l’andamento congiunto di X e Y è rappresentato da una retta, chiamata retta di regressione lineare ŷ= a + bX dove a è l’intercetta e b il coefficiente angolare. Con b>0 la retta è crescente, con b<0 la retta è decrescente.
Definire e interpretare su un diagramma a dispersione: la nuvola di punti, la spezzata di regressione e il modello di regressione
La nuvola di punti è un insieme di coppie di modalità (xi, yj) rilevate e rappresentate sul diagramma cartesiano. A seconda della relazione statistica che lega X e Y essa assume una determinata struttura (o non la assume se la suddetta relazione non esiste).
La spezzata di regressione si ottiene dall’unione, tramite segmenti, dei punti (xi, y̅│xi), è una curva empirica che rappresenta il comportamento congiunto di X e di Y
Il modello di regressione è il modello statistico che interpreta la dipendenza di Y da X semplificandola e permettendo di cogliere l’andamento di fondo del loro comportamento congiunto.