Please enable JavaScript.
Coggle requires JavaScript to display documents.
Lez. 24 - test t a campioni singolo aspetti teorici e matematici - Coggle…
Lez. 24 - test t a campioni singolo aspetti teorici e matematici
introduzione al test t
ESEMPIO
Vogliamo sapere se i voti all'esame di psicometria della nostra uni sono diversi rispetto alla media nazionale.
Voto media nazionale 25
Nostra uni, sessione esami 2025, 25 studenti, voto medio=27
Dobbiamo capire a cosa è dovuta questa differenza
Questa differenza è dovuta al gatto che i nostri studenti studiano di più della media nazionale?
Oppure i risultati sono abbastanza vicini alla media e per caso abbiamo scelto un gruppo di studenti molto bravi?
Questo è il caso applicativo del test t a campione singolo one sample t.test.
test t
Abbiamo quindi i punteggi di un campione di individui e vogliamo confrontare la media di questo campione con una popolazione di cui conosciamo la media ma nbon la varianza.
La verifica delle ipotesi in questa situazione si chiama test t per un campione singolo (o campione unico).
Il test t per un campione singolo è fondamentalmente uguale al test z come logica.
Ma non conosciamo la varianza della popolazione.
Premesse al test
I dati devono essere distribuiti normalmente (è un test cosiddetto parametrico)
Il livello della variabile indipendente deve essere almeno su scala a intervallo.
Stimare la varianza della popolazione
Problema
Non conosciamo la varianza della popolazione
Non possiamo quindi applicare il test z
MA
Possiamo stimarla dalla varianza campionaria
La varianza campionaria può offrire info sulla varianza della popolazione:
Se la varianza del campione è piccola anche quella della popolazione sarà piccola;
Se la varianza del campione è grande, anche quella della popolazione sarà grande
Stima della varianza della popolazione
La varianza campionaria non può essere usata direttamente come stima della varianza della popolazione. → Questa stima è distorta
Può essere dimostrato che la varianza del campione è più piccola della popolazione.
Possiamo calcolare una stima non distorta della varianza della popolazione.
Usiamo il simbolo s2 (s quadro) perché è una varianza stimata e non reale.
S è la deviazione standard
Dimostrazione
la varianza del campione è più piccola della varianza della popolazione
Dipende da N
Calcolata con il software statistico R
E' stata creata una popolazione di 10000 (a), con media 10 e ds 5
Calcoliamo la varianza (a): 24,74
Estraiamo un campione di 1000(b) da questa popolazione e calcoliamo varianza (b) valore di: 24,47 (leggermente più piccolo)
La deviazione standard stimata della popolazione è la radice quadrata della varianza stimata della popolazione
Come viene stimata la varianza della popolazione? Sommando scarti quadratici, diviso il numero di punteggi meno 1.
I gradi di libertà sono il numero dei punteggi del campione meno 1.
I Gradi di libertà
Rappresentano “il numero di punteggi di un campione che è libero di variare quando si calcola una statistica su un campione”
Ci sono N-1 gradi di libertà perché quando si calcolano le deviazioni, ogni punteggio viene sottratto dalla media.
Alla fine ne resta 1, è un punteggio che può avere un solo valore, che è la differenza dagli altri.
ESEMPIO
se abbiamo un piccolo campione con 2 casi N=2 che ha media 10 e un punteggio è 8, l'altro sarà per forza 12.
df=N-1
Quindi la formula per stimare la varianza della popolazione diventa:
S2 = E(somma) (X-M)2 / df - somma degli scarti al quadrato, diviso i gradi di libertà.
Possiamo anche trovarla come SS/df
Di conseguenze
Possiamo calcolare la varianza della distribuzione delle medie dividendo la nostra varianza stimata della popolazione, diviso la numerosità. S2M =s2/N
ultimo passaggio calcolare la deviazione standard della distribuzione delle medie facendo la radice quadrata della varianza. SM=rq S2M
La distribuzione t di student
Se la distribuzione della popolazione segue una curva normale, anche la distribuzione delle medie sarà normale (Teoria centrale dei limimiti)
Però questo quando facciamo una verifica considerando la varianza della popolazione.
Se abbiamo una varianza stimata, non possiamo più usare la distribuzione normale, ma la distribuzione t.
Caratteristiche
Meno dati abbiamo più è ampia la probabilità di errore
La distribuzione di riferimento sarà t o t di Student, sarà differente rispetto a quanti dati abbiamo. Che dipende dai gradi di libertà.
Conseguenza:non avremo una distribuzione unica, può avere diverse forme che dipendono dai gradi di libertà.
Es. è più bassa e ampia con pochi gradi di libertà e assume sempre di più la forma di distribuzione normale.
Quando avremo un infinito gradi di libertà avremo una distribuzione normale.
Affermazoni
C'è una distribuzione t per ogni grado di libertà;
Più grande è il numero di gradi di libertà, più la distribuzione t si approssima alla normale.
per N=infinito, la distribuzione t è come la normale.
Servirebbero tante tavole.
Tavole della distribuzione t
E' stato riportato solo il valore critico corrispondente a specifiche probabilità di interesse.
Come si legge
Abbiamo valori critici per la distribuzione.
Possiamo avere a sx probabilità a una coda
a dx probabilità a due code
nella prima colonna abbiamo i gradi di libertà e poi colonne più piccole relative a:
alpha (a) = 0.1, 0.05 e 0.01
Noi scegliamo se ci interessa 1 o 2 code, poi la nostra probabilità aplha (a) e i nostri gradi di libertà, che sono dati dalla grandezza campionaria -1. Incrociamo dati e troviamo il nostro valore di riferimento.
Abbiamo scelto probabilità ad una coda, con alpha = 0.05, con campione di 10 che ha GDL come 9 e corrisponde un valore di 1,833
3 tipi di test t
t-test per dati appaiati
per il confronto tra le medie di due campioni appaiati 8o misure ripetute);
t-test per campioni indipendenti
per il confronto tra le medie di due campioni indipendenti.
t-test a campione unico
per la verifica di ipotesi sulla media della popolazione nel caso di varianza ignota;