TEORIA CLASSICA DEI TEST (TCT) (CAP.4)

INTRODUZIONE

(Spearman anni 50') misura attendibilità test (analizzare item)-> ci sono diversi modelli utilizzabili nelllo sviluppo, valutazione, analisi di un test -> il primo è questo modello punteggio vero ( o TCT) (modello che ricade all'interno della teoria della risposta all'item)

consideriamo un insieme di misure( o item) indicizzate tramite j=1 (item generico) e un insieme di soggetti rispondenti -> Yj (v.a. che governa la j-esima misura relativamente alla componente osservabile), Tj ( v.a. " " " " componente vera non osservabile), Ej (v.a. " " " componente di errore) --> noi conosciamo solo: Yj e Yj= Tj+ Ej (definizione fondamentale della TCT)-> ciò che misuriamo è = al vero valore ma errore lo indebolisce

proprietà

1) E(Ej)= 0 -> errore ha media nulla (non sistematico), 2) Cor(Ej, Tj)=0-> non sono correlati valore vero ed errore (sennò sarebbe errore sistematico), 3) Cor( Ej, Ej')=0 -> 2 misurazioni diverse hanno Ej non correlati

le osservabili Yj e Yj' sono:

parellele (p1)-> Yj= T+E, Yj'= T+ E (= valore atteso e varianza)

τ- equivalenti (p2)-> Yj= T+E,, Yj'= T+E' ( = valore atteso, diversa varianza)

essenzialmente τ- equivalenti(p3)-> Yj= α+T+E, Yj'= α+T+E' (stessa quantità latente ma diversa precisione) (valore atteso = con + α, varianza diversa)

congeneriche (p4)-> Yj= α+βT+E, Yj'= α+βT+E' ( stessa quantità latente con diversa precisione e scale)

con assunti TCT x derivare le quantità ignote var[Ej] e var[Tj]->
4) var[T]= cor[Yj, Yj'] x var[Yj], 5) var [Ej]= var [Yj] (1-cor[Yj,Yj')

ATTENDIBILITA

misura importante che lega T a Y (pyt)-> esprime la forza con cui si esprimono le realizzazioni delle 2 v.a.-> valori alti di pyt indicano una notevole precisione nella quantificazione di T mediante Y (quanto Y riflette T)

nella realtà della rilevazione dei dati solo Y è conoscibile mentre T e E sono stimabili solo utilizzando una coppia di misure parallele
--> pyt= var[T]/ var[Y] = 1- var [E]/var[Y] in cui per proprietà TCT Corr[Y,Y']= Var[T]
(pyt=[0,1]) --> esprime la variazione del misurando T (non osservato) rispetto al misurabile Y (osservato) utilizzando criterio parallelo Y'-> se var[E]=0 pyt=1, se Var[E]= var[Y] pyt=0--> var[E] indica imprecisione test, pyt indica al contrario precisione

interpretazione di pyt: correlazione tra punteggio vero T e Y = pyt

definizione di attendibilità è basata sull'utilizzo di misure parallele -> somministrazione test: stesso test in tempi diversi (precisione nel tempo), 2 forme diverse dello stesso test su stesso campione

procedure x la stima dell'attendibilità-> 2 approcci generali

procedure che richiedono 2 somministrazioni del test: metodo delle forme parallele, metodo test-retest

procedure che richiedono una sola somministrazione:

split-half: suddivisione del test in 2 parti di medesima lunghezza (ex.pari/dispari)-> nel caso siano parallele formula di spearman-brown: py^2= 2 p^2ab(correlazione tra le 2 parti)/1+p^2ab , nel caso non siano parallele indice di Rulan py^2= 2[1-(varya+varyb)/varytot]
(tende a sottostimare attendibilità rispetto a spearman-brown, invece tendono ad equivalersi quando varianza tra le 2 parti 0.9-1.1)

coerenza interna(basato su covarianza item): consideriamo m misure (Ym.Tm,Em) che formano la misura composta X=ΣYj --> uno stimatore della misura composta p^2x è α di Chronbach: p^2xx'= m/(m-1) [1-(ΣvarYj/(ΣvarYj+ΣcovYj,Yh)]--> > sarà la componente di covarianza > sarà indice α finale--> fornisce un'indicazione sulla coerenza delle misure tra loro --> α >0.9 (ottimo), 0.8<α<0.9 (buono), 0.7<α<0.8(discreto),0.6<α<0.7(sufficiente), α<0.6(insufficiente)

altro indice quando misure componenti (item) sono dicotomici-> KR20(kuder-richardson)-> si ottiene dalla sostituzione generica (nell'α) di var[y] con la varianza della distribuzione binomiale (π)

correlazione interclasse: calcolo attendibilità come rapporto di varianze: rapporta la quantità di varianza della componente vera alla varianza complessiva)

attendibilità e lunghezza del test: in generale data una misura composita iniziale X(o test) possiamo valutare come attendibilità varia in funzione dell'aggiunta di m item-> formula profetica Spearman-Brown: p^2xx'm= m x p^2xx'/ [1+(m-1)pì2xx']

fattori che influenzano attendibilità: qualità campione individui, qualità item, campionamento realmente casuale, condizione di somministrazione test, lunghezza test adeguata

STIMA DEI PUNTEGGI VERI AD UN TEST

stimatore lineare (corrisponde ai valori degli individui sul costrutto latente) τ= p^2yt x ytot+(1-p^2yt) x µ -> se stima attendibilità (p^2yt) è bassa allora µ avrà > peso --> τ potrebbe essere non adeguato se relazione Y-T non è lineare

VALIDITA

quando il nostro interesse è rivolto a capire cosa un determinato test misuri-> diversi metodi x valutarla e diverse accezioni di validità: di contenuto(riferita a semantica item), fattoriale(coerenza interna item),di criterio(coerenza test rispetto a criterio esterno), di costrutto( a convergenze e divergenze rispetto alle altre misure x di un medesimo costrutto)

PUNTEGGI E NORME

scoring: interpretazione ytot viene effettuata x confronto con i valori normativi del test-> x confrontare punteggi ottenuti occorre trasformarli in punteggi standardizzati

diversi modi di ottenerli: punteggio Z (media nulla e varianza 1, normale standardizzata come legge riferimento), punteggio t (si ottiene x trasformazione lineare di Z t=50+10z, media=50 e deviazione s=10-> utilizzata x rendere punteggi finali tutti +)

CONCLUSIONI

TCT: Y (misurazione)= T (misurando) + E(errore), obiettivo costruire un test con alta precisione e attendibilità
( varT>varE), si caratterizza su caratteristiche test + che su item