Please enable JavaScript.
Coggle requires JavaScript to display documents.
TEORIE E TECNICHE 3 - Coggle Diagram
TEORIE E TECNICHE 3
56. Principali fonti di distorsione nella stima dell’attendibilità con due somministrazioni (Test-Retest)
🔹 1. Effetti di memoria o apprendimento (carryover / practice effects)
- Il soggetto ricorda le risposte o le strategie usate nella prima somministrazione.
- Può migliorare artificialmente la performance → sovrastima dell’attendibilità.
🔹 2. Variazioni reali del costrutto
- Il tratto psicologico (es. umore, ansia) può cambiare naturalmente nel tempo.
- La differenza nei punteggi riflette un cambiamento reale, non errore casuale → sottostima dell’attendibilità.
🔹 3. Differenze nelle condizioni di somministrazione
- Cambiano elementi contestuali: luce, rumore, orario, stanchezza, fame ecc.
- Introducono varianza non controllata → errore aggiuntivo.
🔹 4. Differenze nell’amministrazione del test
- Cambiamenti nel somministratore, nel tono delle istruzioni, nella relazione interpersonale.
- Anche minime differenze possono influenzare i risultati → errore sistematico o casuale.
57. Le tre tipologie di validità di criterio
La validità di criterio indica quanto i punteggi di un test sono in grado di correlarsi con un criterio esterno che rappresenta il comportamento o la caratteristica che si intende misurare.
🔹 1. Validità concorrente
- Definizione: il criterio viene misurato nello stesso momento del test.
- Utilizzo: confronto con strumenti già validati o comportamenti attuali.
- Esempio: nuovo test di intelligenza confrontato con il WAIS.
- Scopo: verificare rapidamente la validità dello strumento.
🔹 2. Validità predittiva
- Definizione: il test viene somministrato in un momento anteriore rispetto alla rilevazione del criterio.
- Utilizzo: per prevedere esiti futuri.
- Esempio: test attitudinale → rendimento lavorativo dopo 6 mesi.
- Scopo: selezione, orientamento, diagnosi precoce.
🔹 3. Validità postdittiva
- Definizione: il test viene somministrato dopo la misurazione del criterio.
- Utilizzo: per validare retroattivamente uno strumento con dati passati.
- Esempio: test psicologico attuale confrontato con vecchie cartelle cliniche.
- Condizione: il costrutto misurato deve essere stabile nel tempo
59. 3 dei 6 aspetti della validità di costrutto secondo Messick (1995)
Messick (1995) concepisce la validità di costrutto come unitaria, ma articolata in sei aspetti complementari. Eccone tre:
🔹 1. Aspetto di contenuto
- Verifica la rappresentatività e pertinenza degli item rispetto al costrutto teorico.
- Richiede un’attenta definizione teorica e una copertura completa delle dimensioni previste.
- ⚠️ Evita l’inclusione di contenuti fuori dominio.
- ✔ Esempio: un test di intelligenza verbale deve includere vocaboli, analogie, comprensione del testo, non matematica o logica.
🔹 2. Aspetto strutturale
- Valuta la struttura interna del test in relazione al modello teorico (es. fattori latenti).
- Si verifica tramite Analisi Fattoriale (esplorativa o confermativa).
- Gli item devono caricare sui fattori teorici attesi.
- ✔ Esempio: in un test di motivazione, gli item della motivazione intrinseca dovrebbero formare un fattore distinto da quelli della motivazione estrinseca o dell’amotivazione.
🔹 3. Aspetto esterno (convergenza e discriminazione)
- Verifica le correlazioni con altri strumenti o criteri esterni.
- Validità convergente: correlazione alta con test di costrutti simili.
- Validità discriminante: correlazione bassa o nulla con costrutti diversi.
- ✔ Esempio: un questionario sull’ansia dovrebbe:
- Correlare fortemente con altri test di ansia ✅
- Correlare poco con test di depressione o autostima ❌
60. Costruzione della matrice multi-tratto multi-metodo (MTMM) per la validità di costrutto:
Misure necessarie
- Almeno 2 costrutti distinti (es. Tratto A e Tratto B)
- Ogni costrutto misurato con 2 metodi diversi (Metodo 1 e Metodo 2)
| | Metodo 1 | Metodo 2 |
| ------------ | -------------------------- | -------------------------- |
| Tratto A | A1 (Tratto A con Metodo 1) | A2 (Tratto A con Metodo 2) |
| Tratto B | B1 (Tratto B con Metodo 1) | B2 (Tratto B con Metodo 2) |
Matrice 4×4: correlazioni tra tutte le misure
- Diagonale principale:
Mono-tratto, mono-metodo
Correlazioni tra ripetizioni della stessa misura (affidabilità interna)
- Celle adiacenti alla diagonale:
Mono-tratto, etero-metodo
Correlazioni tra lo stesso tratto misurato con metodi diversi (validità convergente) → attese elevate
- Celle più distanti lungo righe/colonne:
Etero-tratto, mono-metodo
Correlazioni tra tratti diversi misurati con lo stesso metodo (validità discriminante legata al metodo) → moderate o basse
- Celle più distanti (angoli opposti):
Etero-tratto, etero-metodo
Correlazioni tra tratti diversi misurati con metodi diversi (validità discriminante più pura) → attese basse
In sintesi:
- Serve un disegno con almeno 4 misure: 2 tratti × 2 metodi
- La matrice permette di valutare:
- Attendibilità (diagonale)
- Validità convergente (mono-tratto, etero-metodo)
- Validità discriminante (etero-tratto, mono-metodo e etero-metodo)
61. l’errore standard di misurazione (SEM)
Errore Standard di Misurazione (SEM)
✅ Definizione: Indica quanto un punteggio osservato si discosta, in media, dal vero punteggio a causa di errori casuali.
- È una stima della precisione della misurazione psicologica.
📊 Formula per calcolarlo
- SEM = σX × √(1 - rtt)
- σX = deviazione standard dei punteggi osservati
- rtt = coefficiente di attendibilità (es. alfa di Cronbach)
- Attendibilità alta → SEM piccolo → stima più precisa
- Attendibilità bassa → SEM grande → stima meno precisa
🎯 Utilizzo
- Per costruire intervalli di confidenza sul punteggio osservato:
- Es.: X ± 1,96 × SEM → intervallo al 95% di probabilità
- Permette di comunicare l’incertezza di un punteggio, non solo il valore grezzo.
⚠️ Limiti del SEM
- Assume errore costante lungo tutta la scala dei punteggi
→ Falso nei modelli IRT: la precisione può variare a seconda del livello di abilità o difficoltà degli item.
- Dipende da rtt stimato nel campione
→ Se l’attendibilità è calcolata su un campione poco rappresentativo, il SEM sarà poco generalizzabile.
- Considera solo l’errore casuale
→ Non rileva bias sistematici (es. errori di somministrazione, correzione soggettiva).
🧩 Conclusione
Il SEM è uno strumento utile ma non autosufficiente: deve essere usato con consapevolezza delle sue assunzioni e integrato con altre analisi per una valutazione completa della qualità di un test.
63. Punteggio grezzo: definizione, limiti e stima del punteggio vero
📌 Definizione di punteggio grezzo
- Somma (o media) dei punteggi ottenuti dal soggetto sugli item di un test.
- Esempi:
- N° di risposte corrette in un test a scelta multipla.
- Totale dei punteggi su una scala Likert.
⚠️ Limiti del punteggio grezzo
- Contiene errore:
- Include sia la componente vera (T) sia quella d’errore (e).
- Dipende da difficoltà e lunghezza del test.
- Non è comparabile tra versioni diverse dello stesso test.
- Suscettibile a variazioni casuali e sistematiche (es. stanchezza, comprensione, contesto).
🧠 Relazione della Teoria Classica dei Test
X=T+e
- Dove:
- X = punteggio osservato (grezzo)
- T = punteggio vero
- e = errore casuale
📈 Stima del punteggio vero (T^)
T^= X̄. + rtt(X-X̄.)
- X̄ = media del gruppo
- rtt = coefficiente di attendibilità (es. alfa di Cronbach)
Interpretazione:
- Se rtt è alto: il punteggio grezzo è affidabile, quindi si dà più peso alla deviazione da X̄.
- Se rtt è basso: si regredisce più verso la media → meno fiducia nel singolo punteggio osservato.
🎯 Utilità della stima
- Riduce l’impatto dell’errore casuale.
- Migliora la precisione delle inferenze.
- Consente di costruire intervalli di confidenza usando il SEM:
IC= T^ ± z x SEM
✅ Conclusione
- Il punteggio grezzo è il punto di partenza.
- Per una valutazione accurata, va integrato con:
- Attendibilità (rtt)
- SEM
- Stima del punteggio vero
- Solo così si ottiene una rappresentazione più precisa e interpretabile del livello del costrutto misurato.
64. Applicazioni dell'Errore Standard di Misurazione (SEM)
1.🎯 Stima dell’intervallo di confidenza
- Calcolo di un intervallo attorno al punteggio osservato:
IC= T^ ± z x SEM
- Esempio: ±1,96·SEM per un livello di confidenza del 95%.
2.🧪 Valutazione della precisione del punteggio
- SEM basso = punteggio più preciso e vicino al punteggio vero.
- Aiuta a giudicare l’attendibilità del punteggio individuale.
3.⚖️ Confronto tra soggetti
- Considera la variabilità dovuta all’errore.
- Evita interpretazioni errate di differenze non significative.
4.🔁 Confronto nel tempo
- Utilizzato nel Reliable Change Index (RCI):
- Verifica se una differenza tra due test è statisticamente affidabile (cioè non dovuta solo all’errore di misura).
- Utile per monitorare il cambiamento clinico.
5.🩺 Supporto a decisioni cliniche o diagnostiche
- Raffina l’interpretazione dei cut-off diagnostici.
- Mostra il margine di incertezza attorno alla soglia, aiutando a evitare errori decisionali.
65. Assunzioni per il calcolo degli intervalli di confidenza usando il SEM
- 🎲 Errori casuali e normalmente distribuiti
- L’errore di misurazione è aleatorio, con distribuzione normale e media zero.
- 🔗 Indipendenza tra errore e punteggio vero
- L’errore non deve essere sistematicamente influenzato dal livello reale del tratto (nessuna correlazione tra e e T).
- 📏 Attendibilità costante
- Il coefficiente di attendibilità (rtt) si assume stabile lungo tutta la scala dei punteggi.
- 🧍 Stabilità del punteggio vero
- Il tratto latente del soggetto non cambia nel tempo (nessuna variazione reale tra somministrazione e interpretazione).
- 🧭 Unidimensionalità del costrutto
- Il test misura un solo fattore o dimensione psicologica ben definita.
- 🌍 Rappresentatività del campione
- Le stime di σₓ (deviazione standard) e rtt devono derivare da un campione rappresentativo della popolazione di riferimento.
66. Descriva brevemente ciascuna delle 4 fasi della standardizzazione di un test
- Costruzione e validazione preliminare degli item
🔹 Definizione teorica del costrutto
🔹 Redazione del pool iniziale di item (coerenza e copertura del contenuto)
🔹 Controllo linguistico e coerenza concettuale
🔹 Somministrazione pilota (gruppo ristretto)
🔹 Verifica della validità di contenuto e della coerenza interna (es. α di Cronbach, KR-20)
- Somministrazione al campione normativo
🔹 Selezione del campione rappresentativo (stratificazione per età, genere, scolarità, ecc.)
🔹 Somministrazione standardizzata (istruzioni, tempi, contesto)
🔹 Raccolta e pulizia dati (eliminazione risposte anomale o mancanti)
- Elaborazione statistica e costruzione delle norme
🔹 Calcolo di statistiche descrittive (media, DS, centili, punteggi z)
🔹 Analisi psicometriche:
- Affidabilità interna
- Test–retest
- Struttura fattoriale (EFA/CFA)
🔹 Verifica di bias tra gruppi
🔹 Costruzione di tabelle normative (T-score, stanine, percentili)
- Redazione del manuale e diffusione
🔹 Manuale del test:
- Obiettivi, teoria di riferimento
- Istruzioni di somministrazione e correzione
- Proprietà psicometriche e norme
- Guida all’interpretazione clinica
🔹 Materiali formativi:
- Workshop, webinar, esempi d’uso
62. Elementi per calcolare un campione normativo e relativa procedura
📌 Elementi necessari per il calcolo
- Dimensione della popolazione (finita o infinita)
- Margine di errore (E) accettabile (es. ±3)
- Livello di confidenza desiderato (es. 95%, con Z ≈ 1,96)
- Variabilità attesa del dato:
- Se stimiamo una media: serve la deviazione standard (σ)
- Se stimiamo una proporzione: serve p (valore più conservativo: p = 0,5)
🧮 Formule principali
- Campione per popolazione infinita (per media):
n0= Z2xσ2/ E2
- Correzione per popolazione finita:
n= n0xN/ n0 +(N-1)
- Per proporzioni (caso peggiore p = 0,5):
n0= Z2 x p(1-p)/ E2
🗂️ Fase di progettazione del campionamento
- Campionamento stratificato: la popolazione viene suddivisa in strati rilevanti (es. età, genere, area geografica)
- Selezione casuale all’interno degli strati per garantire rappresentatività
- Ponderazione (post-stratificazione): eventuali discrepanze tra campione e popolazione vengono corrette con pesi statistici
✅ Obiettivo finale
Assicurare:
- Precisione statistica (con la parte numerica)
- Rappresentatività demografica (tramite disegno stratificato e ponderazione)
50. criteri per stabilire il numero di fattori da estrarre: Kaiser-Guttman; Scree-test; Parallel Analysis
🧮 1. Criterio di Kaiser-Guttman (autovalore > 1)
- Principio: un fattore va mantenuto se spiega più varianza di una variabile standardizzata (varianza = 1).
- ✅ Vantaggi: semplice, automatico nei software.
- ❌ Svantaggi: può sovrastimare il numero di fattori (soprattutto con molti item o campioni piccoli).
📉 2. Scree-Test (test del gomito)
- Procedura: si tracciano gli autovalori decrescenti → si cerca il “gomito”, dove la curva cambia pendenza.
- Si mantengono i fattori prima del gomito.
- ✅ Vantaggi: intuitivo, visuale.
- ❌ Svantaggi: soggettivo, il gomito non sempre è chiaro.
🔁 3. Parallel Analysis (PA)
- Procedura: si confrontano gli autovalori reali con quelli ottenuti da dati casuali simulati.
- Si mantengono solo i fattori con autovalori reali > autovalori simulati.
- ✅ Vantaggi: tra i più affidabili, tiene conto della varianza casuale.
- ❌ Svantaggi: richiede simulazioni, non sempre incluso nei software standard.
54 principi generali, stabiliti nel Codice Etico della Ricerca e dell’Insegnamento della Psicologia, che il somministratore, come psicologo, è tenuto a rispettare
🧠 1. Competenza
- Utilizzo di strumenti e tecniche solo se adeguatamente formati.
- Scelta di test validi e affidabili.
- Interpretazione corretta dei risultati, adattata al contesto.
- Aggiornamento professionale continuo.
⚖️ 2. Integrità
- Comportamento onesto, trasparente, corretto.
- Spiegazione chiara degli obiettivi e uso dei dati.
- Evitare conflitti di interesse e manipolazione dei risultati.
- Segnalazione di eventuali errori, imparzialità.
🤝 3. Responsabilità sociale
- Tutela della dignità e privacy dei partecipanti.
- Uso dei test solo per scopi giustificati e proporzionati.
- Prevenzione di discriminazioni.
- Promozione del benessere del soggetto e dell’equità.
52. tre assunzioni fondamentali sull’errore nella Teoria Classica dei Test
🔹 1. Valore atteso dell’errore = 0
- In media, l’errore non altera il punteggio vero.
- Se una persona sostenesse infinite volte lo stesso test, gli errori si compenserebbero.
🔹 2. Indipendenza tra errore e punteggio vero
- L’errore non è correlato al livello reale del tratto misurato.
- Es. chi ha un alto punteggio vero non fa più errori di chi ha un punteggio basso (e viceversa).
🔹 3. Distribuzione normale dell’errore
- L’errore ha media zero e varianza costante (omoschedasticità).
- Segue una curva normale: errori piccoli sono più frequenti; quelli grandi, rari e simmetrici.
55. coefficiente di attendibilità
🔹 Definizione
- È la proporzione di varianza del punteggio osservato (X) attribuibile al punteggio vero (T).
Formula:
- pxx'= Var(T)/Var(X)= 1- Var(E)/Var(X)
🔹 Intervallo di valori
- 0 ≤ ρ ≤ 1
🔹 Significato dei valori
- ρ = 0 → tutta la varianza è errore → test completamente inaffidabile.
- ρ = 1 → nessun errore → test perfettamente attendibile.
- ρ = 0.70 → il 70% della varianza è vera, il 30% è errore.
- ρ = 0.90 → alta attendibilità, utile per scopi diagnostici o individuali.
🔹 Interpretazione pratica
| Valore di ρ | Interpretazione | Uso suggerito
| ≥ 0.90 | Ottima attendibilità | Diagnosi clinica, decisioni individuali |
| 0.70 – 0.89 | Buona attendibilità | Ricerca, screening, selezione |
| < 0.70 | Bassa attendibilità → rischio decisionale | Evitare uso in contesti critici |