Please enable JavaScript.
Coggle requires JavaScript to display documents.
Analisi dei dati (cap.12) - Coggle Diagram
Analisi dei dati (cap.12)
organizzare i dati
matrice dei dati
: griglia costituita da righe (=casi, variabile QUALITATIVA) e colonne (valori delle variabili, variabili QUANTITAVIVE), costruzione di una matrice CxV (es. nome dei soggetti e gli item)
esaminare i dati
statistica descrittiva
per controllare la validità dei dati (se corrispondono ai valori effettivamente possibili per le variabili)
pulizia dei dati
possono esserci stati errori nella compilazione dello strumento di ricerca oppure nell'inserimento dei dati stessi
es. presenza di
outliers
(punteggi che si discostano molto dalla media dei punteggi), che vengono eliminati
distribuzione di frequenza
es. vogliamo sapere quante volte ad un test sull'ansia i soggetti hanno risposto 1 o quante volte i soggetti hanno risposto 5 agli item
rappresentazione grafica dei dati
grafici a barre, a linee, o poligoni di frequenza
i
grafici a barre
: possono esser usati per qualsiasi tipo di dati, ma sono molto appropriati per le variabili DISCRETE (i valori intermedi tra singoli punteggi non possono verificarsi)
grafici a linee o poligoni di frequenza
: variabili CONTINUE (vi sono valori intermedi tra i singoli punteggi)
sintetizzare i dati
si fa attraverso un numero o un'immagine
moda
: indici di tendenza centrale, indica il punteggio che è presente più frequentemente nella distribuzione
mediana
: valore che divide in due parti uguali la distribuzione di frequenza
media
: somma di tutti i valori e divisione per il numero totale dei valori
media di una popolazione viene indicata con il simbolo mi, in greco antico
media di un campione viene indicata con la lettera M
indici di dispersione o variabilità
permettono di sintetizzare la variabilità delle distribuzioni che notiamo nei grafici
la misura più semplice di variabilità è il
range
o
campo di variazione
, può essere determinato individuando il punteggio più basso dal punteggio più alto della distribuzione
la misura di dispersione più usata è la
deviazione standard
: fornisce una misura della dispersione dei dati attorno alla media
la deviazione standard della popolazione è indicata con la lettera greca sigma
la deviazione standard di un campione è indicata con S
può essere calcolata solo per le variabili misurate su una scala ad intervalli equivalenti o a rapporti equivalenti
è la radice quadrata della varianza
la varianza è la somma degli scarti della media dei singoli punteggi elevati al quadrato e diviso per il numero di casi
coefficiente di correlazione di Pearson
(R di Pearson)
ci dice se due variabili in uno stesso individuo covariano
la R di Pearson varia da -1 a 1
calcolo della forza
più il valore è vicino a 1 o -1 e più la forza è alta, se il valore vicino a 0 la forza è bassa
calcolo della direzione
se valore vicino a 1 vuol dire direzione positiva, se valore vicino a -1 significa direzione negativa
valutare ciò che i dati rilevano: la statistica inferenziale
statistica inferenziale
: conclusioni statisticamente affidabili su intere popolazioni sulla base di dati raccolti in un campione tratto da quelle popolazioni
errore standard della media
rapporto tra deviazione standard e radice quadrata del campione
non conosciamo la deviazione standard della popolazione, quindi si usa quella del campione
si riesce a capire però solo l'
errore standard stimato della media
e non l'errore standard della media
verifica dell'ipotesi nulla
ipotesi alternativa o H1 (grazie a una variabile x si ottiene un risultato y
ipotesi nullao H0 (nessuna relazione tra una variabile x e un risultato y)
attraverso la verifica dell'ipotesi nulla io verifico se accettare l'ipotesi nulla o l'ipotesi alternativa
p-value
: consente di studiare la probabilità che l'ipotesi nulla sia vera
se la probabilità è bassa rifiutiamo l'ipotesi nulla e accettiamo l'ipotesi alternativa
i risultati che ci consentono di rifiutare l'ipotesi nulla sono
statisticamente significativi
un risultato è tale quando ha una probabilità molto bassa di verificarsi nel caso in cui l'ipotesi nulla fosse vera
p= 5% (0,05); questa quantità viene scritta con il simbolo greco alfa e viene definita con il termine:
livello di significatività
errori di I tipo e di II tipo
intervalli di confidenza
calcolandolo si specifica una gamma di valori che si ritiene con una certa probabilità includa la media della popolazione
più l'intervallo è grande maggiore sarà la probabilità che la media vi sia inclusa, ma intervalli più grandi forniscono meno informazioni specifiche circa il valore esatto della media della popolazione
i ricercatori hanno stabilito che intervalli di confidenza del 95% e del 99% sono i migliori da impiegare quando si desidera una stima dell'intervallo della media della popolazione
sensibilità sperimentale e potenza statistica
sensibilità di un esperimento
: probabilità di trovare un effetto della VI che influenza significativamente il comportamento
potenza statistica
: probabilità di trovare una differenza statisticamente significativa laddove questa esiste nella popolazione, ossia che l'ipotesi nulla venga rifiutata quando è falsa
permette di cogliere un effetto quando esso esiste realmente, ed è una stima della replicabilità dell'esperimento
misure della dimensione dell'effetto
misure della dimensione dell'effetto o grandezza dell'effetto
: forza della relazione tra VI e VD
prescinde dalla dimensione del campione
d di Cohen
: comunemente utilizzata quando si confrontano due medie
rapporto tra la differenza fra le medie e la deviazione standard complessiva dei punteggi
(m1-m2)/σ
effetto piccolo=0,20; effetto medio=0,50; effetto grande=0,80
significatività statistica, pratica e clinica
significatività statistica
: se c'è una bassa probabilità che l'ipotesi nulla sia vera
significatività pratica
: se la dimensione dell'effetto è ampia
significatività clinica
: se l'intervento produce effettivamente una differenza nella vita quotidiana della persona o di quella con cui essa interagisce; sfugge ad ogni tentativo di misura
confronto tra due medie: verifica dell'ipotesi nulla
il
test t
(T di student) per gruppi indipendenti
confrontare le medie ottenute da due gruppi differenti di individui
confrontare le medie ottenute dallo stesso gruppo di individui (o da gruppi appaiati) (es. confronto tra test e pretest)
analisi della varianza a una via per disegni a gruppi indipendenti
metodo statistico per testare le differenze tra le medie di tre o più gruppi
gruppi casuali o naturali (dal punto di vista teorico dovrebbe essere usata solo con disegni che prevedono gruppi casuali)
test f
(fisher): dice se la variazione dei dati ottenuti dovuti alla VI sia dovuta al caso o meno
se l'ipotesi nulla è vera non c'è l'effetto della VI, e non esiste varianza sistematica fra i gruppi: F=1,00, all'aumentare della varianza aumenta il valore di F sopra l'1
la misura della dimensione dell'effetto per i disegni a gruppi indipendenti è l'età al quadrato, l'età al quadrato si ottiene dividendo la devianza tra gruppi per la devianza totale
analisi della varianza per misure ripetute
procedure generali e logica per la verifica dell'ipotesi nulla sono simili a quelle dell'analisi della varianza per gruppi indipendenti
1) calcolo della media dei punteggi per ogni condizione 2) i dati descrittivi vengono calcolati per riassumere la prestazione in ciascuna condizione della VI
differenza con l'anova per gruppi indipendenti: stima della varianza, ossia la varianza d'errore è la varianza che rimane quando la varianza sistemica e quella dovuta ai soggetti sono state rimosse dalla varianza totale
analisi della varianza a due vie per disegni a gruppi indipendenti
variabili indipendenti ciascuna almeno con due livelli
procede in modo diverso a seconda che il test-F globale riveli o meno un effetto di interazione
effetto di interazione statisticamente significativo: la fonte dell'effetto viene identificata usando le analisi degli effetti principali e i confronti tra le due medie
se la VI ha tre o più livelli, si possono fare confronti a coppie fra le medie
non è presente un effetto di interazione statisticamente significativo: esaminare se gli effetti principali delle variabili sono statisticamente significativi, la fonte viene individuata confrontando le medie due alla volta e costruendo gli intervalli di confidenza
analisi della varianza a due vie per disegno misto
le VI sono almeno una tra i soggetti (per gruppi indipendenti) e una entro i soggetti (per misure ripetute)
risultati della statistica F: effetto della variabile tra i soggetti, effetto della variabile entro i soggetti, effetto di interazione
interpretazione segue la stessa logica dei modelli di analisi della varianza a due vie
organizzare i dati, esaminare i dati, sintetizzare i dati, valutare ciò che i dati rivelano