Please enable JavaScript.
Coggle requires JavaScript to display documents.
Descrivere e analizzare i dati quantitativi - Coggle Diagram
Descrivere e analizzare i dati quantitativi
Analisi dei dati
Organizzare i dati
: costruzione di una matrice dei dati he deve contenere tutti i dati prodotti dalla ricerca che si è condotta--> griglia con righe e colonne. Nelle righe vengono inseriti i
casi
(C), nelle colonne i
valori delle variabili
(V) = CxV. Per le variabili
qualitative
possono essere inseriti valori arbitrari per ciascun livello/condizione; per quelle
quantitative
si inseriscono i punteggi dei soggetti.
Esaminare i dati
: Si usa la
statistica descrittiva
per pulire i dati, lavorare in sintesi e organizzarli, permette di sintetizzate le proprietà di un insieme di punteggi utilizzando pochi numeri.
La pulizia è utile per eliminare errori di compilazione, rilevare errori e anomalie. L'
outlier
è un numero estremo che rientra nei valori possibili ma non rimane affine al corpo principale dei dati. Lìeliminazione di anomalie va segnalata o verrà indicato un dato mancante o missing.
Distribuzione di frequenza
: i valori della v. vanno indicati nellla prima colonna, la frequenza di ciascun punteggio viene riportata nella seconda. La d. di frequenza semplice è utile per numero di v. limitati, se i valori sono molti si una la d. di frequenza per classi, in cui vengono suddivisi per intervalli.
Rappresentazione grafica dei dati
: Grafici a barre; Grafici a linee o poligoni di frequenza
Sintetizzare i dati
: attraverso numeri, grafici e verbalmente per ottenere un numero o immagine sintesi dei dati.
Indicatori di tendenza centrale
: moda, mediana e media_ indicano il punteggio intorno al quale i dati tendono a disporsi. La moda indica il punteggio presente più frequentemente nella distribuzione (bimodale con due mode). La mediana è il valore che divide in due parti uguali la distr. di frequenza. La media indica la tendenza centrale, data dalla somma di tutti i valori diviso per il numero dei casi; viene influenzata da punteggi estremi. Se la scala è nominale si può solo calcolare la moda, con quella ordinale la moda e la mediana, con quella metrica tutte e 3.
Gli
indicatori di dispersione
indicano la variabilità nei dati. Due insiemi di punteggi possono avere medie simili ma avere distribuzioni diverse.
Range
o campo di variazione si individua il punteggio più alto e quello più basso.
Deviazione standard
: misura di dispersione più usata, fornisce una misura della dispersione dei dati attorno alla media
Coefficente di correlazione di Pearson
: si calcola se entrambe le variabili sono su scala metrica; fornisce misure di forza e direzione della relazione tra le variabili. L'r di Pearson può assumere valori tra -1 e 1 (positivo) o 0 negativo. La direzione indica se la relazione è + o - il che indica se le relazioni covariano assieme o no. Un puntino sul grafico indica il singolo soggetto di ricerca. --> creazione di nube di punti con retta inclinata
Statistica inferenziale
: insieme di tecniche induttive per effettuare conclusioni statisticamente affidabili su intere popolazioni sulla base dei dati raccolti in un campione --> verifica dell'ipotesi nulla o intervalli di confidenza.
Errore standard della media
:
Verifica dell'ipotesi nulla
: si basa sulla probabilità che i dati siano il risultato del fatto che un'ipotesi sia vera (ipotesi nulla) che ipotizza l'assenza di differenze, effetti o legami nella popolazione di riferimento
P-value
: indica la probabilità di ottenere il risultato osservato se l'ipotesi nulla fosse vera. I risultati che ci consentono di rifiutare l'ipotesi nulla vengono detti
statisticamente significativi
: un risultato è tale quando ha una probabilità molto bassa di verificarsi nel caso di ipotesi nulla.
Errore di I tipo
: rifiutare l'ipotesi quando questa è vera;
Errore di II tipo
: non rifiutare l'ipotesi nulla quanddo questa è falsa.
Statistica inferenziale
Intervallo di confidenza
la stima dell'errore standard della media fornisce informazione sulla gamma "normale" di dell'errore di campionamento; più grande è l'intervallo più è probabile che la media venga inclusa. L'intervallo è centrato intorno alle stime della media e stanno intorno al 95%. L'unico elemento non noto è t e bisogna calcolare i gradi di libertà o v. liberi di variare N-1. L'aumento della dimensione del campione aumenta la precisione della stima dell'intervallo di confidenza della media
Sensibilità sperimentale e potenza statistica
: probabilità di trovare un effetto della variazione indipendentequando influenza il cambiamento.
Potenza
_ probabilità di trovare una differenza significativa quando l'ipotesi nulla venga rifiutata quando è falsa. Stima della replicabilità di un esperimento. L'ampiezza del campione è il fattore principale su cui lo sperimentatore agisce per controllare la potenza. Gli errori di II tipo accadono quando la potena è bassa.
Misure della dimensione dell'effetto
: forniscono infoo sulla forza della relazione esistente fra v. dipendente e indipendente. Calcolo della differenza tra medie e deviazione standard complessiva dei punteggi o d di Cohen
dove s è la devianzione standard calcolata rapportando dimensione campionaria dei gruppi e varianza fratto N (sottrazione tra valore dei due gruppi) il tutto sotto radice