Please enable JavaScript.
Coggle requires JavaScript to display documents.
le misure di variabilità :star: - Coggle Diagram
le misure di variabilità :star:
i 5 numeri di sintesi
min<q1<q2<q3<max
minimo, primo quartile, secondo quartile (o mediana), terzo quartile, massimo
boxplot (o diagramma scatola e baffi)
è la rappresentazione grafica dei 5 numeri di sintesi
il boxplot ci da informazioni
sulla posizione e sulla forma
sull'associazione di due variabili
sulla variabilità
24 :!:
25 :!:
26 :!:
se si hanno due variabili, si possono rappresentare due boxplot all'interno di un grafico (x|y=y)
23 :!:
osservazione
a volte i baffi non sono minimo e massimo ma dei valori soglia per gli outliers
regola base (del pollice) che può essere modificata a piacimento
soglia inferiore = q1-1,5(q3-q1) soglia superiore = q3+1,5(q3-q1)
se x<soglia inf. o x>soglia sup. allora x è un outlier
termini
campo di variazione (range)
(max-min) -> è la lunghezza del boxplot
differenza interquartile (interquatile range)
(q3-q1) -> è la lunghezza della scatola
è la misura della variabilità del 50% centrale delle osservazioni
varianza e scarto quadratico medio
si indica con la lettera "sigma" o S
è la media degli scarti al quadrato dalla media. si utilizza il quadrato per evitare la compensazione (=0). perciò:
sigma elev.2 è espresso nel quadrato dell'unità di misura
sigma è espresso nell'unità di misura
27 :!:
lo scarto quadratico medio è chiamato anche deviazione standard
coefficiente di variazione
a volte è necessario confrontare la variabilità di due insiemi di dati. potremmo semplicemente confrontare le misure di variabilità, ma spesso è preferibile utilizzare il coefficiente di variazione
si indica con CV
si trova con sqm / media in valore assoluto
28 :!:
se le medie sono molto diverse è meglio affidarsi al coefficiente di variazione. questo perché la variabilità è relativa anche alla media. il coefficiente di variazione "sconta" la diversità delle medie. un ulteriore vantaggio è che il coefficiente di variazione non dipende dall'unità di misura. quindi, posso usarlo anche se i dati dei due gruppi sono espresse con diverse unità di misura
disuguaglianza di Chebychev e Regola empirica
entrambi ci danno informazioni sulla percentuale di osservazioni che si trovano "vicino" alla media e di conseguenza anche informazioni sulla percentuale di osservazioni "lontane" dalla media
Regola empirica
in una popolazione (insieme di dati) di forma campanulare, la percentuale di osservazioni entro k deviazioni standard (=sqm) dalla media è la seguente: 29 :!:
disuguaglianza di Chebychev
vale per qualsiasi distribuzione (non solo campanulare). ci indica che la percentuale minima di osservazioni nell'intervallo (mu-ks, mu+ks) è almeno pari a (1-1/k elevato 2)*100%: 30 :!:
l'osservazione è informativa per k>1