ELS PARÀMETRES ESTADÍSTICS
Paràmetres de posició central
Els paràmetres de posició central o de centralització ens ensenyen valors que se situen cap al centre de la distribució de les dades.
Mitjana aritmètica simple
no agrupades
La mitjana aritmètica simple o mitjana d'un conjunt de dades no agrupades,
es calcula sumant les dades i dividint el resultat entre el nombre de dades:
Dades agrupades en intervals
La marca de classe, xi, és un valor representatiu d'un interval.
Es calcula fent la mitjana entre els extrems de l'interval.
Mitjana aritmètica ponderada
no agrupades
La mitjana aritmètica ponderada d'un conjunt de dades no agrupades, es calcula multiplicant les dades pels pesos i dividint el resultat entre la suma dels pesos.
Dades agrupades en intervals
Si agrupem les dades en intervals, la mitjana aritmètica ponderada es calcula de manera similar. Multipliquem les marques de classe per les freqüències absolutes i pels pesos i dividim el resultat entre la suma de pesos.
moda
no agrupades
La moda d'un conjunt de dades no agrupades, Mo, és el valor amb una freqüència absoluta més gran. Hi ha casos particulars:
Si totes les dades tenen la mateixa freqüència absoluta, la
distribució no té moda.
Si dues dades tenen la mateixa freqüència absoluta màxima, la distribució és bimodal.
Si tres o més dades tenen la mateixa freqüència absoluta màxima, la distribució és multimodal.
Dades agrupades en intervals
La moda d'un conjunt de dades agrupades en intervals, Mo, és la
marca de classe amb una freqüència absoluta més gran. L'interval que conté la moda s'anomena classe modal.
mediana
no agrupadas
La mediana d'un conjunt de dades no agrupades, Me, depèn de la quantitat de dades:
Per a un nombre senar de dades, és el valor que ocupa la posició central.
Per a un nombre parell de dades, és la mitjana aritmètica dels dos valors que ocupen les posicions centrals.
Altres paràmetres de posició
Quartils
Un cop tenim les dades d'una distribució ordenades de petites a grans, els quartils serveixen per dividir la distribució en quatre parts que continguin la mateixa quantitat de dades.
no agrupades
procediment
Pas 1: escrivim els valors en ordre
creixent.
Pas 2: per a tots els quartils
calculem
Pas 3: es poden produir dues situacions :
Si és un nombre enter, la mitjana aritmètica entre les dades que ocupen aquesta posició i
la següent.
Dades agrupades en intervals
procediment
Pas 1: construïm una taula de
freqüències amb aquestes columnes: intervals, xi, fi i Fi.
Pas 2: per a tots els quartils calculem
Pas 3: es poden produir dues situacions: Si és la
mitjana aritmètica entre les marques de classe de Fi i Fi + 1és la marca de classe de Fi + 1.
Decils i percentils
Quan volem dividir les dades d'una distribució en deu grups iguals, fem servir els decils. Aquests paràmetres ens indiquen per sota de quins valors es troba el 10 %, el 20 %, el 30 %, etc. de les dades.
De la mateixa manera, si volem dividir les dades de la distribució en 100 grups iguals, fem servir els centils o percentils. Així sabem per sota de quins valors tenim l'1 %, el 2 %, el 3 %, etc. de les dades.
Paràmetres de dispersió
Rang
El rang d'un conjunt de dades, R, és la diferència entre els valors màxim i mínim. R = Valor màxim – Valor mínim
Rang interquartílic
El rang interquartílic d'un conjunt de dades, RIQ, és la diferència
entre els valors del tercer i el primer quartils. RIQ = Q3 – Q1
Pas 1: escrivim les dades
en ordre creixent.
Pas 2: calculem Q1 i Q3.
Pas 3: restem Q1 a Q3.
Desviació mitjana
La desviació mitjana d'un conjunt de dades no agrupades, d, és la mitjana dels valors absoluts de les diferències entre les dades i la mitjana aritmètica.
pas 1: construïm una taula de freqüències amb aquestes columnes:
Pas 2: calculem la desviació mitjana
dm sumant la columna dividint el resultat entre la suma de la columna
Variància i desviació típica
La variància d'un conjunt de dades no agrupades, s2, és la mitjana
de les diferències entre les dades i la mitjana aritmètica al
quadrat.
La desviació típica, s, és l'arrel quadrada de la variància.
Pas 1: construïm una taula de
freqüències amb aquestes columnes:
Pas 2: calculem la variància sumant la columna el resultat entre la
suma de la columna
Pas 3: calculem la desviació
típica s traient l'arrel quadrada.
Coeficient de variació
El coeficient de variació relaciona la desviació típica d'un conjunt de dades amb la seva mitjana.
El coeficient de variació d'un conjunt de dades, CV, es calcula dividint la desviació típica, s, entre la mitjana aritmètica,
de caixa i bigotis
Pas 1: busquem els valors màxim i mínim de la distribució.
Pas 2: calculem els quartils Q1, Q2 i Q3.
Pas 3: calculem el RIQ.
Pas 4:marquem en una recta
numèrica el valor mínim, Q1, Q2, Q3 i el valor màxim.
Pas 5: dibuixem la caixa. És un rectangle que va de Q1 a Q3 i que està partit per Q2.
Pas 6: dibuixem els bigotis.
Ho fem així:
El bigoti esquerre, del valor mínim a Q1.
El bigoti dret, de Q3 al valor màxim.
Els bigotis no poden fer més d'1,5 · RIQ. Si són més llargs, els retallarem pels extrems
Els valors de la distribució que queden fora dels bigotis s'anomenen valors atípics i els representem amb punts.
.