Estadistica

Estudis estadístics

Mostra:

Variables estadístiques: Anomenem variable estadística a la característica de la població que volem estudiar.

Població:

Anomenem població al conjunt de tots els elements que són objecte d'un estudi estadístic.

Anomenem mostra a qualsevol subconjunt de la població que permet treure conclusions sobre el
total d’individus. Un individu és qualsevol element de la mostra o de la població.

Variables qualitatives: són les que expressen una qualitat de la població. S’expressen
amb paraules.

Variables quantitatives: són les que s'expressen per quantitats numèriques.

Discretes: no poden prendre tots els valors possibles dins d'un interval. Un exemple seria "el nombre de germans", ja que no es poden tenir 2.5 germans.

Contínues: poden prendre tots els valors possibles dins d'un interval. Un exemple
seria "alçada", ja que pot ser 172 cm, 172,5 cm, 172,8 cm,...

Freqüències

Conceptes de frequencies

Taula de freqüències

La freqüència absoluta d'una variable estadística xi , és el nombre de vegades que apareix en l'estudi aquest valor. La representem per fi.
La suma total de totes les freqüències absolutes ha de donar el total de la mostra estudiada (N).

La freqüència relativa d'una variable estadística xi , és el quocient entre la freqüència absoluta i la
mida de la mostra (N). La representem per hi.

La freqüència absoluta acumulada d'una variable estadística xi , és el nombre de vegades que apareix en l'estudi aquest valor i els més petits al valor. La representem per Fi.

La freqüència relativa acumulada d'una variable estadística xi , és el quocient entre la freqüència
absoluta acumulada i la mida de la mostra (N). La representem per Hi

Després de fer un estudi estadístic i recopilar les dades, hem de fer un recompte de les mateixes
per expressar-les de manera ordenada.

Intervals i marques de classe

En els exemples que hem treballat la variable tenia pocs valors però en moltes ocasions s'obtenen
un gran nombre de valors xi diferents com és el cas de les variables contínues

Gràfics estadístics

Diagrama de barres

Els diagrames de barres s'utilitzen per representar variables qualitatives o quantitatives discretes.

Histograma

Els histogrames s'utilitzen per representar variables quantitatives contínues quan aquestes estan
agrupades per intervals.

Diagrama de sectors

S'utilitza per representar qualsevol tipus de variable i és el més comú als mitjans de comunicació ja
que és molt visual.


Consisteix en dividir un cercle de manera que els seus 360° siguin proporcionals
a les freqüències.

Mesures de centralització

Mitjana aritmètica

La mitjana aritmètica és una mesura estadística associada a un conjunt de dades numèriques que
s'obté sumant els valors de totes les dades i dividint-lo pel nombre d'elements del conjunt.

Mediana

La mediana és una mesura estadística que indica el valor que ocupa la posició central de les dades
quan aquests s'ordenen en ordre creixent.
Per tant, aquest valor fa que el nombre de dades que
queda per sota d'ell sigui igual al nombre de dades que queda per sobre.
Es representa per M.

Moda

La moda és una mesura estadística que indica el valor de màxima freqüència en una mostra de
dades.
Es representa per Mo.

Mesures de posició

Els quartils

El rang interquartílic

Els quartils són els tres valors que divideixen al conjunt de dades ordenats en quatre parts percentualment iguals.El primer quartil (Q1) és el valor que té una quarta part (25%) de les dades més petits que ell.El segon quartil (Q2) és el valor que té una quarta part (50%) de les dades més petits que ell. Coincideix amb la mediana (M).El tercer quartil (Q3) és el valor que té una quarta part (75%) de les dades més petits que ell

Els rang interquartílic és la diferència entre el tercer i el primer quartil:

Mesures de dispersió

El rang

El rang o recorregut estadístic és la diferència entre el valor mínim i el valor màxim en un grup de
dades. Se'l sol representar amb R.

La variància i la desviació típica

La mesura de la desviació típica és una de les informacions més importants, juntament amb la mitjana aritmètica, que es pot obtenir d’un estudi estadístic. Ens dóna una idea de com estan
d’allunyades les dades de la mitjana aritmètica

La variància és la mitjana aritmètica del quadrat de les desviacions respecte de la mitjana x .

La desviació típica és l’arrel quadrada positiva de la variància.

Estadística bidimensional

Taules de contingència

Una taula de contingència s'utilitzen per registrar i analitzar la relació entre dues variables estadístiques, normalment qualitatives o quantitatives discretes.

Diagrames de punts

Un diagrama de punts, o núvol de punts, és la representació gràfica sobre uns eixos de coordenades de tots els punts que corresponen als parells ordenats (xi, yi) formats per valors observats de
les variables estadístiques X i Y, respectivament

Coeficient de correlació

Els diagrames de punts poden tenir diferents formes en funció de si hi ha relació entre les variables. A aquest fet l'anomenarem correlació.

El coeficient de correlació lineal entre dues variables X i Y es representa per r