Medidas de localización relativa

Valor Z

Teorema de Chebyshev

Son la caracterización de variables cuantitativas, usando datos agrupados o no.

Se usa para comparar valores entre distintos grupos de datos.

Se usan para esto (ejemplos):

Medidas de dispersión slide_20

Medidas de posición 51546a10f16050ed2400e8b52d3be530

Medidas de tedencia central images

Es el número de desviaciones estándar a las que se encuentra un dato Xi con respecto a la media.

Fórmula descarga

Determina la cantidad de valores que deben ubicarse en una cantidad de desviaciones

Arroja un intervalo donde están los datos a analiza de una distribución

Formula-del-teorema-de-chebyshev

Cuando z=3, el 89% de los datos deben estar a menos de z=3 desviaciones de la media.

Cuando z=4, el 94% de los datos deben estar a menos de z=4 desviaciones de la media.

Cuando z=2, el 75% de los datos deben estar a menos de z=2 desviaciones de la media.

Fue un matemático ruso, que se dedicó a estudiar el tema de la estadística y la probabilidad.

descarga

La Regla Empírica

Permite encontrar el % de datos que debe estar dentro de las desviaciones respecto a la media.

Se usa cuando los datos se distribuyen en forma de campana

descarga (1)

Aprox. el 95% está a menos de 2 desviaciones de la media

Casi todos los datos de la muestra están a 3 desviaciones de la media.

Aprox. el 68% está a menos de 1 desviación de la media

descarga (2)

Propuesta por Abraham de Moivre

Valores Atípicos

Son los datos que son muy grandes/pequeños con respecto al resto
outliers_3

Pueden darse por:

Error en el conjunto de datos

Es un elemento poco común pero válido.

Dato mal anotado

En cualquiera de estos casos se deben tomar decisiones respecto.

  • Caso 1 y 2 : Se ignoran los datos.
    -Caso 3: Se toman en cuenta.

Podemos detectar estos valores usando el valor Z y la regla empírica.

Si la distribución tiene forma de campana, la mayor parte de los datos estarán separados por z=3

Entonces, los datos fuera del intervalo [-3;3] se consideran atípicos.