MEDIDAS DE LA FORMA DE LA DISTRIBUCIÓN, POSICIÓN RELATIVA Y DETECCIÓN DE OBSERVACIONES ATÍPICAS (3)

Forma de distribución

Detección de observaciones atípicas

Regla empírica

Teorema de Chebyshev

Valor Z

Histogramas

image

image

image

image

Formula para calcular el sesgo

image

Para datos sesgados a la derecha, el sesgo es positivo

Para datos sesgados a la izquierda, el sesgo es negativo

Si los datos son simétricos, el sesgo es cero

En una distribución simétrica, la media
y la mediana son iguales

Llamado valor estandarizado

Para calcular la puntuación z para xi

image

Un valor z de cero indica que el valor de
la observación es igual a la media

El valor z para cualquier observación
puede interpretarse como una medida de la posición relativa de la observación en un conjunto de datos.

Permite hacer afirmaciones acerca de la proporción de los valores de datos que deben estar dentro de un número específico de desviaciones estándar

Por lo menos (1 - 1/z^2) de los valores de datos debe estar dentro de z desviaciones estándar de la media, donde z es cualquier valor mayor que 1.

Implicaciones cuando z= 2, 3 y 4 desviaciones estándar

Por lo menos 0.75, o 75%, de los datos debe estar dentro de z 2 desviaciones estándar de la media

Al menos 0.89, u 89%, de los datos debe estar dentro de z 3 desviaciones estándar de la media

Por lo menos 0.94, o 94%, de los datos debe estar dentro de z 4 desviaciones estándar de la media

Se usa para determinar el porcentaje de valores de datos que deben estar dentro de un número
específico de desviaciones estándar de la media

Cuando las distribuciones tienen forma de campana:

Aproximadamente 68% de los valores de datos estará dentro de una desviación estándar

Aproximadamente 95% de los valores de datos estará dentro de dos desviaciones estándar

Casi todos los valores de datos deben estar dentro de tres desviaciones estándar de la media.

Valor de datos que se registró incorrectamente, el error se debe corregir antes de un análisis posterior.

Se utiliza para identificar estos errores los valores estandarizados (puntuaciones z).

Una o más observaciones con valores inusualmente grandes o sumamente pequeños de los datos.

Se cuenta cualquier valor de datos con una
puntuación z menor que -3 o mayor que +3