MEDIDAS DE LA FORMA DE LA DISTRIBUCIÓN, POSICIÓN RELATIVA Y DETECCIÓN DE OBSERVACIONES ATÍPICAS (3)
Forma de distribución
Detección de observaciones atípicas
Regla empírica
Teorema de Chebyshev
Valor Z
Histogramas
Formula para calcular el sesgo
Para datos sesgados a la derecha, el sesgo es positivo
Para datos sesgados a la izquierda, el sesgo es negativo
Si los datos son simétricos, el sesgo es cero
En una distribución simétrica, la media
y la mediana son iguales
Llamado valor estandarizado
Para calcular la puntuación z para xi
Un valor z de cero indica que el valor de
la observación es igual a la media
El valor z para cualquier observación
puede interpretarse como una medida de la posición relativa de la observación en un conjunto de datos.
Permite hacer afirmaciones acerca de la proporción de los valores de datos que deben estar dentro de un número específico de desviaciones estándar
Por lo menos (1 - 1/z^2) de los valores de datos debe estar dentro de z desviaciones estándar de la media, donde z es cualquier valor mayor que 1.
Implicaciones cuando z= 2, 3 y 4 desviaciones estándar
Por lo menos 0.75, o 75%, de los datos debe estar dentro de z 2 desviaciones estándar de la media
Al menos 0.89, u 89%, de los datos debe estar dentro de z 3 desviaciones estándar de la media
Por lo menos 0.94, o 94%, de los datos debe estar dentro de z 4 desviaciones estándar de la media
Se usa para determinar el porcentaje de valores de datos que deben estar dentro de un número
específico de desviaciones estándar de la media
Cuando las distribuciones tienen forma de campana:
Aproximadamente 68% de los valores de datos estará dentro de una desviación estándar
Aproximadamente 95% de los valores de datos estará dentro de dos desviaciones estándar
Casi todos los valores de datos deben estar dentro de tres desviaciones estándar de la media.
Valor de datos que se registró incorrectamente, el error se debe corregir antes de un análisis posterior.
Se utiliza para identificar estos errores los valores estandarizados (puntuaciones z).
Una o más observaciones con valores inusualmente grandes o sumamente pequeños de los datos.
Se cuenta cualquier valor de datos con una
puntuación z menor que -3 o mayor que +3