Estadísticos para escribir, explorar y comparar datos

3.1 REPASO Y PREAMBULO

3.3 MEDIDAS DE VARIACIÓN

3.2 MEDIDAS DE TENDENCIA CENTRAL

Los métodos y las herramientas de este capítulo y del anterior se conocen cómo métodos de estadística descriptiva, ya que su objetivo es resumir o describir las carac- terísticas importantes de un conjunto de datos.

Las medidas de tendencia central, incluyendo la media y la mediana, como herramientas para analizar los datos

La media

La media aritmética o media de un conjunto de datos es la medida de tendencia central que se calcula al sumar los datos y dividir el total entre el número de datos.

Mediana

La mediana de un conjunto de datos es la medida de tendencia central que implica el valor intermedio, cuando los datos originales se presentan en orden de magnitud creciente (o decreciente). La mediana suele denotarse con x (y se lee “x con tilde”).

Moda

La moda de un conjunto de datos es el valor que se presenta con mayor frecuencia.

Mitad del rango

Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de un conjunto de datos.

La mitad del rango es la medida de tendencia central que constituye el valor que se encuentra a la mitad, entre la puntuación más alta y la más baja, en el conjunto original de datos. Se calcula sumando el valor máximo con el valor mínimo y luego dividiendo la suma entre 2, de acuerdo con la siguiente fórmula:

Sesgo

Una distribución de datos está sesgada si no es simétrica y se extiende más hacia un lado que hacia el otro. (Una distribución de datos es simétrica si la mitad izquierda de su histograma es aproximadamente una imagen especular de su mitad derecha).

click to edit

Varianza

Coeficiente de Variacion

Desviación estandar

Rango

El rango de un conjunto de datos es la diferencia entre el valor máximo y el valor mínimo

La desviación estándar de un conjunto de valores muestrales, denotada con s,es la medida de variación de los valores con respecto a la media. Es un tipo dedesviación promedio de los valores con respecto a la media, que se calcula utilizando las fórmulas 3-4 o 3-5. La fórmula 3-5 es solo una versión diferente de la 3-4, pero algebraicamente son iguales.

La varianza de un conjunto de valores es una medida de variación igual al cuadrado de la desviación estándar.

  • Varianza muestral: s2 el cuadrado de la desviación estándar s.
  • Varianza poblacional: s2 el cuadrado de la desviación estándar poblacional s.

El coeficiente de variación (o CV) de un conjunto de datos muestrales o pobla- cionales sin valores negativos, expresado como porcentaje, describe la desviación estándar en relación con la media.