Please enable JavaScript.
Coggle requires JavaScript to display documents.
Unidad 1. Introducción a la Estadística, Unidad 2. Recolección y…
Unidad 1. Introducción a la Estadística
1.1. ¿Qué es la Estadística?
La Estadística es la ciencia que estudia conjuntos de datos y su interpretación en términos matemáticos estableciendo métodos para la obtención de las medidas que lo describen, así
como para el análisis de las conclusiones, con especial referencia a la teoría de la probabilidad.
1.2. Historia de la Estadística
Desde los comienzos de la civilización han existido formas sencillas de estadísticas, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, , animales o ciertas cosas.
Hacia el año 3000 A.C. los babilonios usaban ya
pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos
sobre la población, superficie y renta de todos los territorios bajo su control.
Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de
Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo
en 1086, se recoge en el Domesday Book.
En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.
1.3. Aplicaciones de la Estadística
La estadística es un potente auxiliar de muchas ciencias y actividades humanas: sociología, psicología, geografía humana, economía, etcétera
Es una herramienta
indispensable para la toma de decisiones.
También es ampliamente empleada para mostrar los aspectos cuantitativos de una situación.
La estadística está relacionada con el estudio de proceso cuyo resultado es más o
menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones.
1.4. Divisiones de la Estadística
Estadística Descriptiva
Aquellos métodos que incluyen la recolección , presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto.
Estadística Inductiva o Inferencia Estadística
Aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población basándose sólo en los resultados de una muestra.
Unidad 2. Recolección y Presentación de Datos
2.1. Conceptos Básicos
• Población
Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los
cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de
tornillos producidos por una fábrica en un año, lanzamientos de una moneda, etc.).
Llamamos población estadística o universo al conjunto de referencia sobre el cual van
a recaer las observaciones.
Muestra
Es el subconjunto de la población que es estudiado y a partir de la cual se sacan
conclusiones sobre las características de la población.
La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población.
Individuo
Cada uno de los elementos de la muestra o de la población n (personas, tornillos, hospitales, comercios) y sobre los que recaerá la observación.
Variable
Cada uno de los rasgos o característica de los elementos de una población y que
varían de un individuo a otro (salario, color de ojos, sexo, número de hijos).
Censo
Es un estudio que se hace directamente a toda una población.
Muestreo
Es un estudio que se hace solo a una muestra de la población.
Si la muestra es representativa, los resultados que se obtengan serán iguales o muy cercanos a los que se obtendría de hacerse un censo.
2.2. Tablas
Los datos pueden ser recolectados de diversas formas: cuestionarios, muestreos,
censos, observaciones, etcétera.
Sea como sea, luego de recopilados, deben ser resumidos para facilitar su análisis.
La manera más elemental de resumirlos es a
través de tablas.
Luego, con base en esas tablas, se pueden construir cualquiera de los siguientes instrumentos de presentación de datos.
2.3. Presentación Gráfica de Datos – Parte A
Histogramas
Los histogramas son diagramas de barras verticales en los que se construyen barras
rectangulares en los límites de cada clase.
La variable aleatoria o fenómeno de interés
se despliega a lo largo del eje horizontal; el eje vertical representa el número, proporción o porcentaje de observaciones por intervalo de clase, dependiendo de si el histograma particular,
Para hacer el histograma dividimos el intervalo total de los valores de la serie de
datos s (desde el valor mínimo al máximo) en subintervalos de igual amplitud que denominaremos clases.
El número de clases dependerá de la magnitud del intervalo total y el número de clases que deseemos. No debe ser superior a 15 ni inferior a 5.
En los histogramas vamos a situar en el eje "x" los diferentes rangos definidos por los
valores absolutos (límites de cada rango) o los valores centrales del rango; en el eje
"y" se sitúan el número de veces (número de años o meses) en los que ha habido una
precipitación dentro de dicho rango (también se pueden representar las frecuencias).
Polígonos
Un polígono es una gráfica que une con líneas los puntos medios en el tope de las
barras de histogramas.
2.4. Presentación Gráfica de Datos – Parte B
Gráficas de barras
En la gráfica de barras, cada categoría se describe mediante una barra, cuya longitud
representa la frecuencia o porcentaje de observaciones que caen en una categoría. Para construir una gráfica de barras se hacen las siguientes sugerencias:
Las barras deben construirse horizontalmente.
Todas las barras deben tener el mismo ancho.
Los espacios entre las barras deben variar entre la mitad el ancho de una barra
hasta el ancho de una barra.
Las escalas y guías son auxiliares útiles en la lectura de una gráfica y deben incluirse.
El punto cero u origen debe indicarse.
Los ejes deben llevar nombre
Gráfica de Pastel
Una gráfica circular o de pastel es un círculo divido en partes que representan la
frecuencia relativa o porcentaje de las diferentes categorías.
Existen otras formas de presentación gráfica de datos a parte de las presentadas en
este módulo. Por motivos didácticos y prácticos, sólo hemos incluido algunas de las
más usadas.
Unidad 3. Medidas de Tendencia Central
3.1. Definición de Medidas de Tendencia Central
Una de las características más sobresalientes de la distribución de datos es su tendencia a acumularse hacia el centro de la misma.
Esta característica se denomina
Tendencia Central. En otras palabras, las medidas de tendencia central son aquellas
que nos indican el centro de un conjunto de datos.
Media o Promedio (el valor medio).
Mediana (el valor central).
Moda (el valor más frecuente).
3.2. Media o Promedio
La media es un promedio. Se calcula sumando todos los datos y luego dividiendo el total entre el número de datos involucrados.
Cuando los estudiantes de secundaria
suman todas sus notas parciales y las dividen entre el número de notas, obtienen su
promedio parcial. Ese promedio es la media aritmética de sus calificaciones
parciales.
Si tenemos un conjunto de datos, podemos calcular la media del conjunto y de esa
forma resumiremos toda la información en un sólo número. Todos los datos del conjunto están alrededor de ese número o promedio. En vez de una tabla, nos quedaríamos con un sólo número.
3.3. Mediana
Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de
las observaciones serán menores y la otra mitad serán mayores.
La mediana no se ve
afectada por valores extremos.
Para calcular la mediana, primero se deben poner los datos en orden
Después usamos la fórmula del punto de posicionamiento.
3.4. Moda
En una serie de datos, la moda es el valor que más se repite, el que aparece con más
frecuencia.
La moda no se ve afectada por la ocurrencia de cualquier valor extremo.
Unidad 4. Medidas de Desviación
4.1. Definición de Medidas de Desviación
Si bien contamos con las medidas de tendencia central que nos indican el centro de un Si bien contamos con las medidas de tendencia central que nos indican el centro de un conjunto de datos, muchas veces esas medidas no nos muestran la realidad por completo.
Puede que muchos datos se alejen mucho del centro.
Por ejemplo,
supongamos que en su salón de clase la edad promedio (media) sea de 28 años.
Puede que la mayoría de los miembros estén efectivamente alrededor de esa edad, pero eso no necesariamente va a ocurrir para todos los miembros.
Algunos podrán tener arriba
de 40, e incluso otros abajo de 20.
Para conocer mejor la realidad están las medidas de desviación, las cuales nos indican cuánto se alejan (o desvían) los datos del centro (muchas veces imaginario) de un conjunto.
Rango
El rango es la diferencia entre la mayor y la menor observación en una serie de datos.
El rango mide la propagación total en la serie de datos.
4.2. La Varianza y la Desviación Estándar
La varianza y la desviación estándar toman en cuenta como se distribuyen las observaciones. La Varianza de muestra es el promedio de las diferencias cuadradas entre cada una de las observaciones de una serie de datos y la media
4.3. El Coeficiente de Variación
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos.
Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.