ANÁLISIS E INTERPRETACIÓN DE DATOS ESTADÍSTICOS

DIAGRAMAS DE DISTRIBUCIÓN DE FRECUENCIAS

RELACIÓN ENTRE VARIABLES: CORRELACIÓN, REGRESIÓN Y ANÁLISIS FACTORIAL

CONCEPTOS ESTADÍSTICOS

PARÁMETROS ESTADÍSTICOS

Es una serie de procedimientos para el recuento, ordenación y clasificación de información y datos y obtener una conclusión

El principal objetivo, consiste en poder decir algo con respecto al comportamiento de un gran conjunto (población) de personas, en base a las observaciones hechas sobre solo una parte (muestra).

El recuento, ordenación y clasificación de datos de cada variable entran dentro del ámbito de la Estadística Descriptiva y la Inferencia Estadística.

Los principales conceptos

Población

Conjunto de todos los elementos posibles que se van a estudia.**

Individuo

Muestra y Muestreo

Es cada uno de los elementos que componen la población.

La muestra es el conjunto representativo de la población en estudio; el muestreo es la técnica de reunión de datos de una proporción reducida de la población.

Variable
estadística

Características que poseen los individuos de una población, Ejemplo: edad.

Valor de una Variable

Son los distinto resusltados

Datos

Son los dato es cada uno de los valores

Frecuencia, es el número de veces que aparece cada valor.

Inferencia estadística, conjunto de técnicas,para sacar conclusiones generales.

VARIABLES ESTADÍSTICA

Dos tipos de variables

Variable cualitativa

Es aquella que recoge una característica o cualidad que no se puede medir con un número.

Variable cuantitativa

Se expresa mediante un número, y
se pueden realizar operaciones aritméticas. Ejemplo: la edad.

Dos tipos:

Variable cualitativa nominal

Variable cualitativa ordinal o variable cuasicuantitativa

Presenta valores no numéricos y que no admite un criterio de orden. Ejemplo: el estado civil.

Presenta modalidades no numéricas, pero a las que se puede asignar un orden. Ejemplo: ranking.

Dos subtipos:

Variable discreta: puede tomar valores concretos dentro de un rango. Ejemplo: La edad.

Variable continua: puede tomar un número infinito de valores dentro de un rango. Ejemplo: La altura.

DISTRIBUCIÓN DE FRECUENCIAS

O tabla de frecuencias es una ordenación, en forma de tabla, de los datos estadísticos obtenidos para una variable.

TIPOS

Frecuencia absoluta: es el número de veces que aparece un determinado valor en un estudio estadístico.

Frecuencia relativa: es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.

Frecuencia acumulada: es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Frecuencia relativa acumulada: es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.

La distribución de frecuencias: se suele agrupar en tablas denominadas distribución de frecuencias agrupadas o tabla con datos agrupados.

HISTOGRAMAS

TIPOS

Diagrama de barras: se utiliza para representar datos cualitativos o datos cuantitativos de tipo discreto.

Polígonos de frecuencia: se forma uniendo los extremos de las barras mediante segmentos.

Diagrama de sectores:o gráfico de torta, se usa para representar variables cualitativas, aunque se puede utilizar para todo tipo de variables.

Es una representación gráfica de una variable en forma de barras, se pueden utilizar tanto para variables continuas como para variables discretas

TIPOS

Polígono de frecuencias, Histograma y polígono de frecuencias acumuladas, Histogramas con intervalos de amplitud diferente.

Es un número que se obtiene a partir de los datos de una distribución estadística,sirven para sintetizar la información dada por una tabla o por una gráfica.

TIPOS

Medidas de centralización

Medidas de posición

Medidas de dispersión

Se basan en el cálculo del centro de una muestra. Indican en torno a qué valor (centro) se distribuyen los datos de dicha muestra.

Media aritmética: Es el valor promedio de la distribución.La media se puede hallar solo para variables cuantitativas.

Moda: Es el valor que más se repite en una distribución, o el que tiene mayor frecuencia absoluta.

Mediana: Es la puntación que se sitúa en el centro de la distribución, separa la mitad superior de la distribución de la inferior (en número de datos, no en valor).

Se pueden utilizar para variables cuantitativas y
dividen un conjunto de datos en grupos con el mismo número de individuos, o de observaciones.

La definición y forma de cálculo de las medidas de posición es la siguiente:

Cuartiles: dividen la serie de datos en cuatro partes iguales.

Deciles: dividen la serie de datos en diez partes iguales.

Percentiles: dividen la serie de datos en cien partes iguales.

Reflejan cuánto se alejan del centro los valores de la distribución. Se utilizan para variables cuantitativas, y nos permiten medir el grado de error.

La desviación respecto a la media se define como la diferencia entre cada valor de la variable estadística y la media aritmética (promedio); estas son:

Rango o recorrido, desviación media, varianza y desviación típica o estándar.

INFERENCIAS ESTADÍSTICA

Estudia cómo sacar conclusiones generales para toda la población,
a partir del estudio de una muestra (tomada de esa población), y el grado de confiabilidad.

Experimentos aleatorios y deterministas

Muestreo: Poblaciones, censos y muestras

Se denomina experimento o fenómeno determinista a aquél que siempre se produce de la misma forma cuando se dan las mismas condiciones. Un fenómeno aleatorio, por el contrario, es aquel que incluye la posibilidad de que en idénticas condiciones puedan producirse resultados diferentes,

Tipos de muestreo

Muestreo aleatorio simple: se numeran los elementos de la población y se seleccionan al azar los n elementos de la muestra.

Muestreo aleatorio sistemático: se elige un individuo al azar y a partir de él, se eligen los demás hasta completar la muestra.

Muestreo aleatorio estratificado:se divide la población en estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional

Distribución muestra

Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita.

Estimación de Parámetros y niveles de confianza

Cuando se el comportamiento de una población, se toma una muestra, y se pueden calcular los parámetros de esa muestra.

Estimación de parámetros es el procedimiento utilizado para conocer las características de un parámetro poblacional

Intervalo de confianza es un intervalo(valores mínimo y máximo) en el que sabemos que está un parámetro, con un nivel de confianza específico.

Dentro del análisis del comportamiento de las poblaciones, otro objetivo puede ser la
identificar la existencia de tendencias comunes o variaciones simultáneas en dicho comportamiento, no solamente el estudio de cada una por separado.

HIPÓTESIS ESTADÍSTICA

O preguntas de investigación, que generalmente están relacionadas con el comportamiento de una o varias variables, ya sea de forma independiente o conjunta.

NATURALEZA Y FUENTE DE INFORMACIÓN

En función de cómo se registra.

Series Temporales: Se denomina así a todos los conjuntos de observaciones sobre los valores que toma una variable en diferentes momentos del tiempo

Series de Corte Transversal:Son conjuntos de datos, de una o más variables recogidos en el mismo momento del tiempo (censos, encuestas regionales)

Información combinada: Es una mezcla de ambas, se toman datos no aleatorios, de corte transversal a lo largo de diferentes momentos del tiempo.

FUENTE DE INFORMACIÓN

Información Primaria es aquella que el investigador recoge directamente de la fuente y
que está sin elaborar, es decir el investigador deberá procesar.

Información Secundaria es aquella que el investigador recoge indirectamente, generalmente de fuentes oficiales.

PRECISIÓN Y CALIDAD DE LA INFORMACIÓN

El investigador
debe tener siempre en mente que el resultado de la investigación solamente será tan bueno, como lo sea la calidad de los datos, así como la correcta selección y aplicación de la(s) técnica(s) de análisis.

Manuel Alonso Ferretti Sotero