Correlación y análisis de regresión

Definición: Medidas descriptivas que se relacionan con la determinación del grado de asociación que hay entre dos o más variables se les denomina medidas de asociación o correlación. Se usa cuando se analizan un par de variables.

Propósito: analizar si existe asociación entre los pares de variables. Porque se quiere predecir una en función de la otra, o porque se desea saber si las variables están o no relacionadas.

Variables:

Variable dependiente: variable que se va a predecir, también se conoce como variable respuesta.(se simboliza con la letra y)

Variable independiente: o variable de entrada o explicatoria (Se simboliza con la letra x)

Medición de asociación

Entre variables cuantitativas: correlación lineal (coeficiente de correlación de Pearson)

Mide la Intensidad de una relación entre dos variables. La correlación lineal pretende descubrir si existe una asociación matemática entre dos variables en términos de una línea recta . Coeficiente de correlación lineal r

Asociación positiva: los valores grandes de una variable se acompañan de los valores grande de la otra, mientras los valores pequeños de una se acompañan de los valores pequeños de la otra. r = +1

Asociación negativa: los valores grandes de una variable se acompañan de los valores pequeños de la otra, mientras los valores pequeños de la una se acompañan de los valores grandes de la otra r = - 1

No hay correlación o no existe relación entre x e y: Si no existe un cambio definido en los valores de y conforme se modifican los valores de x r = 0

Diagrama de dispersión (método gráfico)

Se grafican los datos bivariados en un sistema de ejes coordenados cartesianos. La variable independiente x se grafica sobre el eje horizontal, mientras que la dependiente y aparece en el eje vertical

Para interpretarla se observan los puntos agrupados. Agrupaciones alargadas (gordas o flacas) de puntos muestran una posible asociación.

cuando las agrupaciones de puntos semejan una linea recta, puede decirse que la asociación es deficiente o nula

Regresión Lineal

Establecer entre el par de variables una relación matemática, la cual permita predecir los valores de la variable dependiente y a partir de los valores de la variable independiente x. Esta ecuación se conoce como ecuación de regresión o ecuación de ajuste

Se aplica una ecuación de ajuste si el coeficiente de correlación y el diagrama de dispersión concluyen que existe asociación entre las variables.

El método mas utilizado para realizar este tipo de ajustes es el método de mínimos cuadrados

Coeficiente de Determinación

Mide la efectividad de la regresión

Permite reconocer qué tan bueno es el modelo analizado para predecir y en términos de la variable x. Cuanto mayores sean los valores, menor será la bondad del modelo.

Medidas de Asociación en variables cualitativas

Correlación basada en rangos

Coeficiente phi

Coeficiente biserial puntual

Alternativa no paramétrica al coeficiente de correlación lineal. Solo se utilizan rangos. Coeficiente de correlación de Spearman. Relación monótona decreciente. Monótona creciente. No monótona

Solo hay dos variables con dos posibles valores (0 o 1) cada una, se dice que las variables son dicotómicas. Para analizar la asociación entre dos variables dicotómicas, se tiene el coeficiente phi. Se puede resolver utilizando el estadístico ji cuadrada

Una de las variables es dicotómica y la segunda produce un conjunto de puntuaciones con escala numérica. El término biserial se refiere al hecho de que existen dos series de observaciones en x: las puntuaciones de x cuando y vale 0, y las puntuaciones de x cuando y vale 1.

Bibliografía:
Góngora, J., y Hernández, R. (1999). Capítulo 6: Correlación y análisis de Regresión. En Góngora, J., y Hernández, R. (Eds.), Estadística descriptiva (pp. 217-241). México: Trillas

Universidad Intercontinental
Maestría en Innovación Educativa
Métodos Cuantitativos en Investigación Educativa
Asesor: Doctor Fernando Méndez Rangel
Andrea Alcalá Huerta
Matricula: 219334067
Agosto 2020