REGRESION LINEAL SIMPLE
Es un modelo estadístico usado para relacionar una variable independiente X con una variable dependiente Y. Es decir, en una regresión lineal simple solo hay dos variables (la variable explicativa X y la variable respuesta Y) y se intenta aproximar la relación que hay entre ambas variables.
¿Qué es?
Sirve para encontrar una ecuación que relacione dos variables de una manera lineal. Lógicamente, la relación entre las dos variables debe ser lineal, sino debe utilizar otro tipo de modelo de regresión
La ecuación de un modelo de regresión lineal simple está formada por dos coeficientes:
La constante de la ecuación (bo) y el coeficiente de la correlación entre las dos variables (b1). Por lo tanto, la ecuación de un modelo de regresión lineal simple es:
y=bo+b1x
La ecuación de una regresión lineal simple se representa gráficamente como una línea recta, por lo que el coeficiente bo es la ordenada en el origen y el coeficiente b1 es la pendiente de la recta.
FORMULA
La ecuación resultante del modelo de regresión lineal simple no podrá acertar el valor exacto de todas las observaciones, ya que este modelo simplemente trata de encontrar una ecuación que aproxime la relación entre las dos variables.
EJEMPLO RESUELTO
Después de realizar un examen de estadistica, se ha preguntado a 5 estudiantes cuantas horas de estudio dedicaron al examen, los datos se muestran en la tabla.
Para hacer un modelo de regresión lineal simple tenemos que determinar los coeficientes bo y b1 de la ecuación, y para ello, se tiene que utilizar las fórmulas visitar.
Calcular el coeficiente b1
b1 = 0,4412
Se calculará el coeficiente bo
La ecuación del modelo de regresión lineal simple del problema es:
SUPUESTOS DE REGRESION LINEAL SIMPLE
1. Independencia
2. Homocedasticidad
3. Normalidad
4. Linealidad
Los residuos observados deben ser independientes entre sí.
Una manera común de garantizar la independencia del modelo es añadiendo aleatoriedad en el proceso de muestreo.
Debe haber homogeneidad en las varianzas de los residuos, es decir, la variabilidad de los residuos debe ser constante.
Los residuos deben estar distribuidos normalmente, o dicho de otra forma, deben seguir una distribución normal de media 0.
La relación entre la variable independiente y la variable dependiente debe ser lineal.