MM3 - Regresión Lineal Múltiple
Modelo estadístico versátil para evaluar las relaciones entre un destino continuo y los predictores.
Variables Dumy
Selección de predictores
- Método jerárquico: Se basa en el criterio del analista.
- Método de entrada forzada: Se introducen todos los predictores.
- Método paso a paso: Emplea criterios matemáticos para decidir que predictores in gresar.
Es conocida también como variable indicadora o binaria, se utiliza para el análisis estadístico y econométrico para representar categorías o grupos de datos.
Características
- Representación binaria
- Codificación de categorías
- Interpretación en regresión
Supuestos
Sirven para garantizar la validez de los resultados obtenidos.
Principales supuestos
- Linealidad
- Independencia de errores
- Homocedasticidad
- No multicolinealidad
- Normalidad de errores
- Exogeneidad
Como verificar los supuestos
- Linealidad: Mediante un gráfico de dispersión de los residuos frente a variables independientes.
- Independencia de errores: Mediante un grafico de residuos en función del tiempo.
- Homocedasticidad: Mediante un grafico de dispersión de los residuos estándar frente a los valores predichos.
- No multicolinealidad: Mediante el calculo del factor de inflación de la varianza para cada variable independiente.
- Normalidad de errores: Mediante un histograma de los residuos de un grafico Q-Q.
- Exogeneidad: Solamente se asume que las variables independientes son verdaderamente exógenas en el contexto.
Coeficientes y su interpretación
Representa la relación entre las variables dependientes e independientes.
Interpretación
Interseccion (B0): Valor esperado de Y cuando las varoables independientes son igual a cero.
Coeficiente de las variables independientes (Bi): Mide el cambio esperado en las variables.
Transformaciones de variables
Técnica utilizada para modificar las variables independientes con el fin de mejorar el modelo así como corregir problemas.
Tipos de transformación
Logarítmica: Se utiliza para manejar relaciones no lineales, sobre todo cuando hay una relación exponencial.
Potencial. Se utiliza cuándo la relación entre variables sigue una forma de potencia.
Raíz cuadrada: Maneja relaciones no lineales y reducir la variabilidad en datos con una distribución sesgada.
Inversa: Maneja relaciones no lineales donde los efectos disminuyen a medida que los valores aumentan.
Normalización: Se utiliza las variables en la misma escala, cuando hay diferencias en la magnitud de las variables.