Regresión Lineal

Regresión Lineal Simple

Regresión Lineal Múltiple

Descripción unidimensional

Descripción Bidimensional

(x) variable estadística

Representación de datos

Distribución de frecuencias

Representaciones gráficas

Medidas características

Interesa el comportamiento de X

(x, y) variables estadísticas

Medidas características

Vector de medidas

Covarianza

Interesa el comportamiento de x, y

Vector cuyos componentes son las medias muéstrales de las variables

Medida que indica la variabilidad conjunta entre x, y

Signos

Relación directa; S > 0

Relación inversa; S < 0

No hay relación; S = 0

Modelos de regresión

Representan la dependencia de una variable Y

Conoce de que modo la variable Y depende de la X

Y = m (X) + e

Supuestos

Linealidad

Línea recta

Y= Bo+BiX+e

Homocedasticidad

Varianza del error igual a la variable explicativa

Var(e/X=x) = o2

Normalidad de errores

Distribución normal

e E N (0, o2)

Independencia de los errores

Mutuamente independientes

Residuos

Los errores de predicción son: E = Y-B0-B1

Objetivo

Hallar el modelo (recta) que mejor se ajuste a los datos

Estimación del modelo

Estimación mínimos cuadrados

Selecciona B0 y B1

Estimadores

Recta de estimación estimada por mínimos cuadrados

Recta de proyección

Y = B0 + B1

Estimación de la varianza del error

Supone homocedasticidad

Var (E/X = x) = o2

Se estima por medio de los residuos cuadrados

Prueba F Global

H0: Y =B0 + E

Ha: Y = B0+B1X+E

Validación de un modelo RLS

Cumple con los objetivos

Tener buenas propiedades

Verifica supuestos

Coeficiente de determinación

Modelo de regresión con proporción de varianza explicada

Observaciones

Valores entre cero y uno

CD coincide con variable explicativa y respuesta

Medida de ajuste de regresión

Predicciones

Se toma en cuenta la variable Y denotado por Yo

Se calcula con software estadístico

Hipótesis

Se presuponen en el modelo de regresión lineal

Modelo de Regresión

Repuesta variable Y

Colección de variables explicativas

E1, En... E N (0, o2)

Modelo de Regresión Múltiple Matricial RLM

Normal

Se puede expresar en notación matricial

Matricial

Sustituye cada matriz o vector por un símbolo

Características

X es una matriz no aleatoria

B es un vector de parámetros que hay que estimar

Suposiciones de homocedasticidad

Estimación por mínimos cuadrados

Método de mínimos cuadrados

Estimador B donde se alcance matriz de diseño X

Sistema de ecuaciones normales de regresión

Ecuaciones normales de regresión

Notación matricial

Función objetivo X'X B = X'Y

Cálculo de residuos y estimación de la varianza

Se puede calcular ajustes o predicciones

Estimación de la varianza

image

Inferencia en RLM

Suposición suficiente para estimar que B es un estimador insesgado de B

Teorema

Independientes y distribución común

Sobre coeficientes

Extrae un elemento correspondiente al diagonal (X'X)

Inferencia o2

Inferencia sobre la varianza basada en el pivote

Contraste Global F

Se constituye de igual manera que en RLS

Fórmula

F test = Media cuadrática / Sigma estimada

Bondad de ajuste y coeficiente de determinación

Siendo p los grados de libertad, coincide con el número de parámetros de regresión

Predición en RLM

Media condicionada

IC media condicionada

Intervalo de predicción