Regresión Lineal en un problema de pobreza
Juan Baird

Datos

click to edit

El término regresión fué utilizado por primera vez como un concepto estadístico en 1877 porsir Francis Galton,

la variable que se va a predecir se llama dependiente

las variables que se usan para predecir el valor de la variable dependiente se llaman independientes

Hay 4 posibles formas de relacionar los datos

Relación linear directa

Relación lineal inversa

Relación no linear directa

Relación no linear indirecta

análisis de regresión donde intervienen una variable dependiente y una independiente, y en la cual la relación entre ellas se aproxima por medio de una línea recta.

Se deben enfrentar 3 problemas

Decidir qué clase de curva muestran los puntos y por tanto qué clase de ecuación se debe usar.

Encontrar la ecuación particular que mejor se ajuste a los datos.

Demostrar que la ecuación particular encontrada cumple con ciertos aspectos referentes a los méritos de ésta para hacer pronósticos

En este modelo, es una función lineal de (la parte Bo+B1x ) más E que representa el término de error y explica la variabilidad en que no se puede explicar con la relación lineal

El término de error es una variable aleatoria con
media o valor esperado igual a cero E=0

La varianza de E, representada por σ2, es igual para todos los valores de . Esto implica que la varianza de y es igual a σ2 y es la misma para todos los valores de X

Los valores de son independientes. El valor de para un determinado valor de x no se relaciona con el valor de para cualquier otro valor de X ; así, el valor de y para determinado valor de no se relaciona con el valor de y para cualquier otro valor de X

El término de error, E, es una variable aleatoria con distribución normal.

Criterio de los mínimos cuadrados

Este método emplea los datos de la muestra para determinar las características de la recta que hacen mínima la suma de los cuadrados de las desviaciones

Análisis de regresión

Con el fin de determinar la pertinencia de la ecuación de regresión hallada, es necesario hacer un análisis de la bondad de ajuste de la recta, demostrar si la relación es estadísticamente significativa y validar los supuestos acerca del término de error.

Coeficiente de correlación

Es la segunda medida que se usa para describir qué tan bien explica una variable a la otra. El coeficiente de correlación de la muestra se denota por r y es la raíz cuadrada del coeficiente de determinación

el coeficiente de correlación solo mide la fuerza de asociación en una relación lineal

Desviación estándar de la estimación

El error típico o desviación estándar del estimado se calcula como la raíz cuadrada de la varianza del estimado.

Análisis de Residuales

Este análisis permite validar los supuestos del modelo con respecto al error y se basa en el examen de varias gráficas a saber:

Gráfica de los residuales en función de la variable independiente

Gráfica de residuales estandarizados.

Gráfica de probabilidad normal.