Please enable JavaScript.
Coggle requires JavaScript to display documents.
Correlación y regresión lineal simple - Coggle Diagram
Correlación y regresión lineal simple
Diagrama de dispersión
Representación gráfica de dos variables para un conjunto de datos.
Ambas variables se representan como un punto en el plano cartesiano. De acuerdo la relación que exista entre ellas se define el tipo de correlación.
Correlación positiva
Ambas variables aumentan o disminuyen
Correlación negativa
Una variable se comporta de forma contraria o a la otra
Correlación nula
No se encuentra un comportamiento entre las variables
El coeficiente de correlación en un diagrama de dispersión
Se usa la letra
r
para expresarla
Correlación es positiva perfecta.
r=1
Correlación negativa
-1<r<0
Correlación positiva
0<r<1
Correlación nula
r=0
Correlación negativa perfecta
r=-1
Clasificación del análisis de regresión lineal.
Regresión lineal simple
Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros.
Regresión lineal múltiple
Es posible analizar la relación entre dos o más variables a través de ecuaciones
Maneja varias variables independientes.
Rectas de regresión
Son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión) generada por una distribución conjunta.
Representación de la ecuación de regresión lineal simple
El objetivo de un modelo de regresión es encontrar una relación entre las variables que se ajuste lo mejor posible a los datos.
En el caso de un modelo de regresión lineal simple, el objetivo es encontrar la recta de regresión.
Para ser válido, el modelo de regresión lineal simple necesita que se satisfaga lo siguiente
Linealidad
Para comprobar la linealidad, se representa gráficamente la nube de puntos
asociada al conjunto de observaciones.
Homocedasticidad
Datos homocedásticos
La nube de puntos de los datos tiene una anchura más o menos constante a lo largo de la recta de regresión.
Datos heterocedásticos
Cuando la varianza de los errores no es igual en todas las observaciones realizadas.
Homogeneidad
Las perturbaciones tienen esperanza nula.
Independencia
Las perturbaciones son variables aleatorias independientes.
Normalidad
Los errores tienen una distribución normal.
Uso del análisis de regresión lineal
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables.
Predice un amplio rango de fenómenos,
Medidas económicas
En física se utiliza para caracterizar la relación entre variables o para calibrar medidas.
Puede utilizarse para explorar explorar y cuantificar la relación entre una variables.
Lleva asociados una serie de procedimientos de diagnóstico que informan sobre la estabilidad e idoneidad del análisis y que proporcionan pistas sobre cómo perfeccionarlo
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresión lineal.
JavaScript para regresión lineal.
Coeficiente de relación de Pearson
Es una prueba que mide la relación estadística entre dos variables continuas.
Puede tomar un rango de valores de +1 a -1.
Un valor de 0 indica que no hay asociación entre las dos variables.
Un valor mayor que 0 indica una asociación positiva.
Un valor menor que 0 indica una asociación negativa.
Requisitos para la correlación de Pearson
La escala de medida debe ser una escala de intervalo o relación.
Las variables deben estar distribuida de forma aproximada.
La relación que se quiere estudiar entre ambas variables es lineal (de lo contrario, el coeficiente de Pearson no la puede detectar).
No debe haber valores atípicos en los datos.
Las dos variables deben de ser cuantitativas.
Ecuación en muestra
Ecuación en población
Tipos de variables de regresión lineal
En función del número de variables independientes
Regresión simple
Cuando la variable Y depende únicamente de una única variable X.
Regresión múltiple
Cuando la variable Y depende de varias variables (X1, X2, ..., Xr)
En función del tipo de función
Regresión lineal
Cuando f(X) es una función lineal.
Regresión no lineal
Cuando f(X) no es una función lineal.
En función de la naturaleza de la relación que exista entre las dos variables
La variable X puede ser la causa del valor de la variable Y.