Please enable JavaScript.
Coggle requires JavaScript to display documents.
Regresión y Correlación lineal - Coggle Diagram
Regresión y Correlación lineal
Distribución bidimencional
Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional.
Idea de correlación
Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.
Nube de puntos o diagrama de dispersión
La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Correlación lineal y recta de regresión
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Medida de correlación
La apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.
El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo.
Estimación mediante la recta de regresión
Es evidente que no todos dibujaríamos exactamente la misma recta para una nube de puntos, aunque la correlación fuera bastante fuerte.
De todas las rectas posibles los matemáticos han elegido como la mejor aproximación la llamada de los mínimos cuadráticos, Su cálculo es también algo mecánico que podemos hacer con calculadora o un ordenador. En el siguiente apartado encontrarás un ejercicio para estudiar sus propiedades.
La recta de regresión sirve para hacer estimaciones, teniendo en cuenta que:
Los valores obtenidos son aproximaciones en términos de probabilidad: es probable que el valor correspondiente a x0 sea y0.
La fiabilidad es mayor cuanto más fuerte sea la correlación.
La fiabilidad aumenta al aumentar el número de datos.
La estimación es más fiable para los valores de x próximos a la media.
Propiedades de la recta de regresión de los mínimos cuadráticos
En la siguiente escena puedes comprobar las principales propiedades de la recta de regresión mínimo-cuadrática.
Observa la recta blanca, cuyos coeficientes a y b puedes hacer variar en los recuadros inferiores de la escena, bien con las flechas o introduciendo los valores deseados. Observa los segmentos denominados di, que marcan las distancias de los puntos de la nube a la recta en la dirección del eje OY.
Haz variar los valores de a y de b. Cuando la recta coincida con la recta de regresión mínimo-cuadrática (en color azul claro) la suma de los cuadrados de las distancias di es la mínima posible.
Observa el punto P(p,q), cuyas coordenadas puedes hacer variar en los recuadros correspondientes de la parte inferior de la escena. Observa lo que ocurre si le das a p y a q los valores de las medias de la distribución (puedes escribir mx en la casilla de p y pulsar intro y escribir my en la casilla de q y pulsar intro). Mueve ahora los puntos rojos y repite el ejercicio. ¿qué propiedad puedes deducir?