ANÁLISIS DE REGRESIÓN MÚLTIPLE

Puede utilizarse para analizar la relación entre una única variable de criterio y varias variables independientes.

PRIMER PASO: OBJETIVOS DE LA REGRESIÓN MÚLTIPLE

Es apropiada cuando el investigador esta interesado e una relación estadística no funcional

  • COSTE TOTAL= COSTE VARIABLE + COSTE FIJO

Selección de ambos tipos de variables debería basarse principalmente en fundamentos conceptuales o teóricos
1.- selecciona las variables indiscriminadamente
2.- permite que la selección de una variable independiente se base en bases empíricas.

se agrupan en dos clases:
PREDICCIÓN.-el objetivo es maximizar la potencia conjunta de predicción de las variables independientes.
EXPLICACIÓN.-proporcionar un medio para evaluar objetivamente el grado y carácter de la relación entre variables dependientes e independientes.

El investigador debe considerar 3 puntos: 1.- la conveniencia del programa de investigación, 2.- la especificación de una relación estadística, 3.- la selección de las variables dependientes e independientes

PROBLEMAS DE INVESTIGACIÓN

ESPECIFICACIÓN DE LA RELACIÓN

SELECCIÓN DE VARIABLES

el investigador debe considerar el tamaño de muestra, la naturaleza de las variables y la posible creación de variable

incorporar datos no métricos, como genero o ocupación.

click to edit

SEGUNDO PASO: DISEÑO DE LA INVESTIGACIÓN EN EL ANÁLISIS

POTENCIA ESTADÍSTICA Y TAMAÑO MUESTRAL

TAMAÑO MUESTRAL

tiene un impacto directo en la conveniencia y la potencia estadística de la regresión múltiple. ejemplo: si el investigador emplea 5 variables independientes, a un nivel de 0.05, una muestra de 50, R cuadrado de 23 por ciento y superior.

INCORPORACIÓN DE DATOS NO MÉTRICOS CON VAR. FICTICIAS.-

  • VARIABLES FICTICIAS.- actúan en lugar de las variables independientes, puede representarse como K-1
  • CODIFICACIÓN DE INDICADOR.- se representa por 1 o 0
    -CATEGORÍA DE REFERENCIA.-el grupo omitido que recibe todos los ceros.
    REPRESENTACIÓN DE EFECTOS CURVILÍNEOS.-
    image

CREACIÓN DE VARIABLES ADICIONALES

TERCER PASO: SUPUESTOS EN EL ANÁLISIS

VALORACIÓN DE LAS VARIABLES INDIVIDUALES FRENTE AL VALOR TEÓRICO.-

  • la linealidad del fenómeno molido
  • la varianza constante del termino de error
  • la independencia de los términos de error
  • la normalidad de la distribución del termino de error

LINEALIDAD DEL FENÓMENO.- La linealidad de la relación entre variables dependientes o independientes representa el grado de cambio en la variable dependiente asociado con la variable independiente.

VARIANZA CONSTANTE DEL TERMINO DE ERROR.- La presencia de varianzas desiguales (Heterocedasticidad) en uno de los supuesto se incumple habitualmente, puede tener una forma de diamante, triangulo.
programa SPSS ofrece el test de Levane

INDEPENDENCIA DE LOS TÉRMINOS DE ERROR.- La variable predictor es independiente, si los residuos son independientes, la forma puede parecer aleatoria y similar al gráfico de no correlación

NORMALIDAD DE LA DISTRIBUCIÓN DEL TERMINO ERROR.-
El diagnostico mas simple para el predictor en la ecuación es un histograma de residuos, donde se puede observar si se acerca o no a la normal

tres tareas básicas:
1.- seleccionar un método para especificar el modelo de regresión
2.- evaluar la significación estadística del modelo
3.- determinar si cualquiera de las observaciones tiene influencia sobre los resultados

CONTRATACIÓN DEL CUMPLIMIENTO DE LOS SUPUESTOS.- El investigador debe ahora evaluar el modelo estimado a la hora de cumplir los supuestos subyacentes en la regresión múltiple

EXAMEN DE LA SIGNIFICACIÓN ESTADÍSTICA .-Con una sola muestra y modelo de regresión, necesitamos comprobar la hipótesis con relación a nuestro modelo predictivo para asegurar que representa la población

ESPECIFICACIÓN CONFIRMATORIA.- el investigador especificaría por completo el conjunto de variables independientes a incluir.
MÉTODOS DE BÚSQUEDA SECUENCIAL.- La aproximación general de estimación de las ecuaciones de regresión con un conjunto de variables.

IDENTIFICACIÓN DE OBSERVACIONES INFLUYENTES.- Identifica y evalua su impacto antes de empezar. se clasifican en 3 casos, como: atípicos, puntos de apalanca miento e influyentes

CUARTO PASO: ESTIMACIÓN DEL MODELO DE REGRESIÓN Y VALORACIÓN

interpreta el valor teórico de la regresión evaluando los coeficientes de regresión estimados para la variable dependiente

QUINTO PASO: INTERPRETACIÓN DEL VALOR TEÓRICO

ESTANDARIZACION DE LOS COEFICIENTES DE REGRESION.- muestras de variables predictor ha sido estandarizada antes de estimar la ecuacion. los datos estandarizados se denominan coeficientes beta.

EVALUACIÓN DE LA MULTICOLINEALIDAD.-
1.- valorar el grado de multicolinealidad
2.- determinar su impacto en los resultados y las solucione pertinentes.

UTILIZACIÓN DE LOS COEFICIENTES DE REGRESIÓN.-Se usan para calcular los valores de la predicción para cada observación y para expresar el cambio esperado de la variable dependiente

REMEDIOS PARA LA MULTICOLINELIDAD.-

  • omitir una o varias variables independientes correlacionadas e identificar otras variables independientes para ayudar con la predicción.
    -utilizar el modelo con las variables correlacionadas solo para predecir
    -utilizar las correlaciones simples entre cada variable independiente y dependiente
    -utilizar in método mas sofisticado de análisis, como una regresión bayesiana

consiste en asegurarse de que represente a la población general

MUESTRAS ADICIONALES.-
-primer lugar, el modelo original puede predecir valores con la nueva muestra
-segundo lugar, se puede estimar un modelo separado con la nueva muestra para compararla con la ecuación original

CALCULO DE ESTADÍSTICO SPSS.-estadístico PRESS una medida similar a R cuadrada utilizada para evaluar la precisión predictivos del modelo de regresión.

SEXTO PASO: VALIDACIÓN DE LOS DATOS

la utilización de varias variables como predictores de la correlación múltiple entre variables independientes

PROCESO EN DOS PARTES:
1.- identificar todos los indices de condicionamiento que estén por encima de un valor limite
2.- para todos los indices de condicionamiento que exceden el umbral, identificar variables con proporciones de la varianza.

EVALUACIÓN DE LA MULTICOLINEALIDAD