Correlação e regressão

Correlação

Direta ou positiva

Quando x ⬆, y ⬆

Indireta ou negativa

Quando x ⬆, y ⬇

Linear

Tendência de ser uma reta

Não linear

Não é uma reta

Nula ou variáveis independentes

image

Covariância

Média do produto dos desvios

Média dos produtos - produto das médias

COV (X,Y) = E[(X - E(X)) (Y - E(Y))]

COV(X,Y) = E[(X - µx) (Y -µy)]

COV(X,Y) = E(XY)) - E(X)E(Y)

Reta de regressão

Reta dos mínimos quadrados

image

Para cada valor de X, há valor predito e valor observado de Y

Predito = ^Y - valor sobre a reta

Observado = Yi

Erro ou resíduo (Єi)

Diferença entre o valor observado e o predito

Єi = Yi - ^Y

Pode ser negativo, positivo ou 0

1ª propriedade

Yi = ^α + ^βXi + Єi

Média dos erros = 0

E(Єi) = 0

Soma de todos os erros = 0

2ª propriedade

ΣЄi² é um valor mínimo

Soma dos quadrados dos resíduos é mínima

Por isso reta dos mínimos quadrados

Σ(Yi - ^Y) = valor mínimo

ΣЄi = 0

Cálculo do coeficiente angular

^ = COV(X,Y) / σ²x

^β = n ΣXY - ΣXΣY / n ΣX² - (ΣX)²

Cálculo do coeficiente linear

Y = ^α + ^βX

Substitui o Y e o X pelas médias e o ^β pelo valor já calculado

Єi = 0, porque as médias estão sobre a reta

‾Y = ΣY/n e ‾X = ΣX/n

Centróide

Pontos sobre a reta

Calcula média de Z e Y

A reta passa por cima

Macete para cálculo da reta

Calcula as médias de X e Y

Substitui a média de X na equação

Testa as alternativas para o valor de Y

Y da alteranativa deve ser igual à média calculada

Se funcionar para mais de uma alteranativa, usar a forma tradicional

Coeficientes

Determinação

ρ² = COV²(X,Y) / σ²x σ²y

0 ≤ ρ² ≤ 1

Correlação linear de Pearson

ρ = COV(X,Y) / σx σy

-1 ≤ ρ ≤ +1

Correlação positiva

ρ = +1 ponto exatamente sobre a reta

Coeficiente angular positivo e reta crescente

ρ positivo

Correlação negativa

Coeficiente angular negativo e reta decrescente

ρ negativo

COV = 0, ρ e ρ² = 0

Varáveis independentes

Ou não existe correlação linear

Quanto mais perto de 0, mais fraca a correlação

Não usa fator de Bessel nos cálculos dos coeficientes

Soma de variância

σ²x+y = σ²x + 2COV(X,Y) + σ²y

σ²x-y = σ²x - 2COV(X,Y) + σ²y

Para variáveis independentes, COV = 0

σ²x+y = σ²x + σ²y

σ²x-y = σ²x + σ²y

É afetada por multiplicação e divisão, mas não por adição e subtração

COV (aX + b; cY + d) = ac COV(X,Y)

σ² afetada por multiplicação e divisão

σ²ax+by = a²σ²x + 2ab COV(X,Y) + b²σ²y

ρ não é afetado por números, apenas pelo sinal dos números que multiplicam ou dividem X e Y

ρ² não é afetado por números ou sinais