Please enable JavaScript.
Coggle requires JavaScript to display documents.
covarianza e correlazione :star: - Coggle Diagram
covarianza e correlazione :star:
covarianza
due variabili categoriche
si potrebbe costruire un indice di dipendenza sommando tutte le differenze tra p(xi,yj) e p(xi) p(yj). più è grande, più si allontana dall'indipendenza. l'indice si chiama "chi-quadrato" (x elevato 2). sarà argomento di inferenza
31 :!:
poniamo di avere due variabili categoriche indipendenti. y|x=xi sono tutte uguali e quindi sono uguali alla distribuzione di tutta la variabile y. ovvero, in caso di indipendenza vale -> freq. congiunta = prodotto delle freq. marginali
due variabili numeriche
poniamo di voler costruire un numero che misuri la dipendenza tra x e y, che sia >0. nel grafico prevalgono punti nel I e III quadrante, quindi con xy>0. la covarianza cattura la direzione della relazione tra le due variabili
vorremo, però, catturare pure l'intensità. questa non può essere catturata dalla Covxy perché dipende dalle unità di misura. es: se x=peso e y=altezza, la Cov sarà espressa in kg*cm
32 :!:
coefficiente di correlazione lineare
33 :!:
si indica con "ro"
si trova con sqm di xy / sqm x * sqm y
più il risultato tende a 1, più la relazione è forte
serve fare attenzione
agli outliers che possono falsare ro
alle relazioni non lineari, che non sempre sono catturate da ro
al paradosso di Simpson
34 :!:
retta di regressione
criterio dei minimi quadrati di Gauss: una retta che approssima al meglio la nuvola di punti. serve scegliere la retta che minimizza gli scarti verticali al quadrato
35 :!:
prodotto vettoriale
disuguaglianza di Cauchy-Schwartz: dati due vettori a, b abbiamo |a
b| < radice quadrata di a
a
radice quadrata di b
b
36 :!: