Please enable JavaScript.
Coggle requires JavaScript to display documents.
Analisi dei dati 2, Differenza chiave - Coggle Diagram
Analisi dei dati 2
Regressione lineare
Oltre a capire se esiste un’associazione, possiamo voler modellare come una variabile dipenda dall’altra.
La regressione stima la funzione matematica che mette in relazione X e Y, ad esempio:
-
-
In un grafico a dispersione, la regressione appare come una retta che meglio approssima i punti.
Indicatori di variazione
-
Comprendono:
Deviazione al quadrato
-
-
✔ Proprietà
Più i valori sono lontani dalla media, più aumenta.
-
-
Varianza
-
È la deviazione al quadrato divisa per n, quindi una misura normalizzata.
-
-
-
-
Indicatori di centralità
Gli indicatori di centralità descrivono qual è il "valore tipico" o centrale di una variabile numerica.I più importanti sono:
Media aritmetica
-
-
Proprietà importanti
Sensibile alle anomalie (outlier)Un solo valore molto grande/spiccatamente diverso può cambiare molto la media.
-
Utile per sostituire dati mancantiSe sostituiamo un valore mancante con la media, la media totale del dataset non cambia.
-
-
Moda
-
-
Esempio:Moda(“Rome”, “Rome”, “LA”, “Rome”) = “Rome”.
-
-
-