Cours 3 : Description et exploration des données (Statistiques descriptives)
2. Mesures de tendance centrale
2.1 Le mode (Valeur dont la fréquence est la plus grande)
2.2 La médiance (=50e percentile.
Comment la calculer : (1) Mettre données en ordre, (2) Trouver la position médiane ; N+1//2
2.3 La moyenne (Tendance centrale la plus fréquemment utilisée) :
x̅ = ∑X // N
3. Mesures de variabilité
4. Diagramme en forme de boites
doit avoir :
3.1 L'étendue : Distance entre la valeur la plus petite et la valeur la plus élevée. (Ne pas utiliser lorsqu'il y a des données aberrantes)
Étendue = X(max) - X(min)
3.2 L'espace interquartile : Distance entre Q1 et Q3
Formule pour calculer rang percentile : n = p/100 x N + 1/2
L'écart moyen : Savoir comment les score sont dispersés
∑(X − x̅) //N
3.3 La variance : Si les écart positifs et négatif donne 0, il faut utiliser la variance. = Mettre les écart à la moyenne au carré. Ainsi, tous les écarts deviennent positifs et ne peuvent s'annuler entre eux.
Sº2 = ∑(X − μ)º2 // N
3.4 L'écart-type : Racine carrée de la variance.
- Espace interquartile (Q3-Q1)
Échantillon: S= V'' ∑(X−x̅)º2 // N-1
Population : σ= V''∑(X−μ)º2 // N
- ???Barrières intérieures : Valeurs des quartiles ±1.5 X Espace interquartile
- Q1 et Q3 : n = p/100 X N + 1/2
- Valeurs adjacentes : Valeurs de nos données qui sont les plus proches des barrières intérieures
- Médiane : (N+1) /2
- Valeurs aberrantes: À l'extérieur des barrières intérieures. Présentées avec une étoile