Cours 3 : Description et exploration des données (Statistiques descriptives)

2. Mesures de tendance centrale

2.1 Le mode (Valeur dont la fréquence est la plus grande)

2.2 La médiance (=50e percentile.
Comment la calculer : (1) Mettre données en ordre, (2) Trouver la position médiane ; N+1//2

2.3 La moyenne (Tendance centrale la plus fréquemment utilisée) :
x̅ = ∑X // N

3. Mesures de variabilité

4. Diagramme en forme de boites
doit avoir :

3.1 L'étendue : Distance entre la valeur la plus petite et la valeur la plus élevée. (Ne pas utiliser lorsqu'il y a des données aberrantes)
Étendue = X(max) - X(min)

3.2 L'espace interquartile : Distance entre Q1 et Q3
Formule pour calculer rang percentile : n = p/100 x N + 1/2

L'écart moyen : Savoir comment les score sont dispersés
∑(X − x̅) //N

3.3 La variance : Si les écart positifs et négatif donne 0, il faut utiliser la variance. = Mettre les écart à la moyenne au carré. Ainsi, tous les écarts deviennent positifs et ne peuvent s'annuler entre eux.
Sº2 = ∑(X − μ)º2 // N

3.4 L'écart-type : Racine carrée de la variance.

  1. Espace interquartile (Q3-Q1)

Échantillon: S= V'' ∑(X−x̅)º2 // N-1

Population : σ= V''∑(X−μ)º2 // N

  1. ???Barrières intérieures : Valeurs des quartiles ±1.5 X Espace interquartile
  1. Q1 et Q3 : n = p/100 X N + 1/2
  1. Valeurs adjacentes : Valeurs de nos données qui sont les plus proches des barrières intérieures
  1. Médiane : (N+1) /2
  1. Valeurs aberrantes: À l'extérieur des barrières intérieures. Présentées avec une étoile