Tests statistique

🏁 déterminer si les paramètres de la série sont différents d'une valeur théorique définie

Variable quantitative

Variable qualitative :

Continue

Discrète

Comparaison d'une proportion observée à proportion théorique

Comparaison des fréquence à une fréquence théorique

Test de Wilcoxon de conformité à une médiane

loi normale OUI ✅

Test de student de conformité à une moyenne

Loi normale NON ❌

Test de Wilcoxon de conformité à une médiane

Condition d'application

échantillonnage aléatoire

Normalité de la distribution

Fonction R : t.test()

Conditions d'application

test R wilcox.test()

les données sont aléatoire

les données viennent de la même population

Normalité et homoscédasticité

Loi normale

Test de Shapiro-Wilk

R: shapiro.test()

avec H0 les échantillons suivent la loi normale, H1 ils ne le suivent pas

si p significative, pas normale

QQ plot, si elles suivent la courbe

Homoscédasticité (les variances de diff séries sont égales)

Test de Bartlett

SI la loi normale est respectée

H0 variances égales, H1 variances différentes

si p value significative, pas d'homoscédasticité

Homoscédasticité

Test Z

Conditions d'application

échantillonnage aléatoire

normalité

R z.test()

Test du Chi 2 d'ajustement

Conditions d'application

avoir au moins 5 succès et 5 échecs

Echantillonnage aléatoire

chisq.test()

Les effectifs théoriques doivent être supérieurs à 5

🏁 déterminer si les paramètres de deux séries diffèrent (2 séries indépendantes)

Qualitative

Quantitative

Continue

Discrète

Test Z

Test du Chi2 d'indépendance

Loi normale ✅

Loi normale ❌

Homoscédasticité ✅

Homoscédasticité ❌

Test de student Welch

Test de Student

Test de Mann-Whitney Wilcoxon

Test de Mann-Whitney Wilcoxon

Utiliser la correction de welsh (automatique sur R)

Utiliser var.equal=TRUE si homoscédasticité

échantillonnage aléatoire

t.test()

t.test()

wilcox.test()

échantillonnage aléatoire

wilcox.test()

Conditions

échantillonnage aléatoire

effectifs théoriques supérieurs à 5

compare fréquence à une fréquence théorique

conditions

z.test()

au moins 5 succès et 5 échecs

échantillonnage aléatoire

données suivent la loi binomiale

🏁 déterminer si les paramètres de deux séries diffèrent (2 séries dépendantes)

Quantitative

Continue

Corrélation non linéaire

Corrélation de Spearman

Corrélation linéaire

Loi normale, homoscédasticité

Test non paramétrique

Variable contrôlée vs variable réponse

Discrète

Test non paramétrique

Corrélation non linéaire

Une variable contrôlée vs une variable réponse

Qualtitative

corrélation de Pearson

test student des séries appariées

Test de Wilcoxon (des rangs signés)

régression linéaire

Test de Mc Nemar

Test de Wilcoxon (des rangs signés)

corrélation de Spearman

régression linéaire généralisée

régression non linéaire

conditons

echantillons indépendants

correspondance entre les échantillons des deux séries

normalité de la distribution

homoscédasticité

t.test + option paired=TRUE

Conditions

échantillons indépendants

corespondance entre deux séries

wilcox.test + paired=TRUE

Conditions

Loi normale

relation linéaire

pas de valeurs aberrantes

correspondance entre les séries

corrélation faible

corrélation forte

-0,5 à 0 et 0 à 0.5

-1 à -0.5 et 0.5 à 1

cor.test method="pearson"

Conditions

Variables ordinales

correspondance entre 2 séries

cor.test() method="spearman"

conditions

ANOVA

test student

lm()

Anova()

échantillonnage aléatoire

résidus suivent la loi normale

homoscédasticité

Condition : avoir au moins 10 couples discordants

souvent utilisé lorsque 2 valeurs sont mesurées 2x sur les mêmes individus

mcnemar.test()

Analyses de données avec + de 2 séries indépendantes 🏁

Quantitative

Qualitative

Continue

Discrète

Test de Chi2 d'indépendance

Test de Kruskal-Wallis puis test Wilcoxon par paires

Test non paramétrique

Loi normale, ✅ homoscédasticité ✅

ANOVA puis test-t par paires

test de Welsh si variances inégales

Conditions

Echantillonnage aléatoire

Normalité des distributions

Homoscédasticité

échantillons indépendants

si test significatif, au moins 1 des moyennes est significative

peut aussi être utilisé si conditions de ANOVA pas respectées

ensuite corretion bron feroni pour t test