Le test de Wilcoxon signé

Test signé des rangs de Wilcoxon

Dans le vaste supermarché de tests que les statistiques ont à nous offrir, celui de Wilcoxon sur les rangs signés devrait être l’un des plus utilisés en entreprise. Et pourtant, ce grand modeste n’est pas aussi connu qu’il le mériterait…

 

Utilité

Il s’agit d’un test de rangs sur échantillons appariés. Le fait de s'intéresser aux rangs conduit à l'employer sur des échelles ordinales aussi bien que cardinales.

On l'utilise lorsqu'on souhaite savoir si les échantillons diffèrent.

Par exemple, il peut être utilisé chaque fois que des répondants à une enquête situent leurs opinions sur une échelle (du type : note de 1 à 5), avant d’être réinterrogés après un évènement.

Celui-ci peut concerner les ressources humaines (évaluation d’une formation, évaluation d’un ressenti par un audit social) mais surtout le marketing (évaluation auprès d’un panel d’une nouvelle image de marque, par exemple). Non paramétrique, il s'accommode de distributions asymétriques ou de variances différentes entre la première enquête et la seconde.

Il prend en compte une différence globale : si tout le monde change d'avis entre deux enquêtes mais qu'il existe une compensation entre des avis devenus plus négatifs et d'autres plus positifs, alors le test considère qu'il n'y a pas de changement.

Un autre test concurrence celui de Wilcoxon. C’est celui des signes. L’avantage du test de Wilcoxon est de prendre en considération les différences d'écarts entre valeurs observées : une évolution entre « bon » et « très bon » n’est pas considérée comme identique à une évolution entre « très mauvais » et « très bon ». Donc, malgré une mise en œuvre un peu moins pratique, on opte souvent pour ce test-ci.

bon

 

Le traitement des données

Pour ce faire, on utilise des écarts entre modalités de réponse (que l’on suppose donc équidistantes). Par exemple, sur une échelle de 1 à 5, les distances varient entre -4 et +4. Les nulles sont éliminées de l’effectif (comme ci-dessous, ligne 4) et on ne retient que les valeurs absolues des distances.

Note 1 Note 2 Différence Val abs Elim exaequo
3 1 -2 2 2
2 5 3 3 3
1 3 2 2 2
4 4 0 0
3 2 -1 1 1
1 2 1 1 1
3 1 -2 2 2

Puis on classe par ordre croissant ces valeurs absolues, ce qui permet de leur affecter un rang (ci-dessous la première colonne n'est pas triée pour respecter l'ordre des lignes du tableau précédent).

Elim exaequo Rang
2 3
3 6
2 3
1 1
1 1
2 3

Il y a deux rangs 1, aucun rang 2, trois rangs 3, aucun rang 4 ou 5 et un rang 6. On reporte ce décompte :

Rang Nombre
3 3
6 1
3 3
1 2
1 2
3 3

Il faut ensuite prendre en compte les ex-æquo. Ceci nous conduit à des rangs moyens calculés. Il y a deux rangs 1 et aucun rang 2. Les rangs 1 prennent donc la valeur 1,5. Il y a trois rangs 3 mais ni 4 ni 5. Ainsi les rangs 3 prennent la valeur 4. Le rang 6 reste tel quel puisqu'il est seul.

Ensuite, nous trions ces rangs moyens selon qu'ils correspondent à des différences positives ou négatives (Cf. le premier tableau).

Rang moyen W- W+
4 4
6 6
4 4
1,5 1,5
1,5 1,5
4 4

La somme des rangs négatifs est égale à 9,5 et celle des positifs à 11,5.

 

La statistique

Sous l’hypothèse H0 que l’on teste, ces différences suivent une loi de probabilité symétrique, c’est-à-dire \(W_+ = W_-.\) La somme des rangs est égale à \(\frac{n(n+1)}{2}\) (somme des \(n\) premiers termes d’une suite arithmétique de raison 1 et de premier terme 1). Donc, sous H0, \(W_+ = W_- = \frac{n(n+1)}{4}.\) C’est l’espérance de chacune des deux distributions.

Pour un petit échantillon, on se réfère à une table spécifique à ce test.

Si l’effectif est suffisamment grand (au-delà d'une vingtaine, le seuil n'étant pas toujours le même selon les auteurs), on peut supposer que la variable aléatoire \(W\) suit une loi normale. Sa variance est égale à \(\frac{n(n+1)(2n+1)}{24}.\) Pour résumer...

\[W = \frac{\left| W_+ - \frac{n(n+1)}{4} \right|}{\sqrt{\frac{n(n+1)(2n+1)}{24}}} \leadsto \mathscr{N}(0\,;1)\]

 

Les hypothèses du test

Sous l'hypothèse H0 et pour un seuil de confiance donné, les différences positives et négatives des deux échantillons se compensent. L'hypothèse alternative H1 est que les distributions des deux échantillons diffèrent.

 

Exemple avec logiciels

Voir le test signé de Wilcoxon avec logiciels.

 

évolutions nulles