mèche perceuse

 

 

 

 

 

 

 Le test Z sur un échantillon

Posons le décor : soit un échantillon aléatoire de taille supérieure ou égale à trente observations. On souhaite savoir si la moyenne observée s’éloigne d’une moyenne standard pour un risque d’erreur donné.

On suppose que la distribution suit une loi normale, ce qu’on peut vérifier par un test de normalité. Mais plus l’échantillon est grand, plus on peut s’affranchir sans vergogne de cette condition car l’espérance des moyennes de nombreux échantillons suit de toute façon une loi normale, sauf cas très particuliers (Cf. théorème central-limite).

Nous somme donc dans le cadre d’un test d’hypothèses et plus précisément d’un test de conformité. Selon le cas à traiter, le test est unilatéral ou bilatéral.

C’est la même problématique qu’avec un test de Student, sauf que l’échantillon est plus grand. Pour le statisticien qui utilise un logiciel, la différence ne présente pas un intérêt vital… Sur SPSS ou sur Tanagra, par exemple, on utilise le même test t.

La statistique z suit une loi normale centrée réduite et s’établit ainsi :

Z

La différence avec la statistique du t de Student, c’est que z utilise l’écart-type empirique. Donc, on peut très bien appliquer ce test sur un petit échantillon du moment qu’on connaît la dispersion de la population de référence… De fait, la plupart des auteurs (et des logiciels) préfèrent appliquer le terme « test z » à ce cas plus général où l’on connaît la vraie variance de la population, quel que soit l’effectif.

Toutefois, le cas où l’on travaille sur un petit échantillon alors qu’on connaît la vraie variance est plutôt rare ! Et voici pourquoi le test z est moins connu que d’autres. Soit il reste un cas d’école pour manuels de statistiques, soit on l’utilise mais sans le nommer ainsi (les logiciels ne précisent pas forcément quelle statistique ils calculent pour les tests de moyenne ou de fréquence).

Je résume : on utilise le test z soit lorsque l’échantillon est grand, soit lorsqu’on connaît la vraie variance de la population. Les deux différences avec le test t sont la référence aux valeurs de la loi normale et l'emploi de la variance empirique.

Le fait d’utiliser la loi normale plutôt que la distribution de Student implique un intervalle de confiance plus resserré (puisque la distribution gaussienne est moins étalée que celle du t) mais s’il s’agit d’une approximation, elle peut se révéler fallacieuse… En revanche, lorsque la vraie variance de la population est connue, le gain de précision est réel.

 

testz

plus de livres (France)    plus de livres (Canada)