mèche perceuse

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 ANOVA sur séries chronologiques

Avant de se lancer tête baissée dans une désaisonnalisation, il faut peut-être se demander si celle-ci est vraiment nécessaire. Idem avant de convenir ou non qu’il existe une tendance. Donc, en amont de l’analyse d’une série chronologique, nous allons procéder à deux tests.

En fait, si l’on a détecté un modèle additif, on peut procéder à deux ANOVA à un facteur, l’une pour la saisonnalité et l’autre pour la tendance. En d’autres termes, on teste l’égalité du nombre moyen de visites selon le jour de la semaine (saisonnalité ?) et la moyenne selon les semaines (tendance ?). Un modèle multiplicatif, donc avec une interaction entre deux phénomènes, appelle plutôt une seule ANOVA mais à deux facteurs.  Cette dernière peut être envisagée de toute façon même si l’exemple qui suit ne la privilégie pas…

Ce dernier a le mérite de s’appuyer sur des données réelles. J’ai relevé le nombre de visites quotidiennes du site que vous êtes en train de consulter, jybaudot.fr, sur les 18 premières semaines de l’année 2010. Un tableau de Buys-Ballot permet de présenter les données très simplement (source Awstats).

tableau pour ANOVA

Le graphe montre un mouvement hebdomadaire avec notamment une faible consultation les samedis. Il indique aussi une progression assez sensible, à peine freinée par les vacances de Pâques. C’est la réalité de ces deux phénomènes qu’on va tester. Bien qu’un schéma multiplicatif semble plus adapté, nous testerons successivement la « saisonnalité » et le trend.

graphe

Préalablement aux ANOVA, procédons aux tests de Levene pour valider l’homoscédasticité. En des termes moins savants, nous vérifions si la dispersion est à peu près stable au sein d’une même semaine et d’une semaine à l’autre. Rappelons en effet que c’est une condition de validité du test, bien qu’il soit fréquent de faire l’impasse dessus (NB : par manque de place, je ne procède pas aux tests de normalité, c’est pourquoi j’ai privilégié le test de Levene à celui de Barlett, trop sensible aux distributions non normales).

Nous utiliserons simultanément deux logiciels : Statgraphics Centurion (version anglaise) et Tanagra. Ils réclament tous deux des données entrées en liste et non sous forme de tableau.

Sur Statgraphics, le test est obtenu en option avec One-Way ANOVA (Variance Check).

Lorsque le facteur est le jour de la semaine :

test de Levene

La p-value étant supérieure au seuil habituel de 0,05, on ne rejette pas l’hypothèse d’égalité des variances. Tanagra ne donne pas tout à fait la même valeur mais heureusement la conclusion n’est pas remise en cause.

test de Levene (Tanagra)

Même décision lorsque le facteur est le numéro de la semaine :

test de Levene

Parfait, nous pouvons lancer les ANOVA…

Lorsque le facteur est le jour de la semaine, le tableau de l’ANOVA apparaît ainsi sur Tanagra (cette fois-ci, les chiffres sont rigoureusement les mêmes sur Statgraphics) :

tableau Tanagra

La p-value étant nulle, on peut être certain qu’il y a bien une « saisonnalité » hebdomadaire ! On rejette l’hypothèse selon laquelle les moyennes observées pour chaque jour de la semaine sont les mêmes. Il faut dire qu’avec des visites deux fois plus nombreuses le mercredi que le samedi, ça n’a rien d’étonnant…

Seconde ANOVA. Si elle montre que les moyennes diffèrent selon le numéro de la semaine, on peut affirmer que la tendance à la hausse observée sur le graphique est bien réelle.

tableau Statgraphics

Ouf ! Il y a bien de plus en plus de visiteurs sur mon site. Merci à tous.

 

ANOVA chrono

plus de livres (France)    plus de livres (Canada)