Les tests de saisonnalité et de tendance

ANOVA sur séries chronologiques

Avant de se lancer tête baissée dans une désaisonnalisation, il faut peut-être se demander si celle-ci est vraiment nécessaire. Idem avant de convenir ou non qu’il existe une tendance. Donc, en amont de l’analyse d’une série chronologique, nous allons procéder à deux tests probatoires.

 

Problématique

Pour illustrer la technique à mettre en place, nous nous appuyerons sur l'exemple d'une série de données réelles, en l'occurrence le nombre de visites quotidiennes du site que vous êtes en train de consulter, jybaudot.fr, sur les dix-huit premières semaines de l’année 2010.

Si l’on détecte un modèle additif, on peut procéder à deux ANOVA à un facteur, l’une pour la saisonnalité et l’autre pour la tendance. En d’autres termes, on teste l’égalité du nombre moyen de visites selon le jour de la semaine (saisonnalité ?) et la moyenne selon les semaines (tendance ?). Un modèle multiplicatif, donc avec une interaction entre deux phénomènes, appelle plutôt une seule ANOVA mais à deux facteurs.  Cette dernière peut être envisagée de toute façon, bien que l’exemple qui suit ne la privilégie pas…

Un tableau de Buys-Ballot permet de présenter les données très simplement (source Awstats).

tableau pour ANOVA

Le graphe montre un mouvement hebdomadaire (les creux correspondent aux samedis). Il indique aussi une progression assez sensible, à peine freinée par par une période de vacances. C’est la réalité de ces deux phénomènes qui doit être testée. Bien qu’un schéma multiplicatif semble plus adapté, nous testerons successivement, donc de façon indépendante, la « saisonnalité » et le trend.

graphe

 

Analyse

Préalablement aux ANOVA, procédons aux tests de Levene pour valider l’homoscédasticité. En des termes moins savants, vérifions si la dispersion est à peu près stable au sein d’une même semaine et d’une semaine à l’autre. Rappelons en effet que c’est une condition de validité du test, bien qu’il soit fréquent de faire l’impasse dessus (Note : par manque de place, nous ne procédons pas aux tests de normalité, c’est pourquoi le test de Levene a été privilégié à celui de Barlett, trop sensible aux distributions non normales).

pévisionniste

Nous utiliserons deux logiciels : Statgraphics Centurion (version anglaise) et Tanagra. Ils réclament tous deux des données entrées en liste et non sous forme de tableau.

Sur Statgraphics, le test est obtenu en option avec One-Way ANOVA (Variance Check).

Lorsque le facteur est le jour de la semaine :

test de Levene

La p-value étant supérieure au seuil habituel de 0,05, on ne rejette pas l’hypothèse d’égalité des variances. Tanagra ne donne pas tout à fait la même valeur mais heureusement la conclusion n’est pas remise en cause.

test de Levene (Tanagra)

Même décision lorsque le facteur est le numéro de la semaine :

test de Levene

Parfait, nous pouvons lancer les ANOVA…

Lorsque le facteur est le jour de la semaine, le tableau de l’ANOVA apparaît ainsi sur Tanagra (cette fois-ci, les chiffres sont rigoureusement les mêmes sur Statgraphics) :

tableau Tanagra

La p-value étant nulle, on peut être certain qu’il y a bien une « saisonnalité » hebdomadaire ! On rejette l’hypothèse selon laquelle les moyennes observées pour chaque jour de la semaine sont les mêmes. Il faut dire qu’avec des visites deux fois plus nombreuses le mercredi que le samedi, ça n’a rien d’étonnant…

Seconde ANOVA. Si elle montre que les moyennes diffèrent selon le numéro de la semaine, on peut affirmer que la tendance à la hausse observée sur le graphique est bien réelle.

tableau Statgraphics

Ouf ! Il y a bien de plus en plus de visiteurs sur ce site. Merci à tous.

 

ANOVA chrono