La régression linéaire simple sur Excel et sur calculatrice
Une régression linéaire simple, évidemment disponible sur n’importe quel logiciel de statistiques, est réalisable sur tous les tableurs. Prenons l’exemple théorique de l’hôtel club « Variance bleue » dont le directeur étudie la relation entre le nombre de transats mis à la disposition de ses clients et les recettes du bar (celui qui est en face de la piscine, où le mojito est super réussi…). Toute ressemblance avec un paramètre de régression existant ou ayant existé est purement fortuit.
Excel sans l’utilitaire d’analyse Sélectionnez une plage de deux colonnes et cinq lignes puis tapez =DROITEREG(C2:C16;B2:B16;;VRAI), du moins si la case « date » se trouve ligne 1 col 1 du tableur. Attention, comme les résultats apparaissent dans une plage de cellules, il ne faut pas taper sur « entrée » mais sur « Ctrl+Maj+Entrée ». Le « VRAI » à la fin de la formule signifie que vous voulez d’autres statistiques que l’équation de la droite (si vous n’en voulez pas, ne sélectionnez qu’une plage de deux cellules). Informations sur les estimateurs :
Le graphique est un nuage de points auquel on va « ajouter une courbe de tendance » puis sélectionner « linéaire » en cochant « afficher l’équation sur le graphique » et « afficher le coefficient de détermination ». Vous avez donc déjà compris à quoi correspondent certains chiffres ci-dessus puisque vous les retrouvez sur le graphique. Quant aux autres : 1,0905 est l’écart-type du coefficient de régression et 22,2343 est l’écart-type de la constante. 11,6644 est l'erreur-type (RMSE). 166,4489 est la valeur du F (ce n’est pas ce qu’il y a de plus utile pour une régression simple), 13 est le nombre de degrés de liberté (15 – 1 – 1). Le nombre 22 646 représente la somme des carrés (pas non plus d’une grande utilité) et 1 768,77 est la somme des carrés des résidus.
Graphiquement, on détecte où sont ces fameux résidus. Ce sont les distances verticales qui séparent points et droite. Sur cet exemple, on remarque que la corrélation est très bonne. Peut-être faudrait-il ajouter une variable météorologique pour expliquer quelques petits écarts. Nous serions alors dans le cadre d’une régression linéaire multiple. D’ores et déjà, on peut avec confiance ajouter des transats au bord de la piscine. Utilitaire d’analyse Si l’utilitaire d’analyse d’Excel est chargé, les résultats sont un peu plus complets.
Le premier coefficient est r, le deuxième est R² et le troisième est le R² ajusté.
Les résidus doivent être normalement distribués et non structurés. Dans le cas contraire, le modèle peut être amélioré (régression non linéaire, par exemple). TI-82 STATS (version anglaise) Pour entrer les deux séries de valeurs dans la calculatrice, utilisez la touche STAT puis EDIT dans le menu. Le déplacement s'effectue avec les touches directionnelles. L1 correspond aux transats et L2 à la recette (une photo de saisie se trouve en page régression quadratique). Une fois la saisie terminée, il faut taper à nouveau sur la touche STAT mais cette fois-ci on s'aventure dans le menu CALC. Le choix n° 4 LinReg(ax+b) permet d'obtenir les paramètres de la droite, soit 14,07 et 16,92.
|







