La moyenne arithmétique

Moyenne et espérance mathématique

Calculer une moyenne arithmétique n’est pas le challenge le plus coriace auquel un statisticien doit faire face.

Bien qu’il existe d’autres moyennes, réservées à des usages particuliers, c’est elle qui est utilisée dans la quasi-totalité des cas lorsqu’on décrit une distribution à une variable.

 

Moyenne pondérée

Si toutes les observations sont identiquement pondérées, cette moyenne s'obtient par la somme des valeurs observées divisée par l’effectif. Facile. Si elles ont des poids différents, c’est le produit de chaque poids par la valeur correspondante, divisé par le poids total (voir les pages série statistique, exercice d'initiation aux statistiques et exercice avec moyenne...). Facile aussi. Attention, si au collège on oppose la moyenne arithmétique (même poids pour toutes les observations) à la moyenne pondérée, il ne s'agit que d'un raccourci de langage trompeur.

\(\displaystyle{m = \frac{1}{n} \sum_{i=1}^n x_i}\)

La moyenne est un indicateur de position centrale, c’est-à-dire qu’elle définit, avec la médiane, le « milieu » d’une distribution. C'est aussi un centre de gravité.

Cet indicateur a la propriété d’être linéaire : si une distribution \(A\) de moyenne \(a\) est combinaison linéaire d’une distribution \(B\) de moyenne \(b,\)  \(a\) est également combinaison linéaire de \(b.\) Exemple simple : \(A = \{2\,; 4\}\) avec \(a = 3\) et \(B = \{10\,; 20\}\) avec \(b = 15.\) Comme \(B = 5\times A,\) alors \(b = 5a.\)

La moyenne a le défaut de ne pas être robuste : l’ajout de quelques valeurs aberrantes peut la modifier sensiblement. C’est pourquoi elle ne signifie parfois rien du tout (exemple caricatural : montant moyen des impôts payés par les habitants d'une commune alors que l'un d'eux est milliardaire). Quelquefois, on utilise la moyenne tronquée qui exclut les deux valeurs extrêmes.

Par ailleurs, on peut être amené à calculer une moyenne à partir d’un tableau déjà construit qui présente des fourchettes de valeurs. C’est alors pour chaque classe la moyenne entre les deux bornes que, par convention, on utilise pour le calcul (qui est donc une moyenne de moyennes).

L’exemple suivant cumule ces deux écueils : une moyenne pondérée obtenue à partir des centres de classes d’un tableau déjà travaillé se révèle peu fiable.

exemple de moyenne

 

Valeur moyenne d’une fonction continue

Nous avons survolé deux notions de moyennes, toutes deux applicables à un nombre fini d’observations. Mais cette notion s'étend aussi à un continuum. La formule permettant de calculer la valeur moyenne d’une fonction continue généralise la formule de la moyenne arithmétique pondérée en utilisant l’intégration :

\(\displaystyle{m = \frac{1}{b-a} \times \int_a^b f(x)dx}\)

Exemple emprunté à la session 2007 du bac ES (Pondichéry) :

    Un bénéfice, en milliers d’euros, que réalise une entreprise lorsqu’elle fabrique \(x\) milliers de pièces est égal à :
    \(f(x) = 5 \frac{\ln x}{x} + 3\)
    Déterminer la valeur moyenne du bénéfice lorsque la production varie de 2 000 à 4 000 pièces.

chaîne de montage

On peut résoudre ce problème directement mais les candidats bénéficiaient de plusieurs résultats issus des questions précédentes. Voyons à quoi ressemble le tableau de variation :

tableau de variations

Rappelons que le nombre \(e\) est justement compris entre 2 et 4, bornes de l'intervalle.

D’ailleurs, \(f(2) = f(4) \approx 4,733.\) Le maximum se situe à \(\frac{5}{e} + 3 \approx 4,839.\) On sait déjà que le bénéfice se trouvera quelque part entre 4 733 et 4 839 €.

Le calcul d’une primitive conduit à \(F(x)\) \(=\) \(\frac{5}{2} (\ln x)^2 + 3x.\) L’intégrale entre 2 et 4 s’établit à \(\frac{15}{2}(\ln 2)^2 + 6,\) soit 9,603 environ. La moyenne est donc égale à ce nombre multiplié par \(\frac{1}{4 - 2},\) soit 0,5. Le bénéfice moyen s'établit à 4 802 €. Youpi (voir aussi les exercices sur fonction exponentielle).

 

Moyenne empirique

Une moyenne calculée sur un échantillon sert d'estimateur de la moyenne inconnue de toute la population. On la nomme moyenne empirique ou observée.

 

Espérance mathématique

Indicateur de base des statistiques descriptives, la moyenne s'adapte facilement au contexte probabiliste. Les valeurs prises par une variable aléatoire \(X\) observées sur un échantillon sont alors pondérées par des probabilités d’être observées sur une population. Cette moyenne « espérée » est appelée espérance mathématique. Elle est notée \(E(X).\)

Note : on ne retrouve pas cette distinction de vocabulaire avec la variance

Si la loi de probabilité est discrète et que \(n\) réalisations sont possibles, l'espérance est formalisée ainsi...

\(\displaystyle{E(X) = \sum_{i=1}^n {p_ix_i}}\)

Un ensemble de réalisations infini implique un calcul de limite...

\(\displaystyle{E(X) = \mathop {\lim }\limits_{n \to + \infty } \sum_{i=1}^n {p_ix_i}}\)

En cas de loi de probabilité continue, l'espérance est déterminée par une intégrale généralisée. Soit \(f\) la fonction de densité...

\(\displaystyle{E(X) = \int_{- \infty}^{+ \infty} {xf(x)} dx}\)

Lorsque l'intégrale diverge, il n'y a hélas aucune espérance...

Voir aussi les moments.

 

moyenne