Probabilités conditionnelles, profils lignes ou colonnes
Chères probas conditionnelles grâce auxquelles de nombreux bacheliers trouvent un point pas trop difficile à obtenir lors de l’épreuve de maths… Au-delà de cet indubitable attrait, les notions de probabilités et de fréquences conditionnelles sont un prérequis pour comprendre le mécanisme de plusieurs techniques statistiques de première importance, parmi lesquelles le test du khi² d’indépendance, l’analyse factorielle des correspondances (AFC) et d’une façon générale tout ce qui découle du théorème de Bayes. Le concept de probabilité conditionnelle est abordé en classe de terminale dans la plupart des filières. Il s’agit d’une probabilité « sachant que », c’est-à-dire qui vient derrière une autre probabilité qui, elle, est connue. La probabilité conditionnelle « s’oppose » ainsi à la probabilité indépendante où un premier événement probabilisé n’implique aucune connaissance quant à la probabilité d’un second. La probabilité que survienne un événement A (cause) sachant que B (conséquence) s’est réalisé s’écrit :
C’est donc la probabilité que A et B soient réalisés simultanément, rapportée à la probabilité que B soit réalisé. On rencontre aussi la notation suivante :
Ceci apparaît clairement dans un tableau ou dans un arbre de probabilités. Ainsi, pour connaître la réalisation de trois événements…
C'est la formule des probabilités composées appliquée à trois événements. Exemple. Quelle est la probabilité P(D ∩ U ∩ A) ?
On lit que P(D) = 0,25. On voit aussi que P(U / D) = 0,65. Donc P(U ∩ D) = 0,25 × 0,65 = 0,1625. Par ailleurs P(A / U ∩ D) = 0,1. Par conséquent, P(D ∩ U ∩ A) = 0,01625. Dès lors qu’il n’existe que deux événements, ils peuvent être représentés dans un tableau à double entrée. En pratique, celui-ci est établi à partir d’un tableau de contingence, c’est-à-dire où figurent les effectifs. Il est d’ailleurs plus pratique d’utiliser un tableau qu’un arbre, en particulier lorsque les issues sont nombreuses. Dans celui-ci apparaissent les intersections d’éventualités (qui ne sont habituellement pas indiquées dans un arbre) et les probabilités totales indiquées par les totaux des lignes et des colonnes. En revanche, les probabilités conditionnelles (aux mœurs arboricoles) n’apparaissent pas. À titre d’exemple, voici une même situation décrite par un arbre et par un tableau. Il s’agit de fréquences de réponses à une enquête traduites sous forme de probabilités.
Les seules valeurs qui apparaissent dans les deux présentations sont indiquées en rouge. Le tableau a l’avantage de permettre une comparaison facile avec une situation de parfaite indépendance (voir page test d’indépendance du khi²). Comment faire descendre les probabilités conditionnelles de leur arbre pour les présenter dans un tableau ? En modifiant celui-ci pour que chaque total de ligne ou de colonne soit égal à 1. Ainsi le tableau suivant présente-t-il les profils-lignes. En reproduisant les proportions du tableau de fréquences relatives ci-dessus, on obtient une somme de 1 pour chaque ligne (première cellule : 0,28 / 0,35 = 0,8). On retrouve à cette occasion nos chères probabilités conditionnelles qui figurent dans l’arbre.
De même, on établit facilement le tableau des profils-colonnes.
Les probabilités conditionnelles ainsi mises en lumière sont celles qui apparaîtraient si l’arbre était présenté à l’envers (d’abord oui / non / NS et ensuite homme / femme / enfant). Lorsqu’on ne se situe pas dans une problématique probabiliste mais descriptive, on parle de fréquences. Aucune différence quant aux calculs… Les totaux sont alors les fréquences marginales. Le principe de l’AFC consiste à comparer le tableau des profils-lignes et celui des profils-colonnes.
|









