Calculs de probabilités conditionnelles
Cette page a été rédigée à l’attention des élèves de premières technologiques. Si vous êtes en filière générale, dirigez-vous plutôt en page de conditionnement.
Les probabilités conditionnelles sont d’une importance majeure dans de nombreux domaines. Elles sont même au cœur de l’intelligence artificielle. Ici, nous ne ferons que survoler une initiation.
Ainsi, vous apprendrez comment les calculer, d’une part à partir d'un tableau et d’autre part avec une formule. Enfin, nous survolerons rapidement le vocabulaire des tests diagnostiques.
Probabilités conditionnelles
On cherche une probabilité qui remplit… une condition ! Dans un énoncé on rencontre souvent l’expression « sachant que… ».
On peut par exemple estimer la probabilité qu’un individu vivra centenaire, grâce à des statistiques établies sur la population actuelle. Toutefois, cette probabilité sera plus exacte si l’on connaît certaines informations sur cet individu. Notamment, sa probabilité de vivre centenaire n’est pas du tout la même s’il est fumeur ou non. Parfois, la condition n’implique rien du tout mais dans ce cas, la probabilité que tel individu devienne centenaire « sachant que » c’est un fumeur est plus faible que s’il ne l’est pas.
Tableaux
Prenons le tableau de l’exemple sur les fréquences conditionnelles.
Un musée de véhicules anciens possède 80 voitures : des françaises, des italiennes, des allemandes, des britanniques et des américaines. Certaines sont des voitures de sport et d’autres non. Leurs effectifs figurent dans le tableau ci-dessous.
France | Italie | Allem. | R.U | USA | Total | |
Sport | 10 | 18 | 9 | 8 | 0 | 45 |
Non sport | 9 | 6 | 10 | 8 | 2 | 35 |
Total | 19 | 24 | 19 | 16 | 2 | 80 |
On souhaite photographier une voiture au hasard. Quelle est la probabilité que ce soit une voiture américaine non sportive ?
Il suffit de se reporter au tableau des fréquences. Le calcul est le même (nombre de voitures américaines non sportives divisé par le total), seule la problématique change.
France | Italie | Allem. | R.U | USA | Total | |
Sport | 0,125 | 0,225 | 0,1125 | 0,1 | 0 | 0,5625 |
Non sport | 0,1125 | 0,075 | 0,125 | 0,1 | 0,025 | 0,4375 |
Total | 0,2375 | 0,3 | 0,2375 | 0,2 | 0,025 | 1 |
Soit \(U\) l’évènement « la voiture photographiée est américaine » et \(N\) l’évènement « la voiture photographiée est non sportive ». Nous avons \(P(U ∩ N) = 0,025.\)
Supposons à présent que le musée possède deux salles : une pour les sportives et une pour les autres. Nous nous trouvons dans la salle des non sportives. Quelle est la probabilité que la voiture photographiée soit non sportive et américaine ?
Ici, la probabilité n’est plus la même puisque nous avons une information supplémentaire. Nous n’avons besoin que des effectifs de voitures non sportives.
Non sport | 9 | 6 | 10 | 8 | 2 | 35 |
Pour indiquer que nous connaissons cette information, on l’écrit en indice. \(P_{N}(U ∩ N)\) signifie que nous cherchons la probabilité que la voiture soit non sportive et américaine « sachant que » elle est non sportive.
\(P_{N}(U ∩ N) = \frac{2}{35} ≈ 0,057\)
Formule
La formule est très simple. C’est celle que nous venons d’utiliser, à la différence que l’on ne retient pas les effectifs mais les probabilités.
\[P_B(A) = \frac{P(A ∩ B)}{P(B)}\]
En langage parlé : P de A sachant B égal P de A inter B sur P de B.
Reprenons notre exemple. Nous avons vu que \(P(U ∩ N) = 0,025.\) D’après le tableau des fréquences (que l’on peut considérer, rappelons-le, comme un tableau de probabilités), \(P(N) = 0,4375.\)
La probabilité de photographier une voiture non sportive américaine sachant que la photo a été prise dans la salle des non-sportives s’établit à \(P_N(N ∩ U)) = \frac{P(N ∩ U)}{P(N)}\) \(= \frac{0,025}{0,4375}\) \(≈ 0,057.\) On retrouve évidemment le même résultat qu’avec l’emploi des effectifs.
Tests diagnostiques
On teste si un patient est atteint d’une maladie déterminée. Si le patient n’est pas malade mais que le test est positif, on l’appelle faux positif. Si le test est négatif bien que le patient soit malade, on parle de faux négatif.
La sensibilité du test est sa probabilité d’être positif sachant que le patient est malade.
La spécificité du test est sa probabilité d’être négatif sachant que le patient n’est pas malade.
Test positif | Test négatif | |
Malade | Sensibilité | Faux négatif |
Non malade | Faux positif | Spécificité |
Une application se trouve en page d'exercices sur les probabilités conditionnelles.
Précisons que ces tests ne s'appliquent pas qu'au domaine médical. Soit par exemple un algorithme qui détecte automatiquement si des mouvements bancaires sont frauduleux. C'est l'une des très nombreuses applications du machine learning (un domaine de l'intelligence artificielle). Il faudra préciser, lors de l'élaboration de l'algorithme, si un faux négatif (test négatif alors que le mouvement est frauduleux) est plus grave qu'un faux positif (test positif alors que le mouvement n'a rien de frauduleux). Autre exemple, on teste une voiture autonome. Si elle s'arrête alors qu'il n'y a pas lieu, c'est un faux positif. Si elle écrase quelqu'un, c'est un faux négatif.