Phénomènes aléatoires
Introduction :
Nous avons abordé, dans le cours précédent, l’étude de séries statistiques à deux variables, en disant notamment que l’on peut en recenser les résultats dans un tableau croisé d’effectifs. Dans ce cours, nous allons voir comment, à partir d’un tel tableau, calculer des fréquences, dites marginales et conditionnelles.
Cela nous permettra, dans une seconde partie, d’approfondir la notion de probabilité, avec les probabilités conditionnelles et l’indépendance de deux événements.
Fréquences marginales et conditionnelles
Fréquences marginales et conditionnelles
La fréquence d’un caractère dans une population est égale au quotient du nombre d’individus possédant ce caractère, sur l’effectif total.
On reprend l’exemple du cours précédent, où une société s’intéresse au lien entre distance domicile-travail et moyen de transport. Nous avons alors le tableau croisé d’effectifs suivant :
Tableau croisé d’effectifs
Fréquence marginale
Fréquence marginale
On peut s’intéresser à la fréquence $f_1$ des salariés venant en transport en commun :
$$f_1=\dfrac {40}{275}=\dfrac 8{55}\approx 0,1455$$
- Cette fréquence est appelée fréquence marginale des salariés venant en transport en commun : on se sert des effectifs totaux qui sont « en marge » du tableau.
Fréquence marginale :
Dans un tableau croisé d’effectifs, la fréquence marginale est égale au quotient de la somme des effectifs d’une ligne ou d’une colonne, sur l’effectif total.
Prenons un autre exemple : la fréquence marginale $f_2$ des salariés habitant à une distance comprise entre $2$ et $5\ \text{km}$ est :
$$f_2=\dfrac {53}{275}\approx 0,1927$$
Fréquence conditionnelle
Fréquence conditionnelle
On s’intéresse maintenant à la fréquence $f_3$ des salariés qui viennent à pied parmi ceux qui habitent à moins de $2\ \text{km}$. Parmi les $43$ salariés qui vivent à $2\ \text{km}$ ou moins, $12$ viennent à pied, donc :
$$f_3=\dfrac {12}{43}\approx 0,2791$$
- Cette fréquence est appelée fréquence conditionnelle des salariés venant à pied parmi ceux qui habitent à moins de $2\ \text{km}$ : on donne comme « condition » une distance domicile-travail inférieure ou égale à $2\ \text{km}$.
Fréquence conditionnelle :
La fréquence conditionnelle de $\text{A}$ parmi $\text{B}$ est la fréquence du caractère $\text{A}$ dans la sous-population d’individus qui vérifient le caractère $\text{B}$.
Prenons là aussi un autre exemple : la fréquence conditionnelle $f_4$ des salariés habitant à plus de $5\ \text{km}$ parmi ceux qui viennent en voiture, vaut :
$$f_4=\dfrac {132}{175}\approx 0,7543$$
Probabilités conditionnelles
Probabilités conditionnelles
On s’intéresse de nouveau à la population des salariés de l’entreprise, où l’on choisit au hasard un salarié.
Tableau croisé d’effectifs
On note :
- $\text{M}$ l’événement « La personne vient à pied » ;
- $\text{D}$ l’événement « La personne habite à moins de $2\ \text{km}$ ».
Des fréquences aux probabilités
Des fréquences aux probabilités
Lorsqu’on effectue un tirage aléatoire parmi une population finie, on peut assimiler les fréquences à des probabilités. En considérant que toutes les personnes ont la même chance d’être choisies (situation d’équiprobabilité), on a alors les probabilités suivantes :
- la probabilité $\text{P}(\text{M})$ que la personne choisie vienne à pied correspond à la fréquence (marginale) des salariés qui viennent à pied :
$$\text{P}(\text{M})=\dfrac {17}{275}\approx 0,0618$$ - de la même façon, la probabilité $\text{P}(\text{D})$ que la personne choisie habite à moins de $2\ \text{km}$ correspond à la fréquence (marginale) des personnes habitant à moins de $2\ \text{km}$ :
$$\text{P}(\text{D})=\dfrac {43}{275}\approx 0,1564$$ - et la probabilité que la personne choisie vienne à pied et habite à moins de $2\ \text{km}$ est $\text{P}(\text{M}\cap \text{D})$ :
$$\text{P}(\text{M}\cap \text{D})=\dfrac {12}{275}\approx 0,0436$$
Probabilité conditionnelle
Probabilité conditionnelle
Probabilité conditionnelle :
On considère deux événements $\text{A}$ et $\text{B}$ d’un même univers $\Omega$, avec $\text{A}$ de probabilité non nulle.
La probabilité (conditionnelle) de l’événement $\text{B}$ sachant que l’événement $\text{A}$ est réalisé, notée $\text{P}_\text{A}(\text{B})$, est :
$$\text{P}_\text{A}(\text{B})=\dfrac {\text{P}(\text{A}\cap \text{B})}{\text{P}(\text{A})}$$
En reprenant les événements et les résultats de la partie 2.a, la probabilité que la personne choisie vienne à pied sachant qu’elle habite à moins de $2\ \text{km}$ est $\text{P}_{\text{D}}(\text{M})$, et elle vaut :
$$\begin{aligned} \text{P}_{\text{D}}(\text{M})&=\dfrac {\text{P}(\text{M}\cap \text{D})}{\text{P}(\text{D})} \\ &=\dfrac {\frac {12}{275}}{\frac{43}{275}} \\ &=\dfrac{\pink{12}}{\green{43}} \\ &\approx 0,2791 \end{aligned}$$
Remarque :
Cette probabilité conditionnelle correspond à la fréquence conditionnelle des salariés qui viennent à pied ($\pink{12}$) parmi ceux qui habitent à moins de $2\ \text{km}$ ($\green{43}$), que l’on a calculée dans la partie 1.b.
- De manière générale, en situation d’équiprobabilité, on a :
$$\text{P}_\text{A}(\text{B})=\dfrac {\pink{\text{nombre d’éléments de A$\cap$B}}}{\green{\text{nombre d’éléments de A}}}$$
Pour autre exemple, la probabilité que la personne habite à moins de $2\ \text{km}$ sachant qu’elle vient à pied est $\text{P}_{\text{M}}(\text{D})$ et vaut :
$$\begin{aligned} \text{P}_{\text{M}}(\text{D})&=\dfrac {\text{P}(\text{M}\cap \text{D})}{\text{P}(\text{M})} \\ &=\dfrac {\frac {12}{275}}{\frac{17}{275}} \\ &=\dfrac{12}{17} \\ &\approx 0,7059 \end{aligned}$$
Arbre de probabilités
Arbre de probabilités
Arbre de probabilités :
Lorsqu’on étudie différents événements d’une expérience aléatoire, il est souvent utile d’utiliser un arbre de probabilités : il s’agit d’un arbre des possibles, qu’on a utilisé en seconde notamment pour dénombrer les issues, sur les branches duquel on précise les probabilités.
Remarque :
On parle aussi d’arbre pondéré, car on affecte à chaque branche un poids : la probabilité correspondante.
On considère maintenant une expérience aléatoire d’univers $\Omega$, et deux événements $\text{A}$ et $\text{B}$ de $\Omega$, avec $\overline \text{A}$ et $\overline \text{B}$ leurs événements contraires respectifs.
Pour représenter la situation, on construit un arbre de probabilités à deux niveaux :
- sur les branches du premier niveau, on inscrit les probabilités de $\text{A}$ et $\overline \text{A}$ ;
- sur les branches du deuxième niveau, on inscrit les probabilités conditionnelles de $\text{B}$ et $\overline \text{B}$ sachant $\text{A}$, puis celles $\text{B}$ et $\overline \text{B}$ sachant $\overline \text{A}$.
- On obtient ainsi :
Arbre de probabilités (image temporaire)
On retiendra aussi le vocabulaire suivant :
- les événements $\text{A}$, $\overline \text{A}$, $\text{B}$ et $\overline \text{B}$ sont appelés nœuds de l’arbre ;
- un chemin est une suite de branches.
- La somme des probabilités issues d’un même nœud est égale à $1$. Par exemple :
$$\text{P}(\text{A})+\text{P}(\overline \text{A})=1\qquad\qquad \text{P}_{\overline \text{A}}(\text{B})+\text{P}_{\overline \text{A}}(\overline \text{B})=1$$ - La probabilité de l’événement correspondant à un chemin est égale au produit des probabilités des branches composant ce chemin. Par exemple :
$$\text{P}(\text{A}\cap \overline \text{B})=\text{P}(\text{A})\times \text{P}_\text{A}(\overline \text B)$$ - La probabilité d’un événement est égale à la somme des probabilités correspondant aux chemins qui y mènent. Par exemple :
$$\begin{aligned} \text{P}(\overline \text{B})&=\text{P}(\text{A}\cap \overline \text{B})+\text{P}(\overline \text{A}\cap \overline \text{B}) \\ &=\text{P}(\text{A})\times \text{P}_\text{A}(\overline \text{B})+\text{P}(\overline \text{A})\times \text{P}_{\overline \text{A}}(\overline \text{B}) \end{aligned}$$
On a interrogé un groupe de personnes pour connaître leurs habitudes « écologiques ». Pour cela, on leur a demandé s’ils compostent leurs biodéchets (déchets organiques) et s’ils achètent régulièrement « en vrac ».
On choisit au hasard une personne de ce groupe, et on note :
- $\text{C}$ l’événement « La personne choisie composte ses biodéchets » ;
- $\text{V}$ l’événement « La personne choisie achète régulièrement “en vrac” ».
- On donne ci-dessous l’arbre de probabilités représentant la situation, après étude des réponses données lors de l’enquête :
Arbre de probabilités (image temporaire)
De cet arbre, on peut déduire, par exemple, les informations suivantes.
- La probabilité que la personne choisie composte ses biodéchets vaut :
$$\text{P}(\text{C})=0,44$$ - La probabilité que la personne choisie achète « en vrac » sachant qu’elle composte ses biodéchets vaut :
$$\text{P}_\text{C}(\text{V})=0,61$$ - La probabilité que la personne choisie n’achète pas « en vrac » sachant qu’elle ne composte pas ses biodéchets vaut :
$$\text{P}_{\overline \text{C}}(\overline \text{V})=0,78$$ - La probabilité que la personne choisie composte ses biodéchets et achète « en vrac » vaut :
$$\begin{aligned} \text{P}(\text{C}\cap \text{V})&=\text{P}(\text{C})\times \text{P}_\text{C}(\text{V}) \\ &=0,44\times 0,61 \\ &=0,2684 \end{aligned}$$ - La probabilité que la personne choisie achète « en vrac » vaut :
$$\begin{aligned} \text{P}(\text{V})&=\text{P}(\text{C}\cap \text{V})+\text{P}(\overline \text{C}\cap \text{V}) \\ &=\text{P}(\text{C})\times \text{P}_\text{C}(\text{V})+\text{P}(\overline \text{C})\times \text{P}_{\overline \text{C}}(\text{V}) \\ &=0,44\times 0,61+0,56\times 0,22 \\ &=0,3916 \end{aligned}$$
Remarque :
En se servant des résultats 4 et 5 ci-dessus, on peut aussi déterminer la probabilité que la personne choisie composte ses biodéchets sachant qu’elle achète « en vrac ». En effet :
$$\begin{aligned}
\text{P}_\text{V}(\text{C})&=\dfrac {\text{P}(\text{C}\cap \text{V})}{\text{P}(\text{V})} \\
&=\dfrac {0,2684}{0,3916} \\
&\approx 0,6854
\end{aligned}$$
Notion d’indépendance
Notion d’indépendance
Événements indépendants
Événements indépendants
Événements indépendants :
On considère deux événements $\text{A}$ et $\text{B}$ d’un même univers $\Omega$, avec $\text{A}$ de probabilité non nulle.
Les événements $\text{A}$ et $\text{B}$ sont dits indépendants lorsque la probabilité conditionnelle de $\text{B}$ sachant $\text{A}$ est égale à la probabilité de $\text{B}$ :
$$\text{P}_\text{A}(\text{B})=\text{P}(\text{B})$$
Remarques :
Cela signifie que la réalisation ou non de l’événement $\text{A}$ n’influe pas sur la réalisation de $\text{B}$.
- Deux événements $\text{A}$ et $\text{B}$ sont indépendants si et seulement si :
$$\text{P}(\text{A}\cap \text{B})=\text{P}(\text{A})\times \text{P}(\text{B})$$ - Si $\text{A}$ et $\text{B}$ sont indépendants, alors les couples d’événements suivants sont indépendants :
- $\text{A}$ et $\overline \text{B}$ ;
- $\overline \text{A}$ et $\text{B}$ ;
- $\overline \text{A}$ et $\overline \text{B}$.
Dans l’exemple précédent, de la partie 2.c, on avait les résultats suivants :
$$\text{P}_\text{C}(\text{V})=0,61 \qquad\qquad \text{P}(\text{V})=0,3916$$
Ainsi, la probabilité que la personne choisie achète en vrac sachant qu’elle composte ses biodéchets est différente de la probabilité qu’elle achète en vrac :
$$\text{P}_\text{C}(\text{V})\neq \text{P}(\text{V})$$
- Les événements $\text{C}$ et $\text{V}$ ne sont donc pas indépendants.
On peut le comprendre de la manière suivante : une personne qui composte ses biodéchets témoigne déjà de son attention à l’environnement, elle aura donc tendance à en faire encore davantage en achetant « en vrac » pour limiter ses ordures ménagères.
Succession d’épreuves indépendantes
Succession d’épreuves indépendantes
Succession d’épreuves indépendantes :
On considère une expérience aléatoire durant laquelle se succèdent différentes épreuves.
Ces épreuves sont dites indépendantes lorsque les résultats de l’une n’influent pas sur les résultats des autres.
Un sac opaque contient $4$ jetons indiscernables au toucher, numérotés de $1$ à $4$, et de deux couleurs différentes : $3$ rouges et $1$ vert.
On tire un jeton au hasard, on note son numéro, et on le remet. Puis on tire de nouveau un jeton, et on note cette fois sa couleur. Ce sont les deux épreuves successives de l’expérience aléatoire.
De plus, on remet le jeton après le premier tirage, donc son résultat n’influe pas sur le second tirage. Les deux épreuves sont donc indépendantes.
On note :
- $\text{N}_1$ l’événement « Obtenir $1$ au premier tirage », $\text{N}_2$ « Obtenir $2$ au premier tirage », $\text{N}_3$ « Obtenir $3$ au premier tirage » et $\text{N}_4$ « Obtenir $4$ au premier tirage » ;
- $\text{R}$ l’événement « Obtenir un jeton rouge au deuxième tirage » et $\text{V}$ « Obtenir un jeton vert au deuxième tirage ».
Les issues de la première épreuve sont équiprobables, on a :
$$\text{P}(\text{N}_1) =\text{P}(\text{N}_2)= \text{P}(\text{N}_3)= \text{P}(\text{N}_4)=\dfrac 14=0,25$$
Pour la deuxième épreuve, on a, quel que soit le résultat de la première épreuve :
$$\text{P}(\text{R})=\dfrac 34=0,75\qquad\qquad \text{P}(\text{V})=\dfrac 14=0,25$$
On peut alors construire l’arbre de probabilités représentant l’expérience aléatoire :
Arbre de probabilités (image temporaire)
Comme les épreuves sont indépendantes, les événements $\text{N}_4$ et $\text{V}$, par exemple, sont indépendants. Et la probabilité d’obtenir $4$ au premier tirage et un jeton vert au deuxième vaut :
$$\begin{aligned}
\text{P}(\text{N}_4\cap \text{V})&=\text{P}(\text{N}_4)\times \text{P}(\text{V}) \\
&=0,25\times 0,25 \\
&=0,0625
\end{aligned}$$