Probabilités

I – Vocabulaire

Définitions : Univers d'une expérience aléatoire
  • Une expérience est dite aléatoire lorsqu’elle a plusieurs issues (ou résultats) possibles et que l’on ne peut ni prévoir, ni calculer laquelle de ces issues sera réalisée.
  • L’ensemble \Omega = \{ x_1, x_2, \dots, x_n\} des issues possibles est appelé l’univers de cette expérience aléatoire.
Définitions : Évènements d'un univers
  • Un évènement A est un sous-ensemble (ou une partie) de l’univers \Omega d’une expérience aléatoire. On note A \subset \Omega (lire : A inclus dans \Omega).
  • Dire qu’une issue x_i de \Omega réalise l’évènement A signifie que x_i est un élément de A. On note x_i \in A (lire : x_i appartient à A).
Définitions : Évènements particuliers
  • Le sous-ensemble \{x_i\} qui ne contient qu’une seule issue est appelé évènement élémentaire.
  • L’ensemble vide, noté \O, est appelé évènement impossible : aucune issue n’appartient à cet ensemble.
  • L’univers \Omega est l’évènement qui contient toutes les issues. Il est appelé évènement certain.
Définition : Évènement contraire
Soit A un évènement d’un univers \Omega. L’évènement contraire de l’évènement A est formé des issues ne réalisant pas A. On le note \overline{A}.
Définition : Intersection d'évènements
L’intersection des évènements A et B est l’évènement formé des issues réalisant à la fois A et B. On le note A \cap B et on lit : A inter B.
Définition : Réunion d'évènements
La réunion des évènements A et B est l’évènement formé des issues réalisant au moins l’un des évènements A ou B. On le note A \cup B et on lit : A union B.

II – Probabilités sur un ensemble fini

Expérience

On lance n fois un dé cubique dont les faces sont numérotées de 1 à 6. On observe la fréquence f_n d’apparition de l’évènement « obtenir un 5 ». On place dans un repère orthonormé les points de coordonnées (n,f_n) pour des valeurs de n prise entre 1 et 1000. En reliant ces points on obtient la courbe bleue.

On observe expérimentalement que plus n augmente, plus la fréquence f_n se stabilise autour d’une valeur p représenté par la droite horizontale rouge et dont la valeur est \dfrac{1}{6}, environ 0,167. Cette valeur sera appelée « probabilité de l’évènement « obtenir un 5 ».

Dans le suite de ce chapitre, \Omega = \{ x_1, x_2, \dots, x_n\} désigne l’univers d’une expérience aléatoire.

Définition : Loi de probabilité
Définir une loi de probabilité sur \Omega, c’est associer à chaque issue x_i de \Omega, un nombre p_i, appelé probabilité de x_i tel que :

  • 0 \le p_i \le 1 pour tous les p_i
  • p_1 + p_2 + \dots + p_n = 1
Définition : Équiprobabilité
Lorsque, dans une expérience aléatoire, toutes les issues ont la même probabilité p de se réaliser, on dit qu’il y a équiprobabilité.

Propriété
En situation d’équiprobabilité sur un univers de n issues, chaque issue a une probabilité de se réaliser p = \dfrac{1}{n} 

Démonstration : on sait que la somme des probabilités de toutes les issues d’une expérience aléatoire est égale à 1. Puisqu’il y a équiprobabilité, toutes les issues ont la même probabilité p donc :

    \[ \underbrace{p + p + \cdots + p}_{n \text{ fois}} = 1 \quad \text{soit} \quad n \imes p = 1 \quad \text{et} \quad p = \dfrac{1}{n} \]

Définition : Modélisation
Modéliser une expérience aléatoire d’univers \Omega, c’est choisir une loi de probabilité sur \Omega qui représente au mieux les chances de réalisation de chaque issue.

Le choix du modèle peut résulter :

  • d’hypothèses d’équiprobabilité : lancer d’une pièce ou d’un dé non pipé, tirer une boule au hasard dans une urne, …
  • de la réalisation de l’expérience aléatoire un grand nombre de fois. On observe alors que la fréquence de chaque issue se stabilise vers un nombre que l’on choisit pour probabilité de cette issue.

III – Calculs de probabilités

Dans le suite de ce chapitre, \Omega = \{ x_1, x_2, \dots, x_n\} désigne l’univers d’une expérience aléatoire.

Définition : probabilité d'un évènement
La probabilité d’un évènement A, notée P(A), est la somme des probabilités des issues réalisant A.

Conséquences

    \[ P(\O) = 0 \qquad \qquad P(\Omega) = 1 \qquad \qquad \text{Pour tout \'ev\`enement A,} \quad p \le P(A) \le 1 \]

Propriété
En situation d’équiprobabilité, la probabilité d’un évènement A est : \dfrac{\text{nombre d'issues de } A}{\text{nombre d'issues de } \Omega}

Démonstration : Supposons que \Omega ait n issues. La probabilité de chaque issue est \dfrac{1}{n}.
De plus, supposons que l’évènement A ait p issues. Alors

    \[ P(A) = \underbrace{ \dfrac{1}{n} + \dfrac{1}{n} + \cdots + \dfrac{1}{n}}_{p \text{ fois}} = \dfrac{p}{n} \]

Définition : évènements incompatibles
Deux évènements A et B sont incompatibles lorsqu’ils ne peuvent être réalisés tous les deux à la fois. C’est-à-dire que A \cap B = \O, autrement dit que ces deux évènements n’ont aucune issue en commun.

Conséquence
La probabilité de l’union de deux évènements incompatibles est la somme des probabilités de chaque évènement : P(A \cup B) = P(A) + P(B).

Propriété
Pour tous évènements A et B, P(A \cup B) = P(A) + P(B) - P(A \cap B)

Interprétation : A et B peuvent avoir des issues communes. Lorsqu’on écrit les issues de A et, à la suite, celles de B, on écrit deux fois les issues qui sont communes à A et B (c’est-à-dire les issues de A \cap B). C’est pour cela que l’on doit soustraire une fois la probabilité de A \cap B.

Démonstration : Soit A_1, l’évènement formé des issues de A qui ne sont pas dans B.
Alors A_1 et A \cap B sont incompatibles.
Or A = A_1 \cup (A \cap B) donc P(A) = P(A_1) + P(A \cap B).
Ce qui donne P(A_1) = P(A) - P(A \cap B).

Par ailleurs A_1 et B sont incompatibles.
Or A_1 \cup B = A \cup B donc P(A \cup B) = P(A_1) + P(B) = P(A) - P(A \cap B) + P(B)

Finalement : P(A \cup B) = P(A) + P(B) - P(A \cap B).

Propriété
Pour tout évènement A, \quad P(A) + P(\overline{A}) = 1

Démonstration : Par définition A et \overline{A} sont des évènements incompatibles et A \cup \overline{A} = \Omega. Donc P(A) + P(\overline{A}) = P(A \cup \overline{A}) = P(E) = 1.

IV – Arbre des probabilités

Un arbre des probabilité permet de décrire graphiquement une expérience aléatoire puis de calculer des probabilités d’évènements liés à cette expérience.

Exemple : on lance deux fois de suite une pièce équilibrée. On note F l’évènement « obtenir Face » et \overline{F} l’évènement « obtenir Pile » (qui est l’événement contraire de F). L’arbre des probabilités ci-contre permet de lister les issues possibles. Il possède 4 chemins possibles.

Donc l’univers est l’ensemble des couples : \lbrace (F;F),(F;\overline{F}),(\overline{F};F);(\overline{F};\overline{F})) \rbrace. Chaque issue a la même probabilité d’être réalisée. Cette probabilité vaut \dfrac{1}{4}.

L’évènement « obtenir 2 faces » correspond à un seul chemin, donc sa probabilité est \dfrac{1}{4}.

L’évènement « obtenir deux faces différentes » correspond aux deux chemins (F;\overline{F}) et (\overline{F};F). Sa probabilité est alors \dfrac{2}{4}=\dfrac{1}{2}=0,5. On remarque que la probabilité d’avoir deux faces identiques est également 0,5.

V – Tableau à double entrée

Un tableau à double entrée est une autre façon de lister l’ensemble des issues d’une expérience aléatoire et de calculer des probabilités.

Exemple : On lance deux dés cubiques équilibrés, un rouge et un jaune. On s’intéresse au couple formé par les numéros des faces supérieures de ces dés. À l’aide du tableau à double entrée ci-contre, on recense toutes les issues possibles. On a 36 issues possibles. Chaque issue a la même probabilité d’être réalisée. Cette probabilité vaut \dfrac{1}{36}.

L’évènement A « Obtenir deux nombres pairs » contient 9 issues que l’on trouve dans ce tableau. Sa probabilité est donc \dfrac{9}{36}=\dfrac{1}{4}=0,25.

L’évènement B « Obtenir un 4 avec le dé rouge » contient 6 issues que l’on trouve dans ce tableau. Sa probabilité est donc \dfrac{6}{36}=\dfrac{1}{6}.

L’évènement A \cap B, à savoir obtenir deux nombres pairs dont le 4 avec le dé rouge. est \lbrace (4;2),(4;4}),(4;6) \rbrace. Sa probabilité est donc \dfrac{3}{36}=\dfrac{1}{12}.

VI – Echantillonage

1) Introduction

Lorsqu’on étudie une grande population, il est parfois impossible de récolter toutes les données. On restreint cette étude à une partie de la population.

Exemple : si une étude porte sur la population des éléphants d’Afrique, on va limiter l’étude à une centaine d’éléphants car il est impossible de tous les étudier.

Dans le reste du chapitre, on considère une expérience aléatoire à deux issues possibles (pile ou face par exemple) que l’on répète plusieurs fois.

Définitions
  • On dit que l’on répète une expérience aléatoire de façon indépendante lorsque le résultat de chaque expérience ne dépend pas des résultats des expériences précédentes.
  • Un échantillon de taille n est la liste des résultats obtenus lorsqu’on répète n fois une même expérience aléatoire de façon indépendante.

2) Fluctuation d’échantillonnage

On étudie le caractère d’une population donnée et on note p la proportion d’individus présentant ce caractère dans la population totale. On prélève un échantillon de taille n de cette population et on détermine la fréquence f d’apparition de ce caractère.

On répète plusieurs fois cette opération dans les mêmes conditions et on constate que la fréquence f varie suivant l’échantillon prélevé mais que cette valeur fluctue autour de la proportion p. Ce phénomène s’appelle la fluctuation d’échantillonnage.

Exemple : On sait que dans une entreprise de 5\:000 employés , il y a 48% de femmes. La proportion de femmes est donc p=0,48. On choisit un groupe de 100 employés et on compte le nombre de femmes. Puis on recommence l’expérience plusieurs fois. Il est clair que l’on ne va pas obtenir pour tous les groupes la même fréquence de femmes.  Mais on vérifie bien que ces fréquences sont très souvent proches de 0,48.

3) Estimation d’une probabilité par simulation

Dans certains cas, on ne connait pas  la proportion d’un caractère dans une population donnée ou la probabilité de l’évènement « l’individu présence ce caractère ». Par exemple, des études ont montré que près de 40% des français sont myopes. On ne les a pas comptés un par un. On a étudié des échantillons.

Propriété admise, conséquence de la loi des grands nombres
On souhaite étudier un caractère dans une population donnée. On ne connait pas la proportion d’individus présentant ce caractère et on ne connait pas non plus la probabilité qu’un individu présente ce caractère. On note p cette proportion ou cette probabilité.

Pour obtenir une estimation de la valeur p, on  prélève des échantillons de taille n tel que n \ge 25. Si la fréquence f observée pour la présence du caractère est telle que f \in [0,2 ; 0,8], alors pour plus de 95% des échantillons, p \in \left [f-\dfrac{1}{\sqrt{n}} ; f+\dfrac{1}{\sqrt{n}} \right ].

Cet intervalle est appelé intervalle de confiance de p au seuil de 95%.

Cela signifie que :

  • si la taille de l’échantillon est suffisante,
  • si le caractère observé n’est ni très rare ni très fréquent

alors dans la majorité des cas, la proportion ou la probabilité du caractère sera située entre f-\dfrac{1}{\sqrt{n}} et f-\dfrac{1}{\sqrt{n}}