Loi normale

I- Loi normale centrée réduite

1) Introduction : Théorème de Moivre-Laplace

Soit \(X\) une variable aléatoire qui suit la loi binomiale \(\cal B(n;p)\).
On a : \(E(X)=np\), \(V(X)=np(1-p)\) et \(\sigma(X)=\sqrt{np(1-p)}\).
A l'aide des propriétés de l'espérance et de la variance \(E(aX+b)=aE(X)+b\) et \(V(aX+b)=a^2V(X)\), on peut construire par translation et dilatation à partir de \(X\) une nouvelle variable aléatoire \(Z\) qui aura pour espérance 0 et pour écart-type 1 : \(Z=\frac{X-np}{\sqrt{np(1-p)}}\). On dit qu'on a normalisé \(X\).
De plus, comme on le constate avec l'animation ci-dessous, l'histogramme représentant une loi binomiale \(\cal B(n;p)\) finit par prendre l'allure d'une courbe «en cloche» lorsque \(n\) devient grand.

Les transformations effectuées pour passer de \(X\) à \(Z\) ne font que déplacer et étirer/contracter l'histogramme. Ainsi, la représentation de \(Z\) en histogramme a l'aspect d'une courbe en cloche symétrique par rapport à l'axe des ordonnées :


Le théorème de Moivre-Laplace énoncé ci-dessous sans démonstration permet de préciser ce phénomène :


Propriété
Soit \(X_n\) une variable aléatoire qui suit la loi binomiale \(\cal B(n;p)\). On pose \(Z_n=\frac{X_n-np}{\sqrt{np(1-p)}}\).
Alors on a pour tous réels \(a\) et \(b\) (avec \(a\leq b\)) : \(\lim\limits_{n\rightarrow +\infty}P\left(Z_n\in [a;b]\right)=\frac{1}{\sqrt{2\pi}}\int_a^b e^{-\frac{x^2}{2}}dx\).
Exercice : Lionel doit disputer un match de football chaque mercredi après-midi.
S'il ne fait pas beau, le match est annulé.
La probabilité qu'il fasse beau un mercredi est 0,7.
Calculer la probabilité (arrondie à \(10^{-3}\)) que Lionel dispute entre 30 et 40 matches lors des 50 prochains mercredis :
a) En utilisant la loi binomiale.
b) En utilisant une approximation de la loi binomiale par une loi normale via le théorème de Moivre-Laplace.
Solution :
a) Soit \(X\) le nombre de matches disputés lors des 50 prochains mercredis. \(X\) suit une loi binomiale de paramètres \(n=50\) et \(p=0,7\) (la météo est supposée indépendante d'un mercredi à l'autre).
\(P(30\leq X\leq 40)=P(X\leq 40)-P(X\leq 29)\approx 0,912\) d'après la calculatrice.
La probabilité que Lionel dispute entre 30 et 40 matches lors des 50 prochains mercredis est environ 0,912.
b) On pose \(Z_n=\frac{X_n-np}{\sqrt{np(1-p)}}=\frac{X-35}{\sqrt{10,5}}\). Le théorème de Moivre-Laplace dit que pour tous réels \(a\) et \(b\) (avec \(a\leq b\)) : \(P\left(Z\in [a;b]\right)\approx\frac{1}{\sqrt{2\pi}}\int_a^b e^{-\frac{x^2}{2}}dx\) (le nombre \(n=50\) est considéré comme assez grand pour que l'approximation soit suffisament précise).
Dans la question a), nous aurions pu aussi bien calculer \(P(30\leq X\leq 40)\) que \(P(29\lt X\lt 41)\). Fixons donc les bornes à 29,5 et 40,5.
\(29,5\leq X\leq 40,5\iff -5,5\leq X-35\leq 5,5\iff \frac{-5,5}{\sqrt{10,5}}\leq\frac{X-35}{\sqrt{10,5}}\leq\frac{5,5}{\sqrt{10,5}}\iff -1,697\leq Z\leq 1,697\)
Ainsi : \(P(29,5\leq X\leq 40,5)=P(-5,5\leq Z\leq 5,5)\approx \frac{1}{\sqrt{2\pi}}\int_{-1,697}^{1,697}e^{-\frac{x^2}{2}}dx\approx 0,910\) d'après la calculatrice.
On retrouve pratiquement le même résultat qu'à la question a).
Remarque : La deuxième méthode est un peu moins précise, mais moins gourmande en calculs. En effet, le calcul de \(P(30\leq X\leq 40)\) (où \(X\) suit la loi binomiale) oblige la calculatrice à calculer \(P(X=i)\) pour \(i\) allant de 30 à 40, soit 11 calculs impliquant chacun des calculs de puissances et de coefficients binomiaux.

2) Définition de la loi normale centrée réduite

Définition
Une variable aléatoire \(X\) (à valeurs dans \(]-\infty;+\infty[\)) suit la loi normale centrée réduite \(\cal N(0;1)\) si sa densité de probabilité est la fonction \(f\) définie sur \(\mathbb R\) par \(f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\).

Remarque :
  1. \(f\) est bien une densité de probabilité sur \(\mathbb R\). En effet :
    • \(f\) est continue sur \(\mathbb R\).
    • \(f\) est positive sur \(\mathbb R\).
    • Bien qu'elles existent, on ne sait pas exprimer les primitives de \(x\mapsto e^{-x^2}\) ou de \(x\mapsto e^{-\frac{x^2}{2}}\) à l'aide des fonctions usuelles. On peut cependant démontrer (sans calcul de primitive) que \(\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}=\sqrt{2\pi}\). On obtient alors \(\int_{-\infty}^{+\infty}f(x)dx=\frac{1}{\sqrt{2\pi}}\times\sqrt{2\pi}=1\).
  2. La fonction \(f\) est paire (\(f(-x)=f(x)\) pour tout réel \(x\)) donc sa courbe est symétrique par rapport à l'axe des ordonnées. On en déduit que \(P(X\geq 0)=P(X\leq 0)=\frac 12\) si \(X\) suit la loi normale centrée réduite.
  3. La calculatrice permet d'obtenir une valeur approchée de \(P(a\leq X\leq b)\) pour tous réels \(a\) et \(b\) (\(a\leq b\)).
    Avec la calculatrice TI-82 par exemple, \(P(a\leq X\leq b)\) s'obtient par les touches 2nde var puis normalFRép(a,b,0,1).
  4. On peut aussi utiliser une table de valeurs, qui donne en général les valeurs approchées de \(P(0\leq X\leq a)\) pour \(a\) positif.
  5. La calculatrice permet également d'obtenir le nombre \(c\) tel que \(P(X\leq c)=a\).
    Par exemple, pour obtenir le nombre \(c\) tel que \(P(X\leq c)=0,8\) avec la calculatrice TI-82 : touches 2nde var puis FracNormale(0.8,0,1).
    Le résultat est envron 0,8416.
Exercice : La température maximale prévue pour demain par Météo France est de 21,5°C. On suppose que l'écart entre la température maximale réelle et la température prédite suit une loi normale centrée réduite.
Calculer la probabilité que la température maximale de demain :
a) soit comprise entre 21°C et 22°C.
b) ne dépasse pas 20°C.
c) dépasse 24°C.
Solution :
Soit \(X\) l'écart entre la température maximale observée et la temérature maximale prédite.
a) La probabilité que la température maximale soit comprise entre 21°C et 22°C est \(P(-0,5\leq X\leq 0,5)\approx 0,383\) (d'après la calculatrice).
b) La probabilité que la température maximale ne dépasse pas 20°C est \(P(X\leq -1,5)\approx 0,067\) (d'après la calculatrice).
c) La probabilité que la température maximale dépasse 24°C est \(P(X\geq 2,5)\approx 0,0062\) (d'après la calculatrice).
Exercice : La variation quotidienne en pourcentage de l'indice CAC40 suit approximativement une loi normale centrée réduite.
a) Calculer la probabilité que l'indice CAC40 monte de plus de 2% au cours d'une journée.
b) Sachant que l'indice CAC40 a progressé de plus de 2%, calculer la probabilité qu'il ait progressé de plus de 3%.
Solution :
a) La probabilité que l'indice CAC40 monte de plus de 2% au cours d'une journée est \(P(X\gt 2)\approx 0,023\) (d'après la calculatrice).
b) La probabilité que l'indice CAC40 ait progressé de plus de 3%, sachant qu'il a progressé de plus de 2% est : \(P_{(X\gt 2)}(X\gt 3)=\frac{P(X\gt 2 \text{ et }X\gt 3)}{P(X\gt 2)}=\frac{P(X\gt 3)}{P(X\gt 2)}\approx 0,059\) (d'après la calculatrice).
Exercice : On donne ci-dessous un extrait d'une table de valeurs de la loi normale centrée réduite. Soit \(X\) une variable aléatoire qui suit la loi normale centrée réduite.
Déterminer sans calculatrice une valeur approchée des probabilités suivantes :
\(P(0\leq X\leq 0,7)\) ; \(P(X\lt 0,7)\) ; \(P(X\gt 0,7)\) ; \(P(X\lt -0,7)\) et \(P(-0,7\lt X\lt 0)\).Tableau de valeurs
Solution :
La table ne donne pas la valeur de \(P(0\leq X\leq 0,7)\). 0,7 se trouvant à mi-chemin entre 0,6 et 0,8, on procède par interpolation en prenant la moyenne de \(P(0\leq X\leq 0,6)\) et de \(P(0\leq X\leq 0,8)\) :
\(P(0\leq X\leq 0,7)\approx\frac{0,226+0,288}{2}\approx 0,257\) (la calculatrice donne 0,258).
\(P(X\lt 0,7)=P(X\lt 0)+P(0\leq X\leq 0,7)\approx 0,5+0,257\approx 0,757\)
\(P(X\gt 0,7)=1- P(X\lt 0,7)\approx 1-0,757\approx 0,243\)
\(P(X\lt -0,7)=P(X\gt 0,7)\approx 0,243\) (par symétrie de la densité par rapport à 0)
\(P(-0,7\lt X\lt 0)=P(0\lt X\lt 0,7)\approx 0,257\) (par symétrie)
Exercice : Soit \(X\) une varaiable aléatoire qui suit la loi normale centrée réduite.
a) Déterminer le nombre \(c\) (arrondi à \(10^{-2}\)) tel que \(P(X\lt c)=0,32\).
b) Déterminer le nombre \(d\) (arrondi à \(10^{-2}\)) tel que \(P(X\gt d)=0,42\).
c) Déterminer le nombre \(s\) (arrondi à \(10^{-2}\)) tel que \(P(1\lt X\lt s)=0,1\).
Solution :
a) La calculatrice donne directement \(c\approx -0,47\).
b) \(P(X\gt d)=0,42\iff P(X\lt d)=1-0,42=0,58\). La calculatrice donne \(d\approx 0,20\).
c) \(P(X\lt 1)\approx 0,841\)
\(s\) est donc le nombre tel que \(P(X\lt s)\approx 0,841+0,1\approx 0,941\). La calculatrice donne \(s\approx 1,56\).

3) Propriétés de la loi normale centrée réduite

a) Espérance, variance et écart-type

Soit \(X\) une variable aléatoire qui suit la loi normale centrée réduite \(\cal N(0;1)\).
On définit l'espérance de \(X\) par \(E(X)=\int_{-\infty}^{+\infty}xf(x)dx=\lim\limits_{a\rightarrow -\infty}\int_{a}^{0}xf(x)dx+\lim\limits_{b\rightarrow +\infty}\int_{0}^{b}xf(x)dx\).
On peut alors démontrer que \(E(X)=0\).

On définit la variance de \(X\) par \(V(X)=E[(X-E(X) )^2]\). On peut alors démontrer que \(V(X)=1\). On en déduit que l'écart-type de \(X\) est \(\sigma(X)=1\).

Remarque : Dans l'expression « loi normale centrée réduite » , « centrée » fait référence au fait que l'espérance est nulle, et « réduite » au fait que l'écart-type est égal à 1.
b) Intervalle de probabilité \(1-\alpha\)
Propriété
Soit \(X\) une variable aléatoire qui suit la loi normale centrée réduite \(\cal N(0;1)\).
Pour tout réel \(\alpha\in]0;1[\), il existe un unique réel positif \(u_{\alpha}\) tel que \(P(-u_{\alpha}\leq X\leq u_ {\alpha})=1-\alpha\).

Démonstration :

Soit \(g\) la fonction définie sur \([0;+\infty[\) par \(g(x)=P(-x\leq X\leq x)=\int_{-x}^{x}f(t)dt=2\int_{0}^{x}f(t)dt\).
La fonction \(g\) est dérivable sur \([0;+\infty[\) et on a pour tout \(x\in [0;+\infty[\) : \(g'(x)=2f(x)\) (voir le chapitre 17 Intégration). Comme \(f\) est strictement positive, \(g'\) l'est aussi. On en déduit que \(g\) est strictement croissante sur \([0;+\infty[\). \(g\) étant dérivable, elle est continue sur \([0;+\infty[\).
De plus, \(g(0)=0\) et \(\lim\limits_{x\rightarrow +\infty}g(x)=1\). Comme \(\alpha\in ]0;1[\), \(1-\alpha\in ]0;1[\) donc \(1-\alpha\) est compris entre \(g(0)\) et \(\lim\limits_{x\rightarrow +\infty}g(x)\).
D'après le théorème de la bijection, il existe un unique réel \(u_{\alpha}\) dans \([0;+\infty[\) tel que \(g(u_{\alpha})=1-\alpha\), et donc tel que \(P(-u_{\alpha}\leq X\leq u_ {\alpha})=1-\alpha\).

Deux valeurs particulières sont à connaître, car elles sont couramment utilisées :

\(u_{0,05}\approx 1,96\)      Autrement dit : \(P(-1,96\leq X\leq 1,96)\approx 0,95\)

\(u_{0,01}\approx 2,58\)      Autrement dit : \(P(-2,58\leq X\leq 2,58)\approx 0,99\)

Exercice : Retrouver ces deux valeurs à la calculatrice.
Solution :
\(u_{0,05}\) est le nombre \(c\) tel que \(P(-c\leq X\leq c)=0,95\), c'est-à-dire tel que \(P(0\leq X\leq c)=\frac{0,95}{2}=0,475\), ou encore tel que \(P(X\leq c)=0,5+0,475=0,975\). La calculatrice donne avec invNormale : \(c\approx 1,96\).
De même, \(u_{0,01}\) est le nombre \(d\) tel que \(P(X\leq d)=0,5+\frac{0,99}{2}=0,995\). La calculatrice donne \(d\approx 2,58\).

II- Loi normale \(\cal N(\mu;\sigma^2)\)

Définition
Soit \(\mu\) et \(\sigma\) deux nombres réels, avec \(\sigma\gt 0\).
On dit qu'une variable aléatoire \(X\) suit la loi normale \(\cal N(\mu;\sigma^2)\) si la variable aléatoire \(\frac{X-\mu}{\sigma}\) suit la loi normale centrée réduite \(\cal N(0;1)\).
Remarque :
Propriété
Espérance et variance d'une loi normale \(\cal N(\mu;\sigma^2)\) :
Soit \(X\) une variable aléatoire qui suit la loi normale \(\cal N(\mu;\sigma^2)\).
L'espérance de \(X\) est \(E(X)=\mu\), sa variance est \(V(X)=\sigma^2\), son écart-type est \(\sigma\).

Interprétation de l'espérance \(\mu\) et de l'écart-type \(\sigma\) :

Valeurs remarquables à connaître :
Soit \(X\) une variable aléatoire qui suit la loi normale \(\cal N(\mu;\sigma^2)\).

1,2,3 sigmas
Exercice : Pour la densité de la loi normale centrée réduite, calculer la demi-largeur de la courbe à mi-hauteur (longueur du segment rouge sur la figure). schéma explicatif
Solution :
La densité est donnée par \(f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\).
La demi-largeur de la courbe à mi-hauteur est la solution positive de l'équation \(f(x)=\frac 12f(0)\). Cette équation équivaut successivement à :
\(\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}=\frac 12\times\frac{1}{\sqrt{2\pi}}\)
\(e^{-\frac{x^2}{2}}=\frac 12\)
\(-\frac{x^2}{2}=\ln\left(\frac 12\right)\)
\(-x^2=-2\ln 2\)
\(x^2=2\ln 2\)
La seule solution positive est \(x=\sqrt{2\ln 2}\).
La demi-largeur de la courbe à mi-hauteur est donc \(\sqrt{2\ln 2}\), soit environ \(1,18\).
Remarque : Dans le cas général d'une loi normale \(\cal N(\mu;\sigma^2)\), on peut démontrer de la même manière que la demi-largeur de la courbe de la densité à mi-hauteur est égale à \(\sqrt{2\ln 2}\sigma\), soit environ \(1,18\sigma\). La demi-largeur nous donne donc grossièrement une approximation de \(\sigma\) (sur-estimée de 18%).
Exercice : Soit \(X\) une variable aléatoire qui suit la loi normale de paramètres \(\mu=52\) et \(\sigma=3\).
1) Calculer à la calculatrice \(P(53\lt X\lt 54)\), \(P(X\lt 56)\) et \(P(X\gt 50)\). Arrondir à \(10^{-3}\).
2) Calculer le nombre \(c\) (arrondi à \(10^{-2}\)) tel que \(P(X\lt c)=0,75\).
Solution :
1) La calculatrice donne directement (via NormalFRép) : \(P(53\lt X\lt 54)\approx 0,117\) ; \(P(X\lt 56)\approx 0,909\) et \(P(X\gt 50)\approx 0,748\).
2) La calculatrice donne directement (via invNormale) : \(c\approx 54,02\).
Exercice : On donne ci-dessous un extrait d'une table de la loi normale centrée réduite. Tableau de valeurs
Soit \(T\) une variable aléatoire qui suit la loi normale de paramètres \(\mu=10\) et \(\sigma=5\).
Calculer \(P(8\leq T \leq 13)\) sans calculatrice.
Solution :
La variable aléatoire \(Z=\frac{T-\mu}{\sigma}=\frac{T-10}{5}\) suit la loi normale centrée réduite \(\cal N(0;1)\).
\(8\leq T \leq 13\iff -2\leq T-10\leq 3\iff \frac{-2}{5}\leq\frac{T-10}{5}\leq\frac{3}{5}\iff -0,4\leq Z\leq 0,6\)
\(P(8\leq T \leq 13)=P(-0,4\leq Z\leq 0,6)\)\(=P(-0,4\leq Z\leq 0)+P(0\leq Z\leq 0,6)\)\(=P(0\leq Z\leq 0,4)+P(0\leq Z\leq 0,6)\)\(\approx 0,155+0,226\)\(\approx 0,381\)
Exercice : Une étude commandée par le gérant d'un supermarché permet de modéliser la durée, exprimée en minutes, passée dans le supermarché par un client choisi au hasard par une variable aléatoire \(T\). Cette variable \(T\) suit une loi normale d'espérance 40 minutes et d'écart-type un réel positif noté \(\sigma\). Grace à cette étude, on estime que \(P(T\lt 10)=0,067\).
Déterminer une valeur arrondie du réel \(\sigma\) à la seconde près.
(Source : Sujet Bac Amérique du Nord 2018)
Solution :
La variable \(Z=\frac{T-\mu}{\sigma}=\frac{T-40}{\sigma}\) suit la loi normale centrée réduite \(\cal N(0;1)\).
\(T\lt 10\iff T-40\lt -30\iff \frac{T-40}{\sigma}\lt\frac{-30}{\sigma}\iff Z\lt\frac{-30}{\sigma}\)
Ainsi on a : \(P(Z\lt\frac{-30}{\sigma})=0,067\). La calculatrice donne (via invNormale) : \(\frac{-30}{\sigma}\approx -1,4985\).
On en déduit que \(\sigma\approx\frac{30}{1,4985}\approx 20,02\) minutes, soit 20 minutes et 1 seconde.
Exercice : Voici la liste des tailles (en cm) des 18 garçons relevées dans une classe de Terminale :
179 - 182 - 180 - 180 - 187 - 191 - 180 - 179 - 193 - 167 - 185 - 176 - 172 - 168 - 173 - 175 - 184 - 175
1) Calculer la moyenne \(\mu\) et l'écart-type \(\sigma\) de cette série statistique.
2) On modélise la taille des 380 000 garçons qui sont en Terminale dans toute la France par une loi normale dont l'espérance et l'écart-type sont les valeurs obtenues à la question 1) arrondies au cm.
Calculer une estimation du nombre d'élèves de Terminale S en France qui mesurent plus de 2 mètres.
3) Calculer une estimation de la taille du plus grand élève de Terminale sur toute la France.
Solution :
1) A la calculatrice, on trouve : \(\mu\approx 179,2\) cm et \(\sigma\approx 6,9\) cm.
2) On modélise la taille \(X\) par une loi normale de paramètres \(\mu=179\) et \(\sigma=7\).
La calculatrice donne : \(P(X\gt 200)\approx 0,00135\), soit une proportion de 0,135%.
Le nombre d'élèves correspondant est \(0,00135\times 380000\approx 513\).
Il y a donc environ 500 garçons de Terminale qui mesurent plus de 2 mètres.
3) La taille du plus grand élève correspond (approximativement) au nombre \(c\) tel que \(P(X\gt c)=\frac{1}{380000}\), c'est-à-dire tel que \(P(X\lt c)=\frac{379999}{380000}\). La calculatrice donne \(c\approx 211\). On peut donc estimer la taille du plus grand élève de France aux environs de 2,10 mètres.
Remarque : la loi normale est assez réaliste pour ce problème. Cependant, la théorie de l'estimation statistique dit que la meilleure estimation de l'écart-type n'est pas le \(\sigma\) obtenu à la question 1), mais qu'il faut multiplier cette valeur par \(\sqrt{\frac{n}{n-1}}\), où \(n\) est la taille de l'échantillon, pour obtenir l'estimation optimale de \(\sigma\). Dans notre cas, \(n=18\), donc on aurait dû idéalement multiplier \(\sigma\) par \(\sqrt{\frac{18}{17}}\approx 1,059\). Pour notre problème, ceci à pour effet d'augmenter notre estimation à 800 élèves mesurant plus de 2 mètres et de porter la taille du plus grand élève à 2,12 m.