|
{revue}
En probabilité, on dit qu'une variable aléatoire réelle X suit une loi normale (ou loi normale gaussienne, loi de Laplace-Gauss) d'espérance μ et d'écart type σ strictement positif (donc de variance σ2) si cette variable aléatoire réelle X admet pour densité de probabilité la fonction p(x) définie, pour tout nombre réel x, par : ![]() Une telle variable aléatoire est alors dite variable gaussienne. On note habituellement cela de la manière suivante : 1La loi normale est une des principales distributions de probabilité. Elle a été introduite par le mathématicien Abraham de Moivre en 1733 et utilisée par lui afin d'approcher des probabilités associées à des variables aléatoires binomiales possédant un paramètre n très grand. Cette loi a été mise en évidence par Gauss au XIXe siècle et permet de modéliser de nombreuses études biométriques. Sa densité de probabilité dessine une courbe dite courbe en cloche ou courbe de Gauss. La loi normale centrée réduiteDéfinition
Représentation graphique d'une loi normale centrée réduite (dite courbe de Gauss ou courbe en cloche).
On appelle loi normale (ou gaussienne) centrée réduite la loi définie par la densité de probabilité On vérifie qu'elle est continue et que son intégrale sur On sait en effet que On démontre (voir plus bas) que la loi définie par cette densité de probabilité admet une espérance nulle et une variance égale à 1. Remarques :
La représentation graphique de cette densité est une courbe en cloche (ou courbe de Gauss). MomentsLes moments de cette loi existent tous. Pour tout
Pour la suite on supposera μ = 0 et σ2 = 1.
Fonction de répartitionArticle détaillé : fonction d'erreur.
On note Φ la fonction de répartition de la loi normale centrée réduite. Elle est définie, pour tout réel x, par : ![]() C'est la primitive de Citons les propriétés suivantes de la fonction Φ :
Remarque : les notations Approximation de la fonction de répartitionIl n'existe pas d'expression pour Φ mais on peut exploiter avec profit son aspect régulier pour en donner une approximation grâce à un développement en série de Taylor. Par exemple, voici une approximation (à l'ordre 5) autour de 0: ![]() Cette approximation est performante pour | x | < 2. Une approximation pour les grandes valeurs de x est donnée, pour x positif, par la formule ![]() série divergente pour tout x positif, mais dont les sommes partielles encadrent 1-Φ(x) de manière efficace lorsque x est grand. Par exemple, ![]() d'où une erreur relative inférieure à 25% pour x supérieur à 2 ou bien inférieure à 11% pour x supérieur à 3. Ou bien encore : ![]() d'où une erreur relative inférieure à 25% pour x supérieur à 2 ou bien inférieure à 2% pour x supérieur à 3. Tables numériquesIl existe des tables de la fonction de répartition, donnant des valeurs approchées de Au lieu des précédentes, on utilise souvent des tables de la fonction qu'on notera ici La table suivante donne pour tout x de 0 jusqu'à 3,9 par pas de 0,01, la valeur de 105 Φ(x). Ces valeurs sont arrondies à l'unité la plus proche. L'entrée en colonne donne les deux premiers chiffres de x, c'est-à-dire le chiffre des unités et celui des dixièmes, et l'entrée en ligne le chiffre des centièmes. Par exemple : Pour Φ(1,73) = 0,95818, on choisira 1,7 en ligne et 0.03 en colonne (1,7 + 0.03 = 1.73) et l'intersection nous donnera le résultat.
On dispose des relations simples suivantes entre
Soit T une variable aléatoire suivant la loi normale centrée réduite :
Exemples numériquesÀ l'aide de la table ci-dessus, on obtient, pour la variable aléatoire précédente : La loi normale généraleSoient On définit la variable aléatoire On a Cherchons la loi de
Ainsi,
Ceci légitime la définition suivante : DéfinitionOn appelle loi normale (ou gaussienne, ou de Laplace-Gauss) de paramètres
Une variable gaussienne est une variable aléatoire réelle qui suit une loi normale de paramètres Notation: cette loi est notée On peut énoncer plusieurs propriétés, compte tenu de ce qui précède (le dernier point se démontrant de manière analogue). PropriétésSoit une variable aléatoire
Soit une variable aléatoire Soit une variable aléatoire Largeur à mi-hauteurLorsque l'on travaille sur une représentation graphique, on estime fréquemment la largeur de la gaussienne par sa largeur à mi-hauteur H (en anglais full width at half maximum, FWHM), qui est la largeur de la courbe à une altitude qui vaut la moitié de l'altitude du sommet. La largeur à mi-hauteur est proportionnelle à l'écart type : Le facteur 2 sert à prendre en compte l'extension de la gaussienne dans les valeurs négatives. Calcul de P(a ≤ X ≤ b)Les résultats précédents permettent de ramener tout calcul de probabilité relatif à la loi normale Si la variable aléatoire Cas d'un intervalle centré à la moyenne, plages de normalité
Exemples numériquesGrâce à la table précédente, on obtient :
Champ d'application
Une planche de Galton nous montre que la loi binomiale tend vers la loi normale
Le Théorème de Moivre-Laplace affirme la convergence d'une loi binomiale vers une loi de Gauss quand le nombre d'épreuves augmente. On peut alors utiliser la loi normale comme approximation d'une loi binomiale de paramètres (n ; p) pour n grand et p, 1 - p de même ordre de grandeur ; on approche alors cette loi binomiale par la loi normale ayant même espérance np et même variance np(1 − p). On a dessiné ci-dessous :
![]()
![]() Le mathématicien Carl Friedrich Gauss a introduit cette loi pour le calcul d'erreurs. En statistiques, de nombreux phénomènes suivent des distributions gaussiennes : données biométriques des individus (Adolphe Quetelet). Critères et tests de normalitéCritères de normalitéLe recours à une distribution gaussienne est si fréquent qu'il peut finir par être abusif. Il faut alors rechercher des critères de normalité. Le premier critère, le plus simple, consiste à tracer l'histogramme ou le diagramme en bâtons de la distribution et à vérifier si le diagramme est en forme de « cloche ». Ce critère, subjectif, permet cependant d'éliminer une partie des distributions jugées alors non gaussiennes. Le critère suivant consiste à utiliser les plages de normalité ou intervalles de confiance. On a vu que si une distribution est gaussienne :
Lorsque ces pourcentages ne sont pas respectés, il y a fort à parier que la distribution n'est pas gaussienne. On peut aussi utiliser la droite de Henry, en particulier quand on possède peu de renseignements sur la distribution. La droite de Henry va permettre de porter un diagnostic sur la nature non gaussienne de la distribution, et, dans le cas où celle-ci a des chances d'être gaussienne, elle permet d'en déterminer la moyenne et l'écart type. Tests de normalitéIl existe également un grand nombre de tests de normalité:
Stabilité de la loi normale par la sommeLa somme de deux variables gaussiennes indépendantes est elle-même une variable gaussienne. Plus explicitement : Soient Alors, la variable aléatoire Cette propriété se démontre directement (par convolution), ou indirectement (au moyen des fonctions caractéristiques). ExempleOn prend ici le gramme comme unité de masse. Si la masse du contenu d'une boîte de conserve suit la loi normale d'espérance 400 et de variance 25, et si celle du contenant suit la loi normale d'espérance 60 et de variance 4, alors (avec l'hypothèse, naturelle, d'indépendance) la masse totale de la boîte de conserve suit la loi normale d'espérance 460 et de variance 29 ; son écart type est environ 5,4 grammes. Stabilité de la loi normale par la moyenneSoient La moyenne ![]() Stabilité de la loi normale par la combinaisonMélange de populationsIl ne faut pas confondre la somme de deux variables gaussiennes indépendantes, qui reste une variable gaussienne, et le mélange de deux populations gaussiennes, qui n'est pas une population gaussienne (voir aussi modèle de mixture gaussienne). Un mélange constitué de
suit une loi de moyenne (2/3)×160+(1/3)×130 = 150 cm, mais non gaussienne, de densité
Sur la représentation graphique de la densité h, on peut apercevoir une double bosse : la distribution est bimodale. ![]() SimulationIl est possible de simuler, par exemple par ordinateur, un tirage aléatoire dont la loi est normale. Les logiciels ou les langages de programmation possèdent en général un générateur de nombres pseudo-aléatoires ayant une distribution uniforme sur ]0,1[. On cherche donc une fonction transformant ces nombres. De manière générale, on peut prendre la fonction réciproque de la fonction de répartition : en l'occurrence, si la variable aléatoire U suit la loi uniforme sur ]0,1[, alors la variable aléatoire Cas de la loi normale à une dimensionPour simuler la loi normale à une dimension (celle qui a été étudiée jusqu'ici), on peut utiliser la méthode de Box-Muller dont voici le principe : suivent toutes deux la loi normale centrée réduite (et sont indépendantes). Les variables aléatoires
Cas de la loi multinormaleLa loi multinormale ou loi normale sur Elle est caractérisée par deux paramètres : un vecteur m de moyennes, et une matrice de variance-covariance V (carrée d'ordre n). Pour simuler une loi multinormale non dégénérée de paramètres m et V, on utilise la méthode suivante :
Le calcul de l'intégrale de GaussOn trouvera ce calcul (utilisant une intégrale double) dans l'article sur l'intégrale de Gauss. AnnexesNotes et références
Articles connexes
Le Texte ci-dessus est disponible sous GNU Free Documentation License. La source est wikipedia http://fr.wikipedia.org/wiki/{title} |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||