Moyenne géométrique

En mathématiques, la moyenne géométrique est un type de moyenne.

Définition élémentaire

La moyenne géométrique de deux nombres positifs a et b est le nombre positif c tel que :

a c = c b {\displaystyle {\frac {a}{c}}={\frac {c}{b}}} .

Cette égalité étant une proportion, ceci justifie l'autre appellation « moyenne proportionnelle » de la moyenne géométrique[1].

Interprétation géométrique

La moyenne géométrique des côtés d'un rectangle est donnée par un carré de même aire. Elle est construite par un cercle tangent aux deux cercles définis par les côtés du rectangle et les séparant.

Géométriquement, ce nombre c est le côté d'un carré dont la surface est la même que celle du rectangle de côtés a et b, puisque dans ce cas :

c 2 = a b . {\displaystyle c^{2}=ab.}

On peut calculer directement la moyenne géométrique de deux nombres en prenant la racine carrée de l'expression précédente :

c = a b = ( a b ) 1 / 2 . {\displaystyle c={\sqrt {ab}}=(ab)^{1/2}.}

Généralisation

Cas discret

Sous cette dernière forme, on voit que le logarithme (en base quelconque) transforme l'expression en une moyenne arithmétique : log c = log a + log b 2 {\displaystyle \log c={\frac {\log a+\log b}{2}}} (à condition que a et b ne soient pas nuls, le logarithme n'étant pas défini en 0).

D'où la généralisation : la moyenne géométrique d'une série statistique quantitative positive non nulle est définie telle que son logarithme est la moyenne arithmétique des logarithmes des valeurs de la série.

Sa formulation peut se faire comme suit :

log x ¯ = log x 1 + log x 2 + + log x n n = 1 n i = 1 n log x i . {\displaystyle \log {\bar {x}}={\frac {\log x_{1}+\log x_{2}+\ldots +\log x_{n}}{n}}={1 \over n}\sum _{i=1}^{n}\log x_{i}.}

On en déduit :

x ¯ = x 1 × x 2 × × x n n = i = 1 n x i n . {\displaystyle {\bar {x}}={\sqrt[{n}]{x_{1}\times x_{2}\times \ldots \times x_{n}}}={\sqrt[{n}]{\prod _{i=1}^{n}{x_{i}}}}.}

Pour une série statistique dont le nombre total d’occurrences est infini ou inconnu, mais dont le nombre de valeurs positives non nulles possibles est fini et leurs fréquences respectives dans la série sont connues, la formulation mathématique devient :

log x ¯ = f 1 log x 1 + f 2 log x 2 + + f n log x n f 1 + f 2 + + f n = i = 1 n f i log x i i = 1 n f i , a v e c i = 1 n f i = 1. {\displaystyle \log {\bar {x}}={\frac {f_{1}\log x_{1}+f_{2}\log x_{2}+\ldots +f_{n}\log x_{n}}{f_{1}+f_{2}+\ldots +f_{n}}}={\frac {\sum _{i=1}^{n}{f_{i}\log x_{i}}}{\sum _{i=1}^{n}{f_{i}}}},\quad \mathrm {avec} \quad \sum _{i=1}^{n}{f_{i}}=1.}

On en déduit (en utilisant par exemple le logarithme népérien) :

x ¯ = exp ( f 1 ln x 1 + f 2 ln x 2 + + f n ln x n f 1 + f 2 + + f n ) = exp ( i = 1 n f i ln x i i = 1 n f i ) , {\displaystyle {\bar {x}}=\exp \left({\frac {f_{1}\ln x_{1}+f_{2}\ln x_{2}+\ldots +f_{n}\ln x_{n}}{f_{1}+f_{2}+\ldots +f_{n}}}\right)=\exp \left({\frac {\sum _{i=1}^{n}f_{i}\ln x_{i}}{\sum _{i=1}^{n}{f_{i}}}}\right),}

d’où :

x ¯ = x 1 f 1 × x 2 f 2 × × x n f n = i = 1 n x i f i . {\displaystyle {\bar {x}}={x_{1}}^{f_{1}}\times {x_{2}}^{f_{2}}\times \ldots \times {x_{n}}^{f_{n}}=\prod _{i=1}^{n}{{x_{i}}^{f_{i}}}.}

Cas continu

La moyenne géométrique d'une distribution f d'une variable continue à valeur dans un intervalle scalaire fini [x0, x1] est la généralisation à la limite de la formule statistique discrète précédente :

log f ¯ x 0 x 1 = x 0 x 1 log ( x ) f ( x )   d x , {\displaystyle \log {{\bar {f}}_{x_{0}}^{x_{1}}}=\int _{x_{0}}^{x_{1}}{\log(x)f(x)~\mathrm {d} x},}

d’où :

f ¯ x 0 x 1 = exp ( x 0 x 1 ln ( x ) f ( x )   d x ) a v e c x 0 x 1 f ( x )   d x = 1. {\displaystyle {\bar {f}}_{x_{0}}^{x_{1}}=\exp \left(\int _{x_{0}}^{x_{1}}\ln(x)f(x)~\mathrm {d} x\right)\quad \mathrm {avec} \quad \int _{x_{0}}^{x_{1}}f(x)~\mathrm {d} x=1.}

Sa dimension n'est pas une fréquence, mais est celle de sa variable continue.

Si la distribution f est définie sur toutes les valeurs réelles de sa variable continue, la moyenne géométrique de la distribution est :

f ¯ = exp ( + ln ( x ) f ( x )   d x ) a v e c + f ( x )   d x = 1. {\displaystyle {\bar {f}}=\exp \left(\int _{-\infty }^{+\infty }\ln(x)f(x)~\mathrm {d} x\right)\quad \mathrm {avec} \quad \int _{-\infty }^{+\infty }f(x)~\mathrm {d} x=1.}

Liens avec les autres moyennes pythagoriciennes

La moyenne géométrique de deux nombres positifs est la moyenne arithmético-harmonique de ces deux nombres dans le sens où cette moyenne est définie sur le modèle de la moyenne arithmético-géométrique. Plus précisément, en considérant x et y positifs, et en définissant les suites :

a 0 = x , b 0 = y , n N , a n + 1 = a n + h n 2 , h n + 1 = 2 1 a n + 1 h n {\displaystyle a_{0}=x,b_{0}=y,\forall n\in N,a_{n+1}={\frac {a_{n}+h_{n}}{2}},h_{n+1}={\frac {2}{{\frac {1}{a_{n}}}+{\frac {1}{h_{n}}}}}}

Alors :

lim n + a n = lim n + h n = x y . {\displaystyle \lim _{n\rightarrow +\infty }a_{n}=\lim _{n\rightarrow +\infty }h_{n}={\sqrt {xy}}.}
Démonstration

Les suites ( a n ) {\displaystyle (a_{n})} et ( h n ) {\displaystyle (h_{n})} sont adjacentes. En effet, comme la moyenne harmonique de deux nombres est toujours inférieure à leur moyenne arhtimétique, on a :

n N , a n + 1 h n + 1 = a n + h n 2 2 1 a n + 1 h n = ( a n + h n ) 2 4 a n h n 2 ( a n + h n ) = ( a n h n ) 2 2 ( a n + h n ) 0 {\displaystyle \forall n\in N,a_{n+1}-h_{n+1}={\frac {a_{n}+h_{n}}{2}}-{\frac {2}{{\frac {1}{a_{n}}}+{\frac {1}{h_{n}}}}}={\frac {(a_{n}+h_{n})^{2}-4a_{n}h_{n}}{2(a_{n}+h_{n})}}={\frac {(a_{n}-h_{n})^{2}}{2(a_{n}+h_{n})}}\geqslant 0}
n N , a n + 1 a n = h n a n 2 0 ,   h n + 1 h n = 2 h n ( a n h n ( a n + h n ) 0 {\displaystyle \forall n\in N,a_{n+1}-a_{n}={\frac {h_{n}-a_{n}}{2}}\leqslant 0,\ h_{n+1}-h_{n}={\frac {2h_{n}(a_{n}-h_{n}}{(a_{n}+h_{n})}}\geqslant 0}

D'autre part, la suite ( a n h n ) {\displaystyle (a_{n}h_{n})} est constante :

n N , a n + 1 h n + 1 = a n + h n 2 × 2 a n h n a n + h n = a n h n . {\displaystyle \forall n\in N,a_{n+1}h_{n+1}={\frac {a_{n}+h_{n}}{2}}\times {\frac {2a_{n}h_{n}}{a_{n}+h_{n}}}=a_{n}h_{n}.}

D'où :

x y = a 0 h 0 lim n + a n h n = ( lim n + a n ) ( lim n + h n ) = ( lim n + a n ) 2 = ( lim n + h n ) 2 . {\displaystyle xy=a_{0}h_{0}\lim _{n\rightarrow +\infty }a_{n}h_{n}=(\lim _{n\rightarrow +\infty }a_{n})(\lim _{n\rightarrow +\infty }h_{n})=(\lim _{n\rightarrow +\infty }a_{n})^{2}=(\lim _{n\rightarrow +\infty }h_{n})^{2}.}

Intérêt

Pour les statisticiens, la moyenne géométrique (antilogarithme de la moyenne des logarithmes de chacune des observations) est moins sensible que la moyenne arithmétique aux valeurs les plus élevées d'une série de données. Elle donne, par conséquent, une autre et meilleure estimation de la tendance centrale des données dans le cas d’une distribution à longue traîne à l’extrémité supérieure de la courbe (type de distribution fréquente dans les mesures sanitaires ou environnementales par exemple de toxiques dans l'organisme, le sang ou l'environnement, où certains individus ou groupes vulnérables ou exposés à des cas particuliers sont plus affectés)[2].

Références

  1. Alain Bouvier, Michel George, François Le Lionnais, Dictionnaire des mathématiques, PUF, , p. 687
  2. Arnaud Rousselle, « Notes de cours IUT de Dijon-Auxerre DUT GEA 1ère année »

Liens externes

  • (en) Eric W. Weisstein, « Geometric Mean », sur MathWorld
  • (en) Eric W. Weisstein, « Arithmetic-Harmonic Mean », sur MathWorld

Voir aussi

  • icône décorative Portail des mathématiques