Quartile

Histogramme avec représentation visuelle des quartiles.

En statistique descriptive, un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de population. Le quartile fait partie des quantiles.

Calcul des quartiles

Le quartile est calculé en tant que 4-quartiles :

  • le 1er quartile est la donnée de la série qui sépare les 25 % inférieurs des données (notation Q1) ;
  • le 2e quartile est la donnée de la série qui sépare les 50 % inférieurs des données (notation Q2) ;
  • le 3e quartile est la donnée de la série qui sépare les 75 % inférieurs des données (notation Q3) ;
  • par extension : le 0e quartile est la donnée de la série qui sépare les 0 % inférieurs des données (notation Q0, c'est le minimum) et le 4e quartile est la donnée de la série qui sépare les 0 % supérieurs des inférieurs des données (notation Q4, c'est le maximum).

La différence entre le troisième quartile et le premier quartile s'appelle écart interquartile ; c'est un critère de dispersion de la série.

Pour le détail des différentes méthodes de calcul, voir l'article quantile.

Dans le cas discret, on range les données par ordre croissant. S'il y a N valeurs :

  • le quartile zéro (minimum) est celui qui a le rang 1 ;
  • le premier quartile est celui qui a le rang ( N + 3 ) / 4 {\displaystyle (N+3)/4}  ;
  • le deuxième quartile (médiane) est celui qui a le rang ( 2 N + 2 ) / 4 {\displaystyle (2N+2)/4} donc ( N + 1 ) / 2 {\displaystyle (N+1)/2}  ;
  • le troisième quartile est celui qui a le rang ( 3 N + 1 ) / 4 {\displaystyle (3N+1)/4}  ;
  • le quatrième quartile est celui qui a le rang N.

Exemple :

Les valeurs dans l'ordre croissant 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 61, 68.

Le nombre de valeurs est N = 13.

Calcul de Q1 : on divise (l'effectif total plus 3) par 4 (quartile)

N + 3 4 = 16 4 = 4 {\displaystyle {N+3 \over 4}={16 \over 4}=4}

Le 1er quartile est la 4e valeur, c'est-à-dire 19.

Calcul de Q3 : Pour Q3 on procède de la même façon mais on multiplie le rang obtenu par 3 :

3 N + 1 4 = 3 × 13 + 1 4 = 40 4 = 10 {\displaystyle {3N+1 \over 4}={3\times 13+1 \over 4}={40 \over 4}=10}

La 10e valeur est 47 donc Q3 = 47.

Calcul de la médiane : on divise (l'effectif total plus 1) par 2 (quartile)

N + 1 2 = 13 + 1 2 = 14 2 = 7 {\displaystyle {N+1 \over 2}={13+1 \over 2}={14 \over 2}=7}
La médiane est la 7e valeur soit 28 (c'est la valeur du milieu).

Les cinq quartiles : finalement, les cinq quartiles de la série sont 1, 19, 28, 47 et 68.


Quand le rang d'un quartile n'est pas une valeur entière : quand les fractions ( N + 3 ) / 4 {\displaystyle (N+3)/4} , ( N + 1 ) / 2 {\displaystyle (N+1)/2} ou ( 3 N + 1 ) / 4 {\displaystyle (3N+1)/4} ne sont pas des valeurs entières, on procède par interpolation linéaire. On fait la moyenne de la valeur situé au-dessus du rang et de celle situé au-dessous du rang, en affectant chaque valeur d'un coefficient. Plus précisément, on note R i n f {\displaystyle R_{\mathrm {inf} }} la valeur située en dessous du rang et R s u p {\displaystyle R_{\mathrm {sup} }} la valeur situé au-dessus :

  • Si le rang se termine par 0,25, alors le quartile est la moyenne entre R i n f {\displaystyle R_{\mathrm {inf} }} affecté du coefficient 3 et de R s u p {\displaystyle R_{\mathrm {sup} }} affecté du coefficient 1.
  • Si le rang se termine par 0,5, alors le quartile est la moyenne entre R i n f {\displaystyle R_{\mathrm {inf} }} et R s u p {\displaystyle R_{\mathrm {sup} }} (sans coefficient).
  • Si le rang se termine par 0,75, alors le quartile est la moyenne entre R i n f {\displaystyle R_{\mathrm {inf} }} affecté du coefficient 1 et de R s u p {\displaystyle R_{\mathrm {sup} }} affecté du coefficient 3.


Exemple :

Les valeurs dans l'ordre ascendant 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 61.

Le nombre de valeurs est N = 12.

Calcul de Q1 : on divise (l'effectif total plus 3) par 4 (quartile)

N + 3 4 = 15 4 = 3.75 {\displaystyle {N+3 \over 4}={15 \over 4}=3.75}

Le 1er quartile est la moyenne entre 15 affecté du coefficient 1 et 19 affecté du coefficient 3.

15 × 1 + 19 × 3 1 + 3 = 72 4 = 18 {\displaystyle {15\times 1+19\times 3 \over 1+3}={72 \over 4}=18}

Le quartile Q1 est 18.

Calcul de Q3 : Pour Q3 on procède de la même façon :

3 N + 1 4 = 3 × 12 + 1 4 = 37 4 = 9.25 {\displaystyle {3N+1 \over 4}={3\times 12+1 \over 4}={37 \over 4}=9.25}

Le 3e quartile est la moyenne entre 37 affecté du coefficient 3 et 47 affecté du coefficient 1.

37 × 3 + 47 × 1 3 + 1 = 158 4 = 39.5 {\displaystyle {37\times 3+47\times 1 \over 3+1}={158 \over 4}=39.5}

Le quartile Q3 est 39,5.


Calcul de la médiane : on divise (l'effectif total plus 1) par 2 (quartile)

N + 1 2 = 12 + 1 2 = 13 2 = 6.5 {\displaystyle {N+1 \over 2}={12+1 \over 2}={13 \over 2}=6.5}
La médiane est la moyenne entre la 6e et la 7e valeur soit la moyenne entre 24 et 28 et donc Q2 = 26.

Les cinq quartiles : finalement, les cinq quartiles de la série sont 1 ; 18 ; 26 ; 39,5 et 61.

Voir aussi

v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail des probabilités et de la statistique