Test de Shapiro-Wilk

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Shapiro et Wilk.

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Test de Shapiro-Wilk
Type
Nommé en référence à
Samuel Sanford Shapiro, Martin WilkVoir et modifier les données sur Wikidata
Formule
W = ( i = 1 n a i x ( i ) ) 2 i = 1 n ( x i x ¯ ) 2 {\displaystyle W={\left(\sum \limits _{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}} Voir et modifier les données sur Wikidata

modifier - modifier le code - modifier WikidataDocumentation du modèle

En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon x 1 , , x n {\displaystyle x_{1},\dots ,x_{n}} est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].

Théorie

La statistique de test W {\displaystyle W} est:

W = ( i = 1 n a i x ( i ) ) 2 i = 1 n ( x i x ¯ ) 2 {\displaystyle W={\left(\sum \limits _{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}

  • x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
  • x ¯ = 1 n ( x 1 + + x n ) {\displaystyle {\overline {x}}={\tfrac {1}{n}}(x_{1}+\cdots +x_{n})} est la moyenne de l'échantillon;
  • la constante ai est donnée par [2]
( a 1 , , a n ) = m V 1 ( m V 1 V 1 m ) 1 / 2 {\displaystyle (a_{1},\dots ,a_{n})={m^{\top }V^{-1} \over (m^{\top }V^{-1}V^{-1}m)^{1/2}}}
m = ( m 1 , , m n ) {\displaystyle m=(m_{1},\dots ,m_{n})^{\top }\,}

et m 1 , , m n {\displaystyle m_{1},\dots ,m_{n}} sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.

Pour conclure, W {\displaystyle W} est alors comparé à une table[3].

Interprétation

Sachant que l'hypothèse nulle est que la population est normalement distribuée,

  • si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
  • si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.

Voir aussi Q-Q plot ou droite de Henry.

Mise en œuvre

  • shapiro.test() avec R.

Voir aussi

Références

  1. (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, nos 3-4,‎ , p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709).
  2. Shapiro et Wilk 1965, p. 593.
  3. Shapiro et Wilk 1965, p. 605.

Liens externes

  • Algorithm AS R94 (Shapiro Wilk) FORTRAN code
  • Shapiro–Wilk Normality Test in CRAN
  • Shapiro–Wilk Normality Test in QtiPlot
  • How do I interpret the Shapiro-Wilk test for normality?
  • Online version of the Shapiro-Wilk test
  • Test de Shapiro avec R
  • Test de Shapiro avec Python
v · m
Tests de comparaison d'une seule variable
Pour un échantillon
Pour deux échantillons
Pour 3 échantillons ou plus
Tests de comparaison de deux variables
Deux variables quantitatives : Tests de corrélation
Deux variables qualitatives
Plus de deux variables
Tests d'adéquation à une loi
Tests d'appartenance à une famille de lois
  • Test de Shapiro-Wilk
Autres tests
v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail des probabilités et de la statistique