Distribuzione chi quadrato non centrale

distribuzione χ 2 {\displaystyle \chi ^{2}} non centrale
Funzione di densità di probabilità
Funzione di ripartizione
Parametri k N { 0 }   {\displaystyle k\in \mathbb {N} \setminus \{0\}\ } (gradi di libertà)
λ 0   {\displaystyle \lambda \geqslant 0\ } non centralità
Supporto x [ 0 , [ {\displaystyle x\in [0,\infty [}
Funzione di densità 1 2 e ( x + λ ) / 2 ( x λ ) k / 4 1 / 2 I k / 2 1 ( λ x ) {\displaystyle {\frac {1}{2}}e^{-(x+\lambda )/2}\left({\frac {x}{\lambda }}\right)^{k/4-1/2}I_{k/2-1}({\sqrt {\lambda x}})}
Funzione di ripartizione j = 0 e λ / 2 ( λ / 2 ) j j ! γ ( j + k / 2 , x / 2 ) Γ ( j + k / 2 ) {\displaystyle \sum _{j=0}^{\infty }e^{-\lambda /2}{\frac {(\lambda /2)^{j}}{j!}}{\frac {\gamma (j+k/2,x/2)}{\Gamma (j+k/2)}}}
Valore atteso k + λ {\displaystyle k+\lambda }
Varianza 2 ( k + 2 λ ) {\displaystyle 2(k+2\lambda )}
Indice di asimmetria 2 3 / 2 ( k + 3 λ ) ( k + 2 λ ) 3 / 2 {\displaystyle {\frac {2^{3/2}(k+3\lambda )}{(k+2\lambda )^{3/2}}}}
Curtosi 12 ( k + 4 λ ) ( k + 2 λ ) 2 {\displaystyle {\frac {12(k+4\lambda )}{(k+2\lambda )^{2}}}}
Funzione generatrice dei momenti e λ t / ( 1 2 t ) ( 1 2 t ) k / 2 {\displaystyle {\frac {e^{\lambda t/(1-2t)}}{(1-2t)^{k/2}}}} per 2 t < 1 {\displaystyle 2t<1}
Funzione caratteristica e i λ t / ( 1 2 i t ) ( 1 2 i t ) k / 2 {\displaystyle {\frac {e^{i\lambda t/(1-2it)}}{(1-2it)^{k/2}}}}
Manuale

In teoria delle probabilità una distribuzione χ 2 {\displaystyle \chi ^{2}} non centrale (chi quadrato, o chi quadro), è una distribuzione di probabilità che generalizza la distribuzione χ 2 {\displaystyle \chi ^{2}} , descrivendo la somma dei quadrati di variabili aleatorie con distribuzioni normali ridotte ma non centrate.

In statistica viene impiegata per l'analisi della varianza e per alcuni test di verifica d'ipotesi.

Definizione

La distribuzione χ 2 ( k , λ ) {\displaystyle \chi ^{2}(k,\lambda )} descrive la variabile aleatoria

X 2 = i = 1 k X i 2 = X 1 2 + + X k 2 {\displaystyle \textstyle X^{2}=\sum _{i=1}^{k}X_{i}^{2}=X_{1}^{2}+\ldots +X_{k}^{2}} ,

dove X 1 , . . . , X k {\displaystyle X_{1},...,X_{k}} sono variabili aleatorie variabili indipendenti aventi distribuzioni normali ridotte (ma non necessariamente centrate) N ( μ 1 , 1 ) , . . . , N ( μ k , 1 ) {\displaystyle {\mathcal {N}}(\mu _{1},1),...,{\mathcal {N}}(\mu _{k},1)} , i cui valori attesi soddisfano

λ = i = 1 k μ i 2 {\displaystyle \textstyle \lambda =\sum _{i=1}^{k}\mu _{i}^{2}} .

Il parametro k è detto numero di gradi di libertà e λ {\displaystyle \lambda } è il parametro di non centralità. (La notazione per λ {\displaystyle \lambda } non è uniforme: alcuni autori prendono λ {\displaystyle \lambda } pari alla metà, oppure alla radice quadrata di questa somma.)

In particolare, per λ = 0 {\displaystyle \lambda =0} le variabili X i {\displaystyle X_{i}} sono centrate e si ottiene nuovamente la distribuzione χ2:

χ 2 ( k , 0 ) = χ 2 ( k )   {\displaystyle \chi ^{2}(k,0)=\chi ^{2}(k)\ }

È possibile definire la distribuzione χ2 non centrale anche tramite variabili aleatorie indipendenti Y 1 , . . . , Y i {\displaystyle Y_{1},...,Y_{i}} di distribuzione normale standard N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} , prendendo X i = Y i + μ i {\displaystyle X_{i}=Y_{i}+\mu _{i}} , ovvero

X 2 = i = 1 k ( Y i + μ i ) 2   {\displaystyle \textstyle X^{2}=\sum _{i=1}^{k}(Y_{i}+\mu _{i})^{2}\ } .

Indipendenza di λ

La distribuzione χ 2 ( k , λ ) {\displaystyle \chi ^{2}(k,\lambda )} dipende da λ e non dai singoli valori μi.

Sullo spazio euclideo di dimensione k, infatti, si possono considerare i vettori

X ¯ = ( X 1 ,   ,   X k ) = ( Y 1 ,   ,   Y k ) + ( μ 1 , ,   μ k ) = Y ¯ + μ ¯ {\displaystyle {\bar {X}}=(X_{1},\ \ldots ,\ X_{k})=(Y_{1},\ \ldots ,\ Y_{k})+(\mu _{1},\ldots ,\ \mu _{k})={\bar {Y}}+{\bar {\mu }}} ;

la distribuzione di probabilità del vettore normale multivariato Y ¯ {\displaystyle {\bar {Y}}} è isotropa, ovvero invariante per isometria. In particolare la variabile aleatoria X 2 {\displaystyle X^{2}} , che è il quadrato della norma di X ¯ = Y ¯ + μ ¯ {\displaystyle {\bar {X}}={\bar {Y}}+{\bar {\mu }}} , dipende dalle μ i {\displaystyle \mu _{i}} solo in termini della norma di ( μ 1 , . . . , μ k ) {\displaystyle (\mu _{1},...,\mu _{k})} , ovvero λ {\displaystyle {\sqrt {\lambda }}} .

Proprietà

Somma

Per definizione, la somma di variabili aleatorie di distribuzioni χ2 non centrali è ancora una variabile aleatoria di distribuzione χ2 non centrale (somma dei quadrati di variabili normali ridotte).

Più precisamente, la somma di due variabili aleatorie con distribuzioni χ 2 ( k , λ ) {\displaystyle \chi ^{2}(k',\lambda ')} e χ 2 ( k , λ ) {\displaystyle \chi ^{2}(k'',\lambda '')} è una variabile aleatoria con distribuzione χ 2 ( k , λ ) {\displaystyle \chi ^{2}(k,\lambda )} , con k = k + k {\displaystyle k=k'+k''} e λ 2 = λ 2 + λ 2 {\displaystyle \lambda ^{2}=\lambda '^{2}+\lambda ''^{2}} .

Mistura di distribuzioni χ2

La distribuzione χ2 non centrale può essere espressa come mistura di distribuzioni χ2, pesate secondo la distribuzione di Poisson.

In altri termini è la distribuzione di una variabile aleatoria Z, dipendente da una variabile aleatoria J di legge di Poisson P ( λ / 2 ) {\displaystyle {\mathcal {P}}(\lambda /2)} , con distribuzione condizionata di Z rispetto a J data da χ 2 ( k + 2 J ) {\displaystyle \chi ^{2}(k+2J)} .

In particolare di χ2(k,λ) si possono descrivere

la densità di probabilità f k , λ = j = 0 e λ / 2 ( λ / 2 ) j j ! f k + 2 j , 0 ( x ) , {\displaystyle f_{k,\lambda }=\sum _{j=0}^{\infty }{\frac {e^{-\lambda /2}(\lambda /2)^{j}}{j!}}f_{k+2j,0}(x),}
e la funzione di ripartizione F k , λ = j = 0 e λ / 2 ( λ / 2 ) j j ! F k + 2 j , 0 {\displaystyle F_{k,\lambda }=\sum _{j=0}^{\infty }e^{-\lambda /2}{\frac {(\lambda /2)^{j}}{j!}}F_{k+2j,0}}

tramite la densità di probabilità f k + 2 j , 0 {\displaystyle f_{k+2j,0}} e la funzione di ripartizione F k + 2 j , 0 {\displaystyle F_{k+2j,0}} delle distribuzioni χ2(k+2j).

Caratteristiche

La funzione generatrice dei momenti della distribuzione χ2(k,λ) non centrale è

g ( t ) = E [ e t Z ] = e λ t / ( 1 2 t ) ( 1 2 t ) k / 2 {\displaystyle g(t)=E[e^{t}Z]={\frac {e^{\lambda t/(1-2t)}}{(1-2t)^{k/2}}}}

I primi momenti semplici della distribuzione sono

μ 1 = k + λ {\displaystyle \mu '_{1}=k+\lambda }
μ 2 = ( k + λ ) 2 + 2 ( k + 2 λ ) {\displaystyle \mu '_{2}=(k+\lambda )^{2}+2(k+2\lambda )}
μ 3 = ( k + λ ) 3 + 6 ( k + λ ) ( k + 2 λ ) + 8 ( k + 3 λ ) {\displaystyle \mu '_{3}=(k+\lambda )^{3}+6(k+\lambda )(k+2\lambda )+8(k+3\lambda )}
μ 4 = ( k + λ ) 4 + 12 ( k + λ ) 2 ( k + 2 λ ) + 4 ( 11 k 2 + 44 k λ + 36 λ 2 ) + 48 ( k + 4 λ ) {\displaystyle \mu '_{4}=(k+\lambda )^{4}+12(k+\lambda )^{2}(k+2\lambda )+4(11k^{2}+44k\lambda +36\lambda ^{2})+48(k+4\lambda )}

e i suoi primi momenti centrali sono

μ 2 = 2 ( k + 2 λ ) {\displaystyle \mu _{2}=2(k+2\lambda )}
μ 3 = 8 ( k + 3 λ ) {\displaystyle \mu _{3}=8(k+3\lambda )}
μ 4 = 12 ( k + 2 λ ) 2 + 48 ( k + 4 λ ) {\displaystyle \mu _{4}=12(k+2\lambda )^{2}+48(k+4\lambda )}

La funzione caratteristica di χ2(k,λ) è [1]

ϕ ( t ) = e i t λ / ( 1 i 2 t ) ( 1 i 2 t ) k / 2 {\displaystyle \phi (t)={\frac {e^{it\lambda /(1-i2t)}}{(1-i2t)^{k/2}}}} .

Formule alternative

Densità di probabilità

La densità di probabilità f k , λ {\displaystyle f_{k,\lambda }} della distribuzione χ2(k,λ) non centrale può essere descritta tramite altre formule.

Una formula alternativa è

f k , λ = 1 2 e ( x + λ ) / 2 ( x λ ) k / 4 1 / 2 I k / 2 1 ( λ x ) {\displaystyle f_{k,\lambda }={\frac {1}{2}}e^{-(x+\lambda )/2}\left({\frac {x}{\lambda }}\right)^{k/4-1/2}I_{k/2-1}({\sqrt {\lambda x}})}

dove

I a ( y ) := ( y / 2 ) a j = 0 ( y 2 / 4 ) j j ! Γ ( a + j + 1 ) {\displaystyle I_{a}(y):=(y/2)^{a}\sum _{j=0}^{\infty }{\frac {(y^{2}/4)^{j}}{j!\Gamma (a+j+1)}}}

è una funzione di Bessel del primo tipo, modificata.

Una terza formula è [2]

f ( x ) = e λ 2 r = 0 ( λ 2 ) r   e x 2   x n 2 + r 1 2 n 2 + r   r !   Γ ( n 2 + r ) = e x + λ 2 x ( x 2 ) n 2 r = 0 ( λ 2 ) r   x r 2 r   r !   Γ ( n 2 + r ) {\displaystyle f(x)=e^{-{\frac {\lambda }{2}}}\sum _{r=0}^{\infty }{\frac {({\frac {\lambda }{2}})^{r}\ e^{-{\frac {x}{2}}}\ x^{{\frac {n}{2}}+r-1}}{2^{{\frac {n}{2}}+r}\ r!\ \Gamma ({\frac {n}{2}}+r)}}={\frac {e^{-{\frac {x+\lambda }{2}}}}{x}}({\frac {x}{2}})^{\frac {n}{2}}\sum _{r=0}^{\infty }{\frac {({\frac {\lambda }{2}})^{r}\ x^{r}}{2^{r}\ r!\ \Gamma ({\frac {n}{2}}+r)}}} per x > 0 {\displaystyle x>0}

Funzione di ripartizione

Voce da controllare
Questa voce o sezione sull'argomento matematica è ritenuta da controllare.
Motivo: Lo n nella formula non ha senso. Da controllare anche che sia il λ giusto.

Anche la funzione di ripartizione F k , λ {\displaystyle F_{k,\lambda }} della distribuzione χ2(k,λ) non centrale può essere descritta tramite altre formule. In particolare in statistica sono stati proposti alcuni metodi per cercare di calcolarne alcuni valori F k , λ ( x 0 ) {\displaystyle F_{k,\lambda }(x_{0})} .

Una formula ricorsiva, basata sulla funzione di ripartizione della distribuzione χ2 (centrale) è [3]

F k , λ ( x ) = F n 2 , 0 ( x ) + r > 0 P r ( x 2 )   {\displaystyle \textstyle F_{k,\lambda }(x)=F_{{\frac {n}{2}},0}(x)+\sum _{r>0}P_{r}({\frac {x}{2}})\ }

dove

P 0 ( x ) = 0 P 1 ( x ) = λ 2 e x x n / 2 Γ ( n / 2 + 1 ) {\displaystyle \textstyle P_{0}(x)=0\qquad P_{1}(x)={\frac {\lambda }{2}}{\frac {e^{-x}x^{n/2}}{\Gamma (n/2+1)}}}
P r ( x ) = λ 2 4 2 ( r 2 ) r ( r 1 ) ( n / 2 + r 1 ) P r 2 ( x ) λ 2 n / 2 + 2 r 3 x r ( n / 2 + r 1 ) P r 1 ( x ) {\displaystyle \textstyle P_{r}(x)={\frac {\lambda ^{2}}{4}}{\frac {2(r-2)}{r(r-1)(n/2+r-1)}}P_{r-2}(x)-{\frac {\lambda }{2}}{\frac {n/2+2r-3-x}{r(n/2+r-1)}}P_{r-1}(x)}

Valori approssimati si possono invece ottenere tramite la distribuzione Gamma e i primi due[4] o tre[5] momenti, oppure tramite la distribuzione normale.[6]

Distribuzioni non centrali

Utilizzando la distribuzione χ2 non centrale come generalizzazione della distribuzione χ2 (centrale) è possibile definire versioni non centrali delle distribuzioni t di Student, F di Fisher-Snedecor e Beta.

Note

  1. ^ (EN) M.A. Sanders, Characteristic function of the noncentral chi-square distribution (PDF), su planetmathematics.com. URL consultato il 7 marzo 2009 (archiviato dall'url originale il 15 luglio 2011).
  2. ^ D. Kerridge, Gives a very interesting probabilistic derivation, in Aust. J. Statist., 1965.
  3. ^ M. L. Tiku, Uses Laguerre polynomials to represent the noncentral chi-quare distribution, in Biometrika, 1965.
  4. ^ P. B. Patnaik, Points out some interesting geometrical features, in Biometrika, 1949.
  5. ^ E. Pearson, Studies the accuracy of the three-moment chi-square approximation, in Biometrika, 1959.
  6. ^ S. Abdel-Aty, Gives various Cornish-Fisher-type approximations, in Biometrika, 1954.

Voci correlate

  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica