Funzione di ripartizione

In statistica e teoria della probabilità, la funzione di ripartizione (o funzione cumulativa) è una funzione di variabile reale che racchiude le informazioni su un fenomeno (un insieme di dati, un evento casuale) riguardanti la sua presenza o la sua distribuzione prima o dopo un certo punto.

Nel calcolo delle probabilità

Lo stesso argomento in dettaglio: Teoria della probabilità.

Nel calcolo delle probabilità la funzione di ripartizione, o funzione di probabilità cumulata, di una variabile casuale X {\displaystyle X} a valori reali è la funzione che associa a ciascun valore x {\displaystyle x} la probabilità del seguente evento: "la variabile casuale X {\displaystyle X} assume valori minori o uguali ad x {\displaystyle x} ".

In altre parole, è la funzione F : R [ 0 , 1 ] {\displaystyle F\colon \mathbb {R} \to [0,1]} con dominio la retta reale e immagine nell'intervallo [ 0 , 1 ] {\displaystyle [0,1]} definita da

F ( x ) = P ( X x ) . {\displaystyle F(x)=P(X\leq x).}

Una funzione F è una valida funzione di ripartizione se è non decrescente, continua a destra e

F ( x ) 0 , x {\displaystyle F(x)\geq 0,\quad \forall x}
lim x + F ( x ) = 1 {\displaystyle \lim _{x\to +\infty }F(x)=1}
lim x F ( x ) = 0 {\displaystyle \lim _{x\to -\infty }F(x)=0}

Una funzione di ripartizione non è necessariamente continua a sinistra (e dunque continua globalmente): se X {\displaystyle X} è una variabile casuale discreta e z {\displaystyle z} un punto del suo supporto, allora F {\displaystyle F} è una funzione a gradino e dunque

lim x z F ( x ) = lim x z i = 1 n p ( x i ) = i = 1 n p ( x i ) {\displaystyle \lim _{x\to z^{-}}F(x)=\lim _{x\to z^{-}}\sum _{i=1}^{n}p(x_{i})=\sum _{i=1}^{n}p(x_{i})}

(ponendo senza restrizioni di generalità x 1 < x 2 < < x n < x < z {\displaystyle x_{1}<x_{2}<\ldots <x_{n}<x<z} ) poiché è una costante indipendente da x {\displaystyle x} , mentre

F ( z ) = i = 1 n p ( x i ) + p ( z ) {\displaystyle F(z)=\sum _{i=1}^{n}p(x_{i})+p(z)}

dunque essendo p ( z ) 0 {\displaystyle p(z)\neq 0} si ha che F {\displaystyle F} non è continua.

Più in generale, una funzione di ripartizione individua univocamente una intera distribuzione di probabilità, cioè una funzione che ad ogni sottoinsieme misurabile A {\displaystyle A} associa la probabilità che X {\displaystyle X} cada in A {\displaystyle A} [1].

Proprietà

Si può dimostrare dalla definizione che valgono le seguenti uguaglianze, ponendo per semplicità di notazione F ( x ) := lim t x F ( t ) {\displaystyle F(x^{-}):=\lim _{t\to x^{-}}F(t)} :

  • P ( X < x ) = F ( x ) {\displaystyle \operatorname {P} (X<x)=F(x^{-})}
  • P ( a < X b ) = F ( b ) F ( a ) {\displaystyle \operatorname {P} (a<X\leq b)=F(b)-F(a)}
  • P ( a X < b ) = F ( b ) F ( a ) {\displaystyle \operatorname {P} (a\leq X<b)=F(b^{-})-F(a^{-})}
  • P ( a X b ) = F ( b ) F ( a ) {\displaystyle \operatorname {P} (a\leq X\leq b)=F(b)-F(a^{-})}
  • P ( a < X < b ) = F ( b ) F ( a ) {\displaystyle \operatorname {P} (a<X<b)=F(b^{-})-F(a)}
  • P ( X = b ) = F ( b ) F ( b ) {\displaystyle \operatorname {P} (X=b)=F(b)-F(b^{-})}

Se X {\displaystyle X} è una variabile casuale assolutamente continua la funzione di ripartizione di X {\displaystyle X} può essere espressa come funzione integrale:

F ( x ) = x f ( u ) d u {\displaystyle F(x)=\int _{-\infty }^{x}f(u)du}

ove f {\displaystyle f} è detta funzione di densità di X {\displaystyle X} . Si può anche considerare la relazione inversa:

F ( x ) = f ( x ) {\displaystyle F'(x)=f(x)}

Se X {\displaystyle X} è una variabile casuale discreta (ossia ammette una collezione numerabile di possibili valori x 1 , , x n , {\displaystyle x_{1},\ldots ,x_{n},\ldots } )

F ( x ) = x i x p ( x i ) {\displaystyle F(x)=\sum _{x_{i}\leq x}p(x_{i})}

dove p ( x ) = P ( X = x ) {\displaystyle p(x)=P(X=x)} è detta funzione di probabilità di X {\displaystyle X} .

Esempi

Grafico della funzione di ripartizione relativa alla distribuzione uniforme

Se X {\displaystyle X} è la variabile aleatoria risultato del lancio di un dado a sei facce si ha

F ( x ) = { 0 x < 1 x / 6 1 x < 6 1 x 6 {\displaystyle F(x)={\begin{cases}0&x<1\\\lfloor x\rfloor /6&1\leq x<6\\1&x\geq 6\end{cases}}}

dove con x {\displaystyle \lfloor x\rfloor } si indica la parte intera di x.

Se X {\displaystyle X} è la variabile casuale uniforme continua in [ 0 , 1 ] {\displaystyle [0,1]} si ha

F ( x ) = { 0 x < 0 x 0 x < 1 1 x 1 {\displaystyle F(x)={\begin{cases}0&x<0\\x&0\leq x<1\\1&x\geq 1\end{cases}}} .

Funzione di sopravvivenza

In alcuni modelli è più utile analizzare la probabilità che un certo dato numerico valga più del valore x {\displaystyle x} (come nella vita di un organismo, biologico o meccanico): questi casi sono trattati dalla branca chiamata analisi di sopravvivenza. Si definisce allora la funzione di sopravvivenza S {\displaystyle S} (dal termine inglese survival) come il complemento della funzione di ripartizione:

S ( x ) = P ( X > x ) = 1 F ( x ) {\displaystyle S(x)=P(X>x)=1-F(x)}

Nei casi rispettivamente continuo e discreto, valgono naturalmente delle identità speculari a quelle della ripartizione:

S ( x ) = x + f ( t ) d t {\displaystyle S(x)=\int _{x}^{+\infty }f(t)dt}

e

S ( x ) = t > x p ( t ) . {\displaystyle S(x)=\sum _{t>x}p(t).}

Ogni funzione di sopravvivenza S ( x ) {\displaystyle S(x)} è una funzione monotona decrescente, vale a dire S ( a ) S ( b ) {\displaystyle S(a)\leq S(b)} per a > b . {\displaystyle a>b.}

Il tempo x = 0 {\displaystyle x=0} rappresenta l'origine, in genere l'inizio di uno studio o l'inizio del funzionamento di alcuni sistemi.


Variabili aleatorie multivariate

Più in generale la funzione di ripartizione di una variabile aleatoria X {\displaystyle X} a valori in R k {\displaystyle \mathbb {R} ^{k}} è la funzione F ( x ) {\displaystyle F(x)} con dominio R k {\displaystyle \mathbb {R} ^{k}} e codominio l'intervallo [ 0 , 1 ] {\displaystyle [0,1]} definita da

F ( x 1 , , x k ) = P ( ( X 1 x 1 ) ( X 2 x 2 ) ( X k x k ) ) {\displaystyle F(x_{1},\ldots ,x_{k})=P((X_{1}\leq x_{1})\cap (X_{2}\leq x_{2})\cap \ldots \cap (X_{k}\leq x_{k}))}

dove X i {\displaystyle X_{i}} sono le componenti di X {\displaystyle X} .

Questa funzione possiede la proprietà di essere continua a destra separatamente per ogni variabile. Valgono inoltre le seguenti formule, derivanti dalla definizione:

  • Per qualsiasi i {\displaystyle i} , lim x i F ( x 1 , , x k ) = 0 {\displaystyle \lim _{x_{i}\to -\infty }F(x_{1},\ldots ,x_{k})=0}
  • F {\displaystyle F} è monotona crescente separatamente in ogni variabile, cioè se c > 0 {\displaystyle c>0} , F ( x 1 , , x i + c , , x k ) F ( x 1 , , x i , , x k ) {\displaystyle F(x_{1},\ldots ,x_{i}+c,\ldots ,x_{k})\geq F(x_{1},\ldots ,x_{i},\ldots ,x_{k})}
  • se k = 2 {\displaystyle k=2} per semplicità, P ( a < X 1 b , c < X 2 d ) = F ( b , d ) + F ( a , c ) F ( a , d ) F ( b , c ) {\displaystyle P(a<X_{1}\leq b,c<X_{2}\leq d)=F(b,d)+F(a,c)-F(a,d)-F(b,c)}
  • lim x i + F ( x 1 , , x k ) = G ( x 1 , , x i 1 , x i + 1 , , x k ) {\displaystyle \lim _{x_{i}\to +\infty }F(x_{1},\ldots ,x_{k})=G(x_{1},\ldots ,x_{i-1},x_{i+1},\ldots ,x_{k})} dove G {\displaystyle G} è la funzione di ripartizione della variabile ( k 1 ) {\displaystyle (k-1)} -variata ( X 1 , X 2 , , X i 1 , X i + 1 , , X k ) {\displaystyle (X_{1},X_{2},\ldots ,X_{i-1},X_{i+1},\ldots ,X_{k})} .

Da quest'ultima proprietà viene anche l'uguaglianza

lim x k + lim x k 1 + lim x 1 + F ( x 1 , x 2 , , x k ) = 1 {\displaystyle \lim _{x_{k}\to +\infty }\lim _{x_{k-1}\to +\infty }\ldots \lim _{x_{1}\to +\infty }F(x_{1},x_{2},\ldots ,x_{k})=1}

e l'affermazione vale ovviamente anche per ogni permutazione degli indici i {\displaystyle i} .

In statistica descrittiva

Lo stesso argomento in dettaglio: Statistica descrittiva.

In statistica la funzione di ripartizione empirica, o funzione di distribuzione cumulata, viene usata per descrivere fenomeni quantitativi o comunque descritti con valori misurati su scale ordinali, intervallari o proporzionali, ma non se misurati con una scala nominale.

La funzione di ripartizione viene indicata solitamente con F ( x ) {\displaystyle F(x)} e rappresenta il numero di osservazioni del fenomeno minori o uguali del valore x {\displaystyle x} .

Se x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} sono le osservazioni (ordinate in senso crescente), con frequenze relative f 1 , , f n {\displaystyle f_{1},\ldots ,f_{n}} la funzione di ripartizione ha espressione analitica

F ( x ) = { 0 x < x 1 F i = j i f j x i x < x i + 1 1 x x n {\displaystyle F(x)={\begin{cases}0&x<x_{1}\\F_{i}=\sum _{j\leq i}f_{j}&x_{i}\leq x<x_{i+1}\\1&x\geq x_{n}\end{cases}}}

Le F i {\displaystyle F_{i}} sono dette frequenze relative cumulate.

Note

  1. ^ J. Jacod; P. Protter, Pag. 41.

Bibliografia

  • Giorgio Dall'Aglio, Calcolo delle probabilità, Zanichelli, Bologna, 2003
  • (EN) Jean Jacod, Philip Protter, Probability Essentials, Springer, 2000, ISBN 3-540-43871-8.

Voci correlate

Altri progetti

Altri progetti

  • Wikimedia Commons
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file su funzione di ripartizione

Collegamenti esterni

  • (EN) Eric W. Weisstein, Funzione di ripartizione, su MathWorld, Wolfram Research. Modifica su Wikidata
Controllo di autoritàGND (DE) 4192219-0
  Portale Matematica
  Portale Statistica