Funzione di ripartizione

Da Wikipedia, l'enciclopedia libera.

In statistica e teoria della probabilità, la funzione di ripartizione è una funzione di variabile reale che racchiude le informazioni su un fenomeno (un insieme di dati, un evento casuale) riguardanti la sua presenza o la sua distribuzione prima o dopo un certo punto.

Nel calcolo delle probabilità[modifica | modifica wikitesto]

Exquisite-kfind.png Per approfondire, vedi Teoria della probabilità.

Nel calcolo delle probabilità la funzione di ripartizione, o funzione di probabilità cumulata, di una variabile casuale X a valori reali è la funzione che associa a ciascun valore x la probabilità dell'evento "la variabile casuale X assume valori minori o uguali ad x".

In altre parole, è la funzione F\colon \R \to [0,1] con dominio la retta reale e immagine l'intervallo [0,1] definita da

F(x)=P(X\leq x).

Una funzione F è una valida funzione di ripartizione se è non decrescente, continua a destra e

F(x)\geq 0, \quad  \forall x
\lim_{x \to +\infty} F(x) =1
\lim_{x \to -\infty} F(x) =0

Una funzione di ripartizione non è necessariamente continua a sinistra (e dunque continua globalmente): se X è una variabile casuale discreta e z un punto del suo supporto, allora F è una funzione a gradino e dunque

\lim_{x \to z^-}F(x)=\lim_{x \to z^-} \sum_{i=1}^n p(x_i)=\sum_{i=1}^n p(x_i)

(ponendo senza restrizioni di generalità x_1 < x_2 < \ldots< x_n < x < z) poiché è una costante indipendente da x, mentre

F(z)=\sum_{i=1}^n p(x_i)+p(z)

dunque essendo p(z)\neq 0 si ha che F non è continua.

Più in generale, una funzione di ripartizione individua univocamente una intera distribuzione di probabilità, cioè una funzione che ad ogni sottoinsieme misurabile A associa la probabilità che X cada in A[1].

Proprietà[modifica | modifica wikitesto]

Si può dimostrare dalla definizione che valgono le seguenti uguaglianze, ponendo per semplicità di notazione F(x^-):=\lim_{t \to x^-}F(t):

  • \operatorname{P}(X < x)=F(x^-)
  • \operatorname{P}(a < X \leq b)=F(b)-F(a)
  • \operatorname{P}(a \leq X < b)=F(b^-)-F(a^-)
  • \operatorname{P}(a \leq X \leq b)=F(b)-F(a^-)
  • \operatorname{P}(a < X < b)=F(b^-)-F(a)
  • \operatorname{P}(X=b) = F(b) - \lim_{x \to b^{-}} F(x)

Se X è una variabile casuale assolutamente continua la funzione di ripartizione di X può essere espressa come funzione integrale:

F(x) = \int_{-\infty}^xf(u)du

ove f è detta funzione di densità di X. Si può anche considerare la relazione inversa:

F'(x) = f(x)

Se X è una variabile casuale discreta (ossia ammette una collezione numerabile di possibili valori x_1,\ldots,x_n,\ldots)

F(x) = \sum_{x_i\leq x} p(x_i)

dove p(x)=P(X=x) è detta funzione di probabilità di X.

Esempi[modifica | modifica wikitesto]

Grafico della funzione di ripartizione relativa alla distribuzione uniforme

Se X è la variabile aleatoria risultato del lancio di un dado a sei facce si ha

F(x)=\begin{cases} 0 & x<1 \\ \lfloor x\rfloor /6 & 1\leq x < 6 \\ 1 & x\geq 6 \end{cases}

dove con \lfloor x\rfloor si indica la parte intera di x.

Se X è la variabile casuale uniforme continua in [0,1] si ha

F(x)=\begin{cases} 0 & x<0 \\ x & 0\leq x < 1 \\ 1 & x\geq 1 \end{cases}.

Funzione di sopravvivenza[modifica | modifica wikitesto]

In alcuni modelli è più utile analizzare la probabilità che un certo dato numerico valga più del valore x (come nella vita di un organismo, biologico o meccanico): questi casi sono trattati dalla branca chiamata analisi di sopravvivenza. Si definisce allora la funzione di sopravvivenza S (dal termine inglese survival) come il complemento della funzione di ripartizione:

S(x)=P(X>x)=1-F(x)

Nei casi rispettivamente continuo e discreto, valgono naturalmente delle identità speculari a quelle della ripartizione:

S(x)=\int_x^{+\infty} f(t)dt

e

S(x)=\sum_{t>x} p(t).

Ogni funzione di sopravvivenza S(x) è una funzione monotona decrescente, Vale a dire R(a) < R(b) per a > b

Il tempo x=0 rappresenta l'origine, in genere l'inizio di uno studio o l'inizio del funzionamento di alcuni sistemi.


Variabili aleatorie multivariate[modifica | modifica wikitesto]

Più in generale la funzione di ripartizione di una variabile aleatoria X a valori in \mathbb R^k è la funzione F(x) con dominio \mathbb R^k e codominio l'intervallo [0,1] definita da

F(x_1,\ldots,x_k)=P((X_1\leq x_1) \cap (X_2\leq x_2) \cap \ldots \cap (X_k\leq x_k))

dove X_i sono le componenti di X.

Questa funzione possiede la proprietà di essere continua a destra separatamente per ogni variabile. Valgono inoltre le seguenti formule, derivanti dalla definizione:

  • Per qualsiasi i, \lim_{x_i \to -\infty}F(x_1,\ldots,x_k)=0
  • F è monotona crescente separatamente in ogni variabile, cioè se c > 0, F(x_1,\ldots,x_i+c,\ldots,x_k) \geq F(x_1,\ldots,x_i,\ldots,x_k)
  • se k=2 per semplicità, P(a < X_1 \leq b, c < X_2 \leq d)=F(b,d)+F(a,c)-F(a,d)-F(b,c)
  • \lim_{x_i \to +\infty}F(x_1,\ldots,x_k)=G(x_1,\ldots,x_{i-1},x_{i+1},\ldots,x_k) dove G è la funzione di ripartizione della variabile (k-1)-variata (X_1,X_2,\ldots,X_{i-1},X_{i+1},\ldots,X_k).

Da quest'ultima proprietà viene anche l'uguaglianza

\lim_{x_k \to +\infty}\lim_{x_{k-1} \to +\infty}\ldots\lim_{x_1 \to +\infty}F(x_1,x_2,\ldots,x_k)=1

e l'affermazione vale ovviamente anche per ogni permutazione degli indici i.

In statistica descrittiva[modifica | modifica wikitesto]

Exquisite-kfind.png Per approfondire, vedi Statistica descrittiva.

In statistica la funzione di ripartizione empirica, o funzione di distribuzione cumulata, viene usata per descrivere fenomeni quantitativi o comunque descritti con valori misurati su scale ordinali, intervallari o proporzionali, ma non se misurati con una scala nominale.

La funzione di ripartizione o viene indicata solitamente con F(x) e rappresenta il numero di osservazioni del fenomeno minori o uguali del valore x.

Se x_1,\ldots, x_n sono le osservazioni (ordinate in senso crescente), con frequenze relative f_1,\ldots, f_n la funzione di ripartizione ha espressione analitica

F(x)=\begin{cases}0 & x < x_1 \\F_i=\sum_{j \leq i}f_j & x_i \leq x < x_{i+1} \\ 1 & x \geq x_n \end{cases}

Le F_i sono dette frequenze relative cumulate.

Note[modifica | modifica wikitesto]

  1. ^ J. Jacod; P. Protter, Pag. 41

Bibliografia[modifica | modifica wikitesto]

  • Giorgio Dall'Aglio, Calcolo delle probabilità, Zanichelli, Bologna, 2003
  • (EN) Jean Jacod, Philip Protter, Probability Essentials, Springer, 2000, ISBN 3-540-43871-8.

Voci correlate[modifica | modifica wikitesto]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica