Disuguaglianza di Čebyšëv

Da Wikipedia, l'enciclopedia libera.
bussola Disambiguazione – Se stai cercando la disuguaglianza omonima riguardante numeri reali, vedi Disuguaglianza di Čebyšëv sulla somma.

La disuguaglianza di Čebyšëv è usata soprattutto nell'ambito della teoria probabilistica e più raramente nell'ambito di serie di dati reali. Spesso la disuguaglianza di Čebyšëv viene indicata come disuguaglianza di Markov, di cui è un corollario.

La disuguaglianza venne pubblicata la prima volta nel 1853 da Irenée-Jules Bienaymé e riscoperta indipendentemente da Pafnutij L'vovič Čebyšëv alcuni anni dopo (pertanto viene anche citata come disuguaglianza di Bienaymé-Čebyšëv).

Nell'ambito della variabili stocastiche (v.s.) afferma che se la v.s. X ha valore atteso μ e la varianza σ² e λ è un reale positivo, allora la probabilità che X assuma un valore compreso tra μ-λσ e μ+λσ è maggiore di 1-1/λ².

In altre parole afferma che, dato un carattere di cui sono noti solamente media aritmetica \mu e deviazione standard \sigma , possiamo conoscere la probabilità che una variabile casuale possa avere valori esterni a un intervallo simmetrico rispetto alla media aritmetica. In altri termini questo teorema ci assicura che, indipendentemente dalla distribuzione della variabile casuale, la probabilità che questa assuma valori distanti dalla media più di \lambda volte la deviazione standard è al massimo \tfrac{1}{\lambda^2}

Espresso con una formula:

 \Pr(\mu - \lambda \sigma \le X \le \mu + \lambda \sigma) \ge \ 1 - \frac{1}{\lambda^2}

che equivale a:[1]

\Pr\left(|{X-\mu}| \ge \lambda\cdot\sigma\right)\le \;\frac1{\lambda^2}

Nell'ambito della statistica descrittiva afferma che l'intervallo di valori compreso tra μ-λσ e μ+λσ ha un livello di confidenza di almeno (1-1/λ²)·100 percento. Fisz dimostrò che per le variabili dotate di media e varianza non è possibile trovare una disuguaglianza migliore di quella di Čebyšëv, a meno che non si impongano dei vincoli alla distribuzione della variabile.

Da questa disuguaglianza si deduce che

  • almeno il 75% dei valori sono compresi tra μ-2σ e μ+2σ
  • almeno l'88% dei valori sono compresi tra μ-3σ e μ+3σ
  • almeno il 93% dei valori sono compresi tra μ-4σ e μ+4σ
  • almeno il 96% dei valori sono compresi tra μ-5σ e μ+5σ
  • almeno il 99% dei valori sono compresi tra μ-10σ e μ+10σ

indipendentemente da come sono distribuiti i valori.

Dimostrazione probabilistica[modifica | modifica sorgente]

Per ogni evento A, sia IA la variabile casuale indicatore di A, cioè IA è uguale a 1 se l'evento A accade e 0 altrimenti. Allora si ha:

\Pr(|X-\mu| \geq \lambda\sigma) = \operatorname{E}(I_{|X-\mu| \geq \lambda\sigma})
= \operatorname{E}(I_{(X-\mu)^2 \geq (\lambda\sigma)^2 }) = \Pr((X-\mu)^2 \geq (\lambda \sigma)^2)

Dalla disuguaglianza di Markov segue poi:

 \Pr((X-\mu)^2 \geq (\lambda \sigma)^2) \leq \frac{\operatorname{E}((X-\mu)^2)}{(\lambda \sigma)^2}

Si ha quindi:

\Pr(|X-\mu| \geq \lambda \sigma) \leq \frac{1}{\lambda^2}\frac{\operatorname{E}((X-\mu)^2)}{\sigma^2} = \frac{1}{\lambda^2}

Note[modifica | modifica sorgente]

  1. ^ Si ha infatti:
    \Pr(\mu - \lambda \sigma \le X \le \mu + \lambda \sigma) = \Pr(- \lambda \sigma \le X - \mu \le  + \lambda \sigma) = \Pr\left(| X-\mu | \le \lambda\cdot\sigma\right)
    e:
    \Pr\left(|{X-\mu}| \le \lambda\cdot\sigma\right) \ge \ 1 - \frac{1}{\lambda^2}
    da cui:
    1-\Pr\left(|{X-\mu}| \le \lambda\cdot\sigma\right) \le \ \frac{1}{\lambda^2}

Bibliografia[modifica | modifica sorgente]

  • A. Papoulis (1991), Probability, Random Variables, and Stochastic Processes, 3rd ed. McGraw-Hill. ISBN 0-07-100870-5. pp. 113–114.
  • G. Grimmett and D. Stirzaker (2001), Probability and Random Processes, 3rd ed. Oxford. ISBN 0-19-857222-0. Section 7.3.

Voci correlate[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica