Utente:Floydpig/Teoria delle grandi deviazioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

In teoria della probabilità, la teoria delle grandi deviazioni studia il comportamento asintotico delle code delle distribuzioni di probabilità. Mentre alcune idee di base della teoria possono essere ricondotte a Laplace, la formalizzazione è iniziata con lo studio matematico delle assicurazioni, vale a dire la teoria della rovina con Cramér e Lundberg. Una formalizzazione unificata della teoria delle grandi deviazioni fu sviluppata nel 1966, in un articolo di Varadhan.[1] La teoria delle grandi deviazioni formalizza le idee euristiche di concentrazione delle misure e generalizza ampiamente la nozione di convergenza delle misure di probabilità.

In parole povere, la teoria delle grandi deviazioni si occupa del decadimento esponenziale delle misure di probabilità di certi tipi di eventi estremi (corrispondenti alle code delle distribuzioni di probabilità).

Esempi introduttivi[modifica | modifica wikitesto]

Esempio elementare[modifica | modifica wikitesto]

Si consideri una sequenza di lanci indipendenti di una moneta non truccata, i cui possibili risultati sono testa o croce. Si indichi con l'esito dell'i-esimo lancio, avendo definito testa come 1 e croce come 0. Si denoti con il valore medio dopo prove:

è quindi compreso tra 0 e 1. Dalla legge dei grandi numeri ne consegue che al crescere di , la distribuzione di converge verso il valore medio (il valore atteso di un singolo lancio di moneta).

Inoltre, dal teorema del limite centrale, ne deriva che il comportamento di , per grandi , è approssimativamente descritto da una distribuzione normale. Il teorema del limite centrale fornisce informazioni più dettagliate sul comportamento di rispetto alla semplice legge dei grandi numeri. Ad esempio, si può calcolare approssimativamente una probabilità legata alla coda della distribuzione di , , ossia la probabilità che sia più grande di un certo valore , per un fissato. Tuttavia, l'approssimazione dal teorema del limite centrale perde di validità se è lontano da , a meno che non sia sufficientemente grande. Inoltre, non fornisce informazioni sulla convergenza delle probabilità della coda per . Lo scopo della teoria delle grandi deviazioni è di fornire risposte a tali problemi.

Si consideri un esempio più preciso. Per un dato valore , si calcoli la probabilità della coda . Definendo

la funzione è una funzione convessa e non negativa, nulla per e crescente per che tende a . È il negativo dell'entropia di Bernoulli con che sia appropriata per il lancio di monete deriva dalla proprietà di equipartizione asintotica applicata a un processo di Bernoulli. Dalla diseguaglianza di Chernoff si può dimostrare [2] Questo limite è piuttosto netto, nel senso che non può essere sostituita con un numero maggiore in grado di produrre una rigida disuguaglianza per qualsiasi positivo.[3] (Tuttavia, il limite esponenziale può ancora essere ridotto di un fattore subesponenziale di ordine  ; ciò deriva dall'approssimazione di Stirling applicata al coefficiente binomiale che compare nella distribuzione di Bernoulli) Si ottiene quindi il seguente risultato:

.

La probabilità decade esponenzialmente per ad un tasso che dipende da . Questa formula costituisce un'approssimazione valida per la coda di qualsiasi distribuzione probabilità della media campionaria delle variabili e ne descrive la convergenza all'aumentare del numero di campioni.

Grandi deviazioni per somme di variabili casuali indipendenti[modifica | modifica wikitesto]

Nell'esempio precedente sul lancio di monete si è esplicitamente assunto che ogni lancio costituisca una prova indipendente, e che la probabilità di ottenere testa o croce sia sempre la stessa.

Si assuma che siano variabili casuali indipendenti e identicamente distribuite (i.i.d.) la cui distribuzione comune soddisfa una certa condizione di crescita. Esiste allora il seguente limite:

.

Dove come prima

,

La funzione è chiamata " funzione di rate " o "funzione di Cramer" o talvolta "funzione entropia".

Il suddetto limite implica che, per grandi ,

,

che è il risultato alla base della teoria delle grandi deviazioni.[4][5]

Se si conosce la distribuzione di probabilità di , è possibile ottenere un'espressione esplicita per la funzione di rate. Si deve applicare una trasformata di Legendre-Fenchel,

,

dove

è la funzione generatrice dei cumulanti (CGF) e denota il valore di aspettativa.

Se segue una distribuzione normale, la funzione di rate è una parabola con il suo vertice sulla media della distribuzione normale.

Definizione formale[modifica | modifica wikitesto]

Dato uno spazio polacco , sia una sequenza di misure di probabilità di Borel su , e sia una sequenza di numeri reali positivi tale che , e infine sia un funzionale semicontinuo inferiorermente su La sequenza si dice che soddisfa un principio di grande deviazione con velocità e rate se, e solo se, per ogni insieme di Borel misurabile ,

,

dove e denotano rispettivamente la chiusura e l'interno di . 

Storia[modifica | modifica wikitesto]

I primi risultati rigorosi relativi alle grandi deviazioni si devono al matematico svedese Harald Cramér, che li applicò per modellare le polizze assicurative.[6] Dal punto di vista di una compagnia di assicurazioni, il guadagno arriva con un tasso mensile costante (il premio mensile) ma i sinistri arrivano in modo casuale. Affinché l'azienda abbia successo in un certo periodo di tempo (preferibilmente lungo), il guadagno totale dovrebbe superare il totale della richiesta. Quindi per stimare il premio bisogna porsi la seguente domanda: "Che premio si deve scegliere per avere che, trascorsi mesi, il reclamo totale sia inferiore a ?" Questa è la stessa domanda posta dalla teoria delle grandi deviazioni. Cramér fornì una soluzione a questa domanda per variabili casuali i.i.d., dove la funzione di rate è espressa in termini di una serie di potenze.

Un elenco molto incompleto di matematici che hanno ottenuto risultati importanti nel campo includere Aleksej Petrov,[7] I. N. Sanov,[8] S. R. Srinivasa Varadhan (che ha vinto il premio Abel proprio per il suo contributo alla teoria), David Ruelle, Oscar E. Lanford, Amir Dembo, e Ofer Zeitouni.

Applicazioni[modifica | modifica wikitesto]

I principi delle grandi deviazioni possono essere applicati in modo efficace per ottenere informazioni da un modello probabilistico. Pertanto, la teoria delle grandi deviazioni trova le sue applicazioni primarie nel campo della teoria dell'informazione e della gestione del rischio. In fisica, le applicazioni più note della teoria delle grandi deviazioni si trovano in termodinamica e meccanica statistica (a causa della relazione fra la funzione entropia e la funzione di rate). Recentemente ha assunto importanza nello studio delle onde anomale,[9] e delle ondate di calore estreme.[10]

Grandi deviazioni ed entropia[modifica | modifica wikitesto]

La funzione di rate in meccanica statistica è strettamente collegata all'entropia. Questo può essere visto euristicamente nel modo seguente. In meccanica statistica l'entropia di un particolare macrostato è correlata al numero di microstati che corrisponde a questo macrostato. Nell'esempio precedente del lancio della moneta il valore medio potrebbe designare un particolare macrostato, mentre la particolare sequenza di testa e croce che dà origine a un particolare valore di costituirebbe un particolare microstato. In parole povere, un macrostato a cui corrisponde un numero maggiore di microstati possiede una maggiore entropia, e uno stato con una maggiore entropia ha maggiori possibilità di essere osservato nella realtà. Il macrostato con valore medio di 1/2 (tante teste quante croce) ha il maggior numero di microstati che gli danno origine ed è infatti lo stato con la più alta entropia. Nella maggior parte delle situazioni pratiche si otterrà effettivamente questo macro-stato in un gran numero di prove. La "funzione di rate" invece misura la probabilità di comparsa di un particolare macrostato. Minore è la funzione di frequenza, maggiore è la possibilità che appaia un macrostato. Nel caso del lancio di monete il valore della funzione di rate per un valore medio pari a 1/2 è zero. In questo modo si può vedere la funzione tasso come il negativo dell'entropia.

Note[modifica | modifica wikitesto]

  1. ^ S.R.S. Varadhan, Asymptotic probability and differential equations, Comm. Pure Appl. Math. 19 (1966),261-286.
  2. ^ "Large deviations for performance analysis: queues, communications, and computing", Shwartz, Adam, 1953- TN: 1228486
  3. ^ Varadhan, S.R.S.,The Annals of Probability 2008, Vol. 36, No. 2, 397–419,[1]
  4. ^ http://math.nyu.edu/faculty/varadhan/Spring2012/Chapters1-2.pdf
  5. ^ S.R.S. Varadhan, Large Deviations and Applications (SIAM, Philadelphia, 1984)
  6. ^ H. Cramér, “On a new limit theorem of the theory of probability”, Uspekhi Mat. Nauk, 1944, no. 10, 166–178, su www.mathnet.ru. URL consultato il 25 gennaio 2022.
  7. ^ V. V. Petrov, “Generalization of Cramér's limit theorem”, Uspekhi Mat. Nauk, 9:4(62) (1954), 195–202, su www.mathnet.ru. URL consultato il 25 gennaio 2022.
  8. ^ (EN) I. N. Sanov, On the Probability of Large Deviations of Random Variables, United States Air Force, Office of Scientific Research, 1958. URL consultato il 25 gennaio 2022.
  9. ^ (EN) Giovanni Dematteis, Tobias Grafke e Eric Vanden-Eijnden, Rogue waves and large deviations in deep sea, in Proceedings of the National Academy of Sciences, vol. 115, n. 5, 30 gennaio 2018, pp. 855–860, DOI:10.1073/pnas.1710670115. URL consultato il 28 gennaio 2022.
  10. ^ Francesco Ragone, Jeroen Wouters e Freddy Bouchet, Computation of extreme heat waves in climate models using a large deviation algorithm, in Proceedings of the National Academy of Sciences, vol. 115, n. 1, 19 dicembre 2017, pp. 24–29, DOI:10.1073/pnas.1712645115. URL consultato il 5 aprile 2022.

Bibliografia[modifica | modifica wikitesto]

Voci correlate[modifica | modifica wikitesto]

[[Categoria:Analisi asintotica]] [[Categoria:Teoria della probabilità]]