Equilibrio di Nash

Da Wikipedia, l'enciclopedia libera.

In teoria dei giochi si definisce equilibrio di Nash un profilo di strategie (una per ciascun giocatore) rispetto al quale nessun giocatore ha interesse ad essere l'unico a cambiare.

Nascita del teorema di Nash[modifica | modifica wikitesto]

La prima formulazione di questo teorema, relativo alla nozione di equilibrio più famosa della teoria dei giochi per quel che riguarda i "giochi non cooperativi", appare in un brevissimo articolo apparso nel 1950 dove John Nash, ancora studente a Princeton, spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani[1]: quella di un punto fisso in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi ad un numero arbitrario di partecipanti, o agenti. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suo payoff, sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso).

Il risultato di Nash può essere visto come una estensione rilevante rispetto al caso dei giochi a "somma zero" studiati in precedenza da John von Neumann. L'idea di equilibrio rappresenta anche una variazione concettuale significativa rispetto all'approccio di von Neumann, che faceva ricorso all'idea di minimax.

L'equilibrio di Nash: definizione[modifica | modifica wikitesto]

Vediamo ora più nel dettaglio cosa si intende esattamente per equilibrio di Nash. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici della teoria dei giochi e definire alcuni concetti basilari.

Un gioco è caratterizzato da:

  • Un insieme G di giocatori, o agenti, in numero di N, che indicheremo con i=1,...,N;
  • Un insieme S di strategie, costituito da un insieme di N vettori
S_i=\left(s_{i,1}, s_{i,2},...,s_{i,j},...,s_{i,M_i}\right)

ciascuno dei quali contiene l'insieme delle strategie che il giocatore i-esimo ha a disposizione, cioè l'insieme delle azioni che esso può compiere; per brevità indicheremo nel seguito con s_i la strategia scelta dal giocatore i;

  • Un insieme U di funzioni
u_i=U_i\left(s_1, s_2,...,s_i,...,s_N\right)

che associano ad ogni giocatore i il guadagno (detto anche pay-off) u_i derivante da una data combinazione di strategie (il guadagno di un giocatore in generale dipende infatti non solo dalla sua strategia ma anche dalle strategie scelte dagli avversari).

Un equilibrio di Nash per un dato gioco è una combinazione di strategie (che indicheremo con l'apice e)

s_1^e, s_2^e,...,s_N^e

tale che

U_i\left(s_1^e, s_2^e,...,s_i^e,...,s_N^e\right)\ge U_i\left(s_1^e, s_2^e,...,s_i,...,s_N^e\right)

per ogni i e per ogni strategia s_i scelta dal giocatore i-esimo.

Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia s_i^e dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia s_j^e. Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore i gioca una qualunque strategia a sua disposizione diversa da s_i^e, mentre tutti gli altri hanno giocato la propria strategia s_j^e, può solo peggiorare il proprio guadagno o, al più, lasciarlo invariato. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri. Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia.

Il contributo più importante dato da John Nash alla teoria dei giochi è la dimostrazione matematica dell'esistenza di questo equilibrio. In particolare egli ha dimostrato che ogni gioco finito ha almeno un equilibrio di Nash, eventualmente in strategie miste. Per gioco finito si intende un gioco con un numero qualunque ma finito di giocatori e di strategie, e per strategia mista per un dato giocatore si intende una distribuzione di probabilità sulle strategie a disposizione del suddetto giocatore.

Equilibrio di Nash e ottimo di Pareto[modifica | modifica wikitesto]

Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di equilibrio di Nash. Si è visto infatti come esso rappresenti una situazione nella quale nessun agente razionale ha interesse a cambiare strategia e come sia il frutto della scelta, da parte di tutti i giocatori, della propria strategia dominante: l'equilibrio di Nash rappresenta quindi la situazione nella quale il gruppo si viene a trovare se ogni componente del gruppo fa ciò che è meglio per sé, cioè mira a massimizzare il proprio profitto a prescindere dalle scelte degli avversari. Tuttavia, non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. Infatti, se è vero che in un equilibrio di Nash il singolo giocatore non può aumentare il proprio guadagno modificando solo la propria strategia, non è affatto detto che un gruppo di giocatori, o, al limite, tutti, non possano aumentare il proprio guadagno allontanandosi congiuntamente dall'equilibrio. È noto infatti che l'equilibrio di Nash può non essere un ottimo di Pareto (o ottimo paretiano), e quindi possano esistere altre combinazioni di strategie che conducono a migliorare il guadagno di alcuni senza ridurre il guadagno di nessuno, o addirittura, come accade nel caso del dilemma del prigioniero, ad aumentare il guadagno di tutti. Analogamente, il risultato migliore per tutti può non essere un equilibrio. Supponiamo quindi che in un gioco esista un equilibrio di Nash ed esista anche una combinazione di strategie ottimale, che indicheremo con l'apice o, tale che

U_i\left(s_1^o, s_2^o,...,s_i^o,...,s_N^o\right)> U_i\left(s_1^e, s_2^e,...,s_i^e,...,s_N^e\right)

per ogni i, ma che questa tale combinazione non sia un equilibrio, come accade nel dilemma del prigioniero, o, in altre parole, che s_i^o non sia una strategia dominante. In tal caso, ogni singolo agente avrà a disposizione almeno una strategia s_i^e diversa da s_i^o che gli permette di migliorare ulteriormente il proprio profitto modificando la sua sola strategia, vale a dire che esiste per ogni agente una s_i^e tale che

U_i\left(s_1^o, s_2^o,...,s_i^e,...,s_N^o\right)> U_i\left(s_1^o, s_2^o,...,s_i^o,...,s_N^o\right) .

Conseguentemente, per l'assioma di razionalità, sarà portato a preferire una strategia diversa da s_i^o. Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia s_i^o, dipende, come sempre, dal fatto che tutti abbiano scelto tale strategia, poiché in generale il guadagno di i dipende dalle scelte di tutti i giocatori; non essendo s_i^o una strategia dominante, è possibile che se anche uno solo degli agenti sceglie di non giocare s_i^o , gli altri subiscano una riduzione del proprio guadagno rispetto a quello che avrebbero ottenuto giocando una strategia ottimale. In conclusione, ogni giocatore troverà comunque preferibile non rischiare e giocare la propria strategia dominante, e la soluzione del gioco resterà comunque l'equilibrio di Nash, anche se esso non garantisce il massimo guadagno possibile.

Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi s_i^o coincide con s_i^e e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una cooperazione tra i giocatori, vale a dire che tutti agiscano non col fine di ottenere il miglior risultato per sé, ma di ottenere il miglior risultato per il gruppo, e quindi, indirettamente, ottenendo un risultato migliore anche per sé (anche questo concetto è ben esemplificato nel dilemma del prigioniero). Poiché tuttavia spesso la razionalità collettiva contrasta con quella individuale, è nella maggior parte dei casi necessario un accordo vincolante tra i giocatori (e quindi una istituzione che vigili su tale accordo) ed una sanzione nei confronti di chi non lo rispetta, riducendo quindi il profitto del singolo se esso si allontana dalla combinazione di strategie che garantisce a tutti il miglior risultato, affinché nessuno trovi preferibile defezionare.

Esempio: il "dilemma del prigioniero"[modifica | modifica wikitesto]

Exquisite-kfind.png Per approfondire, vedi dilemma del prigioniero.

Il dilemma del prigioniero fornisce un valido spunto per confrontare i due concetti di equilibrio di Nash e ottimo di Pareto, e per comprenderne l'applicazione in economia. Riprendendo quanto illustrato nella definizione matematica dell'equilibrio di Nash, vediamo la loro applicazione al caso del dilemma del prigioniero. Le possibili scelte per due prigionieri in celle diverse non comunicanti sono parlare (accusando l'altro) o non parlare.

  • Se entrambi non parlano avranno una pena leggera (1 anno);
  • Se entrambi parlano, accusandosi a vicenda, avranno una pena pesante (6 anni);
  • Se fanno scelte diverse, quello che parla avrà la libertà (0 anni) e l'altro avrà una pena leggermente più pesante (7 anni) che non se avessero confessato entrambi.

Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio di Nash è di parlare, per entrambi. Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica).

Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessi pay-off (2x2) che sono (indicheremo per brevità confessa con c e non confessa con n e gli anni di carcere col segno meno poiché rappresentano perdite e quindi guadagni negativi):

  • Strategie: S_i=\left(c, n\right)
  • Pay-off:
u_i\left(c, c\right)=-6
u_i\left(c, n\right)=0
u_i\left(n, c\right)=-7
u_i\left(n, n\right)=-1

Si deduce immediatamente che, per entrambi, la strategia dominante è confessa, infatti

u_i\left(c, c\right)\ge u_i\left(n, c\right)

e

u_i\left(c, n\right)\ge u_i\left(n, n\right)

quindi qualunque sia la scelta dell'avversario, scegliere confessa garantisce sempre un guadagno maggiore rispetto a scegliere non confessa. È immediato riconoscere come la combinazione di strategie dominanti confessa-confessa soddisfi la disuguaglianza che definisce l'equilibrio di Nash, infatti per entrambi i giocatori

u_i\left(c, c\right)\ge u_i\left(n, c\right)

(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sostanza, posto che il secondo giocatore confessi, il primo deve scegliere anch'esso confessa, e non può aumentare il proprio guadagno cambiando solo la sua strategia: il suo pay-off nel caso non confessa-confessa è minore di quello che otterrebbe giocando l'equilibrio. confessa-confessa è inoltre l'unico equilibrio del gioco, infatti nessun'altra combinazione di strategie soddisfa la disuguaglianza.

La soluzione del gioco è quindi che entrambi confessano, ottenendo 6 anni di carcere ciascuno.

L'aspetto tuttavia più interessante del dilemma del prigioniero è il seguente: tutte le combinazioni di strategie, ad eccezione dell'equilibrio di Nash, sono ottimi paretiani. Infatti, presa una qualunque di queste combinazioni, non è possibile trovarne un'altra che comporti per almeno uno dei due giocatori una riduzione degli anni di carcere senza che aumentino quelli dell'altro. Questo concetto non è invece applicabile all'equilibrio confessa-confessa: la combinazione non confessa-non confessa porta ad una riduzione degli anni di carcere per entrambi i giocatori (un anno ciascuno invece di 6) e poiché

u_i\left(n, n\right)>u_i\left(c, c\right)

per ogni i, (c, c) non è una soluzione Pareto-ottimale.

L'ottimo paretiano è un concetto di grande importanza in economia: un Ottimo di Pareto si definisce come una situazione nella quale, indipendentemente dalla specifica allocazione delle risorse, non sia possibile trovare un'altra che porti ad un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate o che sono state allocate male; meglio quindi cambiare allocazione. Nel caso dell'ottimo paretiano, infatti, l'ulteriore arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: l'ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è affatto dal punto di vista individuale; in sostanza, se gli N agenti di un gioco (e quindi, per estensione, di un mercato) agiscono secondo la razionalità individuale, cioè col solo fine di massimizzare il proprio profitto personale, non è detto che essi raggiungano un ottimo di Pareto. In alcuni casi lo raggiungono ed in altri no; in quest'ultimo caso le loro azioni comportano una dispersione o cattiva allocazione di risorse.

Il confronto tra equilibrio di Nash e ottimo paretiano fa dubitare della generalità di quanto sostenuto da Adam Smith. Egli infatti riteneva che se ogni componente di un gruppo persegue il proprio interesse personale e vi sono condizioni di concorrenza perfetta, l'equilibrio che ne esce è uno nel quale ogni azione individuale accresce la ricchezza complessiva del gruppo. Un ottimo di Pareto, insomma. Oggi invece sappiamo che se ogni componente del gruppo fa ciò che è meglio per sé, il risultato cui si giunge è, in generale, un equilibrio di Nash ma non necessariamente un ottimo di Pareto: è quindi possibile che, se ogni agente fa solo il proprio interesse personale, si giunga ad un'allocazione inefficiente delle risorse. Nel caso del dilemma del prigioniero, ciò è evidente: il valore minimo possibile di anni di carcere è 0 per il singolo e 2 per il gruppo, ma se entrambi scelgono la propria strategia dominante, ne ottengono 6 a testa.

L'equilibrio di duopolio di Cournot e l'economia[modifica | modifica wikitesto]

Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio di duopolio che Antoine Augustine Cournot, matematico ed economista, descrisse già nel 1838.

Note[modifica | modifica wikitesto]

  1. ^ Si noti che questa connessione era comunque già presente qui: John von Neumann: Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung der Brouwerschen Fixpunktsatzes, Ergebnisse eines Math. Kolloquiums (curatore: Karl Menger), 8, 73-83, 1937. Traduzione inglese: A model of general economic equilibrium, Review of Economic Studies, 13, 1-9, 1945-1946.

Bibliografia[modifica | modifica wikitesto]

  • Nash, John F. Jr. [1950]: Equilibrium Points in n-Person Games, Proc. Nat. Acad. Sci. U.S.A., 36, 48-49.
  • Nash, John F. Jr. [1951]: Non-Cooperative Games, Ann. of Math., 54, 286-295.

Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

  • Nash, Berge, Kakutani dimostrazione del teorema di esistenza dell'equilibrio di Nash e preliminari (file pdf, 18 pagg.)
matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica