Funzione convessa

Da Wikipedia, l'enciclopedia libera.
bussola Disambiguazione – Se stai cercando altri significati, vedi Convesso.
Una funzione convessa: presi due punti del grafico, il segmento che li congiunge si trova al di sopra della funzione

In matematica, una funzione f(x) a valori reali definita su un intervallo si dice convessa se il segmento che congiunge due qualsiasi punti del suo grafico si trova al di sopra del grafico stesso. Per esempio, sono funzioni convesse la funzione quadratica f(x) = x^2 e la funzione esponenziale f(x) = e^x.

Le funzioni convesse sono di notevole importanza in molte aree della matematica. Per esempio, sono importanti nei problemi di ottimizzazione, e sono tra le più studiate nel calcolo delle variazioni. In analisi e nella teoria delle probabilità, sono le funzioni per cui vale la disuguaglianza di Jensen.

Il concetto opposto a quello di funzione convessa è quello di funzione concava, ovvero di una funzione in cui il segmento che congiunge due qualsiasi punti del grafico si trovi al di sotto del grafico stesso. Una funzione f(x) è concava se il suo opposto -f(x) è una funzione convessa.

Definizione[modifica | modifica wikitesto]

Spiegazione grafica della convessità di f

Una funzione f: I \to \mathbb{R} a valori reali, definita su un intervallo  I (o, più in generale, su un sottoinsieme convesso di uno spazio vettoriale reale), si dice convessa nel suo dominio se:

f(\lambda x + (1- \lambda) y) \leq \lambda f(x) + (1- \lambda) f(y) \qquad \forall x,y \in I \quad \forall \lambda \in [0,1].[1]

Se l'uguaglianza vale solo nel caso in cui x=y oppure se \lambda = 0 o \lambda = 1, allora si parla di funzione strettamente convessa.

Nel caso in cui  f sia funzione di una sola variabile, detto  I = (a,b), è possibile utilizzare la scrittura equivalente:

\frac{f(x)-f(y)}{x-y} \le \frac{f(t)-f(x)}{t-x} \qquad a < y < x < t < b

Si dimostra inoltre che se una funzione è convessa in un intervallo  I , allora è continua in  I . La funzione risulta inoltre lipschitziana in ogni intervallo chiuso contenuto in  I ed i cui estremi non coincidono con gli estremi di  I .

Convessità in più variabili[modifica | modifica wikitesto]

Una funzione differenziabile f: A \to \mathbb{R} si dice strettamente convessa con parametro m > 0 se per ogni coppia di punti x,y\in A del dominio si ha:[2]:

 ( \nabla f(x) - \nabla f(y) )^T (x-y) \ge m \|x-y\|_2^2.

Se f: A \to \mathbb{R} ha derivate parziali seconde continue, allora f è convessa se e solo se la matrice hessiana Hf(x) è semidefinita positiva in ogni punto x\in A, ed è strettemente convessa se Hf(x) è definita positiva in ogni punto x\in A.

Altre definizioni[modifica | modifica wikitesto]

L'epigrafico di una funzione convessa è un insieme convesso

Una funzione f in I è convessa:

R_f(x,y)=\frac{f(y)-f(x)}{y-x}
è crescente in entrambe le variabili.
  • Solo se:
\forall x,y \in I ~:~ f \left (\frac{x+y}{2}\right ) \leq \frac{f(x) + f(y)}{2}
Tale fatto deriva direttamente dalla definizione ponendo  \lambda = 1/2 . L'implicazione inversa può essere affermata se f è anche continua in I, esclusi eventualmente gli estremi se I è un intervallo, oppure se è superiormente limitata in I, oppure se è misurabile in I secondo Lebesgue.
\operatorname{epi}f = \left \{(x,y) \in \mathbb{R}^{2} : y \geq f(x) \right \}

In alcuni articoli la definizione di funzione convessa si basa su questo criterio, che però non è equivalente alla definizione oggi comunemente usata:

  • Una funzione è convessa se e solo se ha derivate destra e sinistra definite su I, crescenti, con f'_{-}\leq f'_{+} .
  • Se una funzione è derivabile in I allora è convessa se e solo se \displaystyle f'(x) è crescente. In particolare, funzioni derivabili due volte sono convesse se e solo se \forall x \in I ~:~ f''(x) \geq 0.

Disuguaglianza di Jensen[modifica | modifica wikitesto]

Exquisite-kfind.png Per approfondire, vedi Disuguaglianza di Jensen.

Uno dei principali teoremi riguardanti le funzioni convesse è la disuguaglianza di Jensen. Sia (\Omega,\mathfrak{F},\mu) uno spazio di misura, tale che \mu(\Omega) = 1. Se g è una funzione integrabile da \Omega a valori reali, e \varphi è una funzione convessa sull'immagine di g, allora:[3]

\varphi\left(\int_{\Omega} g\, d\mu\right) \le \int_\Omega \varphi \circ g\, d\mu.

Note[modifica | modifica wikitesto]

  1. ^ W. Rudin, Pag. 60
  2. ^ p. 72, Convex Analysis and Optimization", by Dimitri Bertsekas, Athena Scientific, 2003
  3. ^ W. Rudin, Pag. 61

Bibliografia[modifica | modifica wikitesto]

  • Walter Rudin, Real and Complex Analysis, Mladinska Knjiga, McGraw-Hill, 1970, ISBN 0-07-054234-1.

Voci correlate[modifica | modifica wikitesto]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica