Teorema delle funzioni implicite

Da Wikipedia, l'enciclopedia libera.

In matematica, in particolare in analisi matematica e geometria, il teorema delle funzioni implicite è un importante strumento che stabilisce quando il luogo di zeri di un'equazione implicita si può esplicitare rispetto a una variabile.

Il caso più semplice del teorema è detto dalla scuola pisana teorema di Dini.

Il teorema di Dini[modifica | modifica wikitesto]

Il teorema di Dini stabilisce che una funzione reale di classe C^1 di due variabili del tipo:

F(x,y)=0

definisce implicitamente un'unica funzione del tipo:

y=f(x)

in un intorno di un punto (a,b) tale che:[1]

F(a,b)=0 \qquad \frac{\partial F}{\partial y}(a,b)\ne 0

Il teorema di Dini fornisce quindi una condizione sufficiente affinché esista un'unica funzione y=f(x) tale che

F(x,f(x))=0

sia soddisfatta al variare di x, ovvero un'unica funzione x=g(y) tale che

F(g(y),y)=0

sia soddisfatta al variare di y.

Questo non significa che sia possibile esplicitare una delle due incognite in funzione dell'altra, ovvero che sia possibile trovare y=f(x) oppure x=g(y) in forma esplicita, ma mostra piuttosto che esiste almeno una delle due funzioni, detta funzione implicita.

Se ci si limita all'individuazione di particolari tipi di funzione, ad esempio quelle continue e definite su un intervallo, si può dimostrare anche la loro unicità, il che sancisce un'equivalenza formale tra la scrittura implicita F(x,y)=0 e quella esplicita y=f(x) oppure x=g(y). Ad esempio, l'equazione:

F(x,y)=y+x^2e^y = 0

ben definisce un'unica funzione continua y=f(x) definita per ogni x reale, che tuttavia non può essere scritta esplicitamente.

Enunciato[modifica | modifica wikitesto]

Sia F:G \subset \R^2 \to \R una funzione a valori reali, differenziabile e le cui derivate parziali prime siano funzioni continue. Sia inoltre (x_0,y_0) \in G tale che:

F(x_0,y_0) = 0 \qquad F_y (x_0,y_0) \ne 0 \

dove F_y (x_0,y_0) è la derivata rispetto a y in (x_0,y_0).

Il teorema afferma che esiste una funzione derivabile reale:

g : [x_0 - h,x_0 + h] \to [y_0 - k,y_0 + k] \qquad h,k > 0 \quad h,k \in \R

la cui derivata prima sia continua. Inoltre, il grafico di g è l'insieme delle coppie:

\{ (x,y) \in G : F(x,y)=0 \}

che sono contenute nel rettangolo:

[x_0 - h,x_0 + h] \times [y_0 - k,y_0 + k]

Il teorema in due dimensioni[modifica | modifica wikitesto]

Si consideri una funzione di classe C1 F: A \to \R definita su un insieme aperto A \subseteq \R^2, e si consideri l'insieme:

Z=\{(x,y)\in A: F(x,y)=0\}.

Se Z è non vuoto esiste un punto (x_0,y_0) tale che:

F(x_0,y_0)=0 \

Il teorema afferma che se (x_0,y_0) non è un punto critico, ovvero:

\nabla F (x_0,y_0) \neq 0 \

allora esiste un intorno U di (x_0,y_0) tale che l'insieme Z \cap U è il grafico di una funzione derivabile.

Questo equivale a dire che esiste un'unica funzione del tipo y=y(x) o del tipo x=x(y) che mette in relazione le due incognite x e y. Si noti che questo non significa che è davvero possibile esplicitare una delle due variabili in funzione dell'altra, ma solo che l'equazione definisce implicitamente un legame tra le due incognite che è univoco.

Sia g : A\subset\R^2\rightarrow \;\mathbb{R} una funzione di classe \mathcal{C}^1 nell'aperto A e sia (x_0,y_0)\in A tale che:

g(x_0,y_0)=0 \qquad g_y(x_0,y_0)\ne 0

Allora esistono un intervallo reale aperto I, con x_0\in I, un intervallo reale aperto J, con y_0\in J, ed una funzione y(x) di classe \mathcal{C}^1 in I a valori in J tali che:

y(x_0)=y_0 \qquad y'(x_0)=-\left( \frac{g_x(x_0,y_0)}{g_y(x_0,y_0)} \right)

e tali che per ogni x \in I, y \in J la relazione:

g(x,y)=0 \

si verifica se e solo se:

y=y(x) \

Scambiando i ruoli delle variabili si giunge a definire una funzione x=x(y).

Dimostrazione[modifica | modifica wikitesto]

Sia data una funzione continua g:A\subset \R^2\to \R di classe \mathcal{C}^1 in A tale che \nabla g (x,y)\neq0 in tutti i punti tali che g(x,y)=0, cioè nella curva di livello:

V=\{(x,y)\in A : g(x,y)=0\}.

Sia (x_0,y_0) un punto di V e si consideri il relativo sviluppo al primo ordine di Taylor:

g(x,y)=g(x_0,y_0)+g_x(x_0,y_0)(x-x_0)+g_y(x_0,y_0)(y-y_0)+o(\sqrt{(x-x_0)^2+(y-y_0)^2})

Tenendo conto che g(x_0,y_0)=0, uguagliando a zero la prima parte del termine al primo ordine si ottiene:

g_x(x_0,y_0)(x-x_0)+g_y(x_0,y_0)(y-y_0)=0\,

Per ipotesi, tale equazione di primo grado ha almeno un coefficiente diverso da zero, e si può porre g_y(x_0,y_0)\neq0. Si può quindi ricavare y in funzione di x:

y=y_0 - \frac{g_x(x_0,y_0)}{g_y(x_0,y_0)}(x-x_0)

Il teorema mostra che l'errore nella formula di approssimazione al primo ordine non incide sulla possibilità di esprimere una variabile in funzione dell'altra.

La funzione ottenuta ha sviluppo al primo ordine:

y=y_0 - \frac{g_x(x_0,y_0)}{g_y(x_0,y_0)}(x-x_0) + o(x-x_0)

Il teorema in più dimensioni[modifica | modifica wikitesto]

Sia \mathbf f : E \subset \R^{n+m}\rightarrow \R^n una funzione di classe \mathcal{C}^1, dove \R^{n+m} è il prodotto cartesiano \R^n \times \R^m i cui elementi sono del tipo (\mathbf{x},\mathbf{y}) = (x_1, x_2, \ldots, x_n , y_1, y_2, \ldots, y_m). Sia inoltre (\mathbf{a},\mathbf{b}) = (a_1, a_2, \ldots, a_n , b_1, b_2, \ldots, b_m) \in E un punto tale che \mathbf f(\mathbf{a},\mathbf{b}) = 0.

Data la matrice jacobiana di \mathbf f in (\mathbf{a},\mathbf{b}):

\begin{matrix}
(D \mathbf f)(\mathbf{a},\mathbf{b}) & = & 
\left[\begin{matrix}
 \frac{\partial f_1}{\partial x_1}(\mathbf{a},\mathbf{b}) &
    \cdots & \frac{\partial f_1}{\partial x_n}(\mathbf{a},\mathbf{b})\\
 \vdots & \ddots & \vdots\\
 \frac{\partial f_n}{\partial x_1}(\mathbf{a},\mathbf{b}) & \cdots & \frac{\partial f_n}{\partial x_n}(\mathbf{a},\mathbf{b})
\end{matrix}\right|\left.
\begin{matrix} 
 \frac{\partial f_1}{\partial y_1}(\mathbf{a},\mathbf{b}) & \cdots & \frac{\partial f_1}{\partial y_m}(\mathbf{a},\mathbf{b})\\
 \vdots & \ddots & \vdots\\
\frac{\partial f_n}{\partial y_1}(\mathbf{a},\mathbf{b}) & \cdots & \frac{\partial f_n}{\partial y_m}(\mathbf{a},\mathbf{b})\\
\end{matrix}\right] =  \begin{bmatrix} X & | & Y  \end{bmatrix}\\
\end{matrix}

si supponga che X è invertibile.

Il teorema delle funzioni implicite afferma che vi sono due insiemi aperti U \subset \R^{n+m} e V \subset \R^m contenenti rispettivamente (\mathbf{a},\mathbf{b}) e \mathbf{b} tali che per ogni \mathbf{y} \in V esiste un unico \mathbf{x} che soddisfa (\mathbf{x},\mathbf{y}) \in U e \mathbf f(\mathbf{x},\mathbf{y}) = 0. Inoltre, la funzione \mathbf g : V \to \R^n tale che \mathbf g(\mathbf{y}) = \mathbf{x} è una funzione di classe \mathcal{C}^1 tale che:[2]

\mathbf g(\mathbf{b}) = \mathbf{a} \qquad (D \mathbf g)(\mathbf b) = -X^{-1}Y

dove (D \mathbf g)(\mathbf b) è la jacobiana di \mathbf g in \mathbf{b}. La relazione:

\mathbf f(\mathbf g(\mathbf y),\mathbf y)= 0 \qquad \mathbf y \in V

definisce implicitamente \mathbf g.

Il teorema stabilisce quindi che il sistema \mathbf{f}(\mathbf{x},\mathbf{y}) = \mathbf 0:

\left\{
\begin{matrix} 
f_1(x_1 , x_2 , \cdots , x_n , y_1 , y_2 , \cdots , y_m ) = 0 \\
f_2(x_1 , x_2 , \cdots , x_n , y_1 , y_2 , \cdots , y_m ) = 0 \\
\vdots\\
f_n(x_1 , x_2 , \cdots , x_n , y_1 , y_2 , \cdots , y_m ) = 0 \\
\end{matrix}
\right.

può essere risolto esplicitando (x_1 , x_2 , \cdots , x_n ) in funzione di (y_1 , y_2 , \cdots , y_m ) in un intorno di \mathbf{b} se il sistema è risolvibile in (\mathbf{a},\mathbf{b}) e se X è invertibile.[3] Le soluzioni così trovate sono inoltre funzioni di classe \mathcal{C}^1. Il teorema può essere generalizzato al caso di funzioni analitiche.

Note[modifica | modifica wikitesto]

  1. ^ W. Rudin, Pag. 225
  2. ^ W. Rudin, Pag. 226
  3. ^ W. Rudin, Pag. 227

Bibliografia[modifica | modifica wikitesto]

  • Walter Rudin, Principi di analisi matematica, Milano, McGraw-Hill, 1991, ISBN 88-386-0647-1.
  • V.Barutello, M.Conti, D.L.Ferrario, S.Terracini, G.Verzini, Analisi matematica. Con elementi di geometria e calcolo vettoriale, Apogeo Editore, 2008, ISBN 8850324235.

Voci correlate[modifica | modifica wikitesto]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica