Quoziente di Rayleigh

Da Wikipedia, l'enciclopedia libera.

In matematica, in particolare nell'ambito dell'algebra lineare e dell'analisi funzionale, per una data matrice hermitiana A e un vettore non nullo x, il quoziente di Rayleigh è il numero reale:

R(A,x):={x^{\dagger} A x \over x^{\dagger} x}

dove x^{\dagger} indica il vettore trasposto coniugato di x. Anche se definito tramite quantità complesse, il quoziente di Rayleigh è sempre reale, essendo x^{\dagger}A x una forma hermitiana ed essendo x^{\dagger}x = \|x\|^2, dove \| \cdot \| indica la norma euclidea. Come verifica, è sufficiente porre \alpha:=x^{\dagger}Ax e osservare che, essendo A^{\dagger}=A, si ha:

\alpha^{\dagger}=x^{\dagger}A^{\dagger}x=x^{\dagger}Ax=\alpha

ma ciò implica che \alpha \in \R.

Si può dimostrare che il quoziente di Rayleigh assume il valore minimo \lambda_\min, che è il più piccolo autovalore di A, quando x è il corrispondente autovettore v_\min. Analogamente, si ha R(A, x) \leq \lambda_\max e R(A, v_\max) = \lambda_\max.

L'immagine del quoziente di Rayleigh è lo spettro di A, e il numero \lambda_\max è il raggio spettrale.

Matrice delle covarianze[modifica | modifica sorgente]

Un caso di particolare importanza si verifica quando la matrice A è la matrice delle covarianze. Un tale matrice può essere rappresentata dal prodotto D' D, dove D è una matrice di dati empirici e D' la sua trasposta. Essendo simmetrica, A possiede autovalori non negativi e autovettori ortogonali (più precisamente, ortonormalizzabili). Infatti:

A v_i = D' D v_i = \lambda_i v_i
\Rightarrow v_i' D' D v_i = v_i' \lambda_i v_i
\Rightarrow \left\| D v_i \right\|^2 = \lambda_i \left\| v_i \right\|^2
\Rightarrow \lambda_i = \frac{\left\| D v_i \right\|^2}{\left\| v_i \right\|^2} \geq 0

ovvero gli autovalori \lambda_i non sono negativi. Inoltre:

\begin{align}
&\qquad \qquad A v_i = \lambda _i v_i \\
&\Rightarrow v_j' A v_i = \lambda _i v_j' v_i \\
&\Rightarrow \left (A v_j \right )' v_i = \lambda _j v_j' v_i \\
&\Rightarrow \lambda_j v_j ' v_i = \lambda _i v_j' v_i \\
&\Rightarrow \left (\lambda_j - \lambda_i \right ) v_j ' v_i = 0 \\
&\Rightarrow v_j ' v_i = 0
\end{align}

ovvero gli autovettori v_j sono ortogonali (ortonormalizzabili nel caso di autovettori differenti/molteplici).

Per mostrare che il quoziente di Rayleigh è massimizzato dall'autovettore relativo al più grande autovalore (raggio spettrale), si consideri la decomposizione di un generico vettore x nella base degli autovettori v_i:

x = \sum _{i=1} ^n \alpha _i v_i

dove:

\alpha_i = \frac{x'v_i}{v_i'v_i} = \frac{\langle x,v_i\rangle}{\left\| v_i \right\| ^2}

è la coordinata di x proiettata ortogonalmente su v_i. Quindi si ha:

R(A,x) = \frac{x' D' D x}{x' x} = \frac{ \left (\sum _{j=1} ^n \alpha _j v_j \right )' \left ( D' D \right ) \left (\sum _{i=1} ^n \alpha _i v_i \right )}{ \left (\sum _{j=1} ^n \alpha _j v_j \right )' \left (\sum _{i=1} ^n \alpha _i v_i \right )}

che per la mutua perpendicolarità degli autovettori diventa:

R(A,x) = \frac{\sum _{i=1} ^n \alpha_i^2 \lambda _i}{\sum _{i=1} ^n \alpha_i^2} = \sum_{i=1}^n \lambda_i \frac{(x'v_i)^2}{ (x'x)( v_i' v_i)}

ovvero il quoziente di Rayleigh è la somma dei coseni al quadrato degli angoli formati tra x e gli autovettori v_i, pesata per i rispettivi autovalori.

Se un vettore x massimizza R(A,x), allora anche ogni scalare non nullo kx massimizza R e pertanto il problema può essere ridotto al metodo di Lagrange per massimizzare \sum _{i=1}^n \alpha_i^2 \lambda _i, a condizione che:

\sum _{i=1} ^n \alpha _i ^2 = 1

Formulazione tramite moltiplicatori di Lagrange[modifica | modifica sorgente]

Questo risultato può essere ricavato anche utilizzando il metodo dei moltiplicatori di Lagrange. Il problema consiste nel trovare i punti critici della funzione:

R(A,x) = x^T A x

soggetta al vincolo \|x\|^2 = x^Tx = 1. Si tratta cioè di trovare i punti critici di:

\mathcal{L}(x) = x^T A x  -\lambda \left (x^Tx - 1 \right)

dove \lambda è un moltiplicatore di Lagrange. Il punto stazionario di \mathcal{L}(x) si verifica quando:

\frac{d\mathcal{L}(x)}{dx} = 0
\Rightarrow 2x^T M^T  - 2\lambda x^T = 0
\Rightarrow A x = \lambda x

e:

 R(A,x) = \frac{x^T A x}{x^T x} = \lambda \frac{x^Tx}{x^T x} = \lambda

Quindi, gli autovettori x_1, \cdots, x_n di A sono i punti critici del quoziente di Rayleigh e i rispettivi autovalori \lambda_1, \cdots, \lambda_n sono i valori stazionari di R.

Utilizzo nella teoria di Sturm-Liouville[modifica | modifica sorgente]

La teoria di Sturm-Liouville studia l'azione dell'operatore lineare:

L(y) = \frac{1}{w(x)}\left(-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y\right)

sullo spazio prehilbertiano definito da:

\langle{y_1,y_2}\rangle = \int_a^b w(x)y_1(x)y_2(x) \, dx

composto da funzioni che soddisfano alcune specifiche condizioni al contorno in a e b. In tal caso il quoziente di Rayleigh è:

\frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b y(x)\left(-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y(x)\right)dx}{\int_a^b{w(x)y(x)^2}dx}

Talvolta è presentato in una forma equivalente, ottenuta separando l'integrale al numeratore e utilizzando l'integrazione per parti:

\begin{align}
\frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} &= \frac{ \left \{ \int_a^b y(x)\left(-\frac{d}{dx}\left[p(x)y'(x)\right]\right) dx \right \}+ \left \{\int_a^b{q(x)y(x)^2} \, dx \right \}}{\int_a^b{w(x)y(x)^2} \, dx} \\
&= \frac{ \left \{\left. -y(x)\left[p(x)y'(x)\right] \right |_a^b \right \} + \left \{\int_a^b y'(x)\left[p(x)y'(x)\right] \, dx \right \} + \left \{\int_a^b{q(x)y(x)^2} \, dx \right \}}{\int_a^b w(x)y(x)^2 \, dx}\\
&= \frac{ \left \{ \left. -p(x)y(x)y'(x) \right |_a^b \right \} + \left \{ \int_a^b \left [p(x)y'(x)^2 + q(x)y(x)^2 \right] \, dx \right \} } {\int_a^b{w(x)y(x)^2} \, dx}
\end{align}

Generalizzazione[modifica | modifica sorgente]

Per una data coppia di matrici (A, B) e per un dato vettore x \ne \vec 0, il quoziente di Rayleigh generalizzato è definito come:

R(A,B; x) := \frac{x^* A x}{x^* B x}

Il quoziente di Rayleigh generalizzato può essere ridotto al quoziente di Rayleigh R(D, C^*x) attraverso la traformazione D = C^{-1} A {C^*}^{-1}, dove CC^* è la decomposizione di Cholesky della matrice hermitiana B definita positiva.

Bibliografia[modifica | modifica sorgente]

Voci correlate[modifica | modifica sorgente]

Collegamenti esterni[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica