Teoremi di Gershgorin

Da Wikipedia, l'enciclopedia libera.
(Reindirizzamento da Teoremi di Gerschgorin)
Vai alla navigazione Vai alla ricerca

In matematica, e più precisamente in algebra lineare, i teoremi di Gershgorin sono tre teoremi riguardanti la localizzazione degli autovalori di una matrice a termini nel campo complesso. Il nome di questi teoremi è dovuto a quello del matematico bielorusso Semyon Aranovich Gershgorin, che per primo li ha enunciati nel 1931.

Cerchi di Gershgorin

[modifica | modifica wikitesto]
Rappresentazione nel piano complesso dei cerchi di Gershgorin della matrice A = [-2 1 0; -1 2 -1; 1 -2 4].
Rappresentazione nel piano complesso dei cerchi di Gershgorin della matrice . Le croci indicano la posizione effettiva degli autovalori[1].

Una definizione di basilare importanza nella comprensione di questi teoremi è quella del cerchio di Gershgorin.

Sia una matrice in . Si consideri l'elemento -esimo della diagonale principale di e la somma dei moduli degli elementi della riga -esima fuori della diagonale:

Queste due quantità individuano il seguente sottoinsieme del piano complesso:

corrispondente ad un disco di raggio centrato in , che viene detto -esimo cerchio di Gershgorin della matrice .

Primo teorema di Gershgorin

[modifica | modifica wikitesto]
Teorema. Sia e sia [2] un suo autovalore. Se è una coordinata di modulo massimo di un autovettore relativo a , allora . In particolare esiste tale per cui , ovverosia appartiene almeno ad un cerchio di Gershgorin di .

Dimostrazione. Sia un autovalore di e sia un autovettore relativo a . Sia l'indice di una coordinata di con modulo massimo tra tutte le coordinate. Dal momento che è autovettore, non è nullo, e dunque . Sempre perché è un autovettore, vale l'identità , che, applicata all'-esima coordinata, implica che:

Allora, manipolando la somma, otteniamo che:

Dividendo entrambi i membri per (che ricordiamo essere non nullo), passando ai moduli e applicando la disuguaglianza triangolare otteniamo che:

dove la disuguaglianza vale poiché data la scelta iniziale di . Pertanto , da cui la tesi.

Estensione del teorema e generalizzazione agli ovali di Cassini

[modifica | modifica wikitesto]

Dal momento che gli autovalori di sono invarianti per similitudine, se è una matrice diagonale invertibile, allora ha gli stessi autovalori di , mantenendone invariati i centri dei cerchi di Gershgorin e riscalandone soltanto il raggio. In particolare, il nuovo raggio, indicato con , è calcolato mediante la seguente formula:

Pertanto, il primo teorema di Gershgorin può essere esteso al seguente risultato:

Teorema. Sia . Allora [3], dove è un insieme di vettori con coordinate positive.
Confronto tra i cerchi di Gershgorin (in blu, verde e giallo) e gli ovali di Cassini (in rosso) relativi alla matrice . Le croci indicano la posizione effettiva degli autovalori[1].

Il teorema può essere esteso anche abbandonando la struttura dei cerchi di Gershgorin e riducendosi a degli ovali di Cassini della forma , secondo il seguente enunciato:

Teorema (degli ovali di Brauer)[4]. Sia e sia un suo autovalore. Allora è contenuto nell'unione di ovali di Cassini, dove è il raggio dell'-esimo cerchio di Gershgorin di .

Secondo teorema di Gershgorin

[modifica | modifica wikitesto]
Teorema. Sia . Siano e due famiglie di indici con e .
Si definiscano e . Se , allora esattamente autovalori appartengono a (contati con molteplicità algebrica) e i restanti appartengono a .

Questo teorema porta con sé delle importanti implicazioni. Ad esempio, per , si ricava immediatamente che un cerchio disgiunto da tutti gli altri deve per forza contenere un solo autovalore, che, in quanto unico, dovrà per forza essere reale (se fosse complesso non reale, allora nello stesso cerchio dovrebbe trovarsi anche il suo autovalore complesso coniugato, e dunque il cerchio conterrebbe due autovalori invece che uno solo).

Idea di dimostrazione[5]: La dimostrazione fa uso di un argomento di continuità. Sia la matrice diagonale ottenuta prendendo la diagonale di e ponendo tutti gli altri termini. Si consideri la funzione tale per cui (ovverosia parametrizza il cammino fatto sul segmento che congiunge ad ). Chiaramente è una funzione continua dallo spazio topologico con l'usuale topologia euclidea allo spazio avente la topologia indotta dall'analoga euclidea di . Sia l'-esimo cerchio di Gershgorin di . Si osserva che ha centro indipendentemente da , mentre il suo raggio è , dove è il raggio di , il cerchio riferito ad . Pertanto per . Si ricorda che gli zeri di un polinomio dipendono continuamente dai coefficienti, e che gli autovalori di sono gli zeri del polinomio caratteristico di , i cui coefficienti dipendono continuamente dai termini di , e dunque da . Pertanto, poiché anche è continua, gli autovalori di dipendono continuamente da . Sia il cammino continuo di uno degli autovalori. Allora, se , per ogni ; altrimenti esisterebbe uno per cui per ogni (il che violerebbe il primo teorema di Gershgorin) o varrebbe , assurdo. Analogamente vale lo stesso per . Pertanto contiene lo stesso numero di autovalori di , e quindi autovalori. Analogamente ne contiene , da cui la tesi.

Terzo teorema di Gershgorin

[modifica | modifica wikitesto]
Teorema. Sia un autovalore di una matrice irriducibile per permutazioni. Se vale l'implicazione , allora , e dunque .

Dimostrazione. Sia tale per cui . Ripercorrendo la stessa dimostrazione del primo teorema di Gershgorin si ottiene che:

Dal momento che appartiene alla frontiera , allora il primo e l'ultimo membro devono essere uguali, e così tutte le disuguaglianze si rivelano essere uguaglianze. Affinché ciò accada, è necessario che valga per tutti gli indici per cui ; ciò implica che per tutti questi indici anche è una coordinata di modulo massimo per : per il primo teorema di Gershgorin, allora per tali .

Poiché è irriducibile per permutazioni, il grafo associato ad è fortemente connesso, e dunque deve esistere una sequenza di cammini di indici (eventualmente ripetuti) , , ..., con tale per cui appaiano in essa tutti i numeri da a . Dacché esiste dunque un arco da a , , e dunque, per il ragionamento di prima, . Reiterando la stessa dimostrazione fino alla fine della sequenza sostituendo ad e gli indici successivi nella sequenza, si è mostrato dunque che per ogni , da cui la tesi.

  1. ^ a b È possibile ottenere una rappresentazione grafica analoga per ogni matrice con l'ausilio di questo sito.
  2. ^ indica lo spettro di , ossia l'insieme dei suoi autovalori.
  3. ^ Se si sceglie come l'insieme di tutti i vettori in con coordinate positive, si può dimostrare che l'inclusione è stretta (cfr. R. S. Varga, Geršgorin and His Circles, Springer Verlag, 2004).
  4. ^ R. S. Varga, Geršgorin and His Circles, Springer, 2004, pp. 35-36.
  5. ^ D. Bini, M. Capovani e O. Menchi, Metodi numerici per l'algebra lineare, Bologna, Zanichelli, 1988, pp. 79-80.
  • D. Bini, M. Capovani, O. Menchi, Metodi numerici per l'algebra lineare, Zanichelli, Bologna, 1988.
  • R. S. Varga, Geršgorin and His Circles, Springer, 2004.
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica