Analisi della correlazione canonica: differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Inserito voce mancante
Etichette: Modifica visuale Link a pagina di disambiguazione
(Nessuna differenza)

Versione delle 13:31, 16 mar 2022

In statistica, l'analisi della correlazione canonica (CCA nell'acronimo inglese) è un modo per inferire informazioni da matrici di covarianza incrociata incrociata. Dati due vettori X = (X1, ..., Xn) e Y = (Y1, ..., Ym) di variabili aleatorie, con correlazioni fra le variabili, la CCA mira a trovare combinazioni lineari di X e Y che presentino fra loro la massima correlazione[1]. Il metodo è stato proposto per primo da Harold Hotelling nel 1936, sebbene l'idea fosse presente già nel 1875 in una pubblicazione[2] del matematico Camille Jordan.

Definizione

Dati due vettori colonna e di variabili aleatorie, si definisce la covarianza incrociata come matrice il cui elemento è la covarianza . nella pratica, si stima la matrice di covarianza in base a dati campionati da e (ossia da una coppia di matrici di dati).

La CCA cerca i vettori () e () tali che le variabili aleatorie e massimizzino la correlazione . Le variabili aleatorie e costituiscono la prima coppia di variabili canoniche. Poi si cercano i vettori che massimizzano la stessa correlazione con il vincolo aggiuntivo di non essere correlati con la prima coppia di variabili canoniche; si definisce così la seconda coppia di variabili canoniche. Questa procedura può essere ripetuta fino a volte.

Riferimenti

  1. ^ (EN) Canonical Correlation Analysis, Springer, 2007, pp. 321–330, DOI:10.1007/978-3-540-72244-1_14, ISBN 978-3-540-72244-1. URL consultato il 16 marzo 2022.
  2. ^ Camille Jordan, Essai sur la géométrie à $n$ dimensions, in Bulletin de la Société mathématique de France, vol. 2, 1875, pp. 103–174, DOI:10.24033/bsmf.90. URL consultato il 16 marzo 2022.