Regressione logistica

Da Wikipedia, l'enciclopedia libera.

La regressione logistica è un caso particolare di modello lineare generalizzato avente come funzione link la funzione logit. Si tratta di un modello di regressione applicato nei casi in cui la variabile dipendente y sia di tipo dicotomico riconducibile ai valori 0 e 1, come lo sono tutte le variabili che possono assumere esclusivamente due valori: vero o falso, maschio o femmina, vince o perde, sano o ammalato, ecc.

Il modello viene descritto da

logit(p)=\beta_0 + \beta_1 x_1  + \beta_2 x_2 + \beta_3 x_3 + \dots + \beta_k x_k = X\beta

essendo logit(p)=ln \left(\frac{p}{1-p}\right) la funzione logit e p la probabilità che l'evento y si verifichi.

La stima della probabilità di p avviene effettuando prima la stima dei parametri \hat \beta (utilizzando il metodo della massima verosimiglianza) e successivamente la trasformazione

\hat p = \frac{e^{X \hat \beta}}{1+e^{X \hat \beta}}

Benché sia tecnicamente possibile applicare alla variabile y la regressione lineare

y=\alpha_0 + \alpha_1 x_1  + \alpha_2 x_2 + \alpha_3 x_3 + + \alpha_k x_k = X \alpha

ciò viene evitato in quanto porterebbe in generale a stime che vanno da meno infinito a più infinito e dunque fuori dall'intervallo [0,1] previsto per le probabilità.

Voci correlate[modifica | modifica sorgente]

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica