Modello lineare generalizzato

Da Wikipedia, l'enciclopedia libera.

I modelli lineari generalizzati (GLM) sono una generalizzazione del più classico modello lineare nell'ambito della regressione lineare. Mentre nel modello lineare classico si ipotizza che la variabile endogena sia distribuita in modo normale, nell'ambito dei modelli lineari generalizzati la variabile endogena può essere distribuita come una qualsiasi variabile casuale della famiglia esponenziale e dunque, oltre alla v.c. normale anche le variabili casuali binomiale, poissoniana, gamma, normale inversa e altre.

I modelli lineari generalizzati vennero formulati da John Nelder e Robert Wedderburn come un modo per uniformare all'interno di un unico modello diversi altri modelli statistici, compreso il modello lineare, le regressione logistica e la regressione poissoniana. Riesce in questo modo a incorporare anche altri modelli.

Introduzione[modifica | modifica sorgente]

In un GLM, ciascun valore dalla variabile dipendente Y si assume venga generato da una particolare variabile casuale della famiglia esponenziale, la quale comprende parecchie variabili casuali quali binomiale, poissoniana, gamma, normale inversa e altre. La media μ della distribuzione dipende dalla variabile indipendente X:

\operatorname{E}(\mathbf{Y}) = \boldsymbol{\mu} = g^{-1}(\mathbf{X}\boldsymbol{\beta})

dove E(Y) è il valore atteso di Y; Xβ è il predittore lineare, una combinazione lineare di parametri ignoti β; g è la cosiddetta funzione link.


In questo ambito, la varianza è tipicamente funzione V della media:

 \operatorname{Var}(\mathbf{Y}) = \operatorname{V}( \boldsymbol{\mu} ) = \operatorname{V}(g^{-1}(\mathbf{X}\boldsymbol{\beta})).

È conveniente se V è distribuita come una v.c. della famiglia esponenziale, ma può essere semplicemente che la varianza sia una funzione del valore stimato.

I parametri ignoti β vengono stimati solitamente con il metodo della massima veromiglianza, della massima quasi verosomiglianza o con tecniche bayesiane.

Le componenti del modello[modifica | modifica sorgente]

Il GLM è composto da tre elementi:

  1. La funzione di distribuzione f, facente parte della famiglia esponenziale
  2. Il predittore lineare η = Xβ .
  3. Una funzione g, detta "link", tale che E(Y) = μ = g-1(η).
economia Portale Economia: accedi alle voci di Wikipedia che trattano di economia