Vector autoregression

Da Wikipedia, l'enciclopedia libera.

In econometria, un modello VAR, o Vector Autoregression, è un sistema di equazioni simultanee nella forma:

\ \mathbf{Y}_t=\mathbf{c}+\Phi(L)\mathbf{Y}_{t-1}+\varepsilon_t=\mathbf{c}+\Phi_1\mathbf{Y}_{t-1}+\cdots+\Phi_p\mathbf{Y}_{t-p}+\varepsilon_t

dove, per un VAR(p), \ \Phi(L)=\sum_{i=0}^{p-1}\Phi_i L^i è un polinomio matriciale di ordine p nell'operatore ritardo \ L (ossia, l'operatore tale che \ L^{i}\mathbf{Y}_t=\mathbf{Y}_{t-i}); \ \mathbf{Y}_t è un vettore di variabili nella forma:

\ \mathbf{Y}_t=\begin{bmatrix}y_{1t}\\ \vdots\\y_{nt}\end{bmatrix}

e \ \varepsilon_t è un vettore conforme di disturbi stocastici tali che \ \textrm{E}(\varepsilon_t)=\mathbf{0} e \ \textrm{E}\left(\varepsilon_{it}^{2}\right)=\sigma^2_i,  i=1,\ldots,n. Si osservi che gli elementi del vettore \ \varepsilon_t non sono necessariamente incorrelati, ossia in generale \ \textrm{E}\left(\varepsilon_{it}\varepsilon_{jt}\right)=\sigma_{ij}\neq 0 per elementi di \ \varepsilon indicizzati da \ i,j, con \ j\neq i; per contro, per ipotesi nessuna delle componenti del vettore \ \varepsilon esibisce correlazione seriale, ossia \ \textrm{E}\left(\varepsilon_{it}\varepsilon_{i\tau}\right)=0, per ogni  i, per ogni  \tau\neq t.

I modelli VAR sono stati introdotti da Christopher Sims in uno storico articolo pubblicato su Econometrica nel 1980, che proponeva una critica dei modelli strutturali di equazioni simultanee, allora il principale strumento di analisi econometria nell'ambito della macroeconomia. In particolare, i modelli VAR risultano nel complesso più semplici rispetto ai modelli strutturali, e la loro performance in termini di capacità previsiva di variabili macroeconomiche appare migliore. Per contro, un evidente limite dei modelli VAR è che, a differenza del caso dei modelli strutturali, un'espressione come quella sopra (detta forma ridotta) non è in generale giustificabile dal punto di vista teorico.

Rappresentazioni[modifica | modifica sorgente]

La rappresentazione di un modello VAR(p) presentata sopra è nota come forma ridotta. Esistono due ulteriori rappresentazioni, la forma strutturale e la forma finale.

La forma strutturale di un modello VAR(p) è una scrittura del tipo:

\ A_0\mathbf{Y}_t=\mathbf{m}+A(L)\mathbf{Y}_{t-1}+u_t

dove \ \mathbf{m} è in generale diverso dal vettore di costanti della forma ridotta \ \mathbf{c},  A_0 identifica le relazioni strutturali (cioè aventi una giustificazione teorica) contemporanee tra le diverse componenti di  \mathbf{Y}_t, e il vettore dei disturbi \ u_t è un rumore bianco, e in particolare ha componenti tra loro incorrelate: \ \textrm{E}[u_{it}u_{jt}]=0 per \ j\neq i. Non sempre le relazioni strutturali incorporate nella matrice  A_0 sono note; questa difficoltà si riflette nei problemi relativi all'identificazione del modello VAR, nonché nel calcolo delle funzioni di risposta a un impulso (in inglese impulse response functions). In generale, inoltre, la teoria non specifica le relazioni strutturali implicite nel polinomio matriciale  A(L) al secondo membro dell'espressione sopra; questo problema ha tuttavia una minore rilevanza.

Chiaramente è possibile passare dalla forma strutturale alla forma ridotta, premoltiplicando per l'inversa della matrice  A_0:

\ \mathbf{Y}_t=A_0^{-1}\mathbf{m}+A_0^{-1}A(L)\mathbf{Y}_{t-1}+A_0^{-1}u_t=\mathbf{c}+\Phi(L)\mathbf{Y}_{t-1}+\varepsilon_t

L'espressione sopra può essere riscritta come:

\ \left(I-\Phi(L)L\right)\mathbf{Y}_t=\mathbf{c}+A_0^{-1}u_t

Da cui si ottiene la forma finale del modello VAR(p), o rappresentazione di Wold:

\ \mathbf{Y}_t=\left(I-\Phi(L)L\right)^{-1}\mathbf{c}+\left(I-\Phi(L)L\right)^{-1}A_0^{-1}u_t=\mathbf{\mu}+\Psi(L)u_t

dove \ \Psi(L) è un polinomio matriciale nell'operatore \ L di ordine infinito, e \mu è il valore atteso non condizionato di \mathbf{Y}_t. In altre parole, il VAR(p), processo vettoriale autoregressivo di ordine finito, è equivalente a un processo in media mobile di ordine infinito.

Stima dei coefficienti della forma ridotta e inferenza[modifica | modifica sorgente]

Il modello VAR(p) in forma ridotta può scriversi come:

\ y_{1t} = c_1+ \varphi_{11}^{(1)}y_{1t-1}+\cdots+\varphi_{1p}^{(p)}y_{nt-p}+\varepsilon_{1t}
\ \vdots
\ y_{nt} = c_n+ \varphi_{n1}^{(1)}y_{1t-1}+\cdots+\varphi_{np}^{(p)}y_{nt-p}+\varepsilon_{nt}

Osservando che al secondo membro di ogni equazione figurano le stesse variabili, il VAR(p) risulta equivalente a un modello SURE (dall'inglese Seemingly Unrelated Regression Equations), i cui coefficienti possono essere stimati considerando ogni equazione come una regressione lineare standard, indipendentemente dalle altre.

In particolare, gli stimatori OLS ottenuti con il metodo dei minimi quadrati/massima verosimiglianza risultano consistenti; le consuete statistiche t sui coefficienti di regressione, nonché le statistiche F per l'esistenza di regressione, possono essere utilizzate. Si osservi che questo è possibile soltanto se non si impone alcuna restrizione al modello (ossia, non si sa in partenza che uno o più dei coefficienti \ \varphi_{ij}^{(k)} sono nulli, così da assicurare la presenza delle stesse variabili al secondo membro di ogni equazione).

Companion form e impulse response functions[modifica | modifica sorgente]

L'espressione per la forma ridotta di un modello VAR(p) può essere riscritta, accorpando p espressioni vettoriali, nella seguente forma, nota con termine inglese come companion form:

\ \begin{bmatrix}\mathbf{Y}_t\\\mathbf{Y}_{t-1}\\\vdots\\\mathbf{Y}_{t-p+1}\\\end{bmatrix}=\begin{bmatrix}\mathbf{c}\\\mathbf{0}\\\vdots\\\mathbf{0}\end{bmatrix}+\begin{bmatrix}\Phi_1 & \Phi_2 & \cdots & \Phi_{p-1} & \Phi_p\\ I & \mathbf{0} & \cdots & \mathbf{0} & \mathbf{0}\\ \mathbf{0} & I & \cdots & \mathbf{0} & \mathbf{0}\\ \vdots & \vdots & \ddots & \vdots & \vdots\\ \mathbf{0} & \mathbf{0} & \cdots & I & \mathbf{0}\end{bmatrix} \begin{bmatrix}\mathbf{Y}_{t-1}\\\mathbf{Y}_{t-2}\\\vdots\\\mathbf{Y}_{t-p}\\\end{bmatrix} + \begin{bmatrix}A_0^{-1}u_t\\ \mathbf{0}\\ \vdots\\ \mathbf{0}\end{bmatrix}

dove \ I denota la matrice identità. Si adotti ora per la companion form la notazione:

\ \mathbf{Z}_t = \lambda + \mathbf{F}\mathbf{Z}_{t-1} + \xi_t

dove \textrm{E}[\xi_t]=\mathbf{0}, ed essendo \xi=[\xi_1',\ldots,\xi_T']', si ha: \textrm{E}[\xi\xi']=\Sigma\otimes I_T, dove \Sigma è la matrice varianze-covarianze dei disturbi \varepsilon e \otimes denota il prodotto di Kronecker. In questo modo è possibile trattare le (complicate) espressioni di un VAR di arbitrario ordine p come un'espressione di ordine 1, sulla base della companion form.

Illustrazione di una tipica impulse response function; si tratta della risposta del rendimento dell'indice azionario MIB30 a un impulso di una deviazione standard nel rendimento dell'indice azionario S&P500; dati relativi al periodo 2003-2004, su base settimanale; l'area in grigio rappresenta una banda di confidenza del 95%. Il modello è un VAR(2), sulle variabili S&P500, MIB30, e l'indice azionario FTSE.

Si consideri ora il problema di determinare l'effetto nel tempo di uno shock strutturale, ossia uno shock proveniente da uno dei disturbi strutturali u_t, sulle variabili del sistema; si supponga per il momento nota la matrice \ A_0 che propaga gli shock al sistema. Dall'espressione sopra è chiaro che all'istante t si avrà:

\ \Delta\mathbf{Z}_t=\Delta\xi_t

All'istante  t+1 si avrà:

\ \Delta\mathbf{Z}_{t+1}=\mathbf{F}\Delta\mathbf{Z}_t=\mathbf{F}\Delta\xi_t

Iterando, in generale si avrà:

\ \Delta\mathbf{Z}_{t+k}=\mathbf{F}^{k}\Delta\xi_t

Ma considerando la relazione tra la forma ridotta del modello VAR e la companion form, si ha che l'effetto di uno shock strutturale, ossia in una delle componenti del vettore  u_t, dopo  k periodi, sarà descritto per ciascuna variabile del sistema tramite il prodotto tra il vettore degli shock:

\ A_0^{-1}\Delta u_t=A_0^{-1}\begin{bmatrix}0\\\vdots\\\Delta u_{jt}\\\vdots\\0\end{bmatrix}

e il blocco di dimensioni \ n\times n in alto a sinistra nella matrice \mathbf{F}^k. Il valore di tale effetto, per diversi valori di k, è detto impulse response function (o IRF, dall'espressione inglese per funzione di risposta a un impulso). È comune in letteratura riportare illustrate non solo le IRF, ma anche le IRF cumulate, date dalla somma dei valori della IRF per una serie di indici temporali; com'è facile intuire, le IRF cumulate indicano l'effetto cumulato di uno shock strutturale sulla/e serie di interesse.

Il problema dell'identificazione e i VAR strutturali[modifica | modifica sorgente]

Si consideri un modello VAR in forma ridotta; dalla relazione tra quest'ultima e la forma strutturale si ha:

\ \varepsilon_t=A_0^{-1}u_t

Sia \Gamma=A_0^{-1} per semplicità di notazione. Dall'espressione sopra segue che:

\ \textrm{E}(\varepsilon_t\varepsilon_t')=\Gamma\textrm{E}(u_tu_t')\Gamma'=\Gamma\Sigma\Gamma'

dove, per le ipotesi sulla distribuzione del vettore di disturbi strutturali u_t, \Sigma è una matrice diagonale. Nel caso di un VAR con 3 variabili, si avrà, in particolare:

\ \textrm{E}(\varepsilon_t\varepsilon_t')=\begin{bmatrix}1&\gamma_{12}&\gamma_{13}\\\gamma_{21}&1&\gamma_{23}\\\gamma_{31}&\gamma_{32}&1\end{bmatrix}\begin{bmatrix}\sigma_{1}^2&0&0\\0&\sigma_2^2&0\\0&0&\sigma_3^2\end{bmatrix}\begin{bmatrix}1&\gamma_{21}&\gamma_{31}\\\gamma_{12}&1&\gamma_{32}\\\gamma_{13}&\gamma_{23}&1\end{bmatrix}

dove la matrice \Gamma è stata opportunamente normalizzata. Si hanno dunque 9 parametri distinti: \gamma_{12}, \gamma_{13}, \gamma_{21}, \gamma_{23}, \gamma_{31}, \gamma_{32}, \sigma_1^2, \sigma_2^2, \sigma_3^2 , ma soltanto 6 equazioni di stima (le 3 relative alla forma ridotta del VAR, i cui parametri possono essere stimati separatamente, più quelle derivanti dall'espressione sopra). Dunque non tutti i parametri strutturali del sistema possono essere identificati. Questo è più che un problema meramente accademico, in quanto senza conoscere i coefficienti strutturali non è possibile calcolare le impulse response functions (si veda sopra), che sono l'oggetto di principale interesse di chi applica i VAR nella pratica.

Una possibile soluzione è quella di ipotizzare che la matrice \ \Gamma=A_0^{-1} sia triangolare inferiore:

\ \Gamma=\begin{bmatrix}1&0&0\\\gamma_{21}&1&0\\\gamma_{31}&\gamma_{32}&1\end{bmatrix}

così che il numero di parametri da stimare si riduce a 6, e si ha esatta identificazione. Questa strategia è nota come decomposizione di Cholesky, o Cholesky causal chain. Sulla base di tale ipotesi, si possono stimare i parametri strutturali come segue: in primo luogo, si osserva che i residui \hat{\varepsilon}_i delle equazioni della forma ridotta sono stime consistenti dei disturbi \varepsilon_i (si adotta la convenzione per cui i simboli con \hat{\varepsilon} denota la stima di \varepsilon, e così via); dunque essendo A_0 triangolare inferiore si ha:

\ \hat{\varepsilon}_1=\hat{u}_1

Si utilizza questa stima nella seconda equazione della forma strutturale; in particolare, \ u_2 è stimato tramite i residui della regressione:

\ \hat{\varepsilon}_2=\gamma_{21}\hat{u}_1+u_2

Ottenendo inoltre la stima del coefficiente \gamma_{21}. Iterando questa procedura, si stimerà \ u_3 tramite i residui della regressione:

\ \hat{\varepsilon}_3=\gamma_{31}\hat{u}_1+\gamma_{32}\hat{u}_2+u_3

E così via. Le varianze \ \sigma_i^2 degli \ u_i, i=1,\ldots,n possono essere stimate tramite il consueto stimatore della varianza dei disturbi in una regressione lineare.

L'aspetto problematico di una soluzione di questo tipo è che in genere non ci sono ragioni teoriche per cui la matrice A_0^{-1}, che incorpora una serie di relazioni strutturali (e che dunque dovrebbero avere fondamento teorico), debba avere forma triangolare inferiore. Ciononostante, nella pratica la decomposizione di Cholesky è utilizzata da numerosi software statistici, se non altro per la sua semplicità.

Un'alternativa che non sacrifica la teoria è quella di formulare un modello economico (o utilizzare un modello noto) che giustifichi una serie di restrizioni sui valori dei parametri, che possano essere utilizzate per conseguire l'identificazione del modello. Ad esempio, la teoria economica potrebbe implicare che la matrice A_0^{-1} sia simmetrica, così che, nell'esempio sopra, \gamma_{21}=\gamma_{12}, \gamma_{31}=\gamma_{13} e \gamma_{23}=\gamma_{32}: il numero dei parametri da stimare si riduce ancora a 6, conseguendo l'esatta identificazione del modello. Questo approccio porta alla formulazione di modelli VAR strutturali. Tuttavia, in questo caso non sono date strategie generali, ma la soluzione dipenderà dal particolare problema oggetto di studio.

Applicazioni[modifica | modifica sorgente]

L'uso principale dei modelli VAR è la previsione di variabili economiche nel tempo; nonostante la loro apparente semplicità, nonché la mancanza di un fondamento teorico almeno per quel che riguarda la forma ridotta, i VAR hanno dato prova nel tempo di una notevole capacità previsiva, superiore a quella dei modelli strutturali che li hanno preceduti.

I VAR hanno trovato applicazione storicamente nell'ambito della macroeconomia, come strumento statistico per prevedere gli effetti delle manovre di politica economica. Più di recente sono stati utilizzati nella finanza, nonché in una varietà di altre discipline economiche.

Bibliografia[modifica | modifica sorgente]

  • Sims, C.A. (1980), Macroeconomics and Reality, Econometrica, 48(1), pp.1-48 - il contributo storico di Sims che ha introdotto l'uso dei modelli VAR.
  • Hamilton, J.D. (1994), Time Series Analysis, Princeton University Press ISBN 0-691-04289-6 - il testo di riferimento per l'analisi delle serie storiche; i modelli VAR sono trattati nei capitoli 11 e 12.
economia Portale Economia: accedi alle voci di Wikipedia che trattano di economia