第15章: 多元时间序列
15 多元时间序列
15.1 介绍
多元时间序列 \(Y_{t}=\left(Y_{1 t}, \ldots, Y_{m t}\right)^{\prime}\) 是随时间 \(t=1, \ldots, n\) 按顺序观察到的 \(m \times 1\) 向量过程。多元时间序列模型主要关注向量序列 \(Y_{t}\) 的联合建模。经济学家最常用的多元时间序列模型是向量自回归(VAR)。 Sims (1980) 将 VAR 引入计量经济学。
关于多元时间序列的一些优秀教科书和评论文章包括 Hamilton (1994)、Watson (1994)、Canova (1995)、Lütkepohl (2005)、Ramey (2016)、Stock 和 Watson (2016) 以及 Kilian 和 Lütkepohl (2017) 。
15.2 多方程时间序列模型
为了激发向量自回归,让我们首先回顾 \(14.41\) 部分的自回归分布式滞后模型,该模型针对具有单个滞后的两个系列 \(Y_{t}=\left(Y_{1 t}, Y_{2 t}\right)^{\prime}\) 的情况。 \(Y_{1 t}\) 的 AR-DL 模型是
\[ Y_{1 t}=\alpha_{0}+\alpha_{1} Y_{1 t-1}+\beta_{1} Y_{2 t-1}+e_{1 t} . \]
同样,\(Y_{2 t}\) 的 AR-DL 模型是
\[ Y_{2 t}=\gamma_{0}+\gamma_{1} Y_{2 t-1}+\delta_{1} Y_{1 t-1}+e_{2 t} . \]
这两个方程指定每个变量都是其自身滞后和另一个变量滞后的线性函数。通过这样做,我们发现每个方程右侧的变量是 \(Y_{t-1}\)。
我们可以通过组合将两个方程堆叠在一起的回归器来简化方程,并将向量误差写为 \(e_{t}=\left(e_{1 t}, e_{2 t}\right)^{\prime}\) 来查找
\[ Y_{t}=a_{0}+\boldsymbol{A}_{1} Y_{t-1}+e_{t} \]
其中 \(a_{0}\) 是 \(2 \times 1\),\(\boldsymbol{A}_{1}\) 是 \(2 \times 2\)。这是 \(Y_{t}\) 的双变量向量自回归模型。它指定多元过程 \(Y_{t}\) 是其自身滞后 \(Y_{t-1}\) 加上 \(e_{t}\) 的线性函数。它是两个方程的组合,每个方程都是自回归分布滞后模型。因此,多元自回归是一组自回归分布式滞后模型。
上述推导假设有一个滞后。如果方程包含每个变量的 \(p\) 滞后,我们将获得 \(p^{t h}\) 阶向量自回归 (VAR) 模型
\[ Y_{t}=a_{0}+\boldsymbol{A}_{1} Y_{t-1}+\boldsymbol{A}_{2} Y_{t-2}+\cdots+\boldsymbol{A}_{p} Y_{t-p}+e_{t} . \]
此外,两个变量的情况没有什么特别的。 (15.1) 中的符号允许 \(Y_{t}=\) \(\left(Y_{1 t}, \ldots, Y_{m t}\right)^{\prime}\) 为维度 \(m\) 的向量,在这种情况下,矩阵 \(\boldsymbol{A}_{\ell}\) 为 \(m \times m\),误差 \(\boldsymbol{e}_{t}\) 为 \(m \times 1\)。我们将使用符号来表示 \(\boldsymbol{A}_{\ell}\) 的元素
\[ \boldsymbol{A}_{\ell}=\left[\begin{array}{cccc} a_{11, \ell} & a_{12, \ell} & \cdots & a_{1 m, \ell} \\ a_{21, \ell} & a_{22, \ell} & \cdots & a_{2 m, \ell} \\ \vdots & \vdots & & \vdots \\ a_{m 1, \ell} & a_{m 2, \ell} & \cdots & a_{m m, \ell} \end{array}\right] \]
错误 \(e_{t}=\left(e_{1 t}, \ldots, e_{m t}\right)^{\prime}\) 是 \(Y_{t}\) 的组成部分,它在 \(t-1\) 时刻是不可预测的。然而,\(Y_{t}\) 的组成部分同时相关。因此同期协方差矩阵 \(\Sigma=\mathbb{E}\left[e e^{\prime}\right]\) 是非对角的。
VAR 模型属于第 11 章中研究的多元回归模型类别。
在下面的几个部分中,我们退后一步,为平稳时间序列的向量自回归提供严格的基础。
15.3 线性投影
在 \(14.14\) 节中,我们推导了单变量序列 \(Y_{t}\) 在其无限过去历史上的线性投影。我们现在将其扩展到多变量情况。定义多元无限过去历史 \(\widetilde{Y}_{t-1}=\) \(\left(\ldots, Y_{t-2}, Y_{t-1}\right)\)。 \(Y_{t}\) 到 \(\widetilde{Y}_{t-1}\) 的投影(写作 \(\mathscr{P}_{t-1}\left[Y_{t}\right]=\mathscr{P}\left[Y_{t} \mid \widetilde{Y}_{t-1}\right]\))是唯一的,并且具有唯一的投影误差
\[ e_{t}=Y_{t}-\mathscr{P}_{t-1}\left[Y_{t}\right] . \]
我们将投影误差 \(e_{t}\) 称为“创新”。
创新 \(e_{t}\) 均值为零且序列不相关。我们正式声明这一点。
定理 15.1 如果 \(Y_{t}\) 是协方差平稳的,则它有投影方程
\[ Y_{t}=\mathscr{P}_{t-1}\left[Y_{t}\right]+e_{t} . \]
创新 \(e_{t}\) 满足 \(\mathbb{E}\left[e_{t}\right]=0\)、\(\mathbb{E}\left[e_{t-\ell} e_{t}^{\prime}\right]=0\) 满足 \(\ell \geq 1\) 和 \(\Sigma=\mathbb{E}\left[e e^{\prime}\right]<\infty\)。如果 \(Y_{t}\) 严格平稳,则 \(e_{t}\) 严格平稳。
投影误差的不相关性是多元白噪声过程的一个属性。
定义 15.1 如果 \(\mathbb{E}\left[e_{t}\right]=0\)、\(\mathbb{E}\left[e_{t} e_{t}^{\prime}\right]=\Sigma<\infty\) 和 \(\mathbb{E}\left[e_{t} e_{t-\ell}^{\prime}\right]=0\) 对于 \(\ell \neq 0\),则向量过程 \(e_{t}\) 是多元白噪声
15.4 多元世界分解
通过将 \(Y_{t}\) 投影到白噪声创新 \(e_{t}\) 的过去历史上,我们获得了 Wold 分解的多元版本。
定理 15.2 如果 \(Y_{t}\) 是协方差平稳且不确定的,那么它具有线性表示
\[ Y_{t}=\mu+\sum_{\ell=0}^{\infty} \Theta_{\ell} e_{t-\ell} \]
其中 \(e_{t}\) 是白噪声投影误差,\(\Theta_{0}=\boldsymbol{I}_{m}\) 是。系数矩阵 \(\Theta_{\ell}\) 是 \(m \times m\)。
我们可以使用滞后运算符符号将移动平均表示形式写为
\[ Y_{t}=\mu+\Theta(\mathrm{L}) e_{t} \]
在哪里
\[ \Theta(z)=\sum_{\ell=0}^{\infty} \Theta_{\ell} z^{\ell} . \]
还可以建立定理 \(14.19\) 的多元版本。
定理 15.3 如果 \(Y_{t}\) 是协方差平稳、非确定性的,采用 Wold 表示 \(Y_{t}=\Theta(\mathrm{L}) e_{t}\),使得 \(\lambda_{\min }\left(\Theta^{*}(z) \Theta(z)\right) \geq \delta>0\) 对于所有复数 \(|z| \leq 1\),并且对于某些整数 \(s \geq 0\),Wold 系数满足 \(\sum_{j=0}^{\infty}\left\|\sum_{k=0}^{\infty} k^{s} \Theta_{j+k}\right\|^{2}<\infty\),则 $ matheq7$ 具有无限阶自回归表示
\[ \boldsymbol{A} \text { (L) } Y_{t}=a_{0}+e_{t} \]
在哪里
\[ \boldsymbol{A}(z)=\boldsymbol{I}_{m}-\sum_{\ell=1}^{\infty} \boldsymbol{A}_{\ell} z^{\ell} \]
并且系数满足 \(\sum_{k=1}^{\infty} k^{s}\left\|\boldsymbol{A}_{k}\right\|<\infty\)。 (15.4) 中的级数是收敛的。
证明请参见 Meyer 和 Kreiss (2015) 的第 2 节。
我们还可以提供定理 14.6 的模拟。
定理 15.4 如果 \(e_{t} \in \mathbb{R}^{m}\) 是严格平稳、遍历的,\(\mathbb{E}\left\|e_{t}\right\|<\infty\) 和 \(\sum_{\ell=0}^{\infty}\left\|\Theta_{\ell}\right\|<\infty\) 是严格平稳、遍历的,那么 \(Y_{t}=\sum_{\ell=0}^{\infty} \Theta_{\ell} e_{t-\ell}\) 是严格平稳、遍历的。定理 \(15.4\) 的证明是定理 \(14.6\) 的直接扩展,因此被省略。
移动平均值和自回归滞后多项式满足关系 \(\Theta(z)=\boldsymbol{A}(z)^{-1}\)。
出于某些目的(例如脉冲响应计算),我们需要根据自回归系数矩阵 \(\boldsymbol{A}_{\ell}\) 计算移动平均系数矩阵 \(\Theta_{\ell}\)。虽然没有封闭式解决方案,但可以通过简单的递归来计算系数。
定理 15.5 对于 \(j \geq 1, \Theta_{j}=\sum_{\ell=1}^{j} A_{\ell} \Theta_{j-\ell}\)。
为了看到这一点,为简单起见,假设 \(a_{0}=0\) 并且创新满足 \(e_{t}=0\) 和 \(t \neq 0\)。然后 \(Y_{t}=0\) 对应 \(t<0\)。使用 \(t \geq 0\) 的回归方程 (15.4),我们求解每个 \(Y_{t}\)。对于 \(t=0\)
\[ Y_{0}=e_{0}=\Theta_{0} e_{0} \]
其中 \(\Theta_{0}=\boldsymbol{I}_{m}\).对于 \(t=1\)
\[ Y_{1}=\boldsymbol{A}_{1} Y_{0}=\boldsymbol{A}_{1} \Theta_{0} e_{0}=\Theta_{1} e_{0} \]
其中 \(\Theta_{1}=A_{1} \Theta_{0}\).对于 \(t=2\)
\[ Y_{2}=\boldsymbol{A}_{1} Y_{1}+\boldsymbol{A}_{2} Y_{0}=\boldsymbol{A}_{1} \Theta_{1} e_{0}+\boldsymbol{A}_{2} \Theta_{0} e_{0}=\Theta_{2} e_{0} \]
其中 \(\Theta_{2}=A_{1} \Theta_{1}+A_{2} \Theta_{0}\).对于 \(t=3\)
\[ Y_{3}=\boldsymbol{A}_{1} Y_{2}+\boldsymbol{A}_{2} Y_{1}+\boldsymbol{A}_{3} Y_{0}=\boldsymbol{A}_{1} \Theta_{2} e_{0}+\boldsymbol{A}_{2} \Theta_{1} e_{0}+\boldsymbol{A}_{3} \Theta_{0} e_{0}=\Theta_{3} e_{0} \]
其中 \(\Theta_{3}=\boldsymbol{A}_{1} \Theta_{2}+\boldsymbol{A}_{2} \Theta_{2}+\boldsymbol{A}_{2} \Theta_{0}\).这些系数满足所要求的递归。
15.5 脉冲响应
应用多元时间序列中最重要的概念之一是脉冲响应函数 (IRF),它被定义为由于创新或冲击的变化而导致的 \(Y_{t}\) 的变化。在本节中,我们定义基线 IRF - 非标准化非正交脉冲响应函数 - 这是由于创新 \(e_{t}\) 的变化而导致 \(Y_{t}\) 的变化。具体来说,我们将变量 \(i\) 相对于创新 \(j\) 的脉冲响应定义为由于 \(j^{t h}\) 创新 \(Y_{t}\) 导致 \(i^{t h}\) 变量 \(Y_{i t+h}\) 的时间 \(t\) 投影的变化
\[ \operatorname{IRF}_{i j}(h)=\frac{\partial}{\partial e_{j t}} \mathscr{P}_{t}\left[Y_{i t+h}\right] . \]
每个水平线 \(h\) 都有 \(m^{2}\) 这样的响应。我们可以将它们写成 \(m \times m\) 矩阵
\[ \operatorname{IRF}(h)=\frac{\partial}{\partial e_{t}^{\prime}} \mathscr{P}_{t}\left[Y_{t+h}\right] . \]
回想一下多元 Wold 表示
\[ Y_{t}=\mu+\sum_{\ell=0}^{\infty} \Theta_{\ell} e_{t-\ell} . \]
我们可以计算出在时间 \(t\) 到历史上的投影是
\[ \mathscr{P}_{t}\left[Y_{t+h}\right]=\mu+\sum_{\ell=h}^{\infty} \Theta_{\ell} e_{t+h-\ell}=\mu+\sum_{\ell=0}^{\infty} \Theta_{h+\ell} e_{t-\ell} . \]
我们推断脉冲响应矩阵是 \(\operatorname{IRF}(h)=\Theta_{h}\),\(h^{t h}\) 移动平均系数矩阵。单独的脉冲响应是 \(\operatorname{IRF}_{i j}(h)=\Theta_{h, i j}\),即 \(\Theta_{h}\) 的 \(i j^{t h}\) 元素。
这里我们根据线性投影算子定义了脉冲响应。另一种方法是根据条件期望算子定义脉冲响应。当创新 \(e_{t}\) 是鞅差分序列时(因此当真实过程是线性时),两者重合,但否则不会重合。
通常,我们将脉冲响应视为地平线 \(h\) 的函数,并将每对 \((i, j)\) 的脉冲响应绘制为 \(h\) 的函数。脉冲响应函数 \(\operatorname{IRF}_{i j}(h)\) 被解释为 \(i^{t h}\) 变量如何随时间响应 \(j^{t h}\) 创新。
在线性向量自回归中,脉冲响应函数在负创新和正创新中是对称的。也就是说,积极创新 \(e_{j t}=1\) 对 \(Y_{i t+h}\) 的影响是 \(\operatorname{IRF}_{i j}(h)\),消极创新 \(e_{j t}=-1\) 对 \(-\operatorname{IRF}_{i j}(h)\) 的影响是 \(-\operatorname{IRF}_{i j}(h)\)。此外,影响的大小与创新的大小呈线性关系。因此,创新 \(e_{j t}=2\) 的影响是 \(2 \times \operatorname{IRF}_{i j}(h)\),创新 \(e_{j t}=-2\) 的影响是 \(-2 \times \operatorname{IRF}_{i j}(h)\)。这意味着脉冲响应函数的形状不受创新幅度的影响。 (这些是向量自回归模型线性的结果,不一定是真实世界的特征。)
脉冲响应函数可以根据需要缩放。一种标准选择是缩放,以便创新对应于一个单位的脉冲变量。因此,如果脉冲变量以美元测量,则脉冲响应可以缩放以对应于 \(\$ 1\) 或某个倍数(例如一百万美元)的变化。如果脉冲变量以百分比来衡量(例如利率),则脉冲响应可以缩放以对应于一个百分点的变化(例如从 3% 到 \(4 %\) )或对应于一个基数的变化点(例如从 3.05% 到 3.06%)。另一个标准选择是缩放脉冲响应以对应于“一个标准差”创新。当创新规模扩大到具有单位差异时,就会发生这种情况。在后一种情况下,脉冲响应函数可以解释为由于“典型”大小(一个标准偏差)创新而产生的响应。
与 IRF 密切相关的是累积脉冲响应函数 (CIRF),定义为
\[ \operatorname{CIRF}(h)=\sum_{\ell=1}^{h} \frac{\partial}{\partial e_{t}^{\prime}} \mathscr{P}_{t}\left[Y_{t+\ell}\right]=\sum_{\ell=1}^{h} \Theta_{\ell} . \]
累积脉冲响应是 \(Y_{t}\) 从时间 \(t\) 到 \(t+h\) 的累积(求和)响应。累积脉冲响应的极限 \(h \rightarrow \infty\) 是长期脉冲响应矩阵
\[ \boldsymbol{C}=\lim _{h \rightarrow \infty} \operatorname{CIRF}(h)=\sum_{\ell=1}^{\infty} \Theta_{\ell}=\Theta(1)=\boldsymbol{A}(1)^{-1} . \]
这是历年来创新的全部(总和)效果。
值得注意的是,当基于差分观测值 \(\Delta Y_{t}\) 估计 VAR 时,累积脉冲响应为
\[ \operatorname{CIRF}(h)=\frac{\partial}{\partial e_{t}^{\prime}} \mathscr{P}_{t}\left[\sum_{\ell=1}^{h} \Delta Y_{t+\ell}\right]=\frac{\partial}{\partial e_{t}^{\prime}} \mathscr{P}_{t}\left[Y_{t+h}\right] \]
这是水平中变量 \(Y_{t}\) 的脉冲响应。更一般地,当用一些水平变量和一些差异变量来估计 VAR 时,第二组的累积脉冲响应将与以水平测量的相同变量的脉冲响应一致。通常报告以差异形式输入 VAR 的变量的累积脉冲响应函数。事实上,在这种情况下,许多作者将累积脉冲响应标记为“脉冲响应”。
15.6 VAR(1)模型
一阶向量自回归过程,表示为 VAR(1),为
\[ Y_{t}=a_{0}+A_{1} Y_{t-1}+e_{t} \]
其中 \(e_{t}\) 是严格平稳且遍历的白噪声过程。
我们感兴趣的是 \(Y_{t}\) 是平稳过程的条件。令 \(\lambda_{i}(\boldsymbol{A})\) 表示 \(\boldsymbol{A}\) 的 \(i^{\text {th }}\) 特征值。
定理 15.6 如果 \(e_{t}\) 对于 \(i=1, \ldots, m\) 是严格平稳、遍历的,\(\mathbb{E}\left\|e_{t}\right\|<\infty\) 和 \(\left|\lambda_{i}\left(A_{1}\right)\right|<1\) 是严格平稳、遍历的,那么 \(\operatorname{VAR}(1)\) 过程 \(Y_{t}\) 是严格平稳、遍历的。
第 15.31 节给出了证明。
15.7 \(\operatorname{VAR}(\mathrm{p})\) 模型
\(\mathbf{p}^{\text {th }}\)阶向量自回归过程,表示为 VAR(p),为
\[ Y_{t}=a_{0}+\boldsymbol{A}_{1} Y_{t-1}+\cdots+\boldsymbol{A}_{p} Y_{t-p}+e_{t} \]
其中 \(e_{t}\) 是严格平稳且遍历的白噪声过程。
我们可以使用滞后运算符符号将模型编写为
\[ \boldsymbol{A} \text { (L) } Y_{t}=a_{0}+e_{t} \]
在哪里
\[ \boldsymbol{A}(z)=\boldsymbol{I}_{m}-\boldsymbol{A}_{1} z-\cdots-\boldsymbol{A}_{p} z^{p} . \]
系统平稳性的条件可以表示为对自回归多项式行列式方程根的限制。回想一下,\(\operatorname{det}(\boldsymbol{A}(z))\) 的 \(\operatorname{root} r\) 是 \(\operatorname{det}(\boldsymbol{A}(r))=0\) 的解。
定理 \(15.7\) 如果 \(\operatorname{det}(\boldsymbol{A}(z))\) 的所有根 \(r\) 满足 \(|r|>1\),则 \(\operatorname{VAR}(\mathrm{p})\) 过程 \(Y_{t}\) 严格平稳且遍历。
该证明在结构上与定理 \(14.23\) 相同,因此被省略。
15.8 回归符号
定义 \((m p+1) \times 1\) 向量
\[ X_{t}=\left(\begin{array}{c} 1 \\ Y_{t-1} \\ Y_{t-2} \\ \vdots \\ Y_{t-p} \end{array}\right) \]
和 \(m \times(m p+1)\) 矩阵 \(\boldsymbol{A}^{\prime}=\left(\begin{array}{lllll}a_{0} & \boldsymbol{A}_{1} & \boldsymbol{A}_{2} & \cdots & \boldsymbol{A}_{p}\end{array}\right)\)。那么VAR方程组可以写为
\[ Y_{t}=\boldsymbol{A}^{\prime} X_{t}+e_{t} . \]
这是一个多元回归模型。误差有协方差矩阵
\[ \Sigma=\mathbb{E}\left[e_{t} e_{t}^{\prime}\right] . \]
我们还可以将系数矩阵写为 \(\boldsymbol{A}=\left(\begin{array}{llll}a_{1} & a_{2} & \cdots & a_{m}\end{array}\right)\),其中 \(a_{j}\) 是 \(j^{t h}\) 方程的系数向量。因此\(Y_{j t}=a_{j}^{\prime} X_{t}+e_{j t}\)。
一般来说,如果 \(Y_{t}\) 严格平稳,我们可以通过线性投影定义系数矩阵 \(\boldsymbol{A}\)。
\[ \boldsymbol{A}=\left(\mathbb{E}\left[X_{t} X_{t}^{\prime}\right]\right)^{-1} \mathbb{E}\left[X_{t} Y_{t}^{\prime}\right] . \]
这表明 \(Y_{t}\) 是否实际上是 \(\operatorname{VAR}(\mathrm{p})\) 进程。由投影误差的性质
\[ \mathbb{E}\left[X_{t} e_{t}^{\prime}\right]=0 . \]
如果 \(\mathbb{E}\left[X_{t} X_{t}^{\prime}\right]\) 可逆,则投影系数矩阵 \(\boldsymbol{A}\) 被识别。
定理 \(15.8\) 如果 \(Y_{t}\) 严格平稳,且 \(0<\Sigma<\infty\) 对于 (15.6) 中定义的 \(\Sigma\),则可识别 \(\boldsymbol{Q}=\mathbb{E}\left[X_{t} X_{t}^{\prime}\right]>0\) 和系数向量 (14.46)。
第 15.31 节给出了证明。
15.9 预估
从第 11 章开始,多元回归的系统估计量是最小二乘法。估计器可以写成
\[ \widehat{\boldsymbol{A}}=\left(\sum_{t=1}^{n} X_{t} X_{t}^{\prime}\right)^{-1}\left(\sum_{t=1}^{n} X_{t} Y_{t}^{\prime}\right) . \]
或者,\(j^{t h}\) 方程的系数估计器是
\[ \widehat{a}_{j}=\left(\sum_{t=1}^{n} X_{t} X_{t}^{\prime}\right)^{-1}\left(\sum_{t=1}^{n} X_{t} Y_{j t}\right) . \]
最小二乘残差向量为 \(\widehat{e}_{t}=Y_{t}-\widehat{A}^{\prime} X_{t}\)。协方差矩阵的估计量是
\[ \widehat{\Sigma}=\frac{1}{n} \sum_{t=1}^{n} \widehat{e}_{t} \widehat{e}_{t}^{\prime} . \]
(如果需要,可以根据自由度进行调整,但没有针对特定调整的既定有限样本理由。)
如果 \(Y_{t}\) 是严格平稳且遍历且方差有限的,那么我们可以应用遍历定理(定理 14.9)来推论
\[ \frac{1}{n} \sum_{t=1}^{n} X_{t} Y_{t}^{\prime} \underset{p}{\longrightarrow} \mathbb{E}\left[X_{t} Y_{t}^{\prime}\right] \]
和
\[ \sum_{t=1}^{n} X_{t} X_{t}^{\prime} \underset{p}{\longrightarrow} \mathbb{E}\left[X_{t} X_{t}^{\prime}\right] . \]
由于后者由定理 \(15.8\) 正定,我们得出结论 \(\widehat{\boldsymbol{A}}\) 与 \(\boldsymbol{A}\) 一致。标准操作表明 \(\widehat{\Sigma}\) 也是一致的。
定理 15.9 如果 \(Y_{t}\) 严格平稳、遍历,且 \(0<\Sigma<\infty\) 则 \(\widehat{A} \underset{p}{\rightarrow} A\) 和 \(\widehat{\Sigma} \underset{p}{\longrightarrow} \Sigma\) 为 \(n \rightarrow \infty\)
可以使用 var 命令在 Stata 中估计 VAR 模型。
15.10 渐近分布
放
\[ a=\operatorname{vec}(\boldsymbol{A})=\left(\begin{array}{c} a_{1} \\ \vdots \\ a_{m} \end{array}\right), \quad \widehat{a}=\operatorname{vec}(\widehat{\boldsymbol{A}})=\left(\begin{array}{c} \widehat{a}_{1} \\ \vdots \\ \widehat{a}_{m} \end{array}\right) . \]
通过与定理 \(14.30\) 结合定理 \(11.1\) 相同的分析,我们得到以下结果。
定理15.10 假设\(Y_{t}\)遵循\(\operatorname{VAR}(\mathrm{p})\)模型,\(\operatorname{det}(\boldsymbol{A}(z))\)的所有根\(r\)满足\(|r|>1\)、\(\mathbb{E}\left[e_{t} \mid \mathscr{F}_{t-1}\right]=0, \mathbb{E}\left\|e_{t}\right\|^{4}<\infty\)和\(\Sigma>0\),则为\(n \rightarrow \infty\)、\(\sqrt{n}(\widehat{a}-a) \underset{d}{\longrightarrow} \mathrm{N}(0, V)\),其中
\[ \begin{aligned} \boldsymbol{V} &=\overline{\boldsymbol{Q}}^{-1} \Omega \overline{\boldsymbol{Q}}^{-1} \\ \overline{\boldsymbol{Q}} &=\boldsymbol{I}_{m} \otimes \boldsymbol{Q} \\ \boldsymbol{Q} &=\mathbb{E}\left[X_{t} X_{t}^{\prime}\right] \\ \Omega &=\mathbb{E}\left[e_{t} e_{t}^{\prime} \otimes X_{t} X_{t}^{\prime}\right] . \end{aligned} \]
请注意,该定理使用了强有力的假设,即创新是鞅差分序列 \(\mathbb{E}\left[e_{t} \mid \mathscr{F}_{t-1}\right]=0\)。这意味着 \(\operatorname{VAR}(\mathrm{p})\) 模型是每个变量的正确条件期望。换句话说,这些是正确的滞后并且没有遗漏非线性。
如果我们进一步将 MDS 假设强化为条件同方差
\[ \mathbb{E}\left[e_{t} e_{t}^{\prime} \mid \mathscr{F}_{t-1}\right]=\Sigma \]
那么渐近方差简化为
\[ \begin{aligned} &\Omega=\Sigma \otimes \boldsymbol{Q} \\ &\boldsymbol{V}=\Sigma \otimes \boldsymbol{Q}^{-1} . \end{aligned} \]
相反,如果 VAR(p) 是近似值,则 MDS 假设不合适。在这种情况下,可以在混合条件下导出渐近分布。
定理 15.11 假设 \(Y_{t}\) 严格平稳、遍历,并且对于某些 \(r>\)、\(4, \mathbb{E}\left\|Y_{t}\right\|^{r}<\infty\) 且混合系数满足 \(\sum_{\ell=1}^{\infty} \alpha(\ell)^{1-4 / r}<\infty\)。令 \(a\) 为投影系数向量,\(e_{t}\) 为投影误差。然后为 \(n \rightarrow \infty\), \(\sqrt{n}(\widehat{a}-a) \underset{d}{\longrightarrow} \mathrm{N}(0, V)\) 其中
\[ \begin{aligned} &\boldsymbol{V}=\left(\boldsymbol{I}_{m} \otimes \boldsymbol{Q}^{-1}\right) \Omega\left(\boldsymbol{I}_{m} \otimes \boldsymbol{Q}^{-1}\right) \\ &\boldsymbol{Q}=\mathbb{E}\left[X_{t} X_{t}^{\prime}\right] \\ &\Omega=\sum_{\ell=-\infty}^{\infty} \mathbb{E}\left[e_{t-\ell} e_{t}^{\prime} \otimes X_{t-\ell} X_{t}^{\prime}\right] . \end{aligned} \]
该定理不要求真实过程是 VAR。相反,系数被定义为产生最佳(均方)近似的系数,并且对真实过程的唯一要求是一般依赖条件。该定理表明,系数估计量对于采用“长期”三明治形式的协方差矩阵是渐近正态的。
15.11 协方差矩阵估计
\(\widehat{a}\) 协方差矩阵的经典同方差估计等于
\[ \widehat{\boldsymbol{V}}_{\widehat{a}}^{0}=\widehat{\Sigma} \otimes\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1} . \]
尽管没有确定的有限样本合理性,但也可以使用针对自由度进行调整的估计器。该方差估计量在条件期望被正确指定为 \(\operatorname{VAR}(\mathrm{p})\) 并且创新是条件同方差的假设下是合适的。
异方差鲁棒估计量等于
\[ \widehat{\boldsymbol{V}}_{\widehat{a}}=\left(\boldsymbol{I}_{n} \otimes\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1}\right)\left(\sum_{t=1}^{n}\left(\widehat{e}_{t} \widehat{e}_{t}^{\prime} \otimes X_{t} X_{t}^{\prime}\right)\right)\left(\boldsymbol{I}_{n} \otimes\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1}\right) . \]
该方差估计量在条件期望被正确指定为 \(\operatorname{VAR}(\mathrm{p})\) 的假设下是合适的,但不要求创新是条件同方差的。 Newey-West 估计量等于
\[ \begin{aligned} \widehat{\boldsymbol{V}}_{\widehat{a}} &=\left(\boldsymbol{I}_{n} \otimes\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1}\right) \widehat{\Omega}_{M}\left(\boldsymbol{I}_{n} \otimes\left(\boldsymbol{X}^{\prime} \boldsymbol{X}\right)^{-1}\right) \\ \widehat{\Omega}_{M} &=\sum_{\ell=-M}^{M} w_{\ell} \sum_{1 \leq t-\ell \leq n}\left(\widehat{e}_{t-\ell} \otimes X_{t-\ell}\right)\left(\widehat{e}_{t} \otimes X_{t}^{\prime}\right) \\ w_{\ell} &=1-\frac{|\ell|}{M+1} . \end{aligned} \]
数字 \(M\) 称为滞后截断数。未加权版本设置 \(w_{\ell}=1\)。 Newey-West 估计器不要求正确指定 \(\operatorname{VAR}(\mathrm{p})\)。
传统教科书仅使用同方差估计公式(15.9),因此现有软件遵循相同的约定。例如,Stata 中的 var 命令仅显示同方差标准误差。一些研究人员使用异方差稳健估计器 (15.10)。 Newey-West 估计量 (15.11) 并不常用于 VAR 模型。
与独立观测相比,渐近近似在时间序列依赖性下往往不太准确。因此引导方法很受欢迎。在 \(14.46\) 节中,我们描述了几种用于时间序列观察的引导方法。虽然 \(14.46\) 节重点关注单变量时间序列,但扩展到多变量观察结果很简单。
15.12 VAR 中滞后长度的选择
对于选择滞后长度 \(p\) 的数据相关规则,建议最小化信息标准。 AIC 的公式为
\[ \begin{aligned} \operatorname{AIC}(p) &=n \log \operatorname{det} \widehat{\Sigma}(p)+2 K(p) \\ \widehat{\Sigma}(p) &=\frac{1}{n} \sum_{t=1}^{n} \widehat{e}_{t}(p) \widehat{e}_{t}(p)^{\prime} \\ K(p) &=m(p m+1) \end{aligned} \]
其中 \(K(p)\) 是参数数量,\(\widehat{e}_{t}(p)\) 是具有 \(p\) 滞后的模型的 OLS 残差向量。对数行列式是多元正态似然的标准。
在 Stata 中,可以使用 varsoc 命令比较一组估计 VAR 模型的 AIC。然而,应该注意的是,Stata 例程实际上显示 \(\operatorname{AIC}(p) / n=\log \operatorname{det} \widehat{\Sigma}(p)+2 K(p) / n\)。这不会影响模型的排名,但会使模型之间的差异显得很小,从而产生误导。
15.13 插图
我们估计一个三变量系统,这是经常用于研究货币政策影响的模型的简化版本。这三个变量来自 FRED-QD 的季度数据:实际 GDP 增长率 \(\left(100 \Delta \log \left(G D P_{t}\right)\right)\)、GDP 通胀率 \(\left(100 \Delta \log \left(P_{t}\right)\right)\) 和联邦基金利率。滞后 1 到 8 的 VAR 通过最小二乘法进行估计。 AIC 最小的模型是 VAR(6)。表 15.1 报告了 VAR(6) 的系数估计值和(同方差)标准误差。
检查表中的系数,我们可以看到 GDP 显示出中等程度的序列相关性,并对联邦基金利率显示出较大的响应,尤其是在滞后 2 和 3 时。通货膨胀也显示出序列相关性,对 GDP 显示出最小的响应,并且对联邦基金利率有有意义的反应。联邦基金利率具有最强的序列相关性。总体而言,由于相互作用的复杂性,很难从系数估计中解读太多含义。由于这一困难,通常将重点放在系数估计的其他表示上,例如我们将在接下来的部分中讨论的脉冲响应。
15.14 预测回归
在某些情况下(包括预测),考虑因变量的日期早于右侧变量多个周期的模型是有用的。这些方程可以是单方程或多变量;我们可以将两者视为 VAR 的特殊情况(因为单个方程模型可以写为取自 VAR 系统的一个方程)。 \(h\)步预测 VAR(p) 的形式为
\[ Y_{t+h}=b_{0}+\boldsymbol{B}_{1} Y_{t}+\cdots+\boldsymbol{B}_{p} Y_{t-p+1}+u_{t} . \]
整数 \(h \geq 1\) 是地平线。一步预测 VAR 等于标准 VAR。这些系数应被视为给定 \(\left(Y_{t}, \ldots, Y_{t-p+1}\right)\) 的 \(Y_{t+h}\) 的最佳线性预测变量。
VAR 模型和相应的 \(h\) 步预测 VAR 模型之间存在有趣的关系。
定理 15.12 如果 \(Y_{t}\) 是一个 \(\operatorname{VAR}(\mathrm{p})\) 过程,那么它的 \(h\) 步预测回归是一个预测 \(\operatorname{VAR}(\mathrm{p})\),其中 \(u_{t}\) 是一个 MA(h-1) 过程和 \(\boldsymbol{B}_{1}=\Theta_{h}=\operatorname{IRF}(h)\)。
定理 \(15.12\) 的证明在第 15.31 节中给出。
这个定理有几个含义。首先,如果 \(Y_{t}\) 是 \(\operatorname{VAR}(\mathrm{p})\) 过程,则 \(h\) 步预测回归的正确滞后数也是 \(p\) 滞后数。其次,预测回归中的误差是 MA 过程,因此是序列相关的。然而,线性相关性受到范围的限制。第三,前导系数矩阵对应于 \(h^{\text {th }}\) 移动平均系数矩阵,它也等于 \(h^{\text {th }}\) 脉冲响应矩阵。
预测回归(15.12)可以通过最小二乘法来估计。我们可以将估计写为
\[ Y_{t+h}=\widehat{b}_{0}+\widehat{\boldsymbol{B}}_{1} Y_{t}+\cdots+\widehat{\boldsymbol{B}}_{p} Y_{t-p+1}+\widehat{u}_{t} . \]
对于分布理论,我们需要应用定理 \(15.11\),因为创新 \(u_{t}\) 是移动平均线,因此违反了 MDS 假设。由此可见,估计量的协方差矩阵应由 Newey-West (15.11) 估计量来估计。然而,还是有区别的。由于 \(u_{t}\) 已知为 MA(h-1),合理的选择是设置 \(M=h-1\) 并使用简单权重 \(w_{\ell}=1\)。事实上,这是 L. Hansen 和 Hodrick (1980) 最初的建议。
对于分布理论,我们可以应用定理 15.11。令 \(b\) 为 (15.12) 中的系数向量,\(\widehat{b}\) 为相应的最小二乘估计器。令 \(X_{t}\) 为 (15.12) 中的回归向量。表 15.1:向量自回归
\(G D P_{t-1}\) | \(0.25\) | \(0.01\) | \(0.08\) |
---|---|---|---|
\((0.07)\) | \((0.02)\) | \((0.02)\) | |
\(G D P_{t-2}\) | \(0.23\) | \(-0.02\) | \(0.04\) |
\((0.07)\) | \((0.02)\) | \((0.02)\) | |
\(G D P_{t-3}\) | \(0.00\) | \(0.03\) | \(0.01\) |
\((0.07)\) | \((0.02)\) | \((0.02)\) | |
\(G D P_{t-4}\) | \(0.14\) | \(0.04\) | \(-0.02\) |
\((0.07)\) | \((0.02)\) | \((0.02)\) | |
\(G D P_{t-5}\) | \(-0.02\) | \(-0.03\) | \(0.04\) |
\((0.07)\) | \((0.02)\) | \((0.02)\) | |
\(G D P_{t-6}\) | \(0.05\) | \(-0.00\) | \(-0.01\) |
\((0.06)\) | \((0.02)\) | \((0.02)\) | |
\(I N F_{t-1}\) | \(0.11\) | \(0.57\) | \(0.01\) |
\((0.20)\) | \((0.07)\) | \((0.05)\) | |
\(I N F_{t-2}\) | \(-0.17\) | \(0.10\) | \(0.17\) |
\((0.23)\) | \((0.08)\) | \((0.06)\) | |
\(I N F_{t-3}\) | \(0.01\) | \(0.09\) | \(-0.05\) |
\((0.23)\) | \((0.08)\) | \((0.06)\) | |
\(I N F_{t-4}\) | \(0.16\) | \(0.14\) | \(-0.05\) |
\((0.23)\) | \((0.08)\) | \((0.06)\) | |
\(I N F_{t-5}\) | \(0.12\) | \(-0.05\) | \(-0.05\) |
\((0.24)\) | \((0.08)\) | \((0.06)\) | |
\(I N F_{t-6}\) | \(-0.14\) | \(0.10\) | \(0.09\) |
\((0.21)\) | \((0.07)\) | \((0.05)\) | |
\(F F_{t-1}\) | \(0.13\) | \(0.28\) | \(1.14\) |
\((0.26)\) | \((0.08)\) | \((0.07)\) | |
\(F F_{t-2}\) | \(-1.50\) | \(-0.27\) | \(-0.53\) |
\((0.38)\) | \((0.12)\) | \((0.10)\) | |
\(F F_{t-3}\) | \(1.40\) | \(0.12\) | \(0.53\) |
\((0.40)\) | \((0.13)\) | \((0.10)\) | |
\(F F_{t-4}\) | \(-0.57\) | \(-0.13\) | \(-0.28\) |
\((0.41)\) | \((0.13)\) | \((0.11)\) | |
\(0.01\) | \(0.25\) | \(0.28\) | |
\((0.40)\) | \((0.13)\) | \((0.10)\) | |
\(-0.27\) | \(-0.24\) | ||
\((0.18)\) | \((0.14)\) |
定理 15.13 如果 \(Y_{t}\) 是严格平稳、遍历的,\(\Sigma>0\),并且对于某些 \(r>4\)、\(\mathbb{E}\left\|Y_{t}\right\|^{r}<\infty\) 且混合系数满足 \(\sum_{\ell=1}^{\infty} \alpha(\ell)^{1-4 / r}<\infty\),则为 \(n \rightarrow\) \(\infty, \sqrt{n}(\widehat{b}-b) \underset{d}{\longrightarrow} \mathrm{N}(0, V)\) 其中
\[ \begin{aligned} \boldsymbol{V} &=\left(\boldsymbol{I}_{m} \otimes \boldsymbol{Q}^{-1}\right) \Omega\left(\boldsymbol{I}_{m} \otimes \boldsymbol{Q}^{-1}\right) \\ \boldsymbol{Q} &=\mathbb{E}\left[X_{t} X_{t}^{\prime}\right] \\ \Omega &=\sum_{\ell=-\infty}^{\infty} \mathbb{E}\left[\left(\widehat{u}_{t-\ell} \otimes X_{t-\ell}\right)\left(\widehat{u}_{t}^{\prime} \otimes X_{t}^{\prime}\right)\right] . \end{aligned} \]
15.15 脉冲响应估计
脉冲响应估计报告是矢量自回归建模最常见的应用之一。有多种方法可以估计脉冲响应函数。在本节中,我们将回顾基于估计 VAR 参数的最常见估计器。
在 VAR(p) 模型中,脉冲响应由 VAR 系数确定。我们可以将此映射写为 \(\Theta_{h}=g_{h}(\boldsymbol{A})\)。插件方法建议给定 \(\operatorname{VAR}(\mathrm{p})\) 系数估计器 \(\widehat{A}\) 的估计器 \(\widehat{\Theta}_{h}=g_{h}(\widehat{\boldsymbol{A}})\)。这些是估计 VAR 系数隐含的脉冲响应。虽然可以明确地编写函数 \(g_{h}(\boldsymbol{A})\),但计算上简单的方法是使用定理 \(15.5\),该定理表明脉冲响应矩阵可以写为 VAR 系数中的简单递归。因此脉冲响应估计器满足递归
\[ \widehat{\Theta}_{h}=\sum_{\ell=1}^{\min [h, p]} \widehat{A}_{\ell} \widehat{\Theta}_{h-\ell} . \]
然后我们设置\(\widehat{\operatorname{IRF}}(h)=\widehat{\Theta}_{h}\)。
这是脉冲响应估计最常用的方法,并且是在标准包中实现的方法。
由于 \(\widehat{A}\) 是随机的,\(\widehat{\operatorname{IRF}}(h)\) 也是随机的,因为它是 \(\widehat{\boldsymbol{A}}\) 的非线性函数。使用 delta 方法,我们推断 \(\widehat{\operatorname{IRF}}(h)\) 的元素(脉冲响应)是渐近正态分布的。通过一些杂乱的代数,可以获得渐近方差的显式表达式。样本版本可用于计算渐近标准误差。这些可用于形成脉冲响应的渐近置信区间。
然而,渐近近似可能很差。正如我们之前讨论的,由于观测值的序列依赖性,系数 \(\widehat{A}\) 分布的渐近近似可能很差。 \(\widehat{\operatorname{IRF}}(h)\) 的渐近近似可能会明显更差,因为脉冲响应是系数的高度非线性函数。例如,在具有系数估计 \(\widehat{\alpha}\) 的简单 AR(1) 模型中,\(h^{\text {th }}\) 脉冲响应为 \(\widehat{\alpha}^{h}\),即使对于中等范围 \(h\) 也是高度非线性的。
因此,渐近逼近不如自举逼近受欢迎。最流行的 bootstrap 近似使用递归 bootstrap(参见第 14.46 节),使用拟合的 VAR 模型,并使用百分位数方法计算脉冲响应的置信区间。这种选择的一个不幸的特征是百分位数自举置信区间有偏差,因为非线性脉冲响应估计是有偏差的并且百分位数自举会加剧偏差。所述估计方法的一些优点是,它产生的脉冲响应估计与估计的 \(\operatorname{VAR}(\mathrm{p})\) 模型直接相关,并且彼此内部一致。该方法在数值上也是稳定的。当真实过程是具有条件同方差 MDS 创新的真实 \(\operatorname{VAR}(\mathrm{p})\) 时,它是有效的。当真实过程不是 VAR(p) 时,如果 \(p\) 很大(或以数据相关方式适当选择,例如通过 AIC),则可以将其视为脉冲响应的非参数估计器。
该估计器的缺点是它是 VAR 系数估计器的高度非线性函数。因此,脉冲响应估计器的分布不可能很好地近似于正态分布。当 \(\operatorname{VAR}(\mathrm{p})\) 不是真实过程时,非线性变换可能会加剧错误指定偏差。
可以使用 irf 命令在 Stata 中计算并显示脉冲响应函数。命令 irf create 用于计算脉冲响应函数和置信区间。默认置信区间是渐近的(delta 方法)。 Bootstrap(递归方法)标准错误可以使用 bs 选项替换。命令 irf graph irf 生成脉冲响应函数图以及 \(95 %\) 渐近置信区间。命令 irf graph cirf 生成累积脉冲响应函数。知道脉冲响应估计值是未缩放的,因此表示由于脉冲变量的一个单位变化而产生的响应,这可能会很有用。 Stata irf 命令的局限性是标准误差和置信区间构造的选项有限。渐近标准误差是使用同方差公式而不是正确的异方差公式计算的。 Bootstrap 置信区间是使用正态近似 Bootstrap 置信区间(最不可靠的 Bootstrap 置信区间方法)计算的。未提供更好的选项(例如偏差校正百分位数置信区间)。
15.16 局部投影估计器
Jordà (2005) 观察到脉冲响应可以通过最小二乘预测回归来估计。关键是定理 \(15.12\),它建立了 \(\Theta_{h}=\boldsymbol{B}_{1}\),即 \(h\) 步预测回归中的主导系数矩阵。
方法如下。对于每个水平线 \(h\) 估计一个预测回归 (15.12) 以获得领先系数矩阵估计器 \(\widehat{\boldsymbol{B}}_{1}\)。估计器是 \(\widehat{\operatorname{IRF}}(h)=\widehat{\boldsymbol{B}}_{1}\),称为局部投影估计器。
定理 \(15.13\) 表明局部投影脉冲响应估计量是渐近正态的。由于回归误差是序列相关的,因此必须使用 Newey-West 方法来计算渐近标准误差。
Jordà (2005) 推测局部投影估计器对错误指定不太敏感,因为它是一个简单的线性估计器。这是直观但不清楚的。定理 \(15.12\) 依赖于 \(Y_{t}\) 是 \(\operatorname{VAR}(\mathrm{p})\) 进程的假设,否则会失败。因此,如果真实过程不是 VAR(p),则 (15.12) 中的系数矩阵 \(\boldsymbol{B}_{1}\) 不对应于所需的脉冲响应矩阵 \(\Theta_{h}\),因此将被错误指定。传统投影估计器和局部投影估计器的准确性(在低偏差意义上)都依赖于 \(p\) 足够大,使得 \(\operatorname{VAR}(\mathrm{p})\) 模型能够很好地逼近真正的无限阶回归 (15.4)。如果没有正式的理论,就很难知道哪个估计器比另一个更稳健。
实施挑战之一是 \(p\) 的选择。虽然该方法允许 \(p\) 在 \(h\) 范围内变化,但没有成熟的方法来选择预测回归的 VAR 阶数。 (像 AIC 这样的标准选择标准在序列相关误差下是不合适的,就像传统的标准误差是不合适的一样。)因此,看似自然的选择是对所有范围使用相同的 \(p\) ,并将这一选择基于一步 VAR 模型,其中AIC可用于模型选择。
局部投影方法的优点是它是脉冲响应的线性估计器,因此可能具有更好的采样分布。
缺点是该方法依赖于具有序列相关误差的回归(15.12)。后者在长期范围内高度相关,这使得估计量不精确。与传统估计器产生的估计器相比,局部投影估计器往往不太平滑且更不稳定,这反映出可能缺乏精度。
15.17 残差回归
如果创新 \(e_{t}\) 被观察到,那么直接估计多元 Wold 分解的系数将是很自然的。我们将选择一个最大范围 \(h\),然后估计方程
\[ Y_{t}=\mu+\Theta_{1} e_{t-1}+\Theta_{2} e_{t-2}+\cdots+\Theta_{h} e_{t-h}+u_{t} \]
在哪里
\[ u_{t}=e_{t}+\sum_{\ell=h+1}^{\infty} \Theta_{\ell} e_{t-\ell} . \]
变量 \(\left(e_{t-1}, \ldots, e_{t-h}\right)\) 与 \(u_{t}\) 不相关,因此系数的最小二乘估计量是一致且渐近正态的。由于 \(u_{t}\) 是序列相关的,因此应使用 Newey-West 方法来计算标准误差。
实际上,创新 \(e_{t}\) 并未被观察到。如果将它们替换为估计 \(\operatorname{VAR}(\mathrm{p})\) 的残差 \(\widehat{e}_{t}\),那么我们可以通过应用于方程的最小二乘法来估计系数
\[ Y_{t}=\mu+\Theta_{1} \widehat{e}_{t-1}+\Theta_{2} \widehat{e}_{t-2}+\cdots+\Theta_{h} \widehat{e}_{t-h}+\widehat{u}_{t} . \]
这个想法起源于 Durbin (1960)。
这是一个带有生成回归器的两步估计器。 (参见第 12.26 节。)脉冲响应估计量是一致的且渐近正态的,但由于两步估计而具有非标准协方差矩阵。如果不进行修改,传统的、稳健的和 Newey-West 标准误差无法解释这一点。
Chang 和 Sakata (2007) 提出了 Durbin 回归的简化版本。请注意,对于任何水平线 \(h\),我们可以将 Wold 分解重写为
\[ Y_{t+h}=\mu+\Theta_{h} e_{t}+v_{t+h} \]
在哪里
\[ v_{t}=\sum_{\ell=0}^{h-1} \Theta_{\ell} e_{t-\ell}+\sum_{\ell=h+1}^{\infty} \Theta_{\ell} e_{t-\ell} . \]
回归量 \(e_{t}\) 与 \(v_{t+h}\) 不相关。因此,\(\Theta_{h}\) 可以通过 \(Y_{t+h}\) 对 \(e_{t}\) 的回归来估计。在实践中,我们可以用估计的 VAR(p) 中的最小二乘残差 \(\widehat{e}_{t}\) 替换 \(e_{t}\) 来估计回归
\[ Y_{t+h}=\mu+\Theta_{h} \widehat{e}_{t}+\widehat{v}_{t+h} . \]
与 Durbin 回归类似,Chang-Sakata 估计器是带有生成回归器的两步估计器。然而,由于它采用 \(12.27\) 节中研究的形式,因此可以证明 Chang-Sakata 两步估计量与理想化的一步估计量具有相同的渐近分布,就像观察 \(e_{t}\) 一样。因此,不需要针对生成的回归量调整标准误差,这是一个优点。这些误差是连续相关的,因此应使用 Newey-West 标准误差。 Durbin 回归中误差 \(v_{t+h}\) 的方差大于误差 \(u_{t}\) 的方差,因此 Chang-Sakata 估计器可能不如 Durbin 估计器精确。
Chang 和 Sakata (2007) 还指出了 FWL 定理的以下含义。 (15.14) 中的最小二乘斜率估计器在代数上与 \(p-1\) 滞后的预测回归中的斜率估计器 \(\widehat{\boldsymbol{B}}_{1}\) 相同。因此,Chang-Sakata 估计器类似于局部投影估计器。
15.18 正交冲击
我们可以使用脉冲响应函数来检查创新如何影响变量的时间路径。然而,解释上的一个困难是创新向量 \(e_{t}\) 的元素同时相关。因此 \(e_{j t}\) 和 \(e_{i t}\) (通常)不是独立的,因此将 \(e_{j t}\) 和 \(e_{i t}\) 视为基本“冲击”是没有意义的。描述问题的另一种方式是,例如,在“保持”\(e_{i t}\) 不变的情况下描述 \(e_{j t}\) 的影响是没有意义的。
自然的解决方案是对创新进行正交化,使它们不相关,然后将正交化误差视为根本的“冲击”。回想一下,\(e_{t}\) 的协方差矩阵 \(\Sigma\) 均值为零。我们可以将 \(\Sigma\) 分解为 \(m \times m\) 矩阵 \(\boldsymbol{B}\) 与其转置 \(\Sigma=\boldsymbol{B} \boldsymbol{B}^{\prime}\) 的乘积。矩阵 \(\boldsymbol{B}\) 称为 \(\Sigma\) 的“平方根”。 (参见 A.13 节。)定义 \(\varepsilon_{t}=\boldsymbol{B}^{-1} e_{t}\)。随机向量 \(e_{t}\) 具有零均值和协方差矩阵 \(e_{t}\)。元素 \(e_{t}\) 相互不相关。我们可以将创新写为正交误差的函数:
\[ e_{t}=\boldsymbol{B} \varepsilon_{t} . \]
为了区分 \(\varepsilon_{t}\) 和 \(e_{t}\),我们通常将 \(\varepsilon_{t}\) 称为“正交冲击”或更简单地称为“冲击”,并继续将 \(e_{t}\) 称为“创新”。
当 \(m>1\) 时,不存在唯一的平方根矩阵 \(\boldsymbol{B}\),因此不存在唯一的正交化。最常见的选择(最初由 Sims (1980) 提倡)是 Cholesky 分解(参见 A.16 节)。这将 \(\boldsymbol{B}\) 设置为下三角,这意味着它采用以下形式
\[ \boldsymbol{B}=\left[\begin{array}{ccc} b_{11} & 0 & 0 \\ b_{21} & b_{22} & 0 \\ b_{31} & b_{32} & b_{33} \end{array}\right] \]
具有非负对角线元素。我们可以将矩阵 \(\boldsymbol{A}\) 的 Cholesky 分解写为 \(\boldsymbol{C}=\) \(\operatorname{chol}(\boldsymbol{A})\),这意味着 \(\boldsymbol{A}=\boldsymbol{C} \boldsymbol{C}^{\prime}\) 和 \(\boldsymbol{C}\) 是下三角的。我们由此设定
\[ \boldsymbol{B}=\operatorname{chol}(\Sigma) \]
同样,创新与方程的正交冲击有关
\[ \begin{aligned} &e_{1 t}=b_{11} \varepsilon_{1 t} \\ &e_{2 t}=b_{21} \varepsilon_{1 t}+b_{22} \varepsilon_{2 t} \\ &e_{3 t}=b_{31} \varepsilon_{1 t}+b_{31} \varepsilon_{2 t}+b_{33} \varepsilon_{3 t} . \end{aligned} \]
这个结构是递归的。创新 \(e_{1 t}\) 仅是单一冲击 \(\varepsilon_{1 t}\) 的函数。新息 \(e_{2 t}\) 是冲击 \(\varepsilon_{1 t}\) 和 \(\varepsilon_{2 t}\) 的函数,新息 \(e_{3 t}\) 是所有三个冲击的函数。查看该结构的另一种方式是,第一个冲击 \(\varepsilon_{1 t}\) 影响所有三个 Innovationa,第二个冲击 \(\varepsilon_{2 t}\) 影响 \(e_{2 t}\) 和 \(e_{1 t}\),第三个冲击 \(e_{1 t}\) 仅影响 \(e_{1 t}\)。
\({ }^{1}\) 从技术上讲,如果调整样本长度。递归结构是一种排除限制。递归结构排除 \(\varepsilon_{2 t}\) 和 \(\varepsilon_{3 t}\) 同时影响 \(e_{1 t}\),并排除 \(\varepsilon_{3 t}\) 同时影响 \(e_{2 t}\)。
当使用 Cholesky 分解时,递归结构由系统中变量的顺序确定。顺序很重要,并且是关键的识别假设。我们稍后会回到这个问题。
最后,我们提到系统(15.15)相当于系统
\[ A e_{t}=\varepsilon_{t} \]
其中,当 \(\boldsymbol{B}\) 为下三角时,\(\boldsymbol{A}=\boldsymbol{B}^{-1}\) 为下三角。然而,对于我们的大多数目的来说,表示(15.15)更方便。
15.19 正交脉冲响应函数
我们将脉冲响应函数定义为由于创新 \(e_{t}\) 而导致变量 \(Y_{t+h}\) 的时间 \(t\) 投影的变化。正如我们在上一节中讨论的,由于创新是同时相关的,因此关注正交冲击 \(\varepsilon_{t}\) 带来的变化更有意义。因此,我们将正交脉冲响应函数 (OIRF) 定义为
\[ \operatorname{OIRF}(h)=\frac{\partial}{\partial \varepsilon_{t}^{\prime}} \mathscr{P}_{t}\left[Y_{t+h}\right] . \]
我们可以将多元 Wold 表示写为
\[ Y_{t}=\mu+\sum_{\ell=0}^{\infty} \Theta_{\ell} e_{t-\ell}=\mu+\sum_{\ell=0}^{\infty} \Theta_{\ell} \boldsymbol{B} \varepsilon_{t-\ell} \]
其中 \(\boldsymbol{B}\) 来自 (15.16)。我们推断
\[ \operatorname{OIRF}(h)=\Theta_{h} \boldsymbol{B}=\operatorname{IRF}(h) \boldsymbol{B} . \]
这是非正交脉冲响应矩阵乘以矩阵平方根 \(\boldsymbol{B}\)。
将矩阵 \(\Theta_{h}\) 的行写为
\[ \Theta_{h}=\left[\begin{array}{c} \theta_{1 h}^{\prime} \\ \theta_{m h}^{\prime} \end{array}\right] \]
矩阵 \(\boldsymbol{B}\) 的列为 \(\boldsymbol{B}=\left[b_{1}, \ldots, b_{m}\right]\)。我们可以看到
\[ \operatorname{OIRF}_{i j}(h)=\left[\Theta_{h} \boldsymbol{B}\right]_{i j}=\theta_{i h}^{\prime} b_{j} . \]
每个水平线 \(h\) 都有 \(m^{2}\) 这样的响应。
累积正交脉冲响应函数 (COIRF) 为
\[ \operatorname{COIRF}(h)=\sum_{\ell=1}^{h} \operatorname{OIRF}(\ell)=\sum_{\ell=1}^{h} \Theta_{\ell} \boldsymbol{B} \]
15.20 正交脉冲响应估计
我们已经讨论了移动平均矩阵 \(\Theta_{\ell}\) 的估计。我们需要 \(\boldsymbol{B}\) 的估计器。
我们首先通过最小二乘法估计 VAR(p) 模型。这为我们提供了系数矩阵 \(\widehat{A}\) 和误差协方差矩阵 \(\widehat{\Sigma}\)。从后者我们应用 Cholesky 分解 \(\widehat{\boldsymbol{B}}=\operatorname{chol}(\widehat{\Sigma})\) 从而得到 \(\widehat{\Sigma}=\widehat{\boldsymbol{B}} \widehat{\boldsymbol{B}}^{\prime}\)。 (算法见 A.16 节。)正交脉冲响应估计器是
\[ \widehat{\operatorname{OIRF}}(h)=\widehat{\Theta}_{h} \widehat{\boldsymbol{B}}=\widehat{\theta}_{i h}^{\prime} \widehat{b}_{j} . \]
估计器 \(\widehat{\mathrm{OIRF}}(h)\) 是 \(\widehat{\boldsymbol{A}}\) 和 \(\widehat{\Sigma}\) 的非线性函数。通过 delta 方法,它呈渐近正态分布。这允许显式计算渐近标准误差。这些可用于形成脉冲响应的渐近置信区间。
如前所述,渐近近似可能非常差。因此,自举近似比渐近方法使用更广泛。
正交脉冲响应函数可以使用 irf 命令在 Stata 中显示。命令 irf graph oirf 生成正交脉冲响应函数以及 \(95 %\) 渐近置信区间的图表。命令 irf graph coirf 生成累积正交脉冲响应函数。了解 OIRF 针对一标准偏差冲击进行缩放也可能很有用,因此脉冲响应表示由于脉冲变量中的一标准偏差变化而产生的响应。如前所述,Stata irf 命令对于标准误差和置信区间构建的选项有限。渐近标准误差是使用同方差公式而不是正确的异方差公式计算的。自举置信区间是使用正态近似自举置信区间计算的。
15.21 插图
为了说明这一点,我们使用 15.13 节中的三变量系统。我们使用以下顺序:(1) 实际 GDP 增长率,(2) 通货膨胀率,(3) 联邦基金利率。稍后我们讨论身份时会讨论选择。我们使用估计的 VAR(6) 并使用标准 VAR 估计器计算正交脉冲响应函数。
在图 \(15.1\) 中,我们显示了 GDP 增长率对联邦基金利率增加一个标准差的估计正交脉冲响应。面板(a)显示脉冲响应函数,面板(b)显示累积脉冲响应函数。正如我们之前讨论的,脉冲响应和累积脉冲响应的解释取决于变量是否以差异或水平进入 VAR。在这种情况下,GDP增长是自然对数的一阶差分。因此,图 (a)(脉冲响应函数)显示了利率对 GDP 增长率的影响。图 (b)(累积脉冲响应)显示了对 GDP 对数水平的影响。 IRF显示,加息后第二季度GDP增长率受到负面影响(下降约\(0.2 %\),非年化),并且负面影响将持续几个季度。 CIRF 以百分比变化的形式显示了对 GDP 水平的影响。它表明,加息导致 GDP 下降约 8 个季度,使 GDP 减少约 \(0.6 %\)。
15.22 预测误差分解
研究估计 VAR 的另一种工具是预测误差分解,它通过分量冲击分解多步预测误差方差。预测误差分解表明哪些冲击导致系统中每个变量的波动。
- 脉冲响应函数
- 累积IRF
图 15.1:GDP 增长对正交联邦基金冲击的反应
它的定义如下。将 \(i^{\text {th }}\) 变量 \(Y_{i, t+h}\) 的移动平均表示写为正交冲击的函数
\[ Y_{i, t+h}=\mu_{i}+\sum_{\ell=0}^{\infty} \theta_{i}(\ell)^{\prime} \boldsymbol{B} \varepsilon_{t+h-\ell} . \]
\(Y_{t+h}\) 在 \(t\) 时刻的最佳线性预测为
\[ Y_{i, t+h \mid t}=\mu_{i}+\sum_{\ell=h}^{\infty} \theta_{i}(\ell)^{\prime} \boldsymbol{B} \varepsilon_{t+h-\ell} . \]
\(h\)步预测误差是差值
\[ Y_{i, t+h}-Y_{i, t+h \mid t}=\sum_{\ell=0}^{h-1} \theta_{i}(\ell)^{\prime} \boldsymbol{B} \varepsilon_{t+h-\ell} . \]
该预测误差的方差为
\[ \operatorname{var}\left[Y_{i, t+h}-Y_{i, t+h \mid t}\right]=\sum_{\ell=0}^{h-1} \operatorname{var}\left[\theta_{i}(\ell)^{\prime} \boldsymbol{B} \varepsilon_{t+h-\ell}\right]=\sum_{\ell=0}^{h-1} \theta_{i}(\ell)^{\prime} \boldsymbol{B} \boldsymbol{B}^{\prime} \theta_{i}(\ell) . \]
为了隔离 \(j^{t h}\) 冲击的贡献,请注意
\[ e_{t}=\boldsymbol{B} \varepsilon_{t}=b_{1} \varepsilon_{1 t}+\cdots+b_{m} \varepsilon_{m t} . \]
因此 \(j^{t h}\) 冲击的贡献是 \(b_{j} \varepsilon_{j t}\)。现在想象一下用 \(j^{t h}\) 贡献 \(b_{j} \varepsilon_{j t}\) 替换方差计算中的 \(\boldsymbol{B} \varepsilon_{t}\)。这是
\[ \operatorname{var}\left[Y_{i t+h}-Y_{i, t+h \mid t}\right]=\sum_{\ell=0}^{h-1} \operatorname{var}\left[\theta_{i}(\ell)^{\prime} b_{j} \varepsilon_{j t+h-\ell}\right]=\sum_{\ell=0}^{h-1}\left(\theta_{i}(\ell)^{\prime} b_{j}\right)^{2} . \]
检查 (15.18) 并使用 \(\boldsymbol{B}=\left[b_{1}, \ldots, b_{m}\right]\) 我们可以将 (15.18) 写为
\[ \operatorname{var}\left[Y_{i, t+h}-Y_{i, t+h \mid t}\right]=\sum_{j=1}^{m} \sum_{\ell=0}^{h-1}\left(\theta_{i}(\ell)^{\prime} b_{j}\right)^{2} . \]
预测误差分解定义为 \(j^{t h}\) 贡献与总贡献的比率,即 (15.19) 与 (15.20) 的比率:
\[ \mathrm{FE}_{i j}(h)=\frac{\sum_{\ell=0}^{h-1}\left(\theta_{i}(\ell)^{\prime} b_{j}\right)^{2}}{\sum_{j=1}^{m} \sum_{\ell=0}^{h-1}\left(\theta_{i}(\ell)^{\prime} b_{j}\right)^{2}} . \]
\(\mathrm{FE}_{i j}(h)\) 位于 \([0,1]\) 中,并在 \(h\) 中变化。小值表明 \(\varepsilon_{j t}\) 对 \(Y_{i t}\) 的方差贡献很小。大值表明 \(\varepsilon_{j t}\) 对 \(\varepsilon_{i t}\) 的方差贡献较大。版本。
预测误差分解需要正交创新。不存在非正交的
可以使用 irf 命令在 Stata 中计算并显示预测误差分解。命令 irf graph fevd 生成预测误差分解图以及 \(95 %\) 渐近置信区间。
15.23 递归 VAR 的识别
正如我们所讨论的,正交化 VAR 误差的常用方法是下三角 Cholesky 分解,它意味着递归结构。变量的顺序对于这种递归结构至关重要。除非误差不相关,否则不同的排序将导致不同的脉冲响应函数和预测误差分解。订购必须由用户选择;不存在依赖于数据的选择。
为了对脉冲响应和预测误差分解进行因果解释,用户必须根据结构性经济论证来识别正交化。该选择类似于工具变量回归规范所需的排除限制。通过递归地对变量排序,我们有效地施加了排除限制。回想一下,在我们的实证示例中,我们使用的顺序是:(1) 实际 GDP 增长率,(2) 通货膨胀率,(3) 联邦基金利率。这意味着在GDP方程中我们排除了同期通货膨胀率和利率,在通货膨胀方程中我们排除了同期利率。这些是排除限制。他们有道理吗?
一种方法是首先对被认为同时受到最少冲击影响的变量进行排序。一种思考方式是,它们是一段时间内“最具粘性”的变量。最后列出的变量被认为是同时受到最多冲击影响的变量。这些是能够在单一时期内对冲击做出反应或最灵活的。在我们的示例中,我们首先列出产出,其次列出价格,最后列出利率。这与产出实际上是预先确定的(在一段时间内)并且不会(在一段时间内)对价格和利率变动做出反应的观点是一致的。价格可以在一段时间内响应产出变化,但不能响应利率变化。如果利率变化影响投资决策,则后者可能是合理的,但后者至少需要一个时期才能实施。通过将联邦基金利率列在最后,该模型允许货币政策在一段时间内对有关产出和价格的同期信息做出反应。
总的来说,这种推理表明应该首先列出生产指标,其次列出商品价格,最后列出金融价格。当时间段较短时,这种推理更可信,而当时间段较长时,这种推理则不太可信。可能的递归排序的进一步理由可以包括:(1)信息延迟; (2) 实施延误; (三)机构; (四)市场结构; (5)同质性; (6) 强加来自其他来源的估计。在大多数情况下,可以提出这样的论点,但会被视为有争议的和限制性的。在任何情况下,最好明确您的选择和推理。
回到经验例证,将联邦基金利率放在最后是相当传统的。这使得联邦基金利率能够对有关产出和价格增长的同期信息做出反应,并通过假设联邦基金政策冲击不会对其他变量产生同期影响来识别联邦基金政策冲击。然而,目前尚不清楚如何对其他两个变量进行排序。为简单起见,考虑确定产出和价格水平的传统总供给/总需求模型。如果总供给曲线在短期(一个季度)内完全缺乏弹性,那么产出实际上是固定的(粘性的),因此总需求的变化会影响价格,但不会影响产出。总供给的变化会影响产出和价格。因此,我们希望将 GDP 放在第一位,然后将通货膨胀放在第二位。这一选择将把 GDP 误差识别为总供给冲击。这是我们示例中使用的顺序。
相反,假设总供给曲线在短期内是完全弹性的。那么价格是固定的,产量是灵活的。总供给的变化会影响价格和产出,但总需求的变化只会影响产出。在这种情况下,我们希望将通货膨胀放在第一位,然后将 GDP 排在第二位。这一选择将通货膨胀误差识别为总供给冲击,与之前的假设相反!
如果完全弹性和完全非弹性总供给之间的选择不可信,则不能仅根据排序来单独识别供给和需求冲击。在这种情况下,无法识别完整的脉冲响应和误差分解集。然而,可以识别子集。一般来说,如果冲击可以按组排序,那么我们就可以识别组中具有单个变量的任何冲击。在我们的示例中,考虑排序 (1) GDP 和通货膨胀; (2)联邦基金利率。这意味着该模型假设 GDP 和通货膨胀不会同时对利率变动做出反应,但没有施加其他限制。在这种情况下,联邦基金政策冲击就被确定了。这意味着确定了所有三个变量相对于政策冲击的脉冲响应,并且类似地确定了联邦基金冲击对每个变量的影响的预测误差构成。这些可以通过 VAR 使用排序(GDP、通货膨胀、联邦基金利率)(如我们的示例中所做的)或使用排序(通货膨胀、GDP、联邦基金利率)来估计。两种选择都会产生与所描述的相同的估计脉冲响应。然而,其余的脉冲响应(对 GDP 和通胀冲击的响应)在这两种排序中会有所不同。
15.24 油价冲击
为了进一步说明通过递归结构假设来识别脉冲响应函数,我们在这里重复 Kilian (2009) 的一些分析。他的论文涉及确定影响原油价格的因素,特别是区分供给和需求冲击。目标是确定油价如何应对经济冲击以及不同冲击类型的反应有何不同。
为了回答这个问题,Kilian 使用了三变量 VAR,每月衡量全球石油产量、全球经济活动以及 \(1973 \mathrm{~m} 2-2007 \mathrm{~m} 12\) 的全球原油价格。他使用全局变量,因为原油价格是由全球决定的。该论文的一项创新是基利安开发了一种基于海运费率的新的全球经济活动指数。他的动机是运费与全球工业商品的需求直接相关。该数据集在教科书网页上发布为 Kilian2009。
基利安认为,这三个变量是由三种经济冲击决定的:石油供应、总需求和石油需求。他建议,石油供应冲击应被视为生产、加工或运输的中断。总需求是全球经济活动。基利安还认为,石油需求冲击主要是由于未来石油供应短缺的不确定性所驱动的预防性石油需求。
为了确定冲击,Kilian 做出了以下排除限制。首先,他假设原油的短期(一个月)供应相对于价格缺乏弹性。同样,石油生产至少需要一个月的时间才能对价格变化做出反应。由于原油生产的技术因素,这一限制被认为是合理的。开辟新油田成本高昂;一旦开采,几乎不可能封堵油井。其次,基利安假设,在短期(一个月)内,全球实体经济活动不会对油价变化做出反应(由于石油市场特有的冲击),而经济活动则可以对石油生产冲击做出反应。基利安认为这一假设是合理的,因为经济活动对价格变化的反应迟缓。然而,原油价格可以同时对这三种冲击做出反应。
Kilian 的识别策略与上一节中描述的简单总需求/总供给模型类似。供给和需求冲击的分离是通过排除限制来实现的,这意味着短期缺乏弹性。这些假设的合理性部分取决于数据的每月频率。虽然石油生产和经济活动可能不会在一个月内对价格冲击做出反应,这是合理的,但整个季度都没有反应则不太可能。基利安最不令人信服的识别假设(在我看来)是经济活动不会同时对石油价格变化做出反应的假设。虽然许多经济活动是预先计划的,因此反应缓慢,但某些经济活动(例如休闲驾驶)可能会立即对价格变化做出反应。
Kilian 使用 24 个滞后估计三变量 VAR,并使用这些假设隐含的顺序计算正交脉冲响应函数。他没有讨论 24 个滞后的选择,但推测这是为了实现灵活的动态响应。如果使用 AIC 进行模型选择,则将选择三个滞后。对于此处报告的分析,我使用了 4 个滞后。结果在质量上与使用 24 个滞后获得的结果相似。为了便于解释,石油供应量输入负值(乘以-1),以便所有三种冲击都按比例增加石油价格。图 \(15.2\) 显示了 1-24 个月原油价格的两个脉冲响应函数。 (a) 显示原油价格因石油供应冲击而做出的反应;图 (b) 显示了总需求冲击造成的响应。请注意,两个数字均使用相同的 y 轴比例显示,因此这些数字具有可比性。
这些数据值得注意的是原油价格对这两种冲击的反应有何不同。 (a) 面板显示,石油价格仅受石油生产冲击的影响很小。预计油价短期内会出现小幅上涨,但在统计上并不显着,并且会在一年内逆转。相比之下,图(b)显示石油价格受到总需求冲击的显着影响,并且这种影响在两年内累积增加。据推测,这是因为经济活动依赖原油且产出增长呈正序列相关。
Kilian (2009) 的论文是一个很好的例子,它展示了如何通过仔细讨论因果系统和使用每月观察结果,使用递归排序来识别正交化 VAR。
15.25 结构性VAR
递归模型不允许 \(e_{t}\) 的元素之间存在同时性,因此变量 \(Y_{t}\) 不能同时是内生的。这是高度限制性的,可能无法可靠地描述许多经济体系。经济学界普遍偏爱结构向量自回归模型 (SVAR),该模型使用不依赖于其他识别限制的替代识别限制
- 供给冲击
- 总需求冲击
图 15.2:油价对正交冲击的反应
完全依赖于递归性。结构 VAR 模型的两个流行类别是基于短期(同期)限制的模型和基于长期(累积)限制的模型。在本节中,我们根据短期限制回顾 SVAR。
当我们引入正交化 VAR 误差的方法时,我们指出我们可以使用方程 \(e_{t}=\boldsymbol{B} \varepsilon_{t}\) (15.15) 或方程 \(\boldsymbol{A} e_{t}=\varepsilon_{t}\) (15.17) 来表示误差和冲击之间的关系。方程(15.15)将误差写为冲击的函数。方程(15.17)将误差写为同步系统。方程系统可以捕获更广泛的模型类别
\[ \boldsymbol{A} e_{t}=\boldsymbol{B} \varepsilon_{t} \]
其中(在 \(3 \times 3\) 情况下)
\[ \boldsymbol{A}=\left[\begin{array}{ccc} 1 & a_{12} & a_{13} \\ a_{21} & 1 & a_{23} \\ a_{31} & a_{32} & 1 \end{array}\right], \quad \boldsymbol{B}=\left[\begin{array}{lll} b_{11} & b_{12} & b_{13} \\ b_{21} & b_{22} & b_{23} \\ b_{31} & b_{32} & b_{33} \end{array}\right] . \]
(注意:这个矩阵 \(\boldsymbol{A}\) 与回归系数矩阵 \(\boldsymbol{A}\) 无关。我为 \(\boldsymbol{A}\) 的双重使用表示歉意,但我使用符号 (15.21) 是为了与文献中其他地方的符号保持一致.)
写出来,
\[ \begin{aligned} &e_{1 t}=-a_{12} e_{2 t}-a_{13} e_{3 t}+b_{11} \varepsilon_{1 t}+b_{12} \varepsilon_{2 t}+b_{13} \varepsilon_{3 t} \\ &e_{2 t}=-a_{21} e_{1 t}-a_{23} e_{3 t}+b_{21} \varepsilon_{1 t}+b_{22} \varepsilon_{2 t}+b_{23} \varepsilon_{3 t} \\ &e_{3 t}=-a_{31} e_{1 t}-a_{32} e_{2 t}+b_{31} \varepsilon_{1 t}+b_{32} \varepsilon_{2 t}+b_{33} \varepsilon_{3 t} . \end{aligned} \]
矩阵 \(\boldsymbol{A}\) 的对角线元素设置为 1 作为归一化。这种归一化允许冲击 \(\varepsilon_{i t}\) 具有单位方差,这便于脉冲响应计算。
所写的系统未得到充分识别。在这个三方程示例中,矩阵 \(\Sigma\) 仅提供 6 个矩,但上述系统有 15 个自由参数!为了实现身份识别,我们需要九项限制。在大多数应用中,通常首先限制 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 的每个公共非对角元素最多有一个非零。也就是说,对于任何对 \(i \neq j\),\(b_{j i}=0\) 或 \(a_{j i}=0\)。
我们将使用 Blanchard 和 Perotti (2002) 使用的模型的简化版本进行说明,他们对分解政府支出和税收对 GDP 的影响感兴趣。他们提出了一个三变量体系,由实际政府支出(扣除转移支付)、实际税收收入(包括作为负税的转移支付)和实际GDP组成。所有变量均以日志形式测量。他们从限制 \(a_{21}=a_{12}=b_{31}=b_{32}=b_{13}=b_{23}=0\) 开始,或者
\[ \boldsymbol{A}=\left[\begin{array}{ccc} 1 & 0 & a_{13} \\ 0 & 1 & a_{23} \\ a_{31} & a_{32} & 1 \end{array}\right], \quad \boldsymbol{B}=\left[\begin{array}{ccc} b_{11} & b_{12} & 0 \\ b_{21} & b_{22} & 0 \\ 0 & 0 & b_{33} \end{array}\right] . \]
这样做是为了将冲击 \(\varepsilon_{1 t}\) 和 \(\varepsilon_{2 t}\) 之间的关系视为简化形式,但 \(\boldsymbol{A}\) 矩阵中的系数可以解释为变量之间的同期弹性。例如,\(a_{23}\)是税收收入相对于GDP的季度内弹性,\(a_{31}\)是GDP相对于政府支出的季度内弹性等。
我们刚刚描述了六项限制,而识别则需要九项限制。 Blanchard 和 Perotti (2002) 有力地论证了两项额外的限制。首先,政府支出相对于 GDP 的季度内弹性为零,\(a_{13}=0\)。这是因为政府财政政策不会(也不能)对同一季度的 GDP 消息做出反应。由于作者将政府支出定义为扣除转移支付的净额,因此支出中不存在“自动稳定器”组成部分。其次,税收收入相对于GDP的季度内弹性可以根据现有的微观计量经济学研究来估计。作者调查了现有文献并设置了 \(a_{23}=-2.08\)。为了完全识别模型,我们需要最后一个限制。作者认为没有明确的具体限制,因此强加一个递归 \(\boldsymbol{B}\) 矩阵(设置 \(b_{12}=0\) )并尝试替代 \(b_{21}=0\) ,发现这两个规范几乎是等效的,因为这两个规范冲击几乎是不相关的。总之,估计模型采用以下形式
\[ \boldsymbol{A}=\left[\begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 & -2.08 \\ a_{31} & a_{32} & 1 \end{array}\right], \quad \boldsymbol{B}=\left[\begin{array}{ccc} b_{11} & 0 & 0 \\ b_{21} & b_{22} & 0 \\ 0 & 0 & b_{33} \end{array}\right] . \]
Blanchard 和 Perotti (2002) 使用矩阵 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\)。其他作者使用更简单的结构 \(\boldsymbol{A} e_{t}=\varepsilon_{t}\) 或 \(\boldsymbol{e}_{t}=\boldsymbol{B} \varepsilon_{t}\)。一般来说,这两种更简单的结构都更容易计算和解释。
取 (15.21) 两侧变量的方差,我们发现
\[ \boldsymbol{A} \Sigma \boldsymbol{A}^{\prime}=\boldsymbol{B} B^{\prime} \text {. } \]
这是自由参数的二次方程组。如果模型刚刚确定,则可以对其进行数值求解,以在给定 \(\Sigma\) 的情况下找到 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 的系数。同样,给定最小二乘误差协方差矩阵 \(\widehat{\Sigma}\),我们可以数值求解 \(\widehat{\boldsymbol{A}}\) 和 \(\widehat{\boldsymbol{B}}\) 的系数。
虽然大多数应用程序使用刚刚识别的模型,但如果模型被过度识别(如果自由参数少于 \(\Sigma\) 的估计组件),则可以使用最小距离找到 \(\widehat{\boldsymbol{A}}\) 和 \(\widehat{\boldsymbol{B}}\) 的系数。 Stata 中的实现使用 MLE(同时估计 VAR 系数)。当模型被正确指定(包括正态性)但否则选择不明确时,后者是合适的。
给定参数估计,结构脉冲响应函数为
\[ \widehat{\operatorname{SIRF}}(h)=\widehat{\Theta}(h) \widehat{\boldsymbol{A}}^{-1} \widehat{\boldsymbol{B}} . \]
结构预测误差分解的计算方式与之前一样,将 \(b_{j}\) 替换为 \(\widehat{\boldsymbol{A}}^{-1} \widehat{\boldsymbol{B}}\) 的 \(j^{t h}\) 列
结构脉冲响应是 VAR 系数和协方差矩阵估计量的非线性函数,因此通过 Delta 方法是渐近正态的。因此可以计算渐近标准误差(如果方便的话使用数值导数)。对于正交化脉冲响应,渐近正态近似不太可能是一个好的近似,因此自举方法是一个有吸引力的替代方案。
结构 VAR 的解释应类似于工具变量估计量。他们的解释依赖于有效的排除限制,而这些限制只能通过外部信息来证明。
我们复制了 Blanchard-Perotti (2002) 的简化版本。我们使用 1959-2017 年 FREDQD 中的 \({ }^{2}\) 季度变量:实际 GDP (gdpc1)、实际税收收入 (fgrecptx) 和实际政府支出 (gcec1),全部采用自然对数。使用 AIC 进行滞后长度选择,我们估计 VAR 从 1 到 8 个滞后并选择 VAR(5)。该模型还包括时间的线性和二次函数 \({ }^{3}\)。在图 \(15.3\) 中,我们显示了 GDP 相对于政府支出(图(a))和税收冲击(图(b))的估计结构性脉冲响应。估计的脉冲响应与 Blanchard-Perotti 报告的类似。
(一) 开支
- 税项
图 15.3:GDP 对政府支出和税收冲击的反应
在面板 (a) 中,我们看到 \(1 %\) 政府支出冲击对 GDP 的影响是积极的,很小(大约 \(0.2 %\) ),但持续存在,在四年内保持稳定在 \(0.2 %\) 。在面板 (b) 中,我们看到 \(1 %\) 税收收入冲击的影响是完全不同的。对 GDP 的影响是负面且持久的,比支出冲击的影响更为严重,在六个季度达到约 \(-0.5 %\)。总之,脉冲响应估计表明政府支出和税收收入的变化具有有意义的经济影响。增加支出对GDP有积极影响,而增加税收则有消极影响。
\({ }^{2}\) 这些与 Blanchard 和 Perotti 使用的变量类似,但不相同。
\({ }^{3}\) 作者使用时间的二次函数对数据进行去趋势处理。根据 FWL 定理,这相当于在回归中包含时间的二次方。 Blanchard-Perotti (2002) 的论文是一个很好的例子,说明了如何使用可信的排除限制来识别非递归结构系统,以帮助回答重要的经济问题。政府支出的季度内外生性引人注目,利用外部信息来确定税收收入相对于 GDP 的弹性是明智的。
结构向量自回归可以在 Stata 中使用 svar 命令进行估计。可以使用 aeq 和 beq 选项施加 (15.21) 形式的短期限制。可以使用 irf 图 Sirf 显示结构脉冲响应,并使用 irf 图 sfevd 显示结构预测误差分解。不幸的是,Stata 没有提供一种方便的方法来显示累积结构脉冲响应函数。 Stata 中的标准误差和置信区间构造对于结构脉冲响应和非结构脉冲响应具有相同的限制。
15.26 结构性 VAR 的识别
如果可以从(15.23)中唯一求解,则(15.21)中的系数矩阵 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 被识别。这是一组 \(m(m+1) / 2\) 唯一方程,因此 \(\boldsymbol{A}\) 和 \(\boldsymbol{B}\) 中的自由系数总数不能大于 \(m(m+1) / 2\),例如,\(m=3\) 时为 6。这是识别的订购条件。这是必要的,但还不够。很容易写下满足订单条件但不产生识别系统的限制。
仅仅通过查看限制很难看出系统是否被识别(除了递归情况,它相对容易识别)。验证识别的直观方法是利用我们对工具变量的了解。我们可以使用工具变量的比喻,按顺序、一次一个或分块地识别方程。
一般技术如下。首先写出施加所有限制的系统,并将 \(\boldsymbol{B}\) 的对角线元素吸收到冲击中(以便它们仍然不相关,但具有非单位方差)。对于 Blanchard-Perotti (2002) 的例子来说,这是
\[ \begin{aligned} &e_{1 t}=\varepsilon_{1 t} \\ &e_{2 t}=2.08 e_{3 t}+b_{21} \varepsilon_{1 t}+\varepsilon_{2 t} \\ &e_{3 t}=-a_{31} e_{1 t}-a_{32} e_{2 t}+\varepsilon_{3 t} . \end{aligned} \]
一次提出一个方程,并询问是否可以使用排除的变量作为工具,通过工具变量来估计它们。一旦方程被验证为确定的,那么它的冲击就被确定并且可以用作工具,因为它与其他方程中的冲击不相关。
在此示例中,按顺序取方程。第一个方程被确定为没有要估计的系数。因此 \(\varepsilon_{1 t}\) 被识别。对于第二个方程,有一个自由参数,可以通过 \(e_{2 t}-2.08 e_{3 t}\) 在 \(\varepsilon_{1 t}\) 上的最小二乘来估计,这是有效的,因为 \(\varepsilon_{1 t}\) 和 \(\varepsilon_{2 t}\) 不相关。这确定了第二个方程和冲击 \(\varepsilon_{2 t}\)。第三个方程有两个自由参数和两个内生回归量,因此我们需要两个工具。我们可以使用冲击 \(\varepsilon_{1 t}\) 和 \(\varepsilon_{2 t}\),因为它们与 \(\varepsilon_{3 t}\) 不相关,但与变量 \(\varepsilon_{1 t}\) 和 \(\varepsilon_{1 t}\) 相关。这样这个方程就被辨识出来了。我们推断系统已被识别。
考虑另一个基于 Keating (1992) 的例子。他估计了一个包含价格、联邦基金利率、M2 和 GDP 的四变量系统。他的错误模型采用 \(\boldsymbol{A} \boldsymbol{e}_{t}=\varepsilon_{t}\) 的形式。明确写出:
\[ \begin{aligned} e_{P} &=\varepsilon_{A S} \\ e_{F F} &=a_{23} e_{M}+\varepsilon_{M S} \\ e_{M} &=a_{31}\left(e_{P}+e_{G D P}\right)+a_{32} e_{F F}+\varepsilon_{M D} \\ e_{G D P} &=a_{41} e_{P}+a_{42} e_{F F}+a_{43} e_{M}+\varepsilon_{I S} \end{aligned} \]
其中四种冲击是“总供给”、“货币供给”、“货币需求”和“I-S”。这种结构可以基于以下假设: 有弹性的短期总供给曲线(价格在一个季度内不会做出反应);简单的货币供应政策(联邦基金利率仅在季度内对货币供应量做出反应);货币需求仅对季度内名义产出(对数价格加对数实际产出)和联邦基金利率做出反应;和不受限制的 I-S 曲线。
为了分析识别条件,我们首先检查订单条件。系统中有 10 个系数(包括四个方差),它等于 \(m(m+1) / 2\) 因为 \(m=4\)。因此订单条件完全满足。
我们检查方程进行识别。我们从第一个方程开始。它没有系数,因此被识别,因此 \(\varepsilon_{A S}\) 也是如此。第二个方程有一个系数。我们可以使用 \(\varepsilon_{A S}\) 作为工具,因为它与 \(\varepsilon_{M S}\) 不相关。如果 \(\varepsilon_{A S}\) 与 \(e_{M}\) 相关,则相关性条件成立。从第三个方程我们可以看出,如果 \(a_{31} \neq 0\) 成立。鉴于此假设,\(a_{23}\) 和 \(\varepsilon_{M S}\) 已被识别。第三个方程有两个系数,因此我们可以使用 \(\left(\varepsilon_{A S}, \varepsilon_{M S}\right)\) 作为工具,因为它们与 \(\varepsilon_{A S}\) 不相关,与 \(\varepsilon_{A S}\) 相关,而 \(\varepsilon_{A S}\) 与 \(\varepsilon_{A S}\) 相关。从而满足相关性条件。最终方程有三个系数,因此我们使用 \(\varepsilon_{A S}\) 作为工具。它们与 \(\varepsilon_{A S}\) 不相关,但与变量 \(\varepsilon_{A S}\) 相关,因此可以确定该方程。
我们发现系统被识别为\(a_{31} \neq 0\)。这要求货币需求对名义GDP做出反应,这是标准货币经济学的预测。这个条件看起来很合理。无论如何,此练习的目的是确定识别的具体条件并在分析中阐明它们。
15.27 长期限制
回顾一下,脉冲响应估计的代数辨识问题是我们需要一个平方根矩阵 \(\boldsymbol{B}=\Sigma^{1 / 2}\),但后者不是唯一的,并且结果对选择很敏感。出现非唯一性是因为 \(\boldsymbol{B}\) 具有 \(m^{2}\) 元素,而 \(\Sigma\) 具有 \(m(m+1) / 2\) 自由元素。递归解决方案是将 \(\boldsymbol{B}\) 设置为等于 \(\Sigma\) 的 Cholesky 分解,或者等效地将 \(\boldsymbol{B}\) 指定为下三角。基于短期(同期)限制的结构 VAR 概括了这一想法,允许基于关于同期因果关系的经济假设和关于 \(\boldsymbol{B}=\Sigma^{1 / 2}\) 的先验知识对 \(\boldsymbol{B}\) 进行一般限制。识别需要 \(\boldsymbol{B}=\Sigma^{1 / 2}\) 限制。更一般地说,由于脉冲响应函数的任何已知结构或特征,可以通过施加 \(\boldsymbol{B}=\Sigma^{1 / 2}\) 限制来构建结构 VAR。
此类结构性 VAR 的一个重要类别是基于长期限制的 VAR。一些经济假设意味着对长期脉冲响应的限制。这些可以为识别提供令人信服的案例。
Blanchard 和 Quah (1989) 是基于长期限制的结构 VAR 的一个有影响力的例子。他们感兴趣的是分解需求和供应冲击对产出的影响。他们的假设是,需求冲击是长期中性的,这意味着需求冲击对产出的长期影响为零。这意味着产出相对于需求的长期脉冲响应为零。这可以用作识别限制。
长期结构脉冲响应是所有脉冲响应的累积和
\[ \boldsymbol{C}=\sum_{\ell=1}^{\infty} \Theta_{\ell} \boldsymbol{B}=\Theta(1) \boldsymbol{B}=\boldsymbol{A}(1)^{-1} \boldsymbol{B} . \]
长期限制是对矩阵 \(\boldsymbol{C}\) 的限制。由于总和 \(\boldsymbol{A}\) (1) 已被识别,这提供了矩阵 \(\boldsymbol{B}\) 的识别信息。 Blanchard 和 Quah (1989) 建议对实际 GDP 和失业率的一阶差分对数使用二元 VAR。 Blanchard-Quah 假设结构性冲击是总供给和总需求。他们采用的假设是总需求对 GDP 没有长期影响。这意味着长期脉冲响应矩阵满足
\[ \boldsymbol{C}=\left[\begin{array}{cc} c_{11} & 0 \\ c_{21} & c_{22} \end{array}\right] . \]
另一种思考方式是,布兰查德-夸赫将“总供给”标记为GDP的长期组成部分,将“总需求”标记为GDP的暂时组成部分。
关系 \(\boldsymbol{C}=\boldsymbol{A}(1)^{-1} \boldsymbol{B}\) 和 \(\boldsymbol{B} \boldsymbol{B}^{\prime}=\Sigma\) 意味着
\[ \boldsymbol{C} \boldsymbol{C}^{\prime}=\boldsymbol{A}(1)^{-1} \boldsymbol{B} \boldsymbol{B}^{\prime} \boldsymbol{A}(1)^{-1 \prime}=\boldsymbol{A}(1)^{-1} \Sigma \boldsymbol{A}(1)^{-1 \prime} . \]
这是一组 \(m^{2}\) 方程,但由于矩阵是半正定矩阵,因此存在 \(m(m+1) / 2\) 独立方程。如果矩阵 \(\boldsymbol{C}\) 具有 \(m(m+1) / 2\) 自由系数,则系统被识别。这需要 \(m(m-1) / 2\) 限制。在 Blanchard-Quah 示例中,\(m=2\) 因此一个限制足以进行识别。
在许多应用中,包括 Blanchard-Quah,矩阵 \(C\) 是下三角矩阵,这允许以下优雅的解决方案。检查 (15.25),我们发现 \(\boldsymbol{C}\) 是 \(\boldsymbol{A}(1)^{-1} \Sigma \boldsymbol{A}(1)^{-1}\) 的矩阵平方根,并且因为 \(\boldsymbol{C}\) 是下三角的,所以它是 Cholesky 分解。我们推导出 \(\boldsymbol{C}=\operatorname{chol}\left(\boldsymbol{A}(1)^{-1} \Sigma \boldsymbol{A}(1)^{-1}\right)\)。
\(\boldsymbol{C}\) 的插件估算器是 \(\widehat{\boldsymbol{C}}=\operatorname{chol}\left(\widehat{\boldsymbol{A}}(1)^{-1} \widehat{\Sigma} \widehat{\boldsymbol{A}}(1)^{-1}\right)\),其中 \(\widehat{\boldsymbol{A}}(1)=\boldsymbol{I}_{m}-\widehat{\boldsymbol{A}}_{1}-\cdots-\widehat{\boldsymbol{A}}_{p}\)。通过构造,解 \(\widehat{C}\) 将是下三角的并满足所需的限制。
更一般地,如果 \(\boldsymbol{C}\) 的限制不采用下三角形式,则可以通过数值求解二次方程组来找到估计量
\[ \widehat{\boldsymbol{C}} \widehat{\boldsymbol{C}}^{\prime}=\widehat{\boldsymbol{A}}(1)^{-1} \widehat{\Sigma} \widehat{\boldsymbol{A}}(1)^{-1 \prime} . \]
在任何一种情况下,估计量都是 \(\widehat{\boldsymbol{B}}=\widehat{\boldsymbol{A}}(1) \widehat{\boldsymbol{C}}\),结构脉冲响应的估计量是
\[ \widehat{\operatorname{SIRF}}(h)=\widehat{\Theta}_{h} \widehat{\boldsymbol{B}}=\widehat{\Theta}_{h} \widehat{\boldsymbol{A}}(1) \widehat{\boldsymbol{C}} . \]
请注意,通过构造,长期脉冲响应是
\[ \sum_{\ell=1}^{\infty} \widehat{\operatorname{SIRF}}(h)=\sum_{\ell=1}^{\infty} \widehat{\Theta}_{h} \widehat{\boldsymbol{A}}(1) \widehat{\boldsymbol{C}}=\widehat{\boldsymbol{A}}(1)^{-1} \widehat{\boldsymbol{A}}(1) \widehat{\boldsymbol{C}}=\widehat{\boldsymbol{C}} \]
因此 \(\widehat{\boldsymbol{C}}\) 确实是估计的长期脉冲响应并满足所需的限制。
可以使用 svar 命令和 lreq 选项在 Stata 中估计长期结构向量自回归。可以使用 irf 图 Sirf 显示结构脉冲响应,并使用 irf 图 sfevd 显示结构预测误差分解。在施加长期限制时,此 Stata 选项不会产生渐近标准误差,因此对于置信区间,建议使用自举法。与讨论的其他情况一样,在 Stata 中构建的此类区间的限制也适用于结构脉冲响应函数。
不幸的是,Stata svar 命令的一个限制是它不显示累积结构脉冲响应函数。为了显示这些,需要累积脉冲响应估计。这是可以做到的,但标准误差和置信区间不可用。这意味着对于严肃的应用工作来说,编程需要在 Stata 之外完成。
15.28 布兰查德和夸 (1989) 插图
正如我们在上一节中所描述的,Blanchard 和 Quah(1989)估计了 GDP 增长和失业率的双变量 VAR,假设结构性冲击是总供给和总需求,并假设 GDP 对总需求为零。他们最初的应用程序使用了 1950-1987 年的美国数据。我们再次使用 FRED-QD (1959-2017)。 Blanchard 和 Quah 使用 VAR(8) 模型,而 AIC 选择 VAR(3)。我们使用 VAR(4)。为了简化对脉冲响应的解释,将失业率输入负值(乘以-1),以便这两个序列都是顺周期的,并且正冲击会增加产出。布兰查德和夸赫使用了一种谨慎的去趋势方法;相反,我们在估计的 VAR 中包含了线性时间趋势。
拟合的简化形式模型系数满足
\[ \widehat{\boldsymbol{A}}(1)=\boldsymbol{I}_{m}-\sum_{j=1}^{4} \widehat{\boldsymbol{A}}_{j}=\left(\begin{array}{cc} 0.42 & 0.05 \\ -0.15 & 0.04 \end{array}\right) \]
残差协方差矩阵为
\[ \widehat{\Sigma}=\left(\begin{array}{ll} 0.531 & 0.095 \\ 0.095 & 0.053 \end{array}\right) . \]
我们计算
\[ \begin{gathered} \widehat{\boldsymbol{C}}=\operatorname{chol}\left(\widehat{\boldsymbol{A}}(1)^{-1} \widehat{\Sigma} \widehat{\boldsymbol{A}}(1)^{-1 \prime}\right)=\left(\begin{array}{cc} 1.00 & 0 \\ 4.75 & 5.42 \end{array}\right) \\ \widehat{\boldsymbol{B}}=\widehat{\boldsymbol{A}}(1) \widehat{\boldsymbol{C}}=\left(\begin{array}{cc} 0.67 & 0.28 \\ 0.05 & 0.23 \end{array}\right) \end{gathered} \]
考察 \(\widehat{\boldsymbol{B}}\),失业率同时主要受到总需求冲击的影响,而 GDP 增长同时受到这两种冲击的影响。
使用 \(\widehat{\Sigma}\) 的平方根,我们构建结构脉冲响应函数作为两种冲击(总供给和总需求)的函数。在图 \(15.4\) 中,我们显示了(负)失业率的估计结构脉冲响应。图(a)显示了失业率相对于总供给冲击的脉冲响应。 whiled 面板 (b) 显示了失业率相对于总需求冲击的脉冲响应。显示的是 95% 正常近似引导间隔,根据 10,000 个引导复制计算得出。估计的脉冲响应具有类似的驼峰形状,峰值在四分之四左右,并且与 Blanchard 和 Quah (1989) 发现的相似。
让我们检查并对比图 15.4 的面板 (a) 和 (b)。对供应冲击的反应(图 (a))需要几个季度才能生效,在 5 个季度左右达到峰值,然后衰减。对需求冲击(图 (b))的反应更为直接,在 4 个季度左右达到峰值,然后衰减。到 6 年后,两者都接近于零。供给冲击脉冲响应的置信区间比需求冲击的置信区间宽,这表明对供给冲击引起的脉冲响应的估计并未精确估计。
图 \(15.5\) 显示了估计的结构预测误差分解。由于只有两个误差,我们仅显示由于供应冲击而导致的平方误差百分比。在面板(a)中,我们显示了 GDP 的预测误差分解,在面板(b)中显示了失业率的预测误差分解。我们可以看到,GDP 波动中大约 \(80 %\) 归因于供给冲击。对于失业率来说,短期波动主要归因于需求冲击,但由于供应冲击,长期影响约为 \(40 %\)。然而,置信区间非常宽,表明这些估计并不精确。
- 供给冲击
- 需求冲击
图 15.4:失业率的反应
令人着迷的是,这里显示的结构脉冲响应估计与 Blanchard 和 Quah (1989) 发现的几乎相同,尽管我们使用了相当不同的采样周期。
15.29 外部仪器
结构 VAR 也可以使用外部工具变量来识别和估计。此方法也称为代理 SVAR。考虑创新的三变量系统
\[ \begin{array}{rrr} e_{1 t}+a_{12} e_{2 t}+a_{13} e_{3 t} & =\varepsilon_{1 t} \\ a_{21} e_{1 t}+e_{2 t} & = & \varepsilon_{2 t}+b_{23} \varepsilon_{3 t}=u_{2 t} \\ a_{31} e_{1 t}+\quad e_{3 t} & = & b_{32} \varepsilon_{2 t}+\varepsilon_{3 t}=u_{3 t} . \end{array} \]
在这个系统中,我们使用了标准化 \(b_{11}=b_{22}=b_{33}=1\) 而不是标准化冲击的方差。
假设我们有一个外部工具变量 \(Z_{t}\) 满足以下属性
\[ \begin{aligned} &\mathbb{E}\left[Z_{t} \varepsilon_{1 t}\right] \neq 0 \\ &\mathbb{E}\left[Z_{t} \varepsilon_{2 t}\right]=0 \\ &\mathbb{E}\left[Z_{t} \varepsilon_{3 t}\right]=0 . \end{aligned} \]
方程 (15.29) 是相关条件 - 工具和冲击 \(\varepsilon_{1 t}\) 相关。方程 (15.30)-(15.31) 是外生条件 - 该工具与冲击 \(\varepsilon_{2 t}\) 和 \(\varepsilon_{3 t}\) 不相关。识别取决于这些假设的有效性。
假设观察到 \(e_{1 t}, e_{2 t}\) 和 \(e_{3 t}\)。然后,(15.27) 中的系数 \(a_{21}\) 可以使用工具变量 \(Z_{t}\) 通过 \(e_{2 t}\) 对 \(e_{1 t}\) 的工具变量回归来估计。这是有效的,因为 \(Z_{t}\)
(一)国内生产总值
- 失业率
图 15.5:预测误差分解,由于供应冲击造成的百分比
在假设 (15.30)-(15.31) 下与 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 不相关,但在 (15.29) 下与 \(e_{1 t}\) 相关。给定这个估计量,我们获得残差 \(\widehat{u}_{2 t}\)。类似地,我们可以使用工具变量\(Z_{t}\)通过\(e_{3 t}\)对\(e_{1 t}\)的工具变量回归来估计(15.27)中的\(a_{31}\),获得残差\(\widehat{u}_{3 t}\)。然后,我们可以使用工具变量 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 通过 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 在 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 上的工具变量回归来估计 (15.26) 中的 \(a_{12}\) 和 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\)。后者是有效的工具,因为 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 和 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 作为结构错误是不相关的,并且因为 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 通过构造与 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 相关。此回归还产生残差 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\),它是冲击 \(u_{2 t}=\varepsilon_{2 t}+b_{23} \varepsilon_{3 t}\) 的适当估计器。
这种估计方法对于三变量系统并不特殊;它可以应用于任何\(m\)。确定的系数是第一个方程 (15.26)、结构冲击 \(\varepsilon_{1 t}\) 以及该冲击对其他变量的影响 \(\left(a_{21}\right.\) 和 \(\alpha_{31}\) 中的系数。其他冲击 \(\varepsilon_{2 t}\) 和 \(\varepsilon_{3 t}\) 没有单独识别,并且它们的相关结构 \(\left(b_{23}\right.\) 和 \(\left.b_{32}\right)\) 也没有识别。当 \(m=2\) 时会出现例外,在这种情况下,所有系数和冲击都会被识别。
虽然未观察到 \(e_{1 t}, e_{2 t}\) 和 \(e_{3 t}\),但我们可以用估计的 \(\operatorname{VAR}(\mathrm{p})\) 模型中的残差 \(\widehat{e}_{1 t}, \widehat{e}_{2 t}\) 和 \(\widehat{e}_{3 t}\) 替换它们的值。所有系数估计都是带有生成回归量的两步估计器。这会影响渐近分布,因此不应使用传统的渐近标准误差。 Bootstrap 置信区间是合适的。
结构(15.26)-(15.28)很方便,因为可以识别四个系数。也可以使用其他结构。考虑结构
\[ \begin{aligned} &e_{1 t}=\varepsilon_{1 t}+b_{12} \varepsilon_{2 t}+b_{23} \varepsilon_{3 t} \\ &e_{2 t}=b_{21} \varepsilon_{1 t}+\varepsilon_{2 t}+b_{23} \varepsilon_{3 t} \\ &e_{3 t}=b_{31} \varepsilon_{1 t}+b_{32} \varepsilon_{2 t}+\varepsilon_{3 t} \end{aligned} \]
如果应用相同的过程,我们可以识别系数 \(b_{21}\) 和 \(b_{31}\) 以及冲击 \(\varepsilon_{1 t}\),但不能识别其他系数或冲击。在此结构中,系数 \(b_{12}\) 和 \(b_{23}\) 无法单独识别,因为冲击 \(\varepsilon_{2 t}\) 和 \(\varepsilon_{3 t}\) 未单独识别。有关更多详细信息,请参阅 Stock 和 Watson (2012) 以及 Mertens 和 Ravn (2013)。
15.30 动态因素模型
动态因子模型在应用时间序列中越来越受欢迎,特别是在预测方面。有关这些方法的最新详细回顾,请参阅 Stock 和 Watson (2016) 以及其中的参考文献。对于一些基础理论,请参见 Bai (2003) 以及 Bai 和 \(\mathrm{Ng}(2002,2006)\)。
在第 11.13-11.16 节中,我们介绍了标准多因素模型 (11.23):
\[ X_{t}=\Lambda F_{t}+u_{t} \]
其中\(X_{t}\)和\(u_{t}\)是\(k \times 1, \Lambda\)是\(k \times r\)和\(r<k\),\(F_{t}\)是\(r \times 1\)。 \(F_{t}\) 的元素称为公因子,因为它们影响 \(X_{t}\) 的所有元素。 \(X_{t}\) 的列称为因子载荷。变量 \(X_{t}\) 称为特殊错误。通常假设 \(X_{t}\) 的元素已转换为均值零且具有共同方差。
在时间序列的情况下,很自然地增强模型以允许动态关系。特别是,我们希望允许 \(F_{t}\) 和 \(u_{t}\) 串行相关。考虑向量自回归模型是很方便的,可以使用滞后算子符号将其写为
\[ \begin{aligned} &\boldsymbol{A}(\mathrm{L}) F_{t}=v_{t} \\ &\boldsymbol{B}(\mathrm{L}) u_{t}=e_{t} \end{aligned} \]
其中 \(\boldsymbol{A}\) (L) 和 \(\boldsymbol{B}\) (L) 分别是滞后多项式,其中 \(p\) 和 \(q\) 滞后。方程(15.32)-(15.33)(15.34)共同构成标准动态因子模型。为了简化模型和帮助识别,通常会施加进一步的限制,特别是滞后多项式 \(\boldsymbol{B}(\mathrm{L})\) 是对角的。
此外,我们可能希望推广(15.32)以允许 \(F_{t}\) 通过分布式滞后关系影响 \(X_{t}\)。这个概括可以写成
\[ X_{t}=\Lambda(\mathrm{L}) F_{t}+u_{t} \]
其中 \(\Lambda(\mathrm{L})\) 是维度 \(k \times r\) 的 \(\ell^{t h}\) 阶分布滞后。然而,方程(15.35)与(15.32)并没有本质上的不同。也就是说,如果我们定义堆叠因子向量 \(\bar{F}_{t}=\left(F_{t}^{\prime}, F_{t-1}^{\prime}, \ldots, F_{t-\ell}^{\prime}\right)^{\prime}\),则 (15.35) 可以写成 (15.32) 的形式,其中 \(\bar{F}_{t}\) 替换 \(F_{t}\),矩阵 \(\Lambda\) 替换为 \(\left(\Lambda_{1}, \Lambda_{2}, \ldots, \Lambda_{\ell}\right)\)。因此,我们将重点关注标准模型 (15.32)-(15.33)-(15.34)。
定义反滞后运算符 \(\boldsymbol{D}(\mathrm{L})=\boldsymbol{A}(\mathrm{L})^{-1}\) 和 \(\boldsymbol{C}(\mathrm{L})=\boldsymbol{B}(\mathrm{L})^{-1}\)。然后通过将 \(\boldsymbol{C}(\mathrm{L})\) 应用于 (15.32) 并将 \(\boldsymbol{D}(\mathrm{L})\) 应用于 (15.33) 我们得到
\[ \begin{aligned} \boldsymbol{C}(\mathrm{L}) X_{t} &=\boldsymbol{C} \text { (L) } \Lambda F_{t}+\boldsymbol{C} \text { (L) } u_{t} \\ &=\boldsymbol{C} \text { (L) } \Lambda \boldsymbol{D}(\mathrm{L}) v_{t}+e_{t} \\ &=\Lambda(\mathrm{L}) v_{t}+e_{t} \end{aligned} \]
其中 \(\Lambda(\mathrm{L})=\boldsymbol{C}\) (L) \(\Lambda \boldsymbol{D}(\mathrm{L})\)。为简单起见,将此滞后多项式视为具有 \(\ell\) 滞后。使用与上一段相同的堆叠技巧并定义 \(V_{t}=\left(v_{t}^{\prime}, v_{t-1}^{\prime}, \ldots, v_{t-\ell}^{\prime}\right)^{\prime}\),我们发现该模型可以写为
\[ \boldsymbol{C} \text { (L) } X_{t}=\boldsymbol{H} V_{t}+e_{t} \]
对于某些 \(k \times r \ell\) 矩阵 \(\boldsymbol{H}\)。这称为动态因素模型的静态形式。它表明 \(X_{t}\) 可以写成其自身滞后的函数加上序列不相关因子 \(V_{t}\) 和序列不相关误差 \(e_{t}\) 的线性函数。静态形式(15.36)很方便,因为可以使用因子回归进行估计。该模型与第 11.15 节中所述的具有附加回归量的因子回归相同。 (附加回归量是 \(X_{t}\) 的滞后值。)该部分描述了如何通过在多元最小二乘法和因子回归之间迭代来估计系数和因子。
估计显式动态模型 (15.32)-(15.33)-(15.34) 状态空间方法很方便。有关详细信息和参考文献,请参阅 Stock 和 Watson (2016)。
动态因子模型 (15.32)-(15.33)-(15.34) 可以在 Stata 中使用 df actor 进行估计。
15.31 技术证明*
定理 15.6 的证明 不失一般性,假设 \(a_{0}=0\)。
通过 Jordan 矩阵分解(参见 A.13 节),\(\boldsymbol{A}=\boldsymbol{P} \boldsymbol{J} \boldsymbol{P}^{-1}\) 其中 \(\boldsymbol{J}=\operatorname{diag}\left\{\boldsymbol{J}_{1}, \ldots, \boldsymbol{J}_{r}\right\}\) 是 Jordan 范式。每个 Jordan 块 \(\boldsymbol{J}_{i}\) 的维度由 \(\boldsymbol{A}\) 的特征值 \(\lambda_{i}\) 的重数决定。对于唯一特征值 \(\lambda_{i}, \boldsymbol{J}_{i}=\lambda_{i}\)。对于具有双重数的特征值 \(\lambda_{i}\),Jordan 块采用以下形式
\[ \boldsymbol{J}_{i}=\left[\begin{array}{cc} \lambda_{i} & 1 \\ 0 & \lambda_{i} \end{array}\right] . \]
对于具有多重性 \(s>2\) 的特征值,Jordan 块是 \(s \times s\) 上对角线,特征值位于对角线上,1 紧邻对角线上方(参见 A.7)。
定义\(X_{t}=\boldsymbol{P}^{-1} Y_{t}\)和\(u_{t}=\boldsymbol{P}^{-1} e_{t}\),它们满足\(X_{t}=\boldsymbol{J} X_{t-1}+u_{t}\)。与 \(\boldsymbol{J}\) 一致地划分 \(X_{t}\) 和 \(u_{t}\)。 \(i^{\text {th }}\) 集合满足 \(X_{i t}=\boldsymbol{J}_{i} X_{i, t-1}+u_{i t}\)。现在我们证明 \(X_{i t}\) 是严格平稳且遍历的,由此我们推断 \(X_{t}=\boldsymbol{P}^{-1} Y_{t}\) 是严格平稳且遍历的。
对于单维块 \(\boldsymbol{J}_{i}=\lambda_{i}\),\(X_{i t}=\lambda_{i} X_{i, t-1}+u_{i t}\) 是一个 AR(1) 模型,系数为 \(\lambda_{i}\) ,创新为 \(u_{i t}\)。这些假设意味着 \(\left|\lambda_{i}\right|<1\) 和 \(\mathbb{E}\left|u_{i t}\right|<\infty\),因此满足定理 \(14.21\) 的条件,意味着 \(X_{i t}\) 严格平稳且遍历。
对于二维块,通过回代我们找到 \(X_{i t}=\sum_{\ell=0}^{\infty} J_{i}^{\ell} u_{i, t-\ell}\)。通过直接计算我们发现
\[ \boldsymbol{J}_{i}^{\ell}=\left[\begin{array}{cc} \lambda_{i}^{\ell} & \ell \lambda_{i}^{\ell-1} \\ 0 & \lambda_{i}^{\ell} \end{array}\right] . \]
分区 \(X_{i t}=\left(X_{1 i t}, X_{2 i t}\right)\) 和 \(u_{i t}=\left(u_{1 i t}, u_{2 i t}\right)\) 这意味着
\[ \begin{aligned} X_{1 i t} &=\sum_{\ell=0}^{\infty} \lambda_{i}^{\ell} u_{1 i, t-\ell}+\sum_{\ell=0}^{\infty} \ell \lambda_{i}^{\ell} u_{2 i, t-\ell} \\ X_{2 i t} &=\sum_{\ell=0}^{\infty} \lambda_{i}^{\ell} u_{2 i, t-\ell} \end{aligned} \]
级数 \(\sum_{\ell=0}^{\infty} \lambda_{i}^{\ell}\) 和 \(\sum_{\ell=0}^{\infty} \ell \lambda_{i}^{\ell}\) 通过比率检验(经济学家概率与统计定理 A.3)收敛,因为 \(\left|\lambda_{i}\right|<1\)。因此,上述总和满足定理 \(14.6\) 的条件,因此根据要求严格平稳且遍历。
具有多重性 \(s>2\) 的块通过类似但更繁琐的计算来处理。
定理证明 \(15.8\) 假设 \(\Sigma>0\) 意味着如果我们在 \(Y_{2 t}, \ldots, Y_{p t}\) 和 \(Y_{t-1}, \ldots, Y_{t-p}\) 上回归 \(Y_{1 t}\),则误差将具有正方差。如果 \(\boldsymbol{Q}\) 是单数,则存在一些 \(\gamma\) 使得 \(\gamma^{\prime} \boldsymbol{Q} \gamma=0\)。正如定理 \(14.28\) 的证明一样,这意味着 \(15.8\) 在 \(15.8\) 上的回归具有零方差。这是一个矛盾。我们得出结论 \(15.8\) 不是奇异的。
定理证明 15.12 定理的第一部分是通过回代建立的。由于 \(Y_{t}\) 是一个 VAR(p) 过程,
\[ Y_{t+h}=a_{0}+\boldsymbol{A}_{1} Y_{t+h-1}+\boldsymbol{A}_{2} Y_{t+h-2}+\cdots+\boldsymbol{A}_{p} Y_{t+h-p}+e_{t} . \]
然后我们替换掉第一个滞后。我们发现
\[ \begin{aligned} Y_{t+h} &=a_{0}+\boldsymbol{A}_{1}\left(a_{0}+\boldsymbol{A}_{1} Y_{t+h-2}+\boldsymbol{A}_{2} Y_{t+h-3}+\cdots+\boldsymbol{A}_{p} Y_{t+h-p-1}+e_{t-1}\right)+\boldsymbol{A}_{2} Y_{t+h-2}+\cdots+\boldsymbol{A}_{p} Y_{t+h-p}+e_{t} \\ &=a_{0}+\boldsymbol{A}_{1} a_{0}+\left(\boldsymbol{A}_{1} \boldsymbol{A}_{1}+\boldsymbol{A}_{2}\right) Y_{t+h-2}+\left(\boldsymbol{A}_{1} \boldsymbol{A}_{2}+\boldsymbol{A}_{3}\right) Y_{t+h-3}+\cdots+\boldsymbol{A}_{p} \boldsymbol{A}_{p} Y_{t+h-p-1}+\boldsymbol{A}_{1} e_{t-1}+e_{t} . \end{aligned} \]
我们继续进行替换。每次替换,误差都会增加其 MA 阶数。将 \(h-1\) 替换后,方程的形式为 (15.12),其中 \(u_{t}\) 为 MA(h-1) 过程。
要认识 \(\boldsymbol{B}_{1}=\Theta_{h}\),请注意 \(u_{t}\) 是 MA(h-1) 过程的推论意味着我们可以等效地将 \((15.12)\) 写为
\[ Y_{t+h}=b_{0}+\sum_{j=1}^{\infty} \boldsymbol{B}_{j} Y_{t+1-j}+u_{t} \]
用 \(\boldsymbol{B}_{j}=0\) 代替 \(j>p\)。也就是说,方程(15.12)包括所有相关的滞后。通过回归系数的投影属性,这意味着系数 \(\boldsymbol{B}_{1}\) 对于用其他滞后回归的创新来替换回归变量 \(Y_{t}\) 是不变的。这就是VAR(p)模型本身,它有创新\(e_{t}\)。我们推导出系数 \(\boldsymbol{B}_{1}\) 相当于回归中的系数
\[ Y_{t+h}=b_{0}+\boldsymbol{B}_{1} e_{t}+\sum_{j=2}^{\infty} \boldsymbol{B}_{j} Y_{t+1-j}+u_{t} . \]
请注意,\(e_{t}\) 与其他回归量不相关。因此 \(\boldsymbol{B}_{1}=\frac{\partial}{\partial e_{t}^{t}} \mathscr{P}_{t}\left[Y_{t+h}\right]=\Theta_{h}\) 正如所声称的那样。这样就完成了证明。
15.32 练习
练习 15.1 采用 VAR(1) 模型 \(Y_{t}=\boldsymbol{A} Y_{t-1}+e_{t}\)。假设 \(e_{t}\) 是 i.i.d.对于下面每个指定的矩阵 \(\boldsymbol{A}\),检查 \(Y_{t}\) 是否严格平稳。如果需要,使用数学软件计算特征值。\ (a) \(\boldsymbol{A}=\left[\begin{array}{ll}0.7 & 0.2 \\ 0.2 & 0.7\end{array}\right]\)\ (b) \(\boldsymbol{A}=\left[\begin{array}{ll}0.8 & 0.4 \\ 0.4 & 0.8\end{array}\right]\)\ (c) \(\boldsymbol{A}=\left[\begin{array}{cc}0.8 & 0.4 \\ -0.4 & 0.8\end{array}\right]\)
练习 15.2 采用 VAR(2) 模型 \(Y_{t}=\boldsymbol{A}_{1} Y_{t-1}+\boldsymbol{A}_{2} Y_{t-2}+e_{t}\) 以及 \(\boldsymbol{A}_{1}=\left[\begin{array}{cc}0.3 & 0.2 \\ 0.2 & 0.3\end{array}\right]\) 和 \(\boldsymbol{A}_{2}=\left[\begin{array}{cc}0.4 & -0.1 \\ -0.1 & 0.4\end{array}\right]\)。假设 \(e_{t}\) 是 i.i.d. \(Y_{t}\) 严格平稳吗?如果需要,使用数学软件。
练习15.3 假设\(Y_{t}=\boldsymbol{A} Y_{t-1}+u_{t}\)和\(u_{t}=\boldsymbol{B} u_{t-1}+e_{t}\)。证明 \(Y_{t}\) 是 VAR(2) 并导出系数矩阵和方程误差。
练习15.4 假设\(Y_{i t}, i=1, \ldots, m\) 是独立的AR(p) 过程。推导出它们联合 VAR 表示的形式。
练习 15.5 在 VAR(1) 模型 \(Y_{t}=\boldsymbol{A}_{1} Y_{t-1}+e_{t}\) 中,从 (15.3) 中找到 \(h\) 步移动平均矩阵 \(\Theta_{h}\) 的显式表达式。练习 15.6 在 VAR(2) 模型 \(Y_{t}=\boldsymbol{A}_{1} Y_{t-1}+\boldsymbol{A}_{2} Y_{t-2}+e_{t}\) 中,从 (15.3) 中找出 \(h=1, \ldots 4\) 的移动平均矩阵 \(\Theta_{h}\) 的显式表达式。
练习 15.7 类似于自回归方程(14.33),导出 VAR(p) 过程的 VAR(1) 表示。使用它可以导出类似于 (14.42) 的 \(h\) 阶跃脉冲响应 IRF(h) 的显式公式。
练习 15.8 令 \(Y_{t}=\left(Y_{1 t}, Y_{2 t}\right)^{\prime}\) 为 \(2 \times 1\) 并考虑 VAR(2) 模型。假设 \(Y_{2 t}\) 不格兰杰原因 \(Y_{1 t}\)。 VAR 系数矩阵 \(\boldsymbol{A}_{1}\) 和 \(\boldsymbol{A}_{2}\) 有何含义?
练习15.9 继续上一个练习,假设\(Y_{2 t}\) 不导致\(Y_{1 t}\) 格兰杰原因,并且\(Y_{1 t}\) 不导致\(Y_{2 t}\) 格兰杰原因。 VAR 系数矩阵 \(\boldsymbol{A}_{1}\) 和 \(\boldsymbol{A}_{2}\) 有何含义?
练习 15.10 假设您对 \(m=8\) 变量进行了 20 年的每月观察。您的顾问建议 \(p=12\) 滞后以考虑年度模式。您将估计每个方程有多少个系数?你有多少观察结果?在这种情况下,用所有八个变量来估计 VAR(12) 对您来说有意义吗?
练习15.11 设\(\widehat{e}_{t}\)为估计VAR的最小二乘残差,\(\widehat{\Sigma}\)为残差协方差矩阵,\(\widehat{\boldsymbol{B}}=\operatorname{chol}(\widehat{\Sigma})\)。表明 \(\widehat{\boldsymbol{B}}\) 可以通过使用残差的递归最小二乘法来计算。
练习 15.12 Cholesky 分解
推导协方差矩阵 \(\left[\begin{array}{cc}\sigma_{1}^{2} & \rho \sigma_{1} \sigma_{2} \\ \rho \sigma_{1} \sigma_{2} & \sigma_{1}^{2}\end{array}\right]\) 的 Cholesky 分解。
写出相关矩阵的答案(特殊情况 \(\sigma_{1}^{2}=1\) 和 \(\sigma_{2}^{2}=1\) )。
找到相关矩阵的上三角分解。即,满足 \(R R^{\prime}=\left[\begin{array}{ll}1 & \rho \\ \rho & 1\end{array}\right]\) 的上三角矩阵 \(R\)。
假设 \(\Theta_{h}=\left[\begin{array}{ll}1 & 0 \\ 1 & 1\end{array}\right], \sigma_{1}^{2}=1\)、\(\sigma_{2}^{2}=1\) 和 \(\rho=0.8\)。使用 Cholesky 分解求正交脉冲响应 OIRF(h)。
假设变量的顺序颠倒。这相当于使用 (c) 部分的上三角分解。计算正交脉冲响应 OIRF(h)。
比较两个正交脉冲响应。
练习15.13 你阅读了一篇实证论文,该论文估计了一组列出的变量中的VAR,并显示了估计的正交脉冲响应函数。论文中没有对系统的排序或标识进行评论,您没有理由相信文献中使用的顺序是“标准”的。您应该如何解释估计的脉冲响应函数?
练习 15.14 从 FRED-QD 中获取季度序列 gdpcl(实际 GDP)、gdpctpi(GDP 价格平减指数)和 fedfunds(联邦基金利率)。将前两项转换为增长率,如第 15.13 节所示。使用相同的排序估计相同的三变量 VAR(6)。 \(15.23\) 节中讨论的识别策略将供给冲击指定为 GDP 方程的正交冲击。计算 GDP、价格水平和联邦基金利率相对于此供给冲击的脉冲响应函数。对于前两个,这将需要计算累积脉冲响应函数。 (解释原因。)对估计的函数进行评论。练习15.15 采用 Kilian2009 数据集,其中包含变量石油(石油产量)、产出(全球经济活动)和价格(原油价格)。使用与第 15.24 节中所述的 Kilian (2009) 中相同的排序来估计正交化 VAR(4)。 (如该部分所述,将“石油”乘以 \(-1\),以便所有冲击都会增加价格。)估计产出相对于三种冲击的脉冲响应。对估计的功能进行评论。
练习 15.16 从 FRED-MD 获取每月系列许可证(建筑许可证)、hous(新房开工)和 realln(房地产贷款)。列出的顺序是由交易时间决定的。开发商在开始建造房屋(后者称为“房屋开工”)之前必须获得建筑许可证。购买房屋时可以获得房地产贷款。
将 realln 转换为增长率(对数一阶差分)。
通过比较 1 阶到 8 阶 VAR 的 AIC,为三变量系统选择合适的滞后阶数。
估计 VAR 模型并绘制房屋开工相对于三种冲击的脉冲响应函数。
解释你的发现。
练习 15.17 从 FRED-QD 中获取季度序列 gpdicl(实际私人国内投资总额)、gdpctpi(GDP 物价平减指数)、gdpcl(实际 GDP)和 fedfunds(联邦基金利率)。将前三个转换为日志,例如\(g d p=100 \log (g d p c 1)\)。考虑基于短期限制的结构性 VAR。使用 \(\boldsymbol{A} \boldsymbol{e}_{t}=\varepsilon_{t}\) 形式的结构。施加限制,即前三个变量不会对联邦基金利率做出反应,投资不会对价格做出反应,并且价格不会对投资做出反应。最后,假设投资相对于 GDP 具有短期单位弹性(在投资方程中,GDP 的 \(\boldsymbol{A}\) 系数为 \(-1\) )。
写出类似于 (15.22) 的矩阵 \(\boldsymbol{A}\),施加上面定义的识别约束。
模型是否已确定?鉴定有条件吗?解释。
在此模型中,产出和价格是同时的,还是像 \(15.23\) 节中描述的示例那样递归?
使用 6 个滞后或您选择的不同数量(证明您的选择合理)来估计结构 VAR,并包括外生时间趋势。报告您对 \(\boldsymbol{A}\) 矩阵的估计。你能解释一下系数吗?
估计并报告以下三个脉冲响应函数:
1.联邦基金利率对GDP的影响。
2.GDP冲击对GDP的影响。
- GDP冲击对价格的影响。
练习15.18 采用 Kilian2009 数据集,其中包含变量石油(石油产量)、产出(全球经济活动)和价格(原油价格)。考虑基于短期限制的结构性 VAR。使用 \(A e_{t}=\varepsilon_{t}\) 形式的结构。施加限制,即石油生产不响应产量或石油价格,并且产量不响应石油产量。最后一项限制可能是由于观察到供应中断需要一个多月才能到达零售市场,因此对经济活动的影响同样会延迟一个月。 (a) 写下类似于 (15.22) 的矩阵 \(\boldsymbol{A}\),施加上面定义的识别约束。
模型是否已确定?鉴定有条件吗?解释。
使用 4 个滞后或您选择的不同数量来估计结构 VAR(证明您的选择合理)。 (如该部分所述,将“石油”乘以 \(-1\),以便所有冲击都会增加价格。)报告您对 \(\boldsymbol{A}\) 矩阵的估计。你能解释一下系数吗?
估计石油价格对三种冲击的脉冲响应。对估计的功能进行评论。
练习 15.19 从 FRED-QD 中获取季度序列 gdpc1(实际 GDP)、m1realx(实际 M1 货币存量)和 cpiaucsl (CPI)。创建名义 M1(将 m1realx 乘以 cpiaucsl),并将实际 GDP 和名义 M1 转换为增长率。货币中性的假设是名义货币供应量对GDP等实际结果没有影响。严格的货币中性表明不存在短期或长期影响。长期中立性表明没有长期影响。
要测试严格中立性,请使用格兰杰因果检验。根据 GDP 增长的四个滞后和货币增长的四个滞后对 GDP 增长进行回归。检验四个货币滞后的系数共同为零的假设。使用稳健的标准误差。解释结果。
测试长期中性检验,货币增长的四个系数之和是否为零。解释结果。
估计实际 GDP 增长和名义货币增长的结构性 VAR,从而实现货币的长期中性。解释一下你的方法。
报告国内生产总值和名义货币水平对两次冲击的脉冲反应的估计。解释结果。
练习 15.20 Shapiro 和 Watson (1988) 估计了施加长期约束的结构 VAR。复制他们模型的简化版本。以 FRED-QD 的季度系列 hoanbs(工作时间,非农商业部门)、gdpcl(实际 GDP)和 gdpctpi(GDP 平减指数)为例。将前两个转换为增长率,第三个(GDP平减指数)取对数的第二个差(不同的通货膨胀)。夏皮罗和沃森估计了一个结构模型,该模型施加了以下约束:劳动力供应时间长期不受产出和通货膨胀的影响,而国内生产总值长期不受需求冲击的影响。这意味着变量中的递归排序以实现长期限制。
写下矩阵 \(\boldsymbol{C}\),如 (15.24) 所示,施加上述定义的识别约束。
模型是否已确定?
使用 AIC 选择 VAR 的滞后数。
估计结构 VAR。报告估计的 \(\boldsymbol{C}\) 矩阵。你能解释一下系数吗?
估计 GDP 水平对三种冲击的结构性脉冲响应。解释结果。