Articles IV
Researching on IVs methods
(Mogstad, Torgovitsky, and Walters 2021) 两阶段最小二乘法与多个工具变量的因果解释
Mogstad, M., A. Torgovitsky, and C. R. Walters. The Causal Interpretation of Two-Stage Least Squares with Multiple Instrumental Variables[J]. American Economic Review, 2021, 111(11):3663-3698.
中文摘要:
经验研究人员经常使用两阶段最小二乘法 (2SLS) 来组合用于单一处理的多个工具变量 (IV)。当处理效应存在异质性时,纳入多个IV的一个常见理由是 2SLS 估计量可以被赋予因果解释,即作为局部平均处理效应 (LATEs) 的正加权平均值。这种解释需要众所周知的单调性条件。然而,我们证明了当存在多个工具变量时,只有当选择行为实际上是同质的情况下,这个条件才能得到满足。基于这一发现,我们考虑在较弱的部分单调性条件下使用多个IV。我们描述了在部分单调性条件下,2SLS 估计量成为 LATEs 正加权平均值的经验可验证的充分必要条件。我们将这些结果应用于使用多个工具变量对大学回报进行的实证分析。我们证明了标准的单调性条件与数据不符。尽管如此,我们的经验检验表明,2SLS 估计量仍然保留了因果解释,即作为依从者群体中大学就读效应的正加权平均值。(JEL C26, I23, I26, J24, J31, R23)
什么是单调性条件?
IA 单调性条件要求:对于任意两个工具变量值 \(z\) 和 \(z'\),所有个体 \(i\) 的处理状态 \(D_i(z)\) 相对于 \(D_i(z')\) 的变化方向必须相同(要么都增加/不变,要么都减少/不变)。不允许一些人因为工具变量从 \(z'\) 变为 \(z\) 而选择处理,同时另一些人反而放弃处理。
数学定义为:
\[ \forall z, z' \in \mathcal{Z}, \quad \text{either } (D_i(z) \geq D_i(z') \forall i) \quad \text{or } (D_i(z) \leq D_i(z') \forall i) \]
(Imbens and Angrist 1994) 识别和估计局部平均处理效应
Imbens, G. W., and J. D. Angrist. Identification and Estimation of Local Average Treatment Effects[J]. Econometrica, 1994, 62(2):467-475.
中文摘要:
随机分配治疗和同时收集治疗和对照组数据是医学评估研究的标准做法。相比之下,使用随机分配评估社会计划仍然存在争议。在批评参数评估模型(例如Lalonde(1986))之后,计量经济学研究已经转向建立条件,以保证观察性研究中处理效应的非参数识别,即不依赖于函数形式限制或分布假设的识别。重点是识别一个感兴趣人群的平均处理效应,或处理人群的平均效应。然而,这些参数的非参数识别要求可能很严格,并且推导出的识别结果很脆弱。特别是,Chamberlain(1986)、Manski(1990)、Heckman(1990)和Angrist和Imbens(1991)的结果要求存在某些人群,对于这些人来说,治疗的概率至少在极限情况下为零。本文的目的是证明,即使没有人群,对于这些人来说,治疗的概率至少在极限情况下为零,我们仍然可以在满足广泛模型和情况下轻度限制的情况下识别感兴趣的平均处理效应。我们称这种效应为局部平均处理效应(LATE)。局部平均处理效应可以识别的问题包括潜在索引模型和基于自然实验的评估,例如Angrist(1990)和Angrist和Krueger(1991)研究的问题。LATE是处理状态受工具变量影响的个体群体的平均处理效应。
两阶段法为什么可以使用因果效应估计中的处置效应进行解释?
在Imbens和Angrist(1994;“IA” 以下简称)的一篇重要论文中,提供了一种使用多个IV进行两阶段法估计的替代解释,这种解释允许处理效应存在异质性。他们证明了2SLS估计量可以解释为正加权平均值,用于处理状态受工具变量影响的群体的局部平均处理效应(LATEs)。这个结果适用于任何数量的工具变量,只要满足IA的单调性条件。
In an influential paper, Imbens and Angrist (1994; “IA” hereafter) provided an alternative justification for using 2SLS with multiple IVs, one which allows for heterogeneous treatment effects. They showed that the 2SLS estimand can be interpreted as a positively weighted average of local average treatment effects (LATEs) for subpopulations whose treatment status is affected by the instruments. This result holds for any number of instruments, as long as IA’s “monotonicity” condition is satisfied.
两阶段最小二乘法(2SLS)之所以可以用于估计处置效应,是因为在满足特定条件下,它能识别局部平均处理效应(LATE)。根据Imbens和Angrist的研究,LATE是指那些因工具变量变化而改变处理状态的个体子群体的平均处理效应。
具体解释过程如下:
在处理效应存在异质性的情况下,2SLS估计量可被解释为多个局部平均处理效应(LATEs)的正加权平均值,前提是满足单调性条件。
单调性条件要求:对于任意两个工具变量值\(z\)和\(z'\),所有个体的处理状态变化方向必须一致。即:
\[ \forall z, z' \in \mathcal{Z}, \text{ either } (D_i(z) \geq D_i(z') \forall i) \text{ or } (D_i(z) \leq D_i(z') \forall i) \]
- 在此条件下,使用工具变量\(g(Z)\)的IV估计量计算为:
\[ \alpha_g^{IV} = \frac{\text{Cov}(Y, g(Z))}{\text{Cov}(D, g(Z))} = \sum_{k=1}^{K} \lambda_k \cdot \alpha_{z_k, z_{k-1}} \]
其中\(\alpha_{z_k, z_{k-1}}\)表示当工具变量从\(z_{k-1}\)变为\(z_k\)时改变处理状态的个体的局部平均处理效应,而\(\lambda_k\)是非负权重且总和为1。
这一解释克服了传统因果推断中的识别问题,允许我们在没有人群处理概率为零的情况下,依然能够识别有意义的平均处理效应。
由于LATE代表了”依从者”(compliers)群体的平均处理效应,即那些受工具变量影响而改变处理状态的个体,这使2SLS在存在处理效应异质性时仍具有明确的因果解释。