第1章: 引言
1 引言
1.1 什么是计量经济学?
“计量经济学”一词被认为是由挪威的 Ragnar Frisch (1895-1973) 创造的,他是计量经济学会的三位主要创始人之一,《计量经济学》杂志的第一任编辑,也是第一届诺贝尔纪念奖的共同获得者1969 年获得经济学博士学位。因此,我们在《计量经济学》第一期的导言中用弗里施自己的话来描述这门学科是合适的。
关于计量经济学一词的解释可能是有序的。它的定义隐含在[计量经济学]社会范围的声明中,在宪法第一节中写道:“计量经济学会是一个国际社会,旨在促进经济理论与统计和数学的关系…… .. 其主要目的是促进旨在统一理论-定量和经验-定量方法来解决经济问题的研究….”
但是,经济学的定量方法有几个方面,其中任何一个方面,就其本身而言,不应与计量经济学相混淆。因此,计量经济学绝不等同于经济统计。它也不等同于我们所谓的一般经济理论,尽管该理论的相当一部分具有明确的数量特征。计量经济学也不应被视为将数学应用于经济学的同义词。经验表明,统计学、经济理论和数学这三种观点中的每一种都是真正理解现代经济生活中的数量关系的必要条件,但其本身并不是充分条件。这三者的统一才是强大的。正是这种统一构成了计量经济学。
Ragnar Frisch, Econometrica, (1933), 1, pp. 1-2。
这个定义在今天仍然有效,尽管一些术语在使用上有所演变。今天,我们会说计量经济学是对经济模型、数理统计和经济数据的统一研究。
在计量经济学领域内有细分和专业。计量经济学理论涉及工具和方法的发展,以及对计量经济学方法性质的研究。应用计量经济学是描述定量经济模型的发展以及使用经济数据将计量经济学方法应用于这些模型的术语。
1.2 计量经济学的概率方法
现代计量经济学的统一方法论由挪威的 Trygve Haavelmo (1911-1999) 提出,他是 1989 年诺贝尔经济学奖得主,在他的开创性论文“计量经济学中的概率方法”(1944 年)中。 Haavelmo 认为定量经济模型必须是概率模型(今天我们指的是随机模型)。确定性模型与观察到的经济量明显不一致,将确定性模型应用于非确定性数据是不连贯的。应明确设计经济模型以纳入随机性;不应该简单地将随机误差添加到确定性模型中以使其随机化。一旦我们承认一个经济模型是一个概率模型,很自然地,对经济进行量化、估计和进行推断的适当工具方法就是通过强大的数理统计理论。定量经济分析的适当方法来自经济模型的概率构建。
Haavelmo 的概率方法很快被经济学界所接受。今天,经济学中的任何量化工作都不会回避其基本愿景。
虽然所有经济学家都接受概率方法,但它的实施已经发生了一些演变。
结构方法最接近 Haavelmo 最初的想法。指定概率经济模型,并在正确指定经济模型的假设下进行定量分析。研究人员经常将其描述为“认真对待他们的模型”。结构方法通常导致基于似然的分析,包括最大似然和贝叶斯估计。
对结构性方法的批评是,将经济模型视为正确指定是一种误导。相反,将模型视为有用的抽象或近似更为准确。在这种情况下,我们应该如何解释结构计量经济分析?推理的准结构方法将结构经济模型视为近似值而不是事实。该理论导致了伪真值(由估计问题定义的参数值)、拟似然函数、拟 MLE 和拟似然推理的概念。
密切相关的是半参数方法。概率经济模型已部分指定,但某些特征未指定。这种方法通常会导致估计方法,例如最小二乘法和广义矩量法。半参数方法在当代计量经济学中占主导地位,是这本教科书的主要焦点。
数量结构经济学的另一个分支是校准方法。与准结构方法类似,校准方法将结构模型解释为近似值,因此本质上是错误的。不同之处在于校准主义文献拒绝数学统计(认为经典理论不适用于近似模型),而是使用非统计的 \(a d h o c^{1}\) 方法通过匹配模型和数据矩来选择参数。
1.3 特里格维·哈维尔莫
计量经济学领域的创始思想很大程度上归功于挪威计量经济学家 Trygve Haavelmo (1911-1999)。他对概率模型的倡导彻底改变了该领域,他对形式数学推理的使用为后代奠定了基础。他在 \(1989 .\) 获得诺贝尔经济学奖
\({ }^{1}\) Ad hoc 的意思是“为此目的”——一种为特定问题设计的方法——而不是基于可概括的原则。
1.4 计量经济学术语
在典型应用中,计量经济学家对一组变量进行一组重复测量。例如,在劳工申请中,变量可能包括周收入、教育程度、年龄和其他描述性特征。我们称这些信息为数据、数据集或样本。
我们使用术语观察来指代对变量的不同重复测量。个人观察通常对应于特定的经济单位,例如个人、家庭、公司、公司、组织、国家、州、城市或其他地理区域。个人观察也可以是某个时间点的衡量指标,例如季度 GDP 或每日利率。
经济学家通常用斜体罗马字符 \(Y, X\) 和/或 \(Z\) 来表示变量。计量经济学的惯例是使用字符 \(Y\) 来表示要解释的变量,而字符 \(X\) 和 \(Z\) 用于表示条件(解释)变量。按照数学实践,随机变量和向量用大写罗马字符表示,例如 \(Y\) 和 \(X\)。我们对通常用小写字母 \(e, u\) 或 \(v\) 表示的方程错误例外。
实数(实线 \(\mathbb{R}\) 的元素,也称为标量)使用小写斜体书写,例如 \(x\)。向量(\(\mathbb{R}^{k}\) 的元素)通常也使用小写斜体,例如 \(x\),或使用小写粗斜体,例如 \(\boldsymbol{x}\)。我们在矩阵代数表达式中使用粗体来与矩阵表示法兼容。
矩阵使用大写粗斜体书写,例如 \(\boldsymbol{X}\)。我们的符号不会区分随机矩阵和非随机矩阵。通常我们使用 \(\boldsymbol{U}, \boldsymbol{V}, \boldsymbol{X}, \boldsymbol{Y}, \boldsymbol{Z}\) 来表示随机矩阵并使用 \(\boldsymbol{A}, \boldsymbol{B}, \boldsymbol{C}, \boldsymbol{W}\) 来表示非随机矩阵。
我们用自然数 \(n\) 表示观察的数量,并用索引 \(i\) 为变量下标以表示单个观察,例如\(Y_{i}\)。在某些情况下,我们使用 \(i\) 以外的索引,例如在索引 \(t\) 很常见的时间序列应用程序中。在小组研究中,我们通常使用双重索引 \(i t\) 来指代某个时间段 \(t\) 的个体 \(i\)。
我们通常使用希腊字母,例如 \(\beta, \theta\) 和 \(\sigma^{2}\) 来表示未知参数(标量或向量)。参数矩阵使用大写拉丁黑体书写,例如\(\boldsymbol{A}\)。估计量通常用帽子“\(\wedge\)”、波浪号“\("\)”或横杠“-”来表示,例如,\(\widehat{\beta}\) 和 \(\widetilde{\beta}\) 是 \(\beta\) 的估计量,\(\widehat{A}\) 是\(\beta, \theta\) 的估计量。
计量经济学估计量的协方差矩阵通常使用大写粗体 \(\boldsymbol{V}\) 编写,通常带有下标来表示估计量,例如\(\boldsymbol{V}_{\widehat{\beta}}=\operatorname{var}[\widehat{\beta}]\) 作为 \(\widehat{\beta}\) 的协方差矩阵。希望不会引起混淆,我们将使用符号 \(\boldsymbol{V}_{\beta}=\) avar \([\widehat{\beta}]\) 来表示 \(\sqrt{n}(\widehat{\beta}-\beta)\) 的渐近协方差矩阵(渐近分布的方差)。协方差矩阵估计器将通过附加帽子或波浪线来表示,例如\(\widehat{V}_{\beta}\) 是 \(\boldsymbol{V}_{\beta}\) 的估计量。
1.5 观测数据
一个常见的计量经济学问题是量化一组变量对另一变量的因果影响。例如,劳动经济学的一个关注点是学校教育的回报——在保持其他变量不变的情况下,增加工人的教育所引起的收入变化。另一个有趣的问题是男女之间的收入差距。
理想情况下,我们会使用实验数据来回答这些问题。为了衡量学校教育的回报,一项实验可能会将儿童随机分组,要求不同的群体接受不同程度的教育,然后在儿童成年并进入劳动力市场后遵循他们的工资路径。各组之间的差异将直接衡量不同教育水平的影响。然而,像这样的实验会被广泛谴责为不道德的!因此,在经济学中,实验数据集的范围通常很窄。相反,大多数经济数据都是观察性的。继续上面的例子,通过数据收集我们可以记录一个人的教育水平和工资。有了这些数据,我们可以测量这些变量的联合分布并评估它们的联合依赖性。但是从观察数据很难推断因果关系,因为我们无法操纵一个变量来查看对另一个变量的直接影响。例如,一个人的教育水平(至少部分地)由该人的选择决定。这些因素很可能会受到个人能力和工作态度的影响。一个人受过高等教育的事实表明能力水平高,这表明相对工资较高。这是对观察到的教育水平和工资之间正相关的另一种解释。能力强的人在学校表现更好,因此选择接受更高层次的教育,能力强是他们获得高工资的根本原因。关键是,多种解释与受教育程度与教育之间的正相关是一致的。仅对联合分布的了解可能无法区分这些解释。
大多数经济数据集是观察性的,而不是实验性的。这意味着必须将所有变量视为随机变量,并可能共同确定。
这种讨论意味着仅从观测数据很难推断出因果关系。因果推理需要识别,这是基于强有力的假设。我们将在整本书中不时讨论这些问题。
1.6 标准数据结构
经济数据集有五种主要类型:横截面、时间序列、面板、集群和空间。它们的区别在于观察之间的依赖结构。
横截面数据集每个人有一个观察结果。调查和行政记录是横截面数据的典型来源。在典型应用中,被调查的个人是个人、家庭、公司或其他经济主体。在许多当代计量经济学横截面研究中,样本量 \(n\) 非常大。通常假设横截面观察是相互独立的。本书的大部分内容都致力于研究横截面数据。
时间序列数据按时间索引。典型的例子包括宏观经济总量、价格和利率。这种类型的数据的特点是串行依赖。大多数综合经济数据只能以低频率(每年、每季度或每月)获得,因此样本量通常比横截面研究小得多。一个例外是财务数据,其中数据的可用频率很高(每天、每小时或按交易),因此样本量可能非常大。
面板数据结合了横截面和时间序列的元素。这些数据集由一组随时间重复测量的个人(通常是个人、家庭或公司)组成。常见的建模假设是个体相互独立,但给定个体的观察是相互依赖的。在某些面板数据上下文中,每个个体的时间序列观察 \(T\) 的数量很少,而个体 \(n\) 的数量很大。在其他面板数据环境中(例如,当以国家或州作为衡量单位时),个体数量 \(n\) 可能很小,而时间序列观测值 \(T\) 的数量可能适中。计量经济学面板数据中的一个重要问题是误差分量的处理。
聚类样本在应用经济学中越来越流行,并且与面板数据相关。在集群抽样中,观察被分组为“集群”,这些集群被视为相互独立但允许在集群内依赖。与面板数据的主要区别在于,聚类抽样通常不会显式地对误差分量结构进行建模,也不会对聚类内的依赖性进行建模,而是关注对任意形式的聚类内相关性具有鲁棒性的推理。
空间依赖是相互依赖的另一种模式。根据空间度量(例如,地理接近度),观测被视为相互依赖。与聚类不同,空间模型允许所有观察结果相互依赖,并且通常依赖于依赖关系的显式建模。空间依赖也可以看作是时间序列依赖的概括。
1.7 数据结构
横截面
时间序列
控制板
集群
空间
正如我们上面提到的,本文的大部分内容将在相互独立的观察假设下专门讨论横截面数据。通过相互独立,我们的意思是 \(i^{t h}\) 观察 \(\left(Y_{i}, X_{i}\right)\) 独立于 \(i \neq j\) 的 \(j^{t h}\) 观察 \(\left(Y_{j}, X_{j}\right)\)。在这种情况下,我们说数据是独立分布的。 (有时“独立”这个标签会被误解。它是关于观察 \(i\) 和 \(j\) 之间关系的陈述,而不是关于 \(Y_{i}\) 和 \(X_{i}\) 之间关系的陈述。)
此外,如果数据是随机收集的,则将每个观察值建模为来自相同概率分布的抽取是合理的。在这种情况下,我们说数据是同分布的。如果观察是相互独立且同分布的,我们称这些观察是独立同分布的,i.i.d.,或随机样本。对于本文的大部分内容,我们将假设我们的观察来自随机样本。
定义 1.1 如果变量 \(\left(Y_{i}, X_{i}\right)\) 与分布 \(F\) 同分布,则变量 \(\left(Y_{i}, X_{i}\right)\) 是分布 \(F\) 的样本。
定义 1.2 如果变量 \(\left(Y_{i}, X_{i}\right)\) 在 \(i=1, \ldots, n\) 上相互独立且同分布(i.i.d.),则它们是随机样本。
在随机抽样框架中,我们将单个观察 \(\left(Y_{i}, X_{i}\right)\) 视为来自我们称为总体的联合概率分布 \(F(y, x)\) 的实现。这个“人口”是无限大的。这种抽象可能会造成混淆,因为它与现实世界中的物理人口不对应。这是一个抽象,因为分布 \(F\) 是未知的,而统计推断的目标是从样本中了解 \(F\) 的特征。随机抽样的假设为用数理统计工具处理经济统计提供了数学基础。
随机抽样框架是 19 世纪后期的一项重大智力突破,允许将数理统计应用于社会科学。在这一概念发展之前,数理统计方法并未应用于经济数据,因为后者被视为非随机的。随机抽样框架使经济样本能够被视为随机样本,这是应用统计方法的必要前提。
1.8 计量经济学软件
经济学家使用各种计量、统计和编程软件。
Stata 是一个强大的统计程序,具有广泛的预编程计量经济学和统计工具。它在经济学家中颇受欢迎,并不断更新新方法。对于大多数计量经济分析来说,它是一个出色的软件包,但是当您想要使用尚未编程的新的或不太常见的计量经济学方法时,它会受到限制。在这本教科书的许多地方都描述了特定的 Stata 估计方法和命令。这些命令对 Stata 版本 \(16 .\) 有效
MATLAB、GAUSS 和 OxMetrics 是具有多种内置统计函数的高级矩阵编程语言。许多计量经济学方法已经用这些语言编写,并且可以在网上获得。这些软件包的优点是您可以完全控制您的分析,并且比在 Stata 中编写新方法更容易。一些缺点是您必须自己进行大量编程,编写复杂的程序需要大量时间,并且编程错误难以预防,难以检测和消除。在这些语言中,GAUSS 曾经在计量经济学家中非常流行,但目前 MATLAB 更流行。
中间的选择是 R。R 具有上述高级矩阵编程语言的功能,但也有许多内置的统计环境,可以复制 Stata 的大部分功能。 R 是统计领域的主要编程语言,因此在该领域开发的方法在 R 中最常见。独特的是,R 是开源的、用户贡献的,最重要的是,完全免费!越来越多的计量经济学家是 \(R\) 的狂热粉丝。
对于高度密集的计算任务,一些经济学家使用标准编程语言(如 Fortran 或 C)编写程序。这可能会大大提高计算速度,但会增加编程和调试的时间。
计量经济学家还使用了许多其他软件包,包括 Eviews、Gretl、PcGive、Python、Julia、RATS 和 SAS。
由于上述软件包具有明显的优势,许多经验经济学家使用多个软件包。作为计量经济学的学生,您将至少学习这些软件包中的一个,并且可能不止一个。我的建议是所有计量经济学的学生都应该对 Stata、MATLAB 和 R 有一定的了解。
1.9 复制
科学研究需要记录和可复制。对于使用观察数据的社会科学研究,这需要仔细记录和归档研究方法、数据操作和编码。最佳实践如下。伴随每篇发表的论文,作者应创建一个完整的复制包(一组数据文件、文档和程序代码文件)。这个包应该包含用于分析的源(原始)数据,以及执行经验分析和论文中报告的其他数值工作的代码。在大多数情况下,这是一组可能需要按顺序执行的程序。 (例如,可能有一个“清理”和操作数据的初始程序,然后是估计报告模型的第二组程序。)理想的是完整的文档和清晰性。该文件包应发布在作者网站上,并在可以选择的情况下发布在期刊网站上。
一个复杂的因素是,当前许多经济数据集的访问受到限制,未经许可不得共享。在这些情况下,无法发布或共享数据。然而,计算出的代码可以而且应该发布。
大多数经济学期刊都要求已发表论文的作者公开其数据集。例如:
1.10 计量经济学指出:
Econometrica 的政策是所有经验、实验和模拟结果都必须是可复制的。因此,被接受论文的作者必须提交数据集、程序和有关复制所需的经验分析、实验和模拟的信息以及一些有限的敏感性分析。
美国经济评论指出:
美国经济学会的政策是,只有在分析中使用的数据和代码被清晰准确地记录并且对数据和代码的访问对作者来说是非专有的时才发表论文。包含实证工作、模拟或实验工作的已接受论文的作者必须在接受之前提供有关数据、程序和足以允许复制的其他计算细节的信息,以及有关访问数据和程序的信息。
《政治经济学杂志》指出:
《政治经济学杂志》的政策是,只有在分析中使用的数据得到清晰准确的记录并且任何研究人员都可以随时复制以供复制时,才发表论文。
如果您对使用已发表论文中的数据感兴趣,请首先查看该期刊的网站,因为许多期刊在线存档数据和复制程序。其次,查看论文作者的网站。大多数学术经济学家维护网页,有些人提供包含数据和程序的完整复制文件。如果这些调查失败,请给作者发电子邮件,礼貌地索取数据。你可能需要坚持不懈。
作为职业礼仪,所有作者绝对有义务提供他们的数据和程序。不幸的是,许多人没有这样做,而且通常是出于糟糕的原因。具有讽刺意味的是,将尽可能多的工作(包括所有数据和程序)免费提供通常符合学者的最大利益,因为这只会增加他们的工作被引用和产生影响的可能性。
当您开始自己的经验项目时,请记住这一点。请记住,作为最终产品的一部分,您将需要(并且希望)向学者社区提供所有数据和程序。奉承的最大形式是得知另一位学者已经阅读了您的论文,想要扩展您的工作,或者想要使用您的经验方法。此外,公共开放性为实证分析的透明度和完整性提供了健康的激励。
1.11 教科书数据文件
在教科书网页 bhansen/econometrics/ 上发布了许多包含数据集的文件,这些文件是在本书中用于说明和章末的经验练习。大多数数据集有四个文件:(1)描述(pdf格式); (2) Excel数据文件; (3) 文本数据文件; (4) 状态数据文件。这三个数据文件的内容是相同的:观察值和变量在每个中都以相同的顺序列出,并且都有变量标签。
例如,文本经常引用从当前人口调查中提取的工资数据集。该数据集名为 cps09mar,由文件 cps09mar_description.pdf、cps09mar.xlsx、cps09mar .txt 和 cps09mar 表示。数据。
目前包含的数据集是
AB1991
Arellano 和 Bond (1991) 的数据文件
AJR2001
来自 Acemoglu、Johnson 和 Robinson 的数据文件 (2001)
AK1991
来自 Angrist 和 Krueger 的数据文件 (1991)
AL1999
来自 Angrist 和 Lavy (1999) 的数据文件
BMN2016
来自 Bernheim、Meer 和 Novarro 的数据文件(2016 年)
cps09mar
从 2009 年 3 月当前人口调查中提取的住户调查数据
卡1995
Card 的数据文件 (1995)
CHJ2004
来自 Cox、B. E. Hansen 和 Jimenez 的数据文件(2004 年)
CK1994
Card and Krueger (1994) 的数据文件
CMR2008
Card、Mas 和 Rothstein 的日期文件 (2008) - DDK2011
来自 Duflo、Dupas 和 Kremer 的数据文件 (2011)
DS2004
DiTella 和 Schargrodsky 的数据文件 (2004)
FRED-MD 和 FRED-QD
来自 McCracken 和 Ng(2015 年)的美国月度和季度宏观经济数据库
投资1993
Hall and Hall (1993) 的数据文件
LM2007
来自 Ludwig 和 Miller (2007) 以及 Cattaneo、Titiunik 和 Vazquez-Bare (2017) 的数据文件
Kilian2009
Kilian 的数据文件 (2009)
情侣男人
数据文件来自 Forinash 和 Koppelman (1993)、Koppelman 和 Wen (2000) 以及 Wen 和 Koppelman (2001)
*MRW1992
Mankiw、Romer 和 Weil 的数据文件 (1992)
内洛夫1963
Nerlov (1963) 的数据文件
PSS2017
Papageorgiou、Saam 和 Schulte 的数据文件 (2017)
RR2010
来自 Reinhard 和 Rogoff 的数据文件 (2010)
1.12 阅读手稿
我努力使用统一的符号和命名法。材料的发展是累积的,后面的章节建立在前面的章节之上。尽管如此,我们已尽一切努力使每一章都自成一体,以便读者可以根据自己的兴趣选择主题。
为了充分理解计量经济学方法,有必要对其力学有数学上的理解,这包括主要结果的数学证明。因此,该文本是自包含的,几乎所有结果都以完全数学严谨性证明。数学发展和证明旨在简洁明了(有时被描述为数学优雅),但也着眼于教学法。要理解数学证明,仅仅阅读证明是不够的,您需要遵循它并为自己重新创建它。
然而,许多读者不会对每个数学细节、解释或证明感兴趣。这没关系。要使用一种方法,可能不需要了解数学细节。因此,我将更多技术性的数学证明和细节放在章节附录中。这些附录和其他技术部分标有星号 \(\left(^{*}\right)\)。可以跳过这些部分而不会丢失任何说明。
矩阵代数中的关键概念和一组有用的不等式在附录 A 和 B 中进行了回顾。在开始第 3 章之前阅读或回顾附录 A.1-A.11 并在第 6 章之前回顾附录 B 可能会很有用。不必了解附录中的所有材料。它们旨在作为参考资料,其中一些结果未在本教科书中使用。