background-image: url("../pic/slide-front-page.jpg") class: center,middle # 计量经济学(Econometrics) ### 胡华平 ### 西北农林科技大学 ### 经济管理学院数量经济教研室 ### huhuaping01@hotmail.com ### 2025-09-07
--- class: center, middle, duke-orange,hide_logo name: chapter01 # 第1章 导论 [1.1 计量经济学历史与发展](#history) [1.2 计量经济学的内容体系](#frame) [1.3 计量经济学分析过程](#process) --- layout: false class: center, middle, duke-softblue,hide_logo name: history # 1.1 计量经济学历史与发展 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter01"> 第01章 导论</a>                             <a href="#history"> 1.1 计量经济学历史与发展</a> </span></div> --- ## 我们如何理解世界?——客观世界与思维模型 <img src="../pic/chpt1-world-model-01.jpeg" width="950" style="display: block; margin: auto;" /> .footnote[ **Source**: Generated by AI with Google Nano Banana model ] ??? promotes-source: A split-screen illustration comparing three econometric approaches: Left side shows classical econometrics with OLS regression lines and parameter estimation, middle shows modern econometrics with causal inference experiments and policy evaluation, right side shows AI models with deep learning networks and pattern recognition. Include the central theme "How do we understand the world?" with mathematical symbols, data points, and network connections. Style: academic poster design with clear sections and professional typography. --- ## 我们如何理解世界?——客观世界与思维模型 > **"所有的模型都是错误的,但有些是有用的。"** > —— **George Box** 在计量经济学的世界里,我们始终面临一个根本问题:**如何用数学语言描述和预测复杂的经济现象?** 今天,我们将探讨三种不同的"思维模型"如何帮助我们理解客观世界: 1. **经典计量经济学**:寻找"真实"的参数或函数形式 2. **现代计量经济学**:识别因果关系、准确预测未来 3. **人工智能模型**:学习数据模式、打造世界模型 --- ### 经典计量经济学——参数估计模型 **核心思想**:世界有固定的规律,经济现象背后存在**固定的、可估计的参数**或函数形式。 A. **参数估计**:OLS回归是经典计量经济学的一个重要参数估计方法。OLS回归通过最小化残差平方和来估计参数。最经典的例子是收入与教育的关系: .pull-left[ 我们假定收入与教育年限之间存在如下**总体关系**: `$$Y_i = \alpha + \beta X_i + \varepsilon_i$$` - `\(Y_i\)`:个人收入 - `\(X_i\)`:受教育年限 - `\(\beta\)`:**我们想要找到的"真实"参数** ] .pull-right[ 我们可以调研收集获得1000个工人的**样本数据**,OLS估计结果发现: `$$\hat{\beta} = 0.08$$` **解释**:每增加一年教育,收入平均增加8%。 ] --- ### 经典计量经济学——非参数模型 **核心思想**:放弃对函数形式的先验假设,让数据"说话",从而能够捕捉到参数方法可能遗漏的复杂**非线性**关系。 B. **非参数估计**:让数据自己决定函数形式,不预先假设变量间的具体关系,通过数据驱动的方式发现隐藏的模式和结构。还是以收入与教育年限的关系为例。 当线性关系不成立时,我们使用非参数方法建模(非参数模型): `$$E[Y|X] = f(X)$$` - `\(f(\cdot)\)` 是未知函数,让数据自己决定形状。 - 收入与教育年限的关系可能不是线性的,而是先快后慢的增长关系。 针对前面1000个工人的数据,可以采用**样条回归**、**局部加权回归**、**核回归**等对非参数模型进行估计。 --- ### 现代计量经济学——识别因果关系 **核心思想**:现代计量经济学认识到,**找到参数或函数形式还不够,我们需要知道因果关系**。相关不等于因果。 A. **因果推断**:通过识别和消除混淆变量,从观察到的相关性中分离出真正的因果关系,回答"如果...那么..."的反事实问题。 例如,进入**双一流大学**接受高等教育,真的能提高收入吗? - 我们能观察到一个没有进入双一流大学的人以及他的收入(事实),但不能观察到加入他进入双一流大学后的收入(反事实问题)。 -- - 同理,我们也能观察到一个进入双一流大学的人以及他的收入(事实),但不能观察到没有进入双一流大学后的收入(反事实问题)。 -- - 假如某年清华大学的本科招生录取分数线是670分,在这个门槛分数线附近(例如660分-680分)肯定有很多考生,一些考生因考分差一分而未能进入清华大学,而另一些考生因考分高一分而进入清华大学(**断点问题**)。 --- ### 现代计量经济学——识别因果关系 **核心思想**:现代计量经济学认识到,**找到参数或函数形式还不够,我们需要知道因果关系**。相关不等于因果。 A. **因果推断**:通过识别和消除混淆变量,从观察到的相关性中分离出真正的因果关系,回答"如果...那么..."的反事实问题。例如,进入**双一流大学**接受高等教育,真的能提高收入吗? .pull-left[ 理想情况下,我们想要分离出进入双一流大学接受高等教育的**因果效应**,即: `$$\delta=E[Y|T=1] - E[Y|T=0]$$` - `\(T\)`是处理变量(是否进入双一流大学接受高等教育)。 ] .pull-right[ **估计方法**: - **工具变量IV**:利用政策变化(如义务教育法) - **断点回归RDD**:利用录取分数线 - **双重差分DID**:比较政策前后的变化 ] --- ### 现代计量经济学——机器学习 **核心思想**: 预测的艺术。 B. **机器学习模型**:机器学习模型不假设任何函数形式,而是以最大化预测准确性为目标,**从数据中学习复杂的非线性关系**。 经典机器学习方法包括: - **决策树**:通过一系列if-then规则进行决策。 - **随机森林**:集成多个决策树提高预测精度。 - **支持向量机**:寻找最优分类边界。 - **逻辑回归**:处理分类问题的线性模型。 --- ### 现代计量经济学——机器学习 **核心思想**: 预测的艺术。 B. **机器学习模型**:机器学习模型不假设任何函数形式,而是以最大化预测准确性为目标,**从数据中学习复杂的非线性关系**。 .pull-left[ 贷款违约决策树模型: ``` 如果 收入 > 50000 如果 受教育程度 = 本科及以上 预测:不违约 否则 预测:违约 如果 收入 > 30000 如果 受教育程度 = 本科及以上 预测:不违约 否则 预测:违约 如果 ... 预测:... ``` ] .pull-right[ 贷款违约案例估计: - **变量数据**:用收入、年龄、受教育程度、信用评分、消费习惯、社交网络等100个变量,作为输入变量,预测贷款违约,作为输出变量。 - **估计结果**:随机森林模型预测更准确,决策树提供可解释的规则,可解释性强,易于理解 ] --- ### 人工智能模型——发现隐藏世界 **核心思想**: 让机器发现隐藏模式。AI模型不假设任何函数形式,而是**从数据中学习和发现世界运行规律**。 **神经网络模型**:模拟大脑。通过多层相互连接的节点(神经元)模拟大脑神经元的连接方式,通过反向传播算法自动调整连接权重,从而学习输入与输出之间的复杂非线性映射关系。 .pull-left[ 神经网络方法预测经济危机。最简单的神经网络模型: `$$Y = \sigma(W_2 \cdot \sigma(W_1 X + b_1) + b_2)$$` > 其中 `\(\sigma\)`是激活函数, `\(W\)`是权重矩阵。 ] .pull-right[ - **变量数据**:用GDP增长率、通胀率等10个变量(结构化数据),以及新闻文本、社交媒体情绪、高频交易数据等10000个变量(非结构化数据),作为输入变量。 - **结果**:AI模型可能预测更准确,但经济学家无法理解其逻辑。 ] --- ## 我们如何理解世界?——客观世界与思维模型 针对前述三种思维方法和认知模型,我们可以做一个综合比较。 | 方法 | 假设 | 目标 | 优势 | 局限 | |:------:|:------:|:------:|:------:|:------:| | 经典计量 | 线性关系 | 参数估计 | 可解释 | 过于简化 | | 现代计量 | 因果关系 | 政策评估 | 因果识别 | 数据要求高 | | AI大模型 | 无假设 | 预测准确 | 高精度 | 黑箱问题 | **总结**:技术不断进步,方法不断创新,但共同目标不变: > 发现规律、预测未来、理解世界。——**世界模型** --- ## 我们如何理解世界?——客观世界与思维模型 针对未来计量经济学思想和方法的发展,可以从以下几个方面进行思考和展望。 .pull-left[ **挑战**: 1. **可解释性**:AI模型是"黑箱" 2. **数据质量**:大数据不等于好数据 3. **因果关系**:难以识别特定因果 **机遇**: 1. **混合方法**:结合传统计量与AI 2. **因果AI**:发展可解释的AI模型 3. **实时分析**:处理高频、大规模数据 ] .pull-right[ **未来展望**: - 计量经济学的智能化时代 **学习建议**: 1. **掌握基础**:扎实的数学和统计基础 2. **拥抱变化**:学习编程和机器学习 3. **保持批判**:理解每种方法的局限 4. **注重实践**:用真实数据验证理论 ] --- ## 什么是计量经济学?(what) 计量经济学:是利用经济理论、数学以及统计学推断等工具对经济现象进行分析的一门社会科学。 主要构成内容包括: - 经济理论:定性描述为主 - 数理经济学:数学形式或方程 - 统计学: - 经济统计学——主要收集和处理经济数据 - 数理统计学——难以处理特殊经济计量问题 --- ## 计量经济学方法论基础 - 逻辑学基础(也可以上升为哲学基础) - 经济学基础(关系论转向) - 数学基础(主要是概率论基础) - 统计学基础(主要指数据基础) <img src="../pic/chpt1-what-frame.png" width="568" style="display: block; margin: auto;" /> --- ## 计量经济学如何进行研究? 科学研究:试图回答休谟诘问——如何从经历到的过去、特殊、局部,推论到没有经历到的未来、一般、整体? .pull-left[ 经济学研究过程: - 观察(个别、特殊) - 抽象(理论、模型) - 检验(实验、回归) - 发现(一般、普遍) ] .pull-right[ 计量经济学研究过程: - 模型设定 - 样本采集 - 模型估计 - 模型检验 - 模型应用 ] --- layout: false class: center, middle, duke-softblue,hide_logo name: frame # 1.2 计量经济学的内容体系 1.2.1 广义和狭义计量经济学 1.2.2 初、中、高级计量经济学 1.2.3 理论和应用计量经济学 1.2.4 经典和非经典计量经济学 1.2.5 微观和宏观计量经济学 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter01">第01章 导论</a>                             <a href="#frame">1.2 计量经济学的内容体系</a></span></div> --- ## 1.2.1 广义和狭义计量经济学 广义计量经济学: - 是利用经济理论、数学以及统计学定量研究经济现象的经济计量方法的统称 - 包括回归分析方法、投入产出分析方法、时间序列分析方法等。 狭义计量经济学: - 也就是我们通常所说的计量经济学,以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。 本课程中的计量经济学模型,就是狭义计量经济学意义上的经济数学模型。 --- ## 1.2.2 初、中、高级计量经济学 初级计量经济学: - 以计量经济学的数理统计学基础知识和经典的线性单方程模型理论与方法为主要内容。 中级计量经济学: - 以用矩阵描述的经典的线性单方程模型理论与方法、经典的线性联立方程模型理论与方法,以及传统的应用模型为主要内容。 高级计量经济学: - 以非经典的、现代的计量经济学模型理论、方法与应用为主要内容。 本课程定位于中级水平上,适当引入高级的内容。 --- ## 1.2.3 理论和应用计量经济学 理论计量经济学: - 以介绍、研究计量经济学的理论与方法为主要内容,侧重于理论与方法的数学证明与推导,与数理统计联系极为密切。 - 除了介绍计量经济模型的数学理论基础、普遍应用的计量经济模型的参数估计方法与检验方法外,还研究特殊模型的估计方法与检验方法,应用了广泛的数学知识。 应用计量经济学: - 以建立与应用计量经济学模型为主要内容,强调应用模型的经济学和经济统计学基础,侧重于建立与应用模型过程中实际问题的处理。 本课程是二者的结合。 --- ## 1.2.4 经典和非经典计量经济学 经典计量经济学(Classical Econometrics):20世纪70年代以前发展并广泛应用的计量经济学。 - R.Frish创立 - T.Haavelmo建立了它的概率论基础 - L.R.Klein成为其理论与应用的集大成者 经典计量经济学模型以线性模型为主要形式,主要包括: - 单方程模型(Single Equation Model) - 联立方程模型(Simultaneous Equations Model) --- ### 经典计量经济学的特征 - 模型导向:以经济理论为导向建立模型; - 模型类型:采用随机模型; - 模型结构:变量之间为线性或可以转化为线性; - 数据类型:服从正态分布的连续变量,以时间序列或面板数据为样本; - 估计方法:普通最小二乘法或最大似然估计法; - 模型应用:结构分析、政策评价、经济预测 - 模型领域:生产、需求、消费、投资、宏观经济等 --- ### 对经典计量经济学模型的Lucas批判 - Lucas(1976): 使用计量经济模型预测未来经济政策的变化所产生的效用是不可信的。其实质是提出了结构模型模型参数是否随时间变化的问题。 - Sarget(1976):以货币政策为例,重新解析了Lucas批判。结构模型对于评价政策似乎是无能为力的。 - Sims(1980):为使结构方程可以识别而施加了许多约束,这些约束是不可信的。建议采用向量自回归(VAR)模型而避免结构约束问题。 - 关于模型设定:经济学理论不足以指导如何设定模型,以及保证模型设定的正确性。 --- ### 对经典计量经济学模型批判的时代背景 20世纪70年代的世界经济: - 滞涨、石油危机、利率自由化、管理浮动汇率 关于宏观经济政策有效性的争论: - 以弗里德曼为代表货币主义的固定规则 - 以卢卡斯、萨金特、华莱士等为代表新古典宏观经济学第一代的货币政策无效 - 以基德兰德、普利斯科特等为代表新古典宏观经济学第二代的财政政策无效 - 新凯恩斯主义的货币政策连续性 --- ### 非经典计量经济学 非经典计量经济学,也称为现代计量经济学,主要指20世纪70年代末以来发展的计量经济学理论、方法及应用模型。非经典计量经济学主要包括: - 微观计量经济学(Microeconometrics) - 非参数计量经济学(Nonparametric Econometrics) - 时间序列计量经济学(Time-Series Econometrics ) - 面板数据计量经济学(Panel Data Econometrics) - 动态计量经济学(Dynamic Econometrics) 本课程以将适当引入一些简单的、应用较多的现代计量经济学理论方法。 ??? - 从理论方法角度,经典计量经济学理论方法是非经典计量经济学理论方法的基础; - 从应用的角度,经典计量经济学模型仍然是目前应用最为普遍的计量经济学模型。 --- ## 1.2.5 微观和宏观计量经济学 微观计量经济学: - 集中于“对个人和家庭的经济行为进行经验分析”。 - “原材料是微观数据”,微观数据表现为截面数据和面板数据。 - 内容主要包括面板数据模型的理论方法、离散选择模型的理论方法、选择性样本模型的理论方法。 宏观计量经济学: - 经典宏观计量经济学:利用计量经济学理论方法,建立宏观经济模型,对宏观经济进行分析、评价和预测。 - 现代宏观计量经济学的主要研究方向:单位根检验、协整理论以及动态计量经济学。 --- layout: false class: center, middle, duke-softblue,hide_logo name: process # 1.3 计量经济学分析过程 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter01">第01章 导论</a>                             <a href="#process">1.3 计量经济学分析过程</a></span></div> --- ## 1.3.1 一般过程 .pull-left[ - 1.理论或假说的陈述; - 2.理论的数学模型设定; - 3.统计或计量经济模型设定; - 4.获取数据; ] .pull-right[ - 5.计量经济模型的参数估计; - 6.假设检验; - 7.预报或预测; - 8.利用模型进行控制或制定政策 ] <!---https://justinmshea.github.io/wooldridge/articles/Introductory-Econometrics-Examples.html---> --- ### 计量经济分析的基本过程(概览) <img src="../pic/chpt1-modeling-steps.png" width="983" style="display: block; margin: auto;" /> --- ### 消费分析案例:1理论或假说的陈述 > 基本的心理定律...是,通常或平均而言,人们倾向于随着他们收入的增加而增加其消费,但不如收入增加的那么多。 > > --- 凯恩斯 简言之,凯恩斯设想,**边际消费倾向** (marginal propensity to consume, MPC) , 即收入每变化一个单位的消费变化率,大于零而小于1 --- ### 消费分析案例:2数学模型设定 重要概念: - **确定性关系**是指变量之间存在严格准确的数学关系。 - **数学模型**或**数理经济学**模型,是指利用严格的数学函数对这种确定性关系的数学表达形式。 --- ### 消费分析案例:2数学模型设定 凯恩斯假设消费与收入之间存在正向关系,但他并没有明确指出二者之间准确的函数关系。为简单起见,**数理经济学家**也许建议采用如下形式的**凯恩斯消费函数**: `$$\begin{align} Y_i &= \beta_1 +\beta_2 X_i &(0< \beta_2 <1) \end{align}$$` 也可以用下图表示(凯恩斯消费函数的数理经济学模型): <img src="../pic/chp1-model-math.png" width="349" style="display: block; margin: auto;" /> --- ### 消费分析案例:3计量经济模型的设定 重要概念: - **非确定性关系**是指变量之间存在非准确的数学关系。 - **随机干扰项 (stochastic disturbance term) **,也称为误差项 (error term),是用来代表所有**未经指明的**对**因变量**有所影响的那些因素。它是一个随机变量,并具有特定的概率性质,一般记为 `\(u_i\)` 。 - **计量经济学模型**,是指通过引入**随机干扰项** `\(u_i\)` 对变量之间非确定性关系的模型形式表达。 --- ### 测试题 请分别指出下列属于哪一类模型(数量经济学模型/计量经济学模型)? 其中 `\(t\)` 代表时期(年份), `\(T\)` 代表技术水平, `\(K_t\)` 代表资本, `\(L_t\)` 代表资本, `\(u_t\)` 表示随机干扰项, `\(A\)` 代表常数, `\(\alpha,\beta, \gamma\)` 代表参数, `\(e\)` 表示自然数(约等于2.71828) `$$Q=f(T,K_t,L_t)$$` `$$Q=A(T)K_t^{\alpha}L_t^{\beta}$$` `$$Q=A(T)e^{\gamma t}K_t^{\alpha}L_t^{\beta}u_t$$` --- ### 消费分析案例:3计量经济模型的设定 一般地说,经济变量之间的关系是非确定性的。除了收入外,还有其他变量影响着消费支出。比方说,家庭规模、家庭成员的年龄、家庭的宗教信仰等,都会对消费有一定的影响。考虑到收入变量与支出变量之间的非准确关系,计量经济学家会构建如下的**计量经济学模型**: `$$\begin{align} Y_i &= \beta_1 +\beta_2 X_i +u_i &(0< \beta_2 <1) \end{align}$$` 或者通过图形形式表达为(凯恩斯消费函数的计量经济模型): <img src="../pic/chp1-model-eco.png" width="372" style="display: block; margin: auto;" /> --- ## 1.3.2 计量经济学模型的设计 主要包括如下内容: - 确定模型包含的变量 - 确定模型的数学形式 - 确定随机扰动项的概率分布特性* - 拟定模型中待估计参数的理论期望值区间 --- ### [引入思考]:思维视角的多元性与演化 <img src="../pic/chpt1-space-perspects.png" width="382" style="display: block; margin: auto;" /> (a)从远处看,花园的浇水管就像是一维的(一条线) (b)走近来看,水管的第二维就显现出来了——水管管壁是一个曲面 --- ### [引入思考]:对时空认识的演变 <div class="figure" style="text-align: center"> <img src="../pic/chpt1-space-stage1.png" alt="a.欧几里得空间:平直空间" width="253" /> <p class="caption">a.欧几里得空间:平直空间</p> </div> .pull-left[ <div class="figure" style="text-align: center"> <img src="../pic/chpt1-space-stage2.png" alt="b.黎曼空间:曲率空间" width="303" /> <p class="caption">b.黎曼空间:曲率空间</p> </div> ] .pull-right[ <div class="figure" style="text-align: center"> <img src="../pic/chpt1-space-stage3.png" alt="c.量子世界:多维空间" width="182" /> <p class="caption">c.量子世界:多维空间</p> </div> ] --- ### [引入思考]:对时空认识的演变 .pull-left[ <div class="figure" style="text-align: center"> <img src="../pic/chpt1-space-ex1.png" alt="a.空间视角1" width="602" /> <p class="caption">a.空间视角1</p> </div> ] .pull-right[ <div class="figure" style="text-align: center"> <img src="../pic/chpt1-space-ex2.png" alt="b.空间视角2" width="220" /> <p class="caption">b.空间视角2</p> </div> <div class="figure" style="text-align: center"> <img src="../pic/chpt1-space-ex3.png" alt="c.空间视角3" width="269" /> <p class="caption">c.空间视角3</p> </div> ] --- ### [引入思考]:客观世界与**思维模型** 先验学派(apriorius)--> 实用学派(pragmaticus) -->频率学派(frequentisttus) --> 现代学派(sapiens) --> 贝叶斯学派(bayesianis) <div class="figure" style="text-align: center"> <img src="../pic/chpt1-evolution.jpg" alt="客观世界与思维模型的认知演化" width="797" /> <p class="caption">客观世界与思维模型的认知演化</p> </div> --- ### A.确定模型包含的变量 主要包括: - 不遗漏显著的变量。 - 考虑数据的可得性。 - 考虑入选变量之间的关系。例如,要求变量间互相独立。 --- ### 测试题 请分别指出下列计量模型有何问题? - 模型1: `\(Y_i=4219.1 +4.729X_i +e_i\)` 其中: `\(Y_i\)` =财政收入; `\(X_i\)` =股票融资 - 模型2: `\(Y_i= -107.66 + 0.13X_{1i} + 0.22X_{2i} +e_i\)` 其中: `\(Y_i=\)` 农副产品出口额; `\(X_{1i}=\)` 社会商品零售总额; `\(X_{2i}=\)` 农副产品收购额 --- ### 测试题 - 模型3: `\(Y_i = 0.73X_{1i} + 0.21X_{2i}+ 0.18 X_{3i} + 67.60D +e_i\)` 其中: `\(Y_i=\)` 生产资料进口额; `\(X_{1i}=\)` 轻工业投资额; `\(X_{2i}=\)` 出口总额; `\(X_{3i}=\)` 生产部门消费额 ; `\(D=\)` 进出口政策。 - 模型4: `\(Y_i = 0.78+ 0.24X_{1i} + 0.05X_{2i} i - 0.21X_{3i}+e_i\)` 其中: `\(Y_i=\)` 农产品总值; `\(X_{1i}=\)` 粮食产量; `\(X_{2i}\)` =农机动力; `\(X_{3i}=\)` 受灾面积。 --- ### B.确定模型的数学形式 - 利用经济学和数理经济学的成果 - 不断修改完善的过程 - 根据样本数据作出的变量关系图,例如散点图、直方图、自相关图等 - 选择可能的形式试模拟——反复尝试 --- ### 确定模型的数学形式[图片演示] <div class="figure" style="text-align: center"> <img src="../pic/chpt1-curve-points.png" alt="一份样本数据" width="770" /> <p class="caption">一份样本数据</p> </div> --- ### 确定模型的数学形式[图片演示] <div class="figure" style="text-align: center"> <img src="../pic/chpt1-curve-L.png" alt="A同学的视界:一条直线" width="750" /> <p class="caption">A同学的视界:一条直线</p> </div> --- ### 确定模型的数学形式[图片演示] <div class="figure" style="text-align: center"> <img src="../pic/chpt1-curve-U.png" alt="B同学的视界:一条抛物线" width="752" /> <p class="caption">B同学的视界:一条抛物线</p> </div> --- ### 确定模型的数学形式[图片演示] <div class="figure" style="text-align: center"> <img src="../pic/chpt1-curve-S.png" alt="C同学的视界:一条S型曲线" width="739" /> <p class="caption">C同学的视界:一条S型曲线</p> </div> --- ### C.确定随机扰动项的概率分布特性* 以线性回归模型为例: `$$\begin{align} Y_i =\beta_0 +\beta_1X_{1i} + \beta_1X_{2i} + u_i \end{align}$$` 我们通常假定因变量 `\(Y_i\)` 为**随机变量**,自变量 `\(X_{1i},X_{2i}\)` 为**给定的**(非随机的),随机干扰项 `\(u_i\)` 为**随机变量**。那么: - 什么情况下, `\(Y_i\)` 是**可以被认知的**? - 如果自变量是给定的,那么因变量 `\(Y_i\)` 和随机干扰项 `\(u_i\)` 是什么关系? - 以上模型中,那个部分才是我们最为关心的? --- ### 几类重要的统计分布 - 正态分布: `\(N(\mu,\sigma^2)\)` - t分布: `\(t(f)\)` - 卡方分布: `\(\chi^2(f)\)` - F分布: `\(F(f_1,f_2)\)` - 其他分布 `\(\cdots\)` --- ### 分布参数与分布形态 - **概率密度**(pd):如标准正态分布在 `\(X=2.5\)` 时的概率密度`dnorm(X=2.5)=` 0.0175283 - **累积概率密度**(cd):如标准正态分布在从 `\(-\infty\)` 到 `\(X=2.5\)` 之间的累积概率密度`pnorm(X=2.5)=` 0.9937903 - **分布值**(quantile):如标准正态分布在累积概率密度为 `\(p=0.975\)` 时的正态分布值`qnorm(p=0.975)=` 1.959964 - **随机数**(random):如按 `\(N(\mu=0.5,\sigma=2)\)` 生成20个正态分布随机数`rnorm(n=100,mean=0.5, sd=2)` ``` r print(formatC(rnorm(n=20,mean=0.5, sd=2), format="f", digits = 2)) ``` ``` [1] "0.36" "2.16" "0.31" "-2.32" "1.64" "-2.13" "2.39" "5.09" "-0.68" [10] "3.67" "4.29" "1.65" "2.26" "0.25" "3.71" "-2.44" "0.03" "-3.86" [19] "-0.22" "0.20" ``` --- ### 正态分布 <div class="figure" style="text-align: center"> <img src="01-introduction-slide_files/figure-html/unnamed-chunk-14-1.png" alt="正态分布(n=500)" /> <p class="caption">正态分布(n=500)</p> </div> --- ### t分布 <div class="figure" style="text-align: center"> <img src="01-introduction-slide_files/figure-html/unnamed-chunk-15-1.png" alt="t分布(n=500)" /> <p class="caption">t分布(n=500)</p> </div> --- ### 卡方分布 <div class="figure" style="text-align: center"> <img src="01-introduction-slide_files/figure-html/unnamed-chunk-16-1.png" alt="卡方分布(n=500)" /> <p class="caption">卡方分布(n=500)</p> </div> --- ### F分布 <div class="figure" style="text-align: center"> <img src="01-introduction-slide_files/figure-html/unnamed-chunk-17-1.png" alt="F分布(n=500)" /> <p class="caption">F分布(n=500)</p> </div> --- ### D.拟定模型中待估计参数的理论期望值 - 参数的符号(正号?负号?) - 参数值的大小(>1 ? ...) - 参数值之间的关系( `\(\alpha +\beta =1\)` ?) --- ### 测试题 请指出下列计量模型中参数的理论期望值(或范围)? - 模型1: `$$ln(food_{D})= \alpha + \beta ln(income) + \gamma ln(price_{food}) + \delta ln(price_{otherfood}) + u_i$$` - 模型2: `$$Q = A(T)K_t^{\alpha}L_t^{\beta}u_t$$` --- ## 1.3.3 获取数据 数据的类型: - **截面数据**(Cross-sectional Data) - **时间序列数据**(Time-series Data) - **面板数据**(Panel Data) --- ### 消费案例 为了估计上述**计量经济模型**,也即为了得到 `\(\beta_1\)` 和 `\(\beta_2\)` 的数值,需要有**数据(dataset)**。 下面给出某国在1960-2005年间的真实数据,其中变量: - 变量 `\(Y\)` 表示个人消费支出(PCE,单位10亿美元)的加总——度量了一国的**真实消费支出**。 - 变量 `\(X\)` 表示国内生产总值(GDP,单位10亿美元)——度量了一国的**真实总收入**。 --- ### 案例数据 <div class="figure" style="text-align: center">
<p class="caption">1960-2005年间个人消费支出(Y)和国内生产总值(X)数据n=( 46 )</p> </div> --- ### 案例绘图 可以把以上数据绘制为下图: <div class="figure" style="text-align: center"> <img src="01-introduction-slide_files/figure-html/unnamed-chunk-19-1.png" alt="1960-2005年间个人消费支出(Y)和国内生产总值(X)的真实关系" /> <p class="caption">1960-2005年间个人消费支出(Y)和国内生产总值(X)的真实关系</p> </div> --- ## 1.3.4 参数估计 重要概念: - **参数**:用来刻画计量经济模型的**总体特征**。 - **回归分析方法**:用来获得参数估计值的一种重要统计方法和手段。 --- ### 案例的参数估计 利用以上**真实数据**,并采用**回归分析方法**以及**普通最小二乘估计方法(OLS)**,可以对计量经济学模型参数进行**估计**。 得到截距参数 `\(\beta_1\)` 的**估计值**为-299.59,斜率参数 `\(\beta_2\)` 的**估计值**为0.72。因此,估计得到的**消费函数**为: `$$\begin{equation} \begin{alignedat}{999} &\widehat{Y}=&&-299.59&&+0.72X\\ &\text{(t)}&&(-10.4152)&&(163.1880)\\&\text{(se)}&&(28.7649)&&(0.0044)\\&\text{(fitness)}&& R^2=0.9984;&& \bar{R^2}=0.9983\\& && F^{\ast}=26630.33;&& p=0.0000 \end{alignedat} \end{equation}$$` --- ### 案例的参数估计 以上消费函数(也即**回归线**)绘图如下。以上分析可以发现,在1960-2005年期间,斜率系数(即MPC)约为0.72,表明在此样本期间,真实收入每增加1美元,**平均而言**,真实消费支出将增加约72美分。 <div class="figure" style="text-align: center"> <img src="01-introduction-slide_files/figure-html/unnamed-chunk-21-1.png" alt="1960-2005年间个人消费支出(Y)和国内生产总值(X)的直线关系" /> <p class="caption">1960-2005年间个人消费支出(Y)和国内生产总值(X)的直线关系</p> </div> --- ### 主要参数估计方法(知识扩展): - **最小二乘法**(Least Squares Estimation,**LS**) - OLS, GLS, 2SLS, 3SLS,NLS - **极大似然估计**(Maximum Likelihood Estimation,**ML**) - ML, LIML, FILM - **矩估计**(Method of Moments,MM) - IV(工具变量), GMM --- ## 1.3.5 假设检验 **重要概念**: - **统计推断** (sta tistical inference),又称为**假设检验** (hypotheis testing),是以样本证据为依据去肯定或否定经济理论的一整套统计方法。 - **统计分布**:随机变量的概率分布形式。 - **显著水平**:无论怎么**推断**,人们都可能犯错。第一类错误(弃真错误)也称为 `\(\alpha\)` 错误,第二类错误(取伪错误)也被称为 `\(\beta\)` 错误。 --- ### 案例中的假设检验 前述所拟合的模型是对现实的一个较好的近似,但还必须制定适当的准则,借以判断如方程中的**估计值**是否与待检验的**理论预期值**相一致。(why?) 理论上,凯恩斯曾预期**边际消费支出**(MPC)是正的,但小于1 。 实际数据下,我们求得MPC约为0.72。我们需要质疑的是: - 实际结果是否与凯恩斯消费理论一致? - 实际结果中估计值MPC=0.72是否**充分地**小于1? - 这个估计值MPC=0.72仅是一次偶然的机会得来的么? - 我们用的数据是不是太特殊了? 简言之,0.72是不是在统计意义上小于1?如果是,那么这一次的数据分析就可用来支持凯恩斯理论。 --- ### 主要的检验方法/内容 **统计学检验**: - 拟合优度检验(Coefficient of Determination) - 总体显著性检验(Overall Significance of Regression) - 变量显著性检验(Significance of Variables) **计量经济学检验**: - 共线性检验(Multi-collinearity) - 异方差性检验(Heteroskedasticity) - 序列相关性检验(Serial Correlation) --- ## 1.3.6 预报或预测 重要概念: - **预测**(Forecast):根据的预测变量(predictor) `\(X\)` 已知值或预期未来值来预测因变量 `\(Y\)` 的未来值。 - **预测误差**(Forecast Error):预测值与实际值之间的差异。 --- ### 预报或预测的示例 假设我们想预测2006年的平均消费支出,2006年GDP的值为113194亿美元,2006年的**实际个人消费支出**为80440亿美元。那么: 预测得到: `\(\hat{Y}_{2006} =-299.59 + 0.72*11319.4=\)` 7850.378 预测误差为: `\(Y_{2006}- \hat{Y}_{2006}=\)` 193.622 假设政府决定减少**所得税**。这种政策对收入及消费支出和最终**就业**会有什么影响呢? --- ### 预报或预测的示例 假如政策改变的结果是**投资**有所下降,其对经济的影响将如何?宏观经济理论告诉我们,投资支出每改变1美元,收入的改变由**收入乘数** (income multiplier, M): `$$M= \frac{1}{1-MPC}$$` 如果 `\(MPC=0.72\)` ,那么 `\(M=\frac{1}{1-0.72}=\)` 3.5714286。也就是说,投资减少(增加)1美元,将最终导致收入减少(增加) 4 倍之多。 --- ## 1.3.7 利用模型进行控制或制定政策 重要概念: - **控制变量**(Control Variable):易于控制和改变的变量(X) - **目标变量**(Target Variable):期望实现和达到的变量(Y) 若我们已估计出凯恩斯消费函数,而且政府认为87500亿美元的**消费支出**(PCE,Y)水平即可维持当前约4.2%的**失业率**(2006年初)。 那么,什么样的**收入水平**(GDP,X)将保证消费支出达到这个目标水平呢? 利用估计得到的消费函数,很快可以算出: `\(8750 = -299.59 + 0.72*GDP_{2006}\)` `\(X=GDP_{2006}=\)` 6515.7 --- ## 1.3.8 可能的备选模型 人们如何知道这些数据实际上是支持凯恩斯消费理论的呢? 前述所示的凯恩斯消费函数(即回归线)与实际数据点极为接近吗? 还有其他的消费模型(理论)能同样好地拟合这些数据吗? - 米尔顿·弗里德曼提出了一个被称为**持久收入假说** (permanent income hypothesis)的消费模型。 - 罗伯特·霍尔 (Robert Hall)也提出了一个被称为**生命周期持久收入假说** (life-cycle permanent income hypothesis)的消费模型。 --- ### 对待模型的心态 那么: - 人们如何在竞争的模型或假设中进行选择呢? - 或者,你怎么知道自己选择的模型就是**真正正确的**呢? (克莱夫·格兰杰 (Clive Granger) 的建议)在你提出一种新理论或新的经验模型时,你要考虑这些问题: - 它的用途是什么?它有助于什么样的经济决策? - 在已经提出的证据中,有没有某个证据让我能将这种新理论或新模型与其他理论或模型做比较? --- background-image: url("../pic/chpt1-forest-child.jpeg") ### 持续探索新模型 人们需要持续探索和充满好奇心 --- ### 计量经济分析的基本过程(总结) <img src="../pic/chpt1-modeling-steps.png" width="983" style="display: block; margin: auto;" /> --- layout: false background-image: url("../pic/thank-you-gif-funny-fan.gif") class: inverse, center # 本章结束