• 学生活动

    学生活动

2021年厦门大学计量经济和大数据研讨会圆满落幕

 

710-11日,2021年厦门大学计量经济和大数据研讨会在厦大经济楼举行。来自国内外二十余所知名高校和相关机构的专家学者莅临参会。

 

本次研讨会由厦门大学经济学院、王亚南经济研究院、邹至庄经济研究中心主办,厦门大学经济学院统计学与数据科学系、“计量经济学”教育部重点实验室(厦门大学)、福建省统计科学重点实验室(厦门大学)承办。会议共计两天,采用线上和线下(为主)并行的方式,围绕计量经济和大数据分析的理论和应用,共邀请七位知名学者进行特邀报告。同时,会议为青年学者搭建交流平台,安排16个场次的分组报告会,共48位青年教师、博士生进行了论文报告。

 

10日上午,在厦门大学林明教授的主持下,研讨会拉开帷幕。

 

 

 

厦门大学校长助理、经济学院和王亚南经济研究院教授方颖首先致辞。他热烈欢迎各位嘉宾的到来,并对各兄弟院校长久以来给予厦门大学和厦大经济学科的宝贵支持表示感谢。方颖教授简要介绍了厦门大学计量经济学和统计学的发展成果,并提到,数字经济时代到来给我们的学术研究带来巨大机遇与挑战,也推动研究范式和研究方法的深刻变革。他希望,今年的会议能够为统计学界的朋友搭建沟通交流的平台,在促进统计学者间的学术探讨与合作的同时,推动国内统计学科、计量经济学科及相关应用学科的发展。

 

短暂的开幕式后,研讨会迎来当天上午的第一场特邀报告,报告嘉宾为美国南加州大学萧政教授、美国耶鲁大学陈晓红教授。

 

萧政:Statistical inference for the low dimensional regression parameters – an orthogonal projection approach in the presence of high dimensional covariates or panel factor modeling

 

 

萧政教授首先介绍了基本的模型设定:他们将回归模型中的误差项分解成两项,其中两项中有一项与解释变量不相关,另一项则与解释变量相关,且该项可以看作多个变量的函数,但具体函数形式未知。

 

在现存方法中,当变量维度较高时,通常需要进行变量选择,但由此会引入新的选择误差,导致模型精度下降。为解决该问题,萧政教授给出了一种新的投影方法以进行统计推断,该方法无需进行变量选择,且易于计算。

 

随后,萧政教授分别在误差项函数是线性形式和非线性形式两种情况下进行讨论。在线性情况下,若假设误差函数的自变量服从椭圆分布族,在一些条件下,参数估计量可以用正交投影方法得到;在非线性情况下,误差函数可由诸如势函数等一系列基函数的线性组合来近似,从而将误差函数近似看作线性情况进行估计。

 

最后,萧政教授使用蒙特卡洛模拟考察了该投影方法的有限样本性质,且该方法应用到401(k)数据的分析之中。模拟结果和实证结果均表明该方法具备优良性质。

 

陈晓红:ANN efficient estimation of average derivatives of nonparametric instrumental variables regressions

 

 

陈晓红教授首先介绍了在大数据背景下,深度学习(Deep learning)在图像处理、自然语言处理等领域的发展情况;接着介绍了人工神经网络 (Artificial Neural Networks, ANNs)与深度神经网络(Deep Neural Networks, DNNs)的一些相关背景知识以及它们在计量经济学中的若干最新应用,并由此进一步引出了这些方法目前面临的一个挑战:内生变量存在时未知函数的估计问题。

 

陈晓红教授在报告中介绍到,ANN 是一种非线性 Sieve 方法,它能够比各种线性 Sieve 方法更有效的近似高维度变量的函数,但它存在计算方面的问题。在其与合作者的最新研究成果中,陈教授等人考察了ANN方法在稀疏性未知具有高维度协变量的非参数工具变量模型 (nonparametric instrumental variables models, NPIV) 中的计算性能,特别是考察了模型中一些期望泛函 (expectation functionals) ANN有效估计。在报告中,陈教授回顾了文献中已有的一些估计期望泛函的方法,如第一步中使用 Sieve 最小距离方法 (Sieve Minimum Distance) 估计未知函数,然后再通过嵌入方法估计目标期望泛函;与此同时,在估计未知函数时,陈教授还介绍了文献中有线性 Sieve 估计方法与基于单一隐含层和多隐含层的 ANN 非线性 Sieve 估计。除此之外,陈教授还介绍了ANN 方法在其它模型中的应用以及在当前应用中存在的一些问题。

 

最后,陈晓红教授通过蒙特卡洛模拟方法比较了各种估计方法的有限样本表现。

 

10日下午,上海财经大学周亚虹教授、清华大学苏良军教授、北京大学虞吉海教授依次作特邀报告。

 

周亚虹:A closed form estimator of quantile treatment effect in the regression discontinuity design

 

 

如今越来越多的学者开始利用断点回归的框架研究处理效应的识别和估计问题。不同于以往文献仅关注部分个体的识别和估计问题,周亚虹教授利用一种局部的秩相似性条件,对全部个体的处理效应进行了识别和估计,并将研究对象由平均处理效应推进至分位数处理效应。

 

周亚虹教授的研究成果主要基于他所提出的局部秩相似性假设,该假设不依赖于工具变量,因而在断点回归设计下更加合乎逻辑。对于该假设的合理性,周亚虹教授也利用大学扩招的实例进行了形象的说明。在阐释完局部秩相似性这一关键假设后,周亚虹教授详细地介绍了总体分位数处理效应估计量的构造过程,并利用Multiplier bootstrap方法对该估计量的方差和置信带进行了识别,进而得到了良好的渐近性质。该方法对于精确断点回归框架和引入其它协变量的情形依然适用。此外,周亚虹教授还提出了一种针对局部秩相似性假设的检验方法。周亚虹教授应用所提出的方法研究了退休对于家庭消费支出的影响,并利用实证数据检验了是否存在局部秩相似性。

 

苏良军:Profile GMM estimation of panel data models with interactive fixed effects

 

 

苏良军教授首先向我们介绍了一类重要的计量模型——具有交互固定效应的面板数据模型。对于该类模型的估计,有两种主流方法:利用主成分分解进行估计和利用共同相关效应进行估计。这两种估计方法均需要较长的时间期数和较多的个体,且不允许存在内生性问题。然而在实际应用中,内生性问题普遍存在,因此需要提出新的解决办法。

 

苏良军教授在他最新的研究成果中提出了一种基于核范数正则化的轮廓广义矩估计方法,对存在交互固定效应和内生性的面板数据模型中的参数进行了估计。该方法的思路是,首先借鉴轮廓估计的思想,利用广义矩估计方法构造出一个初始估计量,可以证明,该初始估计量是相合的,但收敛速度较慢。然后利用主成分分析的方法,迭代进行广义矩估计以提高收敛速度。最后,借鉴两步广义矩估计的思想,对迭代后所得到的估计量进行一步更新,进而得到有效的估计量。蒙特卡洛模拟结果表明,该方法的表现符合预期。

 

虞吉海:Trending time-varying coefficient spatial panel data models

 

 

虞吉海教授首先对空间计量经济学中的基础模型(如空间自回归模型)进行了介绍,并介绍了空间计量经济学参数模型中的三种主要估计方法:极大似然估计方法、基于工具变量的两阶段最小二乘估计方法和广义矩估计方法。这三种方法各有千秋,且具有不同的应用场景。而虞吉海教授带来的研究成果则是将两步广义矩估计方法应用于具有时变系数的空间面板数据模型中。虞吉海教授的研究成果主要包含初始广义矩估计量、最优广义矩估计量、局部线性下的广义矩估计量和对于时间趋势的估计。

 

利用基于线性矩条件和二次矩条件的工具变量,该方法可以构造出相合的初始估计量,且可以证明该初始估计量具有正态分布。而为了得到最优的估计量,在具有时变系数的非参模型设定下,需要利用条件期望来构造最优工具变量。此外,该方法还可以由局部常数估计拓展至局部线性估计。对于时间趋势的估计,不同于以往文献中直接利用截面平均的处理方法,虞吉海教授推荐在初始估计的基础上利用Nadaraya-Watson核方法来估计时间趋势。最后,虞吉海教授指出,未来还可以对估计时所使用的窗宽进行优化,并考虑如何对参数是否随时间变化进行检验。

 

11日上午,最后一场特邀报告会举行。香港中文大学(深圳)艾春荣教授、香港科技大学陈松年教授依次作报告。

 

艾春荣:Testing unconditional and conditional independence via mutual information

 

 

艾春荣教授首先介绍到随机变量或向量间的独立性或条件独立性检验在计量经济学与统计学文献中获得了越来越多的关注;随后,艾教授回顾了文献中已有的一些统计检验方法,如基于密度函数、特征函数以及基于分布函数的检验方法等。艾教授也回顾了这些检验方法的一些渐近统计性质,如是否具有一致性,是否为渐近枢轴的 (asymptotically pivotal)

 

    为了检验两个随机变量或随机向量是无条件独立的原假设,在艾春荣教授与其合作者的最新研究成果中,他们基于信息论中的一种信息度量—互信息 (Mutual Information)—提出了一种一致非参数检验 (consistent nonparametric test) 方法。在报告中,艾教授提到这种基于互信息提出的相关性度量具有一些优势,如对随机向量的光滑或者是可逆变换具有不变性等。根据提出的相关性度量,他们在研究成果中构造了相应的检验统计量。与文献中已有的检验统计量相比,这种基于互信息的检验方法具有有限样本稳定性、不会遭受维数祸根 (curse of dimensionality)等方面的优势。在某些正则条件下,他们证明了提出检验统计量在原假设、备择假设以及在局部备择假设下的大样本性质。

 

    同时,他们也将提出的检验方法推广到了检验随机变量或随机向量间的条件独立性情形。类似地,也得到了提出检验统计量在原假设、备择假设以及在局部备择假设下的大样本性质。

 

      最后,艾春荣教授通过蒙特卡洛模拟方法比较了提出的检验统计量在各种数据产生机制下的有限样本表现。

 

 

陈松年:Quantile regression with group-level treatments

 

 

陈松年教授指出,固定效应模型在面板数据中是十分重要的模型,但是固定效应模型并不能够识别出time-invariant的变量效应。在已有文献中,Hausman and Taylor (1981) 提出了无外部工具的工具变量方法,Chetverikov et al. (2016) 在此基础上拓展到了分位数回归,但是他们的工作做的并不完整,本文提供了完整的分位数回归分析过程。

 

文章采用了Boston Metco Program学生数据进行分析。在Chetverikov et al. (2016)的基础上,增加了变量和组间排序的交互项,如果没有这个交互项,那么存在很强的同质性假设,即不同班级的20%的学生表现一致,但是这是不符合现实的,每个班级的教师和学习氛围都不同,各班级内的学生表现分布也应该不一样。本文用了两个模型,依次累进增加了政策和组间排序的交互项,控制变量和组间排序的交互项,通过两步分位数回归进行模型估计。

 

 

除特邀报告外,共48位青年教师、博士生,在16个分组报告会中报告他们的论文。

 

WISE  林安语)