Stata夏令营是由北京友万信息科技有限公司主办,专为数据分析爱好者及专业人士打造的学术性实践活动,夏令营以Stata中国用户大会为依托,自2018年至今,已成功开展了七届。在每一届的夏令营活动中,参与者不仅可以深入学习和掌握Stata这一强大的统计分析软件,还能通过一系列精心设计的课程和实践活动,提升数据处理、统计分析及数据可视化的能力。
Stata夏令营不仅是一个学习平台,更是一个充满活力和创意的交流空间。在这里,你可以结识来自不同领域的志同道合的朋友,共同探索数据分析的无限可能。无论你是初学者还是有一定经验的数据分析师,都能在Stata夏令营中找到属于自己的成长之路。我们诚挚邀请对数据分析感兴趣的你加入我们的行列,一起度过一个充实而难忘的Stata夏令营之旅!
2024年8月18日 立即报名 >>
主讲老师:陈 强
上午:09:00-12:00
下午:14:00-17:00
培训费用:1200元/人(食宿差旅自理)
培训地点:南开大学
课程概要
使用面板数据进行实证分析的一种常见情形式,处理组仅有一位或几位个体(地区),而处理前的时期较多。此时,可使用合成控制法、回归控制法或分位数控制法进行有效的因果推断。其中,合成控制法最为流行(Abadie and Gardeazabal, 2003; Abadie et al., 2010, 2015),但需要协变量;而回归控制法则无须协变量,且算法简便(Hsiao et al., 2012)。然而,合成控制法与回归控制法主要依赖于安慰剂检验进行统计推断,在应用中有一定局限性。分位数控制法使用“分位数随机森林”(quantile random forest)的机器学习方法,通过非参数的分位数回归构造处理效应的稳健置信区间,在小样本中表现优异(Chen et al., 2024)。本课程将深入浅出地介绍合成控制法、回归控制法或分位数控制法,并通过经典案例演示相应的Stata操作。
学习要点
合成控制法、回归控制法或分位数控制法,以及Stata操作
课程对象
经管及社科类教师与研究人员、博士生、硕士生、高年级本科生。
课程配套资料
课程PPT、数据集、do文档及相关论文。
第一讲
比较案例分析
比较案例分析是区域政策研究的传统方法,可对少数案例进行深入分析,广泛应用于社会科学,但控制组的选择比较主观。
★ 案例:
马里矣尔船运(Mariel boatlift)对迈阿密劳动力市场的影响(Card, 1990)。
第二讲
合成控制法
合成控制法由比较案例分析发展而来,可以更客观而有效地选择控制组及权重。本讲介绍合成控制法的原理与算法、权重的稀疏性、时间安慰剂检验、空间安慰剂检验、混合安慰剂检验,以及留一稳健性检验。
★ 案例:
西班牙巴斯克地区恐怖活动的经济效应(Abadie and Gardeazabal, 2003);
加州控烟法的效应(Abadie et al., 2010);
德国统一的经济效应(Abadie et al., 2015)
第三讲
回归控制法
回归控制法的应用场景与合成控制法相同,但前者无须协变量,可使用信息准则或拉索估计量(Lasso)选择控制组。本讲介绍回归控制法的原理与算法,时间安慰剂检验、空间安慰剂检验,混合安慰剂检验,以及含协变量的回归控制法(Hsiao and Zhou, 2019)。
★ 案例:
香港回归以及与中国内地经济整合的效应(Hsiao et al., 2012);
四万亿经济刺激政策的效应(Ouyang and Peng, 2015);
上海与重庆房产税试点的效应(Du and Zhang, 2015);高铁开通的政策效应(Ke et al., 2017);
房票政策的房价效应(方诚、陈强, 2021)。
第四讲
分位数控制法
分位数控制法使用分位数随机森林的机器学习方法,通过非参数的分位数回归构造处理效应的稳健置信区间,在异方差、自相关或模型误设情况下依然有效,且在小样本中表现优异(Chen et al., 2024)。本讲介绍分位数控制法的原理与算法,包括决策树、随机森林与分位数回归森林。
★ 案例:
香港回归以及与中国内地经济一体化的效应(Hsiao et al., 2012);
瑞典碳税对于二氧化碳排放的效应(Andersson, 2019)。
课程答疑
2024年8月15-17日 立即报名 >>
主讲老师:王群勇
上午:09:00-12:00
下午:14:00-17:00
培训费用:3600元/人(食宿差旅自理)
培训地点:南开大学
课程概要
多种计量方法的综合应用,包括:
•生产网络与投入产出分析
•指数随机图模型(ERGM)和TERGM模型
•贝叶斯估计
•假设抽取法
•异质空间面板模型
•反事实分析与安慰剂分析
精读经济学、政治学等领域的前沿论文,包括:
•冲击在国际生产网络中的传播特征与反事实分析
•美国货币政策通过生产网路在资本市场的溢出效应
•社会关系与政治支持
•一国的农业政策如何影响其他国家的贫困率
•网络结构对经济行为的影响
研究设计方面的主题包括:
•如何设计研究框架?
•如何写创新点或贡献?
•如何选择适当的模型?
•影响研究结论的威胁来自哪里?
•如何提高论文方法的辨识度?
第一讲
生产网络与投入产出分析
简介:生产网络是研究政策冲击的有力工具,来自于一个行业或一个地区的冲击最终会蔓延到所有地区和所有行业,而生产网络的内在结构直接决定了冲击的传播特征。同时,生产网络也是识别产业链关键部门的有力工具,通过产业连接、渗透因子等统计量及其空间分解评判不同部门在经济系统中的作用。本节结合IOA程序包介绍生产网络的常用概念和分析框架,该程序内嵌了最新版的WIOD、OCED、ADB等世界区域间投入产出表以及中国区域间投入产出表CEADS,包括了投入系数与产出系数、里昂惕夫逆、高息逆、前向连接系数与后向连接系数、产出乘子、高息乘子、生产网络的一阶与高阶出度和入度、逆经验分布函数、幂律的参数估计与拟合优度检验、供给依存度与需求依存度、价值链分解、以及假设抽取法、经济体或部门合并、生产网络的可视化和描述统计、以及中国的双循环生产网络等功能。
内容:
•投入产出表的基本概念
•世界投入产出表与国内投入产出表
•供给侧分析与需求侧分析(里昂惕夫逆与高息逆)
w
• 产业连接(前向连接,后向连接)及其空间分解
•关键产业的识别
• 生产网络的幂律分布及参数估计(极大似然估计和贝叶斯估计)
• 假设(全局)抽取法
•投入产出表的价值链分解
•生产网络分析程序包(IOA)的使用方法
第二讲
论文解读与复现:宏观冲击在生产网络中的传播特征与模拟
王群勇,李月,薛彦.国内国际双循环生产网络的冲击传播:特征与模拟[J].中国工业经济,2023(07):26-45.
简介:这篇论文首先构建了双循环生产网络,将国内和国际投入产出表进行合并,基于此考察了各地区和各行业对外部的依赖性;利用贝叶斯方法估计了生产网络的幂律分布特征,并进一步利用全局假设抽取法进行了反事实模拟,考察了中美贸易断链对国内各地区行业的潜在影响。
学习要点:
•如何合并国内和国际生产网络(投入产出表)
•如何对生产网络可视化、如何描述生产网络的统计特征
•如何进行贝叶斯估计(幂律分布的参数估计)
•如何基于生产网络计算地区或行业的外部依赖性
•如何利用假设抽取法进行反事实模拟
•可扩展到研究方向
第三讲
社会网络的异质空间面板计量分析
简介:在经典的空间面板模型中,空间自回归系数为常数。在宏观面板数据中,由于时间维度相对较长,可以允许空间自回归系数随个体变化,即异质系数空间面板模型。本节介绍空间面板模型的计量分析方法、直接效应和间接效应的Acemoglu et al.(2016)测度和Lesage and Pace(2009)测度、以及空间自举标准差的计算等问题。
学习要点:
•空间自回归模型与网络效应
•空间面板模型
•异质空间自回归模型:极大似然估计、组均值估计(Mean-Group)与贝叶斯估计
•安慰剂分析
•反事实分析
•如何在异质空间自回归模型中做反事实分析
•案例与操作
第四讲
范文解读与复现:美国货币政策基于全球生产网络对资本市场的溢出效应
Julian Di Giovanni & Galina Hale, 2022. “Stock Market Spillovers via the Global Production Network: Transmission of U.S. Monetary Policy,” Journal of Finance, vol. 77(6), pages 3373-3421.
简介:美国的货币政策对世界经济产生了重要影响。这篇论文研究了美国的货币政策对各国资本市场的溢出效应,作者发现通过生产网络的溢出效应达到了60%之多。这篇论文的计量模型利用了异质空间自回归模型和WIOD投入产出表,并且利用反事实模拟考察了。通过这篇论文可以掌握如何将生产网络作为空间计量模型的权重矩阵,如何进行异质性空间自回归分析。如何基于异质空间面板数据计算直接效应和溢出效应;如何做反事实分析、安慰剂分析、以及稳健性分析。
学习要点:
•全球生产网络的构建
•异质空间面板自回归模型
•如何在异质空间面板模型中进行稳健性分析
•如何在异质空间面板模型中进行反事实分析
•如何在异质空间面板模型中进行安慰剂分析
•可扩展到研究方向
第五讲
社会网络形成的计量经济模型
简介: 社会网络对于企业绩效、生产率和冲击传播具有重要的影响,一些研究将社会网络视作外生给定的,这一假定在很多情形下过于简单。即社会网络中关系的形成也会受到自身网络结构的推动,以及外生因素的驱动。本节介绍社会网络的内生形成模型,包括截面中单个网络形成的ERGM模型和多个时点构成的时间网络的TERGM模型。
学习要点:
•社会网络数据的类型
•构建社会网络时的常见问题与处理
•网络结构统计量
•二次指派程序(QAP)
•指数随机图模型(ERGM)
•时间指数随机图模型(TERGM)
•案例与软件操作
第六讲
范文解读与复现:政治关联与效率
Marco Battaglini and Eleonora Patacchini. Influencing Connected Legislators. Journal of Political Economy 2018 126:6, 2277-2322.
简介:这篇论文利用美国国会议员的社会关系网络检验了社会关系如何影响整治资金分配,其核心发现是议员获得的政治资金分配是其社会关系网络的Katz-Bonacich中心度的递增函数。在模型设定和估计上,网络效应参数通过非线性最小二乘法进行估计,并利用自举法计算标准差。
学习要点:
•如何在软件中处理社会网络数据
•如何利用Heckman方法处理内生社会网络
•如何估计指数随机图模型(ERGM)
•如何对社会网络进行可视化与描述统计分析
•可扩展到研究方向
课程答疑
2024年8月21-23日 立即报名 >>
主讲老师:王群勇
上午:09:00-12:00
下午:14:00-17:00
培训费用:3600元/人(食宿差旅自理)
培训地点:南开大学
课程概要
介绍多种计量方法的综合应用,包括:
•网络效应的因果推断
•广义倾向得分与剂量响应函数
•截面相关检验
•截面相关情形下的面板ARDL与面板误差修正模型
•双向引力模型与内生引力模型
•贝叶斯估计
•反事实分析
涵盖了经济学领域的前沿话题,包括:
•农业政策与贫困
•气候变化与长期经济增长
•双向引力模型与内生引力模型
研究设计方面的主题包括:
•如何设计研究框架?
•如何写创新点或贡献?
•如何选择适当的模型?
•影响研究结论的威胁来自哪里?
第一讲
网络效应的因果推断方法
简介: 如果处理组与控制组存在政策效应溢出,那么控制组也会间接受到政策的影响,导致传统的因果推断是无效的。本节我们介绍如何利用广义倾向得分法和邻居倾向得分估计剂量响应函数(DRF)、以及政策的直接效应和网络效应。
内容:
•邻接矩阵
•连续处置变量的广义倾向得分与邻居广义倾向得分
•非线性与非参估计
•剂量响应函数
•如何计算DRF的自举标准差
第二讲
范文解读与复现:农业政策对贫困率的网络效应
Forastiere L, Del Prete D, Sciabolazza V. Causal inference on networks under continuous treatment interference. Social Networks 2024, 76: 88-111. DOI: 10.1016/j.socnet.2023.07.005.
简介: 这篇论文考虑了观测数据中存在连续干预和网络干预的情况,将网络干预定义为通过物理、社会或经济互动连接的个体所接受的干预的加权平均值,忽视干扰可能会低估政策效力的程度。论文提出一种基于广义倾向评分的估计,用于估计连续干预的直接和溢出效应。估计方法允许由异质强度决定的非对称网络连接。论文利用这一方法研究了溢出效应如何影响农业市场的政策干预的优化水平。
学习要点:
•如何估计网络效应的因果推断
•如何设置邻居效应
•如何设置政策的传播网络
•如何估计广义倾向得分和剂量响应函数
•如何实现结果的可视化
•如何进行反事实分析
•可扩展到研究方向
第三讲
截面相关的面板数据分析
简介: 异质性、动态性与截面相关是宏观面板数据的非常重要的特征,经验研究的一个常见问题是将宏观数据做微观式处理。本专题介绍宏观面板数据的截面相关测度与检验,以及考虑截面相关时面板ARDL模型的估计策略。
内容:
•异质性面板的MG估计与PMG估计
•截面相关的检验与测度
•异质面板的共相关效应MG(CCE-PMG)估计
•动态异质面板的共相关效应MG(DCCE-PMG)估计
第四讲
气候变化与长期经济增长
Matthew E. Kahn. et al. Long-term macroeconomic effects of climate change: A cross-country analysis. Energy Economics 104 (2021) 105624: 1-13.
简介: 气候变化是经济学研究中日益受到关注的话题,这篇论文利用174个国家的面板数据研究了气候变化对经济增长的长期影响,并根据巴黎协定对不同情形进行了反事实模拟。实践中常见的不当做法是将宏观数据按照微观数据的方式进行建模,忽视了宏观数据的更关键的特征。通过这篇论文大家可以理解对宏观面板数据研究所需要关注的重点,如何合理测定气候变化,如何修正模型中的弱外生问题和反馈问题等。
学习要点:
•如何估计宏观变量(温度、降雨量等)与长期趋势的偏离
•如何考察时变效应,计算长期效应和半衰期等
•允许截面相关情形下如何估计面板ARDL模型(Hall-panel jackknife)
•如何进行反事实模拟
•可扩展到研究方向
第五讲
网络数据(双边数据,Dyadic data)的计量经济模型
简介: 经验研究中双边关系数据的应用越来越广泛,比如贸易、投资、劳动力流动、人口迁移、双边政治关系等。双边数据最明显的特征是观测值不是独立的,而是存在相关,包括基本的一阶相关和可能的高阶相关。比如,i国向j国的投资不仅取决于i国的特征和j国的特征,还可能取决于k过的特征。如何在模型中体现这种内在的相关性是双边数据建模的一个核心问题,本节介绍对双边关系数据建模的方法和应用。
内容:
•考虑相关的加乘随机效应模型
•双向固定效应模型
•内生双向固定效应模型
•案例与软件操作
第六讲
范文解读与复现:内生自贸协定对双边贸易的影响
Keon Jochmans and Vincenzo Verardi, “Instrumental-Variable Estimation of Exponential Regression Models with Two-Way Fixed Effects with an Application to Gravity Equations”, Journal of Applied Econometrics, Vol. 37, No. 6, 2022, pp. 1121-1137.
简介: 指数回归是双边数据最典型的应用模型,双向固双向固定效应指数回归定效应并不能完全解决模型中的内生性问题。这篇论文提出了内生变量情况下的广义矩估计策略,利用网络的结构统计量作为工具变量得到一致估计。
学习要点:
•双向固定效应指数回归
•双向固定效应指数回归
•带有内生变量的双向固定效应回归
•测算网络的结构统计量(互惠性、三角闭合、传递性等)
课程答疑