金融市场越来越有效,所以宏观数据的高频化是一个趋势,GDP以外的其他高频指 标虽然时效性强,但反映的经济活动范围窄于GDP。GDP数据是衡量经济运行最 为重要的指标,它衡量的是一个时段所有商品和服务的“综合增加值”,无疑比任 何单一领域的经济数据都靠近于经济真实表现,也是我们判断增长周期位置和边际 变化方向的主要依据。
以23年二季度为例,6.3%的实际GDP同比增速是二季度经济的总成绩单,也是各 个行业的增加值总体表现。由于22年同期基数较低,两年平均增速实际在3.3%, 低于一季度的两年平均增速4.6%。其中房地产行业创造的GDP同比由一季度的1.3% 下降至-1.2%,是边际上趋弱最为明显的行业。其次,工业部门的GDP增速在一二 季度均弱于整体水平,一季度低于整体1.6个百分点,二季度4.5%,比整体6.3%进 一步低了1.9个百分点。而第三产业服务业表现好于整体。 但GDP公布较为低频,目前公布频率最高也仅为季频,并不利于市场实时跟踪经济 变化,因此,把GDP高频化具有重要意义。

一个最简单便捷的“高频化”做法是用月度工业增加值同比去粗略估算月度GDP。 工业增加值有“小GDP”之称,占GDP的比重超过30%,可以视为GDP的一个大样 本;且经济中所有终端需求的变化,如出口、消费、资本开支,最终都会映射到工 业生产上。 从历史经验看,季度工业增加值与实际GDP之间具有同步性。一是两者自1992年 至今的相关系数高达0.93。
二是单纯看两者同比每月变动方向,在1992年二季度以来的125个季度样本点中, 共有105个季度工增同比与GDP同向变动,一致率达到84%。两者单季方向背离的 20个季度大致分布在六个时间段,其中15个季度集中在2008年之前。具体方向背 离的时间段一是1993年Q1至1994年Q4,二是1997年Q2和1998年Q2,三是2002 年Q2至2005年Q1,四是2006年Q4至2007年Q2,五是2014年Q4、2016年Q2Q4, 六是2019年Q1Q4。
观察背离时点工增以外的增加值表现,可以发现: 第一,在1993年一季度以来的125个季度样本中,20个样本点方向背离。其中16个 时间段第三产业GDP与实际GDP变动方向相同。2008年后的方向背离阶段集中在 14-16年,均是第三产业GDP与整体GDP变动方向相同,可能与第三产业GDP对整 体GDP的影响加大有关。 第二,剩下4个时间实际GDP与工增、第三产业GDP均变动方向背离,分别是1994 年三季度、2002年四季度、1993年一季度、2004年一季度。其中,1994年三季度、 2002年四季度均是实际GDP负向变动,工增和第三产业正向变动,而第二产业 GDP是负向变动,可能与二产中建筑业的负向波动有关。剩余两个时间点1993年 一季度、2004年一季度没有明确线索。

此外,除了变动方向外,两者变动幅度也有所差异。从波动率看,季度实际GDP 运行明显更为平稳,工增序列标准差为5.5,而季度实际GDP序列标准差仅为3.3。 除了金融危机期间以及2020-21年基数干扰较大外,其余时间里,两者变化幅度上 出现较大差异的时间段一是在2001年Q4至2003年Q1的上行周期中,工增提升较快 且回升斜率较陡,而GDP同比虽同为增长,但回升缓慢,工增自8.47%上行至 17.17%,提升8.7个百分点,而实际GDP自7.5%上行至11.1%,提升3.6百分点。 二是,2014年至2016年工增与GDP虽然趋势上均为回落,但工增回落幅度明显更 大,并且单季出现过回升的时间点。工增自2013年Q4的10%回落至2015年Q1的 6.27%,而相同时间段GDP同比仅仅回落0.6%。
观察变动幅度背离时间段其他的增加值表现,同样可以发现: 第一,2001Q4-2003Q1之间的波幅差异看起来更像是规模以下工业企业增加值增 速平缓带来的。因为工业GDP和整体GDP在那个时候还是比较相近的。工业GDP 和工业增加值的区别就在于后者是统计规模以上工企的情况。 第二,2013Q4-2015Q1这个期间,工增增速和工业GDP的节奏是相似的,回落幅 度都大于整体实际GDP。这个期间可以看到第三产业GDP同比是增长的,并且增 长的幅度和工业GDP下降的幅度相当。2014年是二三产业对整体GDP增速拉动和 贡献率发生转变的一年。2014年首次出现了第三产业拉动GDP3.7%,第二产业拉 动GDP增长3.38%,同时首次出现了第三产业对GDP的贡献率为49.91%、第二产 业贡献率为45.57%,即2013年末开始,第三产业对整体GDP同比的影响力变大了。
从核算方式看,GDP有生产法、收入法和支出法三种,但我们在分析中只采用生产、 支出两种框架。这是因为在我国公布的GDP数据中,一类是通过生产法和收入法融 合计算得到,按照季频和年频公布;另一类是通过支出法核算得到,按照年频公布。
生产法GDP的年度和季度核算方式并不相同。年度核算对不同行业采取不同的计算方式,主要分为直接计算、比例推算、相关指标推算三种方法。季度核算方法主要 是增加值率法、指标推算法。 利用直接计算法核算的行业占比最高,占GDP的55%,主要用于基础资料充足的行 业,核算的准确度最高,有农业、工业、运输业等。 利用比例推算法核算的行业占比其次,约占GDP40%,这是一种间接核算方法。已 知行业内部分企业的增加值数据,然后根据这些企业在行业中的占比进行外推。主 要包括建筑、批发零售、住宿餐饮、房地产等行业。
利用相关指标推算法的行业较少,只占GDP的5%。思路是寻找与行业增加值发展 速度相关的指标,然后乘以年度普查的增加值。利用这种方式的根本原因在于这些 行业的基础资料更难高频获取。主要包括仓储等行业。 季度核算的行业更少,主要是间接计算。农业、工业、建筑也采用增加值率计算, 本期产出乘以上一年度增加值率,主要包括农业、工业以及建筑业。其他行业均使 用相关指标推算法,如运输业、批发零售、房地产、金融、仓储等。 在生产法和收入法的混合核算以外,还有支出法核算,但只有年度数据。计算的核 心是把GDP视为最终消费支出、资本形成总额以及货物服务净出口三者之和。 支出法和生产法是从不同方向核算同一变量,理论上两者数值应该相同,但是实际 中由于统计误差的存在,两者存在差距。我国以生产法核算的GDP为准,将两者差 距视为支出法的误差项。

值得注意的是,虽然最终消费支出、资本形成总额以及货物服务净出口三者与社零 总额、固定资产投资以及海关统计进出口贸易差额相对应,但是前三者与后三者在 统计口径上均有差异。 最终消费支出是政府和居民部门的最终消费,涵盖的范围整体上比社会消费品零售 总额更广。社零主要指实物消费以及部分餐饮住宿服务消费,并且包含部分中间环 节的消耗,比如销售给居民的建筑材料、销售给社会集团的零售额。 资本形成总额包含两个大项,一是固定资本形成总额,二是存货变动。前者既包含 住宅、设备类有形资本,也包含计算机软件、矿藏勘探等无形的知识产权类资本。 而全社会固定资产投资则不包括无形资产、也不包含地产商的房屋销售增值它较资 本形成总额多涵盖的部分为土地购置费、旧设备旧建筑物购置费等。 货物和服务净出口较海关统计的进出口差额多了服务贸易差额。另一方面,货物和 服务净出口中进口出口都按照离岸价格计算,但海关口径的货币进口按照到岸价格 计算。
我们选择以生产法作为估计月度GDP的主要框架,支出法在指标选择方面提供补 充。主要考虑了生产法框架的三点优势:
第一,基于生产法框架估计的月度GDP可以直接和官方口径的季度GDP数据进行 对比。若基于支出法,得到的月度GDP估计理论上会和季度口径GDP有所差异, 而且支出法自身只有年度数据,对于建模的时效性和样本点来说都有所限制。
第二,建模思路是更接近于生产法框架下GDP的“相关指标推算法”。我们估算 月度GDP的核心逻辑是寻找月度层面的其他经济指标,这类经济指标与GDP存在 映射关系。进一步地,我们通过建模定权重,将其与筛选的月度经济指标交乘。这 种方式本质上就是生产法GDP中的“相关指标推算法”。由于季度GDP本身核算 中不少行业没有办法得到充足的基础资料,大多采用的就是“相关指标推算法”。 因此,从指标核算的方式本身来看,估算月度GDP的建模思路更接近于生产法框架 下GDP核算方法。
第三,基于生产法框架的预测可以找到更准确的相关指标。从三次产业中各行业占 GDP的比重可以看到,工业占GDP约32%,其次是批发零售、金融、房地产、建 筑业。这些行业占比合计可以达到GDP的八成以上。工业增加值本身与GDP一致, 为增加值数据,用于建模的合理性较强。而如果基于支出法估计月度GDP,最终消 费支出、资本形成总额以及货币服务进出口的代理变量只能选择社零、固投以及海 关统计进出口,三者都和GDP口径下的相应项目有差异。在建模的时候,不能直接 将三者对GDP建模,而是要先分别对最终消费支出、资本形成总额以及货币服务进 出口进行建模,得到转换系数,再进一步对GDP建模。这一过程中就会融入两层误 差。
(一)双变量生产法:利用工增、服务业生产指数
在生产法框架下估测月度GDP需要从我国产业结构入手寻找相应指标。从22年底 的数据看,二三产合计占GDP比重达到了92.3%。从历史变化来看,第三产业的比 重在逐年上升,第一和第二产业则占比逐年收缩,近年来基本保持稳定。从对GDP 的拉动来看,第一产业拉动贡献小,并且自1994年以来较为稳定,平均拉动在0.08 个百分点。而相对应的二产和三产,平均拉动在4.78%、3.54%。 因此,从占比、历史波动以及对GDP增速的拉动来看,核心是找到二三产的月度 代理变量,而第一产业的影响,由于其稳定性和占比小的特点,可以通过在模型中 加入GDP的前期值来进行反映。

第二产业分为工业和建筑业,但从占比来看,工业占了第二产业的八成;从两者的 增加值当季同比来看,第二产业GDP的当季同比波动与工业GDP的当季同比波动 更一致,而建筑业GDP的当季同比波动更大。在简单的线性回归中,工业增加值同比对第二产业GDP同比的解释力达到0.797,呈现出强相关。因此,出于模型的简 洁性,我们将工业增加值的同比增速作为第二产业GDP的衡量指标。
第三产业涉及行业繁杂,占比较大的是批发零售、金融、地产行业,但三者汇总后 的占比也尚未超过第三产业的一半。我们直接利用统计局与2017年3月正式对外发 布的服务业生产指数作为第三产业增加值的代理变量。按照统计局定义,服务业生 产指数涵盖了从批发零售到文娱的13个行业门类。从服务业生产指数当月同比与第 三产业GDP同比的走势看,两者走势贴合度较高。而简单的线性回归也显示,服务 业生产指数单一指标对第三产业GDP同比的解释力就能达到0.86。因此,服务业生 产指数可以作为衡量第三产业GDP的代理指标。
在得到二、三产业GDP的月度代理指标之后,我们需要估算其在GDP同比合成中 的权重。我们假设在一个季度内,整体GDP与工业增加值同比、服务业生产指数当 月同比的映射关系是稳定的。我们首先构建基于ARDL的季度模型,“AR”部分表 示GDP季同比过去值(T-1期、T-2期……)对当前GDP同比(T期)的影响,“DL” 部分表示工业增加值当季同比(T期)、服务业生产指数当季同比(T期)及两者的 前期值(T-1期、T-2期……)对当前GDP同比(T期)的影响。 模型最优选择为ARDL(1,4,4),拟合优度(R方)为0.993,表明前一期GDP当季同 比、工增当季同比及其滞后四期、服务生产指数当季同比及其滞后四期均对GDP当 季同比有解释力,能解释GDP当季同比波动的99.3%。 我们通过模型系数进行GDP当季同比回溯,比如2023年二季度模型回测结果为 6.72%,与实际23年二季度的GDP同比误差为0.42%。具体的计算构成为:
6.72%(23Q2GDP同比预测值) =-0.39*4.5% ( 23Q1GDP 同 比 ) +0.24*4.5% ( 23Q2 工 增 同 比 ) +0.06*4.29% (23Q1工增同比)+0.10*2.83%(22Q4工增同比)+0.22*4.77%(22Q3工增同比) -0.15*0.57%(22Q2工增同比)+0.53*10.67%(23Q2服务业生产指数同比)+0.18*9.2%(23Q1服务业生产指数同比)-0.13*(-0.87%)(22Q4服务业生产指 数同比)-0.20*1.23%(22Q3服务业生产指数同比)+0.4*(-3.30%)(22Q2服务 业生产指数同比)
以此类推,我们可以得到利用模型拟合的每期GDP当季同比。在样本期内的平均 误差为0.0043%,最大误差发生在2020年12月,为-0.58%,模型预测GDP当季同 比为6.98%,实际GDP为6.40%。由此,总体上,ARDL(1,4,4)能较好地反映工增、 服务业生产指数与GDP同比之间的映射关系。
以上系数是通过季频模型确定的,我们假设季度内系数具有稳定性,将系数乘以对 应交乘于工业增加值月同比、服务业生产指数月同比。 这里需要注意是,在季度模型中的滞后一阶代表上一季度的变量,运用到月度自变 量时,我们需要和三个月前的工业增加值月同比、服务业生产指数月同比交乘。同 样地,季度模型中的滞后两阶代表上两个季度的变量。在和月度数据进行交乘时, 交乘的对象是六个月前的工业增加值月同比、服务业生产指数月同比。 至此,我们可以得到GDP的月度指数。从走势看,相较于季度拟合,月度GDP指 数与实际GDP同比整体趋势一致,季内呈现波动,比季度模型的颗粒度更细。
由这一模型预测的7-8月GDP同比为4.7%、5.3%,7月较6月回落1.4个百分点,8 月较7月回升0.6个百分点。 从驱动因子看,自变量工增和服务业生产指数7月读数均较6月回落,工增同比回落 0.7个百分点、服务业生产指数同比回落0.9个百分点。而8月两者又同时改善,前 者回升0.8个百分点,后者提升1.1个百分点。

(二)三变量混合法:利用工增、社零、地产投资
由于服务业生产指数自2017年开始公布,用该指标与工增同比进行月度GDP的估 测只能获得自2017年3月起始的月度GDP指数序列,对于跟踪研究我国国内增长周 期来说,样本点较少。 那么是否有方式可以估测出跨度时间较长的月度GDP同比呢?第三产业中占比相 对较高的批发零售业(占GDP约10%)与第三产业的GDP走势一致性也最高,相 关系数达到0.78。其次是房地产业,统计上相关系数为0.77。第三产业中其他行业 的GDP同比波动与第三产业整体GDP同比波动的相关性程度都明显低于这两个行 业。
进一步地,我们寻找能代替服务业生产指数,比这一指标序列更长,但也对第三产 业GDP有预测力的指标。 对于第三产业中的批发零售业,由于生产法指标选择存在限制,我们从支出法视角 寻找能对“服务业生产指数”进行近似替代的指标。我们观察到社零同比与第三产 业中批发零售业GDP同比、服务业生产指数月同比的走势具有一致性。而在简单的 线性回归测算中,社零同比对批发零售GDP同比、服务生产指数同比的解释力分别 达到了73%、92%,显示出社零同比与批发零售GDP同比、服务生产指数同比都具 有非常明显的相关性。因此,我们可以选择社零同比作为服务生产指数的一个替代 变量。
对于第三产业中的房地产业,我们以房地产开发投资完成额累计同比作为替代指标。 我们观察这一指标与第三产业中另一个重要行业——房地产业GDP同比增速具有一 致性。在简单线性回归中,其对房地产业GDP同比增速的解释力为63%。虽然这一 R方小于70%,但我们认为这一指标可以作为补充变量,帮助弥补我们用社零替换 掉服务业生产指数带来的部分预测损失。

与双变量模型的预测方法一致,我们先构造工业增加值季同比、社零季同比以及房 地产开发投资季度累计同比与实际GDP当季同比的ARDL模型。结果显示, ARDL(1, 3, 4, 1)是最优的模型设定,显示实际GDP同比的前一期、工业增加值同比 当期与前三期、社零同比当期与前四期、地产投资当期与前一期对当前的GDP同比 具有解释力。模型整体拟合优度达到0.96。
我们同样通过模型系数进行GDP当季同比回溯,比如2023年二季度模型回测结果 为5.9%,与实际23年二季度的GDP同比误差为0.4%。通过这三个变量拟合的GDP 序列可以追溯到1999年6月。在1999年6月以来的全部样本区间上,预测误差平均而言仅有0.3%。与双变量模型放在同一时间段考察,模型误差平均在0.01%。虽然 误差较双变量模型的0.0043%要大,但整体上仍有较好的预测精度。
同理,在根据季度模型确定三个变量对GDP同比的影响系数之后,我们假设季度内 系数具有稳定性。利用工增月同比、社零月同比以及地产投资累计月同比与相应滞 后期的季度系数交乘之后,我们得到了GDP的月度指数。 从走势看,三变量模型下的GDP月度指数同样与实际GDP同比趋势一致。比较双 变量模型结果,三变量模型月际之间波动更大。我们认为,这主要是因为,从本质 上看,三变量模型是通过社零、地产投资来寻找服务业生产指数的替代变量,这两 者与第三产业GDP的关系较服务业生产指数更为间接。但这一模型的好处在于我们 可以回溯更长区间的月度GDP指数。进而在对经济周期进行划分时,我们可以不 用“退而求其次地”用工业增加值作为增长的代理变量,可以直接使用月度GDP 指数进行划分。 根据这一模型预测的2023年7-8月GDP同比为3.5%、4.5%,8月回升1.0个个百分 点,回升幅度较双变量模型预测大。
(三)高频三变量混合法:利用工增、社零同步扩散指数 II 以及地产销 售
以上模型,无论是三变量还是双变量模型,都是基于每月中旬左右公布的经济数据 展开的估测。即便准确度较高,这两种方式都仍需等到下月中旬才能得到上月月度 GDP的估测,并不具有前瞻性。
是否可以在每月月底获得对当月月度GDP的预判?我们利用前期报告《工业增加值 如何预测?》、《社会消费品零售总额如何预测?》中经过高频信息提取的工增同 步扩散指数II、社零同步扩散指数II作为工增同比、社零同比在每月公布前的代理指 标。 从序列走势上看,虽然工增同步扩散指数II与工增实际同比存在一定误差,但两者 在拐点趋势变动上具有一致性。社零同步扩散指数II与社零实际同比也有类似的特 征。在地产领域,我们使用30城商品房成交面积这一周频数据做为地产类高频。由 此,我们可以进一步构造基于工增同步扩散指数II、社零同步扩散指数II、30城商品 房成交面积月同比的GDP预测模型。
与前期模型的预测方法一致,结果显示,基于这三个高频变量的ARDL模型同样有 较好的解释力,模型整体拟合优度达到了0.92。由于工增、社零类同步扩散指数与 GDP的逻辑链接本身就比双变量、三变量中的工增、服务业生产指数、社零、地产 投资更弱,因此模型的拟合优度也低于前两类模型。 在这一模型回测结果下,23年二季度GDP同比为7.06%,误差为0.76%,也显示比 前两类模型更大。自2017年以来,这一模型的预测误差平均在0.09%,最大误差出 现在2020年一季度,误差达到2.62%,为疫情发生的第一个季度。

利用历史的合成方式,我们得到了GDP的月度指数。 从走势看,高频三变量模型虽然整体的拟合优度较双变量模型0.99、三变量模型的 0.96下降至0.92,但拟合度较高,与实际GDP同比有比较一致的趋势走向。三个估 测方式中,基于高频指标合成的工增、社零指数也在月际之间波动更大。但这一类 模型的好处在于前瞻性,我们可以在每月末得到高频数据估计的工增、社零同比,进而在每月末获得当月的GDP月度同比值。换言之,我们牺牲了大约0.08左右的估 测精度,来换取15天左右的领先性。 由这一模型预测的7月GDP同比为4.9%,较6月实际回落0.7个百分点。8月为6.6%, 较7月回升了1.7个百分点。
(四)三种方法平均表现
由此,我们得到了月度GDP同比的三种估计方法。三类方法均从生产法框架进行预 测,但因寻找的二三产GDP的代理变量不同,三者结果也略有差异。三种方法各有 优缺点,拟合优度均较好。在使用中,不同方法可以相互印证和参考。 三种方法下的月度GDP在7月显示为3.5%~4.9%区间波动,8月显示为4.5%~6.6% 区间波动。为了综合预测效果,我们将三种方法拟合的月度GDP进行平均处理,平 均后7月GDP同比的中枢为4.4%,8月为5.4%
(五)23 年以来的月度 GDP 综合表现
我们用方法一和方法二估算了2023年以来单月的GDP模拟同比增速,并对两种方 法下的结果取平均值。这一测算方法下6-8月月度GDP同比分别为4.7%、4.1%、 4.9%,8月经济较6-7月数据已初步回升,与我们报告中所说的“较为全面的边际 好转”结论一致。今年二季度基数较低,为避免基数干扰导致二三季度不可比,我 们进一步测算了这一方法下的两年复合增速,8月两年复合同比为4.2%左右的水平 (4%的两年复合增速对应年度GDP增速5%左右),本轮经济的谷底在4-5月已经 形成,7月是修复过程中的一个增速回撤点,但也高于4-5月。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)