2026年金工深度研究:量化行业轮动的“崎岖之路”

量化行业轮动研究回顾

行业轮动是指从截面视角比较不同行业的投资机会。由于行业弹性通常大于宽基指数,一 旦成功捕获市场主线行业,其收益通常能够显著跑赢宽基指数,加上大部分关注度较高的 行业都有对应的行业 ETF,投资便利性较好,所以不少投资者跃跃欲试。

根据多年研究经验,行业轮动标的的颗粒度是模型表现的一个敏感变量。如果颗粒 度过于粗放,那么一个行业可能混合着数量较多的不同逻辑的子行业、主题、概念,行业 本身的规律可能不显著,比如非银金融行业混合着逻辑愈发分化的保险和证券行业;如果 颗粒度过于精细,那么对于新颖的子行业、主题、概念来说,可能缺乏足够长的时间序列 去验证其逻辑的稳定性,像商业航天、大语言模型就属于这个范畴。我们在决定是否对一 个一级行业进行拆分时,主要考虑以下因素: 1) 一级行业的规模:若一级行业总市值庞大,可以考虑拆分; 2) 二级行业的逻辑:若一级行业下属的二级行业逻辑分化,且各自逻辑明确时,可以考虑 拆分; 3) 二级行业建模可行性:若二级行业的基本面、交易面等基础数据拥有 10 年及以上的时 间序列时,可以考虑拆分; 4) 二级行业投资可落地性:若二级行业有对应的 ETF 时,可以考虑拆分。

在样本外跟踪的过程中,我们发现基本面因子失效最严重,尤其是在 2024 年,几乎“全军 覆没”。除了基本面因子本身带有显著的风格属性之外,根本原因在于行业逻辑的时序稳定 性和截面可比性。首先,行业逻辑会发生改变,例如随着 AI 和机器人技术的发展,智能驾 驶技术已成为汽车制造企业的必争之地,汽车行业的科技属性越来越强,“乘用车销量”这 一消费属性的中观指标对汽车行业股价的解释力度逐渐下降,而且 AI 和机器人技术的迭代 仍在加速产业逻辑变革的趋势。其次,行业逻辑的变化并不会很及时地反映在产业链数据 或财务指标中。再次,不同行业的核心定价指标也不同,有的行业注重资本开支、有的行 业注重股东回报,有的行业注重盈利增长、有的行业注重盈利质量,在常见的基本面指标 中,不易找到一个公认的指标能够开展截面行业比较。在后文我们还将看到,即使用机器 学习的手段去定期挖掘基本面行业轮动因子,同样无法获得稳定的超额收益。

交易面包括技术分析和资金流分析。对于技术分析,我们曾效仿 Alpha101 的因子构建思路 开展行业轮动测试,目前仅发现异同离差乖离率(DBCD)指标在周频行业轮动场景有一定的 效果,且参数较为鲁棒,但超额收益仍有较高波动,且 2024 年同样表现不佳。DBCD 指标 的含义是乖离率的一阶导——当乖离率持续扩大时,表明标的走出了较强的趋势,对应做 多。作为一个传统的技术分析指标,其计算过程可由大语言模型生成,在此不再赘述。

相较于传统技术分析,曾被广泛复现的时点动量因子和我们提出的残差动量因子经受住了 时间的考验,拥挤度指标则帮助我们在 2026 年初连续规避了国防军工、工业金属、贵金属 行业的交易风险,如前期报告《国防军工行业触发高拥挤》(2026-01-11)。ETF 资金和两 融资金依然存在各自的行业偏好,可能不适合用于截面行业比较。而《行业景气投资的顶 层设计和落地方案》(2023-09-14)提出的北向资金加仓持续性因子是样本外表现最优的交 易面因子;遗憾的是,投资者已经很难获得日频的北向资金持仓明细数据,导致加仓持续 性因子无法被计算。 在选股领域,头部的公募量化和私募量化通常会不定期更新因子库。在行业轮动领域,相 较于固定的因子模式,动态更新因子库更有助于行业轮动模型适应市场变化。这项任务我 们已经交给机器学习来执行。综上所述,在过去五年我们所做的诸多尝试中,仍然值得读 者进行样本外跟踪的模型包括:残差动量因子、拥挤度指标、动态因子挖掘系统中的技术 面遗传规划模型。下文三小节将对这三个模型进行回顾。

残差动量因子经受住了时间的考验

残差动量是指行业动量中剔除市场因子动量和风格因子动量的部分,刻画了产业政策、技 术进步等无法被结构化数据所描述的股价影响因子。其中,市场因子和风格因子的计算参 考前期报告《全球资产是否存在统一的市场因子》(2023-12-01),用全球股、债、商的第 一主成分作为市场因子,用其他主成分来表征成长-价值、大盘-小盘、长久期-短久期、贵 金属-工业金属等风格。计算时取 100 个月滚动窗口,为了使滚动窗口下主成分分析的权重 保持稳定,我们用全体资产同比口径(即 12 个月)的对数收益率序列开展主成分分析,获 得主成分中各资产所占权重后,对全体资产环比口径(即 1 个月)的对数收益率序列进行 加总,从而得到市场因子和风格因子的月频对数收益率序列。

接着,以各行业指数的月频对数收益率序列为因变量,以市场因子和风格因子的月频对数 收益率序列为自变量,开展不带常数项的多元线性回归,并提取残差序列。因为自变量是 对数收益率口径,所以残差序列也是对数收益率的含义,可以应用对数的加法法则,故用 最近 12 个月残差之和定义残差动量。

我们进一步发现 1 个月传统动量的反转效应在残差动量中亦有迹可循——残差动量涉及的 12 个月中,行业日波动率最高的月份,其残差呈现出较强的反转效应。于是,我们在计算 12 个月残差之和之前,先将日波动率最高月份对应的残差进行反转,即乘以-1,而后再求 和,就得到了改进残差动量。

拥挤度指标仍然能够及时提示交易风险

是否涨得太快用拥挤度来衡量。交易拥挤往往发生在“击鼓传花”式的上涨中,呈现出短 期涨幅较大、换手率迅速升高等特点。伴随着股价上涨,一旦成交量跟不上,就表明持股 者有可能找不到对手盘,接踵而至的就是短期内快速下跌,呈现出顶部反转的形态。鉴于 此我们通常用量价数据来观察交易是否拥挤。那么,如何区分一个量价指标是趋势追踪指 标还是顶部反转指标?

门限测试是用来评价一个量价指标是否具备顶部反转特征的比较科学的方法。我们可以用 量价指标的滚动分位数来定义门限值。一个良好的顶部反转指标应当具备以下特征:门限 值越靠近 100%,交易越拥挤,未来下跌幅度越大。所以,门限测试进一步统计了达到某个 门限值的全体样本未来 t 日收益率的均值——如果收益率均值随着门限值的提高呈下降趋 势,即呈现出反转特征,说明这是一个良好的拥挤度指标。根据我们的经验,t 取 20 比较 合适,这是考虑到拥挤度模型需要左侧提示行业交易风险;若 t 太大,则过早提示风险,容 易错失主升浪后半段的涨幅;若 t 太小,意味着模型需要“精准踩点”、过于苛刻。

门限测试是用来评价一个量价指标是否具备顶部反转特征的比较科学的方法。我们可以用 量价指标的滚动分位数来定义门限值。一个良好的顶部反转指标应当具备以下特征:门限 值越靠近 100%,交易越拥挤,未来下跌幅度越大。所以,门限测试进一步统计了达到某个 门限值的全体样本未来 t 日收益率的均值——如果收益率均值随着门限值的提高呈下降趋 势,即呈现出反转特征,说明这是一个良好的拥挤度指标。根据我们的经验,t 取 20 比较 合适,这是考虑到拥挤度模型需要左侧提示行业交易风险;若 t 太大,则过早提示风险,容 易错失主升浪后半段的涨幅;若 t 太小,意味着模型需要“精准踩点”、过于苛刻。

本文开头提及的三个行业的拥挤度得分与股价走势对比如下图所示,不难发现拥挤度 3 分 或 4 分基本能够和行业指数的阶段性高点对应,且拥挤度得分略偏左侧。进一步通过回测 发现,规避过去 20 个交易日中有两天拥挤度达到 3 分或 4 分的组合,长期来看对行业轮动 策略是有正向贡献的。需要强调的是,即使有了定量工具,精准逃顶仍然是“幸运儿”,盈 亏同源才是常态,想获取“鱼尾巴”收益就需要做好承受回撤的准备。

动态因子挖掘系统更能适应市场变化

遗传规划作为量化投资领域“元老级别”的因子挖掘方法,在量化投资的诸多子领域依旧 大放光彩。在前期报告《遗传规划因子挖掘的 GPU 加速》(2024-02-19)和《双目标遗传 规划应用于行业轮动》(2024-05-20)中,我们对遗传规划进行了两次关键的升级改造: 1) 第一次升级改造:通过将遗传规划因子计算和评价步骤用 PyTorch 语法重构,从而使 得因子挖掘流程能够在 GPU 上加速运行,因子挖掘效率提升了数十倍; 2) 第二次升级改造:通过引入更多的因子评价维度,使得因子挖掘从传统的以|IC|为核心 的单目标体系转变为多目标体系,缓解了种群拥挤和因子同质化的问题。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告