1.1 多因子模型:基于历史规律的全面发展型选股模式
传统多因子模型是现代量化投资的基石,其核心目标是在横截面上对股票的未 来相对表现进行排序预测。无论是线性回归还是更复杂的合成方式,模型均通过一 系列特征或因子来评估股票,其本质是追求稳定的超额收益,而非预测绝对涨跌或 捕捉趋势行情。这一预测体系的方法论深深植根于历史统计规律,即从历史数据中 挖掘那些长期来看能有效区分股票优劣的因子,并相信这些规律在未来会持续产生 作用。 在这一框架下,投资组合的构建秉承着高度分散化和严格风险控制的原则。模 型倾向于筛选出在各项考察维度上都表现均衡的“全面发展型”股票,而非在某一方面 极端突出的“偏科生”。通过风险模型对行业、市值、估值、Beta 等常见风格暴露进行 严格约束,组合力求剥离市场常见的系统性风险,从而获取理论上“纯粹”的 Alpha。 这种经典范式在长期市场实践中证明了其稳健性。 在公募行业的实践中,这一模式与指数增强产品的目标不谋而合,形成了“多因 子选股 + 组合优化与风控”的经典配置。由于其追求相对基准的稳定超额,且能够容 纳大规模资金,指数增强产品已成为国内量化策略最重要、规模增长最迅速的品类 之一。

1.2 模型有效性面临周期性挑战
然而,上述看似稳健的“多因子选股+组合优化”体系,在市场实践中正面临日益 严峻的挑战,在现实市场环境中并非总能奏效。为客观评估其表现,我们遵循以下步 骤构建并分析了公募指增产品的整体超额收益: 1. 样本基金选择:以沪深 300、中证 500 及中证 1000 指数增强型基金为研究对 象,筛选成立时间大于 180 天、年化跟踪误差低于 7.5%的基金(剔除联接基金), 构建样本池。2. 超额收益计算:对每只基金,逐日计算其相对基准指数(按 95%仓位折算)的超 额收益,并剥离当日打新收益。 3. 汇总统计:每日分别计算同类型的指增基金超额收益的中位数,再对这三个中位 数求均值,作为当日公募指增策略的总体超额收益。
长期来看,公募超额分布呈现出左偏与肥尾特征,表明策略不仅存在稳定的正超额阶段,也伴随着频繁且剧烈的超额回撤期。这一现象直指模型有效性的周期性 失灵。
这些周期性的失效在特定的市场环境中有着具体表现。为进一步剖析模型在结 构性行情中的适应性,我们选取近五年来四个具有代表性的市场阶段,考察指增产 品的超额表现: 1. 2021 年 4 季度:市场风格快速切换,周期板块宽幅震荡,策略拥挤度加剧,以 行业轮动和风格反转为主导,导致依赖因子动量的量化策略集体遭遇超额回撤。 2. 2024 年 1 月至春节前:小微盘股票因流动性危机出现大幅回撤。然而,由于公 募指增产品受 80%成分股约束,其市值敞口得到控制,整体超额回撤幅度相对 有限,这体现了传统风控框架在极端微观结构风险下的防御价值。 3. 2024 年 924 行情:市场在政策等因素驱动下快速反弹,以双创板块为代表的成 长风格反弹尤为迅猛。此阶段,低波、低换手等防御因子普遍失效,传统模型难 以跟上市场情绪驱动的上涨节奏。 4. 2025 年 7 月至 9 月:市场由科创、芯片等产业主题行情主导,股价表现与当期 财报基本面脱钩,更多反映远期预期与主题情绪,导致基于历史财务数据的质量 与盈利因子出现回调。
这些周期性的失效并非偶然,它深刻揭示了传统多因子模型内核逻辑与动态市 场之间存在的固有矛盾。模型基于历史规律构建的“全面发展”选股标准与静态风险约 束,在面对市场风格陡然转向“偏科生”或“主题明星”时,便显得僵化与滞后。这引出 了我们对模型更深层次局限性的拷问:为何模型会在这些特定环境下系统性失灵? 其内在机理是什么?本文后续章节将重点剖析这些问题,并探讨可行的解决方案。
量化模型的局限性错综复杂,不同类型的策略所面临的挑战也各不相同。本文 无意面面俱到,而是基于对现有主流公募量化策略的实证观察和复盘分析,聚焦于 那些导致公募量化策略在关键时期系统性失灵的主要矛盾。深入分析可以发现,这 些挑战并非偶然的外部冲击,而根植于传统多因子模型自身的内生逻辑之中——即 对历史路径的依赖与对市场结构动态变化的不适配。本章将从分散化哲学与选股逻 辑的路径依赖这两个层面进行逐一剖析。
2.1 局限一:分散化哲学与收益分布非正态性的根本矛盾
传统多因子模型在组合构建上遵循着经典的投资分散化原则,其核心假设是: 股票收益在横截面上近似服从正态分布,通过持有大量股票可以平均化个股特异性 风险,从而稳定地获取因子选股带来的平均 Alpha。然而,这一理想化的统计假设 与真实市场的收益分布结构时常发生尖锐冲突。 在市场处于由宏观主线或产业主题驱动的结构性行情时,个股或行业风格超额 收益的分布往往呈现显著的右偏特征。这意味着大部分超额收益并非均匀地来自于 投资组合中的所有股票,而是高度集中于少数几只权重股或处于风口中心的标的。 此时,严格遵循分散化原则、持仓通常多达数百只且权重相对均匀的传统量化模型, 其表现就如同一个被严重稀释的投资组合:虽然抓住了部分强势股,但因权重限制, 无法充分享受其强势上涨带来的收益;同时,组合中大量平庸或弱势的持仓反而拖 累了整体表现。在实践中,这种“均匀主义”的持仓结构很难根据行情分布进行动态、 大幅度的调整,使得模型在结构性行情中天然处于劣势。 我们统计了每月全市场股票在根号总市值加权后的超额收益率的横截面标准差, 并与当月公募指增产品的平均超额收益进行对比。结果表明,个股横截面超额标准 差与指增当月总体超额收益呈现一定的负相关关系,与指增超额收益的绝对值呈正 相关关系。在个股超额分化平缓的月份,量化模型凭借高胜率、低赔率的选股模式, 往往能获取稳定但有限的超额收益。在分化剧烈的月份,市场呈现出“低胜率、高赔率”的特征。尽管其中蕴藏着通过集中持仓博取极高回报的理论机会,但量化模型因 其分散化约束,绝大多数时候无法捕捉这种机会,反而因持仓被大量平庸股票“稀释”, 更容易遭遇显著的超额回撤。这印证了,分散化哲学在应对收益分布的非正态性时 存在天然短板。

2025 年 8 月的行情将这一矛盾极端化呈现。 以沪深 300 成分股为例,该月个 股相对于指数的超额收益率分布呈现极强的右偏性。以寒武纪、中际旭创为首的少 数科技成长股贡献了绝大部分涨幅。然而,量化模型不仅因风险约束天然低配这类 高波动、高估值股票,更在行情演进中陷入被动:这些领涨股因股价飙升,其在指数 内的权重随之快速上升。若模型未能及时调整,则低配的幅度实际上在动态扩大, 形成越涨越拖累超额的恶性循环。这并非简单的选股失误,而是其固守的组合构建 哲学与市场动态的最优收益结构之间产生了根本性矛盾。这一矛盾深刻揭示,旨在 降低风险的分散化持股,在某些市场状态下,其本身就会构成一种无法回避的“收益 稀释风险”。
2.2 局限二:因子库的“路径依赖”与高弹性风格缺失
前文对公募指增产品极端负超额月份的分析,揭示了一个关键现象:量化策略 的大部分剧烈回撤,均伴随着盈利、波动与换手等风格因子的失效乃至反向。更为系 统的统计表明,这种关联并非偶然的尾部特征,而是一种常态化的风格依赖。下表 统计了 2017 年以来公募指增月度超额收益与 Barra 风险因子 Rank IC 的时序相关 系数,可以发现,在大部分年份里,策略整体表现与低 Beta、高盈利、低波动、低 换手等风格因子的表现呈现显著稳定的正相关性。这意味着,传统模型的超额收益 并非完全“纯净”,其表现好坏在常态下就与这些特定风格因子的走势深度绑定。 当然,这种相关性结构并非一成不变,其本身也受市场环境影响。2020 年在公 募资金持续“抱团”大盘成长风格的驱动下,市场表现出明显的高 Beta、高动量特征。 此时,遵循“因子动量”配置逻辑的多因子模型,会通过 ICIR 加权等方式,逐步提升 成长超预期、动量等当期强势因子的权重,同时降低低波动、低换手等近期弱势因 子的权重。这一动态调整过程,使得整个策略的组合风格暴露发生了系统性“漂移”, 其表现与高 Beta、高动量因子的正相关性增强,而与低波、低换手、高盈利等因子 的相关性则转为负值。这恰恰从另一个侧面印证了模型的“路径依赖”:其风格暴露 并非主动前瞻,而是被动跟随过去一段时间内表现强势的因子,从而在市场风格形 成趋势时强化暴露,在风格反转时遭遇冲击。
这种绑定关系根植于模型选股和配置逻辑的双重“路径依赖”。传统多因子模型从 历史数据中挖掘长期有效的统计规律,而历史数据显示,高盈利、低波动等因子在 A 股长期提供了显著的风险溢价。这导致模型在训练和迭代过程中,会不断强化对这 类“高胜率”因子的依赖,最终构建的组合实质上高度暴露于此类风格,演变为一种带 有鲜明风格偏向的 “Smart Beta 增强组合”,而非纯粹的 Alpha 组合。 为量化这一倾向,我们对 Alpha 因子库与 Barra 风格因子的相关性结构进行了 分析。具体而言,计算每个选股因子与各 Barra 风格因子自 2016 年以来的横截面因 子值相关系数的时序均值。若相关系数均值大于 0.3,则定义该选股因子与相应风格 高度正相关;若小于-0.3,则定义为高度负相关。 结果表明,因子库中存在大量与低波动、高盈利、低换手风格显著正相关的“深 度”因子;然而,与高波动、低盈利、高换手风格高度正相关的因子数量却极为稀少。 这种严重不对称性不仅体现在数量上,更体现在暴露的“深度”上:因子库容易构建出对低波、低换手的“深度”暴露,却难以形成对高波、高换手的“深度”暴露,至多只能 达到“浅度”相关。这种结构性缺陷,使得模型在面对由高弹性风格主导的市场时,缺 乏有效、有力的选股工具。
为进一步验证上述观点,我们构建了两个多头组合进行对比:首先,通过因子对 称正交与 12 个月 Rank ICIR 加权的方式构建全市场复合因子,每月选取该因子得 分最高的 100 只股票等权配置,构建全市场多头组合。同时,我们合成一个“弹性”代 理变量,其本质是低盈利、高波动与高换手风格得分的综合,用以刻画股票的弹性 特征。每月,我们筛选出该变量得分最低的 50%股票,构成低弹性股票池,并在此 池内使用完全相同的全市场复合因子进行选股,同样选取得分最高的 100 只股票等 权配置,构建对照组合。 回测结果显示,两者长期超额收益曲线高度重合,月度超额收益相关系数高达 0.89。这表明,传统多因子模型的超额收益,绝大部分可以归因于其因子体系在低 弹性风格域内的选股效应,并未展现出能够有效超越该特定风格域的、更为普适的 选股能力。
在上述研究的基础上,我们进一步从组合持仓构成的视角进行剖析,以检验模 型是否捕捉到了市场中的领涨力量。我们分别统计每月全市场涨幅排名前 10%的强 势股,以及排名前 50%的涨幅领先股票,并计算与同期传统多因子模型选出的同比 例持仓之间的数量重合度。结果显示:在总计 119 个月的样本期内,模型持仓与当 月强势股的重合比例超过 10%的月份仅有 54 个月,平均重合度仅为 9.8%。这意味 着,模型极少能将市场上最具弹性的少数领涨股充分纳入核心持仓。相比之下,模型 持仓与当月涨幅前 50%的中上游股票重合比例超过 50%的月份达到 107 个月,平均 重合度 54.4%,远高于前者。
造成这一困境的原因是多方面的:1. 历史数据挖掘的惯性:模型天然倾向于在 A 股历史上长期占优的低估值、高盈 利、低波动风格。 2. 因子定义的滞后性:模型对成长、盈利的定义多基于已实现的财务数据,而市场 在高弹性行情中定价的核心往往是未来预期。这种“过往事实”与“未来想象”之间 的错配,导致模型系统性地低配由预期驱动、业绩还未体现的热门股。 3. 因子动量与风格反转的冲突:模型本质上是以特定的统计逻辑学习历史市场环境 并合成与之适应的 Alpha,这种以因子动量为核心的线性思想强化了路径依赖。 当市场风格发生周期性反转,模型便会遭遇较大回撤。 在知晓造成传统量化多因子策略失效的根源之后,随之而来的问题是:“高弹性” 风格究竟是一个应被回避的“Stupid Beta”,还是一个需要约束的风险? 长期回测 结果似乎支持前者:依据低盈利、高波动和高流动性的复合得分构建的 TOP30%高 弹性股票池在近 16 年相对全市场等权基准的超额收益为-10.2%,月胜率仅 36.6%, 从年度周期看无疑是一个“价值陷阱”。 然而,深入观察可发现三点变化:第一,自 2020 年以来,高弹性风格的超额收 益下行斜率已显著放缓,月度胜率的劣势不再明显,且时常出现脉冲式高收益。第 二,从投资实践所关注的回撤周期来看,近年来高弹性风格可能带来持续超过 3 个 月的负向超额,因市场结构变化而凸显。第三,随着经济结构转向科创驱动,部分战 略新兴产业的业绩兑现周期拉长,使得基于短期财务稳健性的传统定价逻辑出现阶 段性失效。这警示我们,曾被视为 Alpha 基石的低波、高盈利特征,其风险溢价可 能正在发生结构性变化。若一味将其视为“Stupid Beta”而系统性回避,可能导致策略 在风格覆盖上存在永久性缺陷,无法适应未来市场。
许多曾被视为Alpha的因子(如小市值、账面市值比)已逐渐被认知并“Beta化”, 成为控制优先级较高的风险。始终将其视为“Stupid Beta”而一味回避,会导致策略在 收益来源上存在结构性短板。 面对上述局限,在传统框架内的优化尝试往往面临掣肘:1、因子挖掘层面,从 高频量价数据中挖掘新因子,虽可能部分降低对低频风险的暴露,但多数高频因子 本质上仍偏向低波动、低换手,且对交易端带来较大压力。2、风险模型层面,在风 险模型中动态约束或放宽对高弹性风格的暴露限制,本质上是风险与收益的权衡。 约束过紧则放弃潜在收益,放松约束则需承担更高的波动与回撤,且对于中低频策 略而言,精准把握风格切换的时点极为困难。3、从 Alpha 预测的角度,如何在不同 的特征输入下通过更复杂的模型获得更加稳健的 Alpha 预测,是近年来的研究热点, 在第 3 章第一节中也会简要介绍这部分内容。 因此,更根本的解决方法或许在于突破单一模型的“路径依赖”,构建一个能够兼 容多元风格、特别是覆盖传统模型“盲区”的体系。这自然指向了通过多策略组合来提 升整体鲁棒性的思路:通过引入能捕捉高弹性 Alpha 的辅助策略来提高阶段性超额 收益,同时由于策略间的低相关性来降低整体波动。其核心目标之一是直击痛点, 弥补传统模型在“高弹性风格域”的覆盖度缺失。如何构建这样的策略,正是本文接 下来要探讨的解决方案。
在深入探讨多策略体系之前,有必要首先明确后续分析所依存的比较基准。下 文将简要阐述基于传统线性框架的多因子复合因子的构建流程,该因子将作为后续 各项策略对比的基准源头,基准复合因子构建流程如下:
1、因子池:基于基本面与量价数据,共纳入 229 个华安金工因子库中的因子; 2、样本空间:中证全指成分股; 3、因子预处理:所有因子均在当期横截面上进行缺失值填充、异常值缩尾、ZScore 标准化,并进行行业与市值中性化处理; 4、因子筛选:每年末,基于过去五年的历史数据,计算因子间的平均横截面相 关系数。对高度相关(均值>0.7)的因子群,仅保留其中 Rank ICIR 最高的因子。 5、因子合成:每月末,采用对称正交处理以消除因子间的多重共线性。随后, 基于过去 12 个月的数据,计算每个因子的 Rank ICIR,并以此动态加权合成最终的 横截面 Alpha 预测得分。 6、组合构建:每月末选取得分最高的 100 只股票等权配置。
3.1 基于 XGBoost 树模型的 Alpha 预测
为突破传统线性多因子模型的“路径依赖”,一种直接的思路是采用更具灵活性的 非线性模型来预测 Alpha。机器学习方法,特别是树模型,为此提供了强大的技术工 具。其核心在于,即便使用与线性模型相似的特征集,非线性模型也能够通过复杂的 特征交互与分割,捕捉数据中隐藏的非线性规律与结构性变化,从而可能生成相关 度较低、预测逻辑迥异的新 Alpha 信号。 在众多机器学习模型中,以 XGBoost 为代表的梯度提升决策树模型在量化选 股领域得到了广泛应用与验证。其基本原理是通过一系列二叉树结构对样本进行递 归划分,天然适用于处理非线性关系与高阶交互效应。XGBoost 通过集成多棵决策 树,并采用梯度提升框架逐步修正预测误差,在保持模型可解释性的同时,大幅提升 了预测精度与泛化能力。与近年来兴起的深度神经网络相比,精心调优的树模型在 表格数据预测任务上往往表现相当甚至更优,且与传统线性模型的预测结果通常具 有较低的相关性。这种差异性使得树模型不仅能够作为独立的预测工具,更能在多 策略框架下与线性模型形成有效互补,为实现“1+1>2”的分散化效果奠定了基础。
我们构建 XGBoost 收益预测模型的具体流程如下: 1、输入特征的类型:在传统的因子选股研究中,我们往往会基于先验逻辑和市 场经验手工挖掘有效的选股因子。并通过各种线性模型合成用于构建组合的 Alpha 预测得分。而在机器学习领域中,可用于输入模型的特征类型往往并不要求原本特 征的线性有效性。考虑到 XGBoost 模型对于特征数据的类型也有不同要求,我们使 用如下特征集进行模型训练:

2、样本空间:中证全指成分股。3、训练区间划分:以 2010 年 1 月 1 日-2017 年 12 月 31 日为训练集,2018 年 1 月 1 日-2019 年 12 月 31 日为验证集。 4、特征筛选与预处理:由于树模型本身具有特征筛选机制。在训练模型前不进 行特征筛选。特征进行横截面缺失值填充,在训练集中进行整体 5MAD 缩尾,Zscore 标准化,不做风格中性化处理。 5、预测目标预处理:由于是月度调仓策略,使用未来一个月绝对收益率为预测 目标,同样进行训练集整体 Zscore 标准化处理。 6、超参数选择与调优:损失函数选用均方根误差,通过网格搜索对学习率、树 的最大深度、正则化参数等关键超参数进行优化,旨在验证集上获得最佳泛化性能。 自 2020 年 1 月 1 日-2025 年 11 月 28 日,中证全指内 XGBoost 因子月度 Rank IC 均值为 13.4%,年化 ICIR 为 5.26,分十组多空组合年化收益为 62.3%,多头年 化超额 20.0%,多头信息比达 3.78,全面显著优于同期传统线性复合因子。
分年度来看,XGBoost 多头组合相对全市场等权基准的超额收益表现稳健,尤 其在今年以来累计超额达 25.2%,相较于线性模型多头组合,年均能创造约 6.4%的 增量超额收益。
XGBoost 模型在提供高精度预测的同时,也具备良好的可解释性,其提供的特 征重要性度量有助于我们理解模型决策的底层逻辑。我们主要采用增益重要性作为 评估指标,该指标综合考虑了特征在所有树模型中被用于节点分裂的频率,以及每 次分裂所带来的损失函数下降幅度(即信息增益)。因此,增益重要性能够有效衡量 各特征对模型整体性能提升的贡献程度。 分析结果显示,Alpha158 这类基础技术特征和基本面特征的重要性居高,相对 而言,日频量价因子特征的重要性相对较低,这可能意味着其增量信息在非线性模 型中被其它基础技术性特征或价值类特征所替代或整合。
进一步比较 XGBoost 全市场 Top 100 组合与全市场多因子 Top 100 组合在特 定市场阶段的表现:两者具有一定的收益互补性。例如,在 2024 年春节前因流动性 冲击导致的小微盘回撤行情中,XGBoost 组合的表现阶段性弱于传统线性模型;而 在其余多数市场环境下,XGBoost 组合则能提供更优且相关性较低的超额收益。
为深入理解其收益来源的差异性,我们进一步分析了 XGBoost 合成因子与 Barra 风格因子的相关性。结果显示,相较于传统线性复合因子,XGBoost 因子在 价值、盈利和低波动风格上的暴露显著降低,而在小市值因子上的暴露有所提升。 这一相关性结构表明,XGBoost 模型能够在一定程度上突破依赖低波动、高盈利的 线性选股逻辑,通过非线性路径捕捉了不同的收益来源。
总结而言,XGBoost 模型通过其强大的非线性拟合能力,提供了一条生成差异 化 Alpha 的有效路径,能够在一定程度上缓解传统模型在风格暴露上的“路径依赖” 问题。然而,其预测逻辑仍然主要基于全市场相似的特征集,对于传统模型完全缺失 的“高弹性风格域”,其覆盖能力可能依然有限。因此,要系统性弥补这一风格盲区, 需要更具针对性的策略设计。下文将介绍第二种方案,即通过横截面分域,直接构建 聚焦于高弹性股票池的选股策略。
3.2 构建高弹性策略:捕捉传统模型的风格盲区
传统多因子模型往往缺失对高弹性风格的捕捉能力。若想在不颠覆原有策略核 心的前提下弥补这一盲区,构建一个独立的、针对性覆盖高弹性股票域的子策略, 便成为一条合乎逻辑的路径。这本质上是将分域思想应用于风格维度,通过策略间 的低相关性来提升整体组合的鲁棒性。 分域增强的核心思想,在于承认并利用不同股票子集(域)内可能存在的差异 化定价逻辑。其增量实现取决于两个关键:一是目标域内确实存在显著且稳定的、 区别于全市场的特异 Alpha 来源;二是通过分域建模对组合风格结构进行定向调整,能在风险与收益间获得更优的权衡。目前实践中的分域思路大致可分为三类:一是 单边式风格增强,如专注成长超预期或红利低波等强势风格域,旨在放大对该风格 敞口的暴露以博取更高收益,但通常会同步推高组合跟踪误差,在信息比上较难获 得显著提升;二是基于特征的双边分域,依据长期无明显方向性风险溢价的特征将 全市场划分为两端,并分别建模,其增益完全取决于该特征对因子预测能力的区分 度;三是针对传统模型空头端的建模,即直接对主流模型系统性回避的股票区域如 低盈利、高波动板块进行重点研究,力求在不明显放大跟踪误差的基础上提升超额 收益,这正是本文探索的方向。
实现分域思想,在实践中一般有两种路径:一是在一个庞大的多因子模型中,通 过引入风格条件变量进行复杂交互,试图让模型自身学会在不同域切换选股逻辑; 二是直接构建多个相对简单、各司其职的子策略,再进行组合。本文倾向于后者,主 要基于三点考量:第一,适配性。不同风格域内的股票,其收益分布、波动特性、因 子有效性截然不同,达到最优信息比率所需的持仓集中度与分散化程度存在显著差 异。一个统一的模型框架很难同时最优地满足这些矛盾的要求。第二,灵活性。独立 的子策略在因子选择、模型训练、组合优化上不受“大一统”框架的条条框框约束,可 以针对各自域的特性进行极致优化,包括使用非常规的另类数据与非线性模型。第 三,鲁棒性与可解释性。多个低相关性子策略的组合,其整体表现通常比一个复杂 模型更为稳定;同时,每个子策略的损益归因清晰,便于理解和迭代。因此,从“一 个复杂模型的条件化”走向“多个简单策略的组合化”,是分域模型实践中一个非常经 典和有效的进阶路径。 一种朴素且直观的尝试是:在预先界定的高弹性股票池内,直接沿用为全市场 构建的 Alpha 预测模型(多因子线性复合模型/ XGBoost 模型)进行选股。为此,我 们首先对高弹性股票池进行定义,如下: (1) 基于 BarraCNE5 风险因子,对原始流动性与波动率因子进行等权合成, 再将结果与经过方向调整的盈利因子再次等权合并,得到最终的高弹性 综合得分。 (2) 每月末,我们选取该弹性得分最高的 30%股票,构成当期的高弹性股票 池。
选股方面,我们每月末在高弹性股票池中选取 Alpha 得分最高的 100 只股票等 权配置,从而构建组合。结果表明,这种朴素方法已初见成效。无论是全市场传统线 性多因子模型还是 XGBoost 模型,以此构建的“高弹性优选组合”相对于 Wind 全 A 等权基准均能产生显著的年化超额收益,均为 14.7%。另外,符合直觉的是,高弹 性优选组合的超额收益波动和相对回撤均处于较高水平,导致信息比较低。 分年度来看,传统多因子模型的多头超额主要集中于 2020 年,而基于 XGBoost 模型构建的组合,其超额收益在各年度分布更为均匀,尤其在近期市场表现突出,显 示出非线性模型在该域更强的适应能力。
从策略间的超额收益相关性来看,这类组合与原始全市场选股策略的收益表现 相关性较低,初步具备了作为分散化工具的潜力。
然而,这种朴素方法存在较大的改进空间。首先,其本质近似于在全市场选股 基础上,叠加了对高弹性风格的约束条件,并未构建独立的定价逻辑。其次,更关 键的是,即使在“高弹性”池内,传统模型选出的股票,依然是该池子中相对绩优、低 估值、低波动的部分。这导致组合虽然置身于高弹性域,其内核风格却可能仍偏向 “稳健”,与在全市场选股但适当约束风险敞口的传统组合区别有限,未能真正捕捉高 弹性风格的核心驱动因素——即由情绪、动量、远期预期所主导的定价机制。 因此,要构建一个真正有效、能提供差异化收益的卫星策略,必须进行更深层次 的定制化设计,我们旨在构建一个策略,其收益来源与核心组合低相关,并能在市场 风险偏好上升期,敏锐地捕捉由情绪和动量驱动的机会,真正承担起组合“进攻之矛” 的职能。在此之前,有必要深入剖析高弹性股票池本身的特征画像,从宽基分布、行 业分布及上市板分布进行考察。 从宽基指数的数量和权重分布来看,由于未对高弹性代理变量进行市值中性化 处理,整体而言,高弹性股票池具有明显的小市值倾向。2016 年以来,其在沪深 300内的平均数量占比仅 5.7%,流通市值占比 35.7%;在中证 500 内成分股数量占比 9.5%,流通市值占比 17.3%;在中证 1000 内的数量占比 27.7%,流通市值占比 22.5%;在中证 1800 外数量占比 57.2%,流通市值占比 24.5%。
行业分布上,相较于中证全指,该池明显超配电子、计算机、医药等行业,而大 幅低配银行、非银、交通运输等大金融与周期防御板块。
从上市板分布来看,由于涨跌幅限制与产业属性带来的弹性上的天然差异,池 内股票明显偏向双创板块。2020 年以来,主板股的数量占比 52.8%,流通市值占比 62.2%;创业板成分股数量占比 36.0%,流通市值占比 26.5%;科创板股的数量占 比 11.3%,流通市值占比 11.3%。

这些结构特征共同描绘出一个以中小市值、科创成长为主导的高弹性群体画像, 其定价逻辑与传统蓝筹股主导的低弹性域存在本质不同,这决定了我们必须在该域 内重新审视和评估因子的有效性。 对行业市值中性化后的因子在高弹性股票池里的有效性进行检验。可以看到, 2016 年 1 月 1 日-2025 年 11 月 28 日,其有效性与全市场确实存在差异:传统的价值和盈利因子在该域内选股能力微弱甚至出现反向预测。经改进 的可比价值因子表现显著强于原版因子,其中,可比营收企业价值比因子 Rank IC 均值 4.0%,年化 Rank ICIR 为 3.07,多头年化信息比为 1.13; 成长超预期和分析师预期盈利上调因子具有一定的选股效果,且多头端能 提供可观的收益弹性。相较之下,量价类因子在高弹性股票池内的表现显得较为亮眼,这印证了 我们在先前因子舒适区研究中的结论:在高波动、高换手的环境中,识别并回避其中的“定价噪声”往往能获得显著的 Alpha。 总体而言,虽然量价与成长类因子在该域内保持了一定的选股效果,但完全摒 弃价值与盈利维度势必会损失部分信息。同时,由于该股票池长期具有显著的负向 风格 Beta,单一因子策略难以持续战胜基准,仍需依赖多因子复合来提升稳健性。
然而,一个核心矛盾随之浮现:如果继续沿用传统多因子模型那套在全市场行 之有效的线性合成与因子筛选框架,即使应用于高弹性池,其结果很可能与“在全市 场选股后简单约束风格暴露”的组合大同小异,甚至可能因为样本减少而引入过拟合 风险。 那么,如何才能构建出真正具有差异化收益来源的高弹性策略?一个极端的思路是仅采用纯粹的进攻性因子,完全放弃防御性因子。但历史回测表明,这种极致风 格暴露在约 60%的时间里会承受更大的波动与回撤,仅在大约 40%的高弹性主导行 情中才能绽放异彩。对于旨在作为长期配置的卫星策略而言,这种高波动特性并非 最优解。 因此,本文的目标是构建一个既能捕捉高弹性域内特异 Alpha,又能对核心全 市场策略起到有效分散化作用,尤其是在后者失效时提供保护的子策略。 这就要求 我们在因子加权合成时,不仅要考虑因子在域内的绝对表现,还需纳入其与基准策 略的分散化价值。下文将介绍三种旨在实现这一平衡的差异化构建思路。
为客观评估高弹性策略对传统指数增强模型的提升效果,本章将在贴近实战的 设定下进行回测分析。其中,中证全指增强因其全市场选股、无成分股约束的特性, 为多策略的灵活配置提供了最佳实践场景,将作为首要分析对象。 指数增强模型的组合构建是以全市场线性复合因子作为 Alpha 得分,在风险约 束的条件下最大化复合因子暴露,来求解股票的最优权重。约束方面,除中证全指增 强外需满足 80%成分股约束,沪深 300 成分股个股偏离幅度 1%,中证 500 成分股 个股偏离幅度 0.8%,中证 1000 和中证全指成分股个股偏离幅度 0.5%,行业暴露偏 离 2%,市值暴露偏离 0.2,其余 Barra 风格暴露偏离 0.5。
4.1 中证全指增强策略
我们曾在“量化绝对收益”系列报告中对风险预算模型在资产配置中的应用进 行了深入的探索,并详细阐述了其原理和具体执行流程,因此在此章节中不再重复 赘述。我们以各子策略历史超额收益的协方差矩阵为核心输入,通过优化使各策略 对组合总风险的贡献度符合预设的预算目标。协方差估计采用与 Barra USE4 模型 类似的指数衰减方法,其中超额波动率的半衰期设为 240 天,相关系数的半衰期设 为 480 天。
在不同的风险预算配置下,多策略融合后的中证全指增强组合均实现了年化超 额收益与信息比率的同步提升,同时最大相对回撤也得到改善。随着配置保守性地 向传统增强策略倾斜,超额收益的提升幅度有所降低,但风险调整后收益与回撤控 制的改善更为显著。 具体而言,相较于原始单一增强策略,多策略组合的年化超额收益提升了 2.1% 至 4.7%。在最稳健的配置参数下(70%/10%/10%/10%),信息比率由原始的 2.30 提升至 2.80,最大相对回撤由-8.4%收窄至-6.6%。 从分年度业绩来看,多策略组合在 2021 年及 2025 年表现显著更优,仅在 2024 年小幅跑输,其表现与高弹性风格的市场环境密切相关。
基于多策略融合的中证全指增强组合,在应对不同市场环境时展现出更优的适 应性。该组合在多数市场阶段——尤其是风格剧烈切换或极端行情中——能够持续 获取更为稳健的超额收益,体现了多策略体系通过内生的收益来源分散化,对市场 风格轮动具备更强的适应能力。
为考察各子策略在收益和风险方面的贡献,我们按中证全指增强、全市场 XGB 精选、高弹性 XGB 精选和基于分散价值的高弹性精选策略的顺序依次加入风险预算 模型进行观察,并按策略间相同的风险贡献比例进行配置。可以看到,随着策略加 入,年化超额收益逐步提升。其中,全市场 XGB 策略对收益的贡献最为显著。高弹 性 XGB 策略因其与全市场 XGB 策略收益相关性较高,加入后对提升收益的边际贡 献较小,甚至一度略微增加了超额波动与回撤。而最后加入的基于分散价值的高弹 性策略,则进一步优化了信息比率与收益。

从策略配置权重来看,传统中证全指增强策略占据主导,平均约 84%,全市场 XGB 策略与高弹性 XGB 策略平均各占约 4%-5%,高弹性分散价值策略平均约占 7%。
最后,我们考察多策略组合的超额收益提升,是否源于更激进的风格暴露偏离。 为此,我们每月计算基准增强策略与多策略组合(以 70%/10%/10%/10%风险预算 方案为例)相对于中证全指指数的 Barra 风格暴露度,并计算其时序均值进行对比。 结果表明,多策略组合在绝大部分风格维度上的暴露都更为收敛,尤其在传统 单一增强策略容易产生较大偏离的 Beta、价值、盈利、流动性及波动率等因子上, 其暴露度的绝对值均有明显收窄。这直接证明其更高的信息比率主要来源于选股能 力的纯化与提升,而非承担了额外的风格风险。唯一的例外是在市值因子上,多策略 组合呈现出更偏向小市值的暴露,这主要是由于其中包含的高弹性策略成分所致。 这一分析结果从风险归因的角度印证了前述结论:多策略体系的提升主要来源 于两个 Alpha 层面的贡献,一是机器学习模型带来的预测能力增强,二是高弹性策 略对传统模型风格盲区的针对性补充与分散化价值。
4.2 宽基指数增强:80%成分股约束下的应用
在沪深 300、中证 500 及中证 1000 等宽基指数增强实践中,需遵守至少 80% 仓位投资于指数成分股的约束。为此,我们调整构建思路:以传统线性多因子模型构 建针对全成分股的增强策略作为基础,并固定配置 80%的仓位以满足约束;剩余的 20%仓位,则利用风险预算模型在除中证全指增强以外的三个策略 中进行动态配置,各策略在此部分内的权重由风险预算比例决定。
4.2.1沪深 300 增强策略
多策略融合的沪深 300 增强策略年化超额收益达到 11.1%,信息比为 2.08,相 对回撤为-9.9%。其表现在超额收益和信息比方面显著优于单一的基准增强策略。这 表明,即使在严格的成分股约束下,多策略方法仍能有效提升超额收益与风险调整 后收益。 分年度来看,该策略在绝大多数年份中均战胜基准增强策略,今年以来相对基 准策略的超额为 7.5%,相对沪深 300 指数的超额收益达 9.2%。
4.2.2中证 500 增强策略
多策略融合的中证 500 增强策略年化超额收益达到 12.5%,信息比为 2.57,相 对回撤为-7.3%。同样的,其表现在超额收益和信息比方面均优于单一的基准增强策略。多策略方法仍能有效提升中证 500 增强策略的超额收益与风险调整后收益,但 相对于沪深 300 增强而言,主要提升体现在风险调整后的收益水平。 分年度来看,该策略在大多数年份中均战胜基准增强策略,今年以来相对基准 策略的超额为 3.2%,相对中证 500 指数的超额收益达 7.3%。
4.2.3中证 1000 增强策略
多策略融合的中证 1000 增强策略年化超额收益达到 16.4%,信息比为 3.47, 相对回撤为-5.5%。与沪深 300 与中证 500 增强不同的是,其表现主要在信息比和 相对回撤方面显著优于单一的基准增强策略,超额收益提升微小。我们猜想,原因是 本身中证 1000 成分股与高弹性股票池的属性更为接近,因此收益增量提升有限。 分年度来看,该策略在大多数年份中均战胜基准增强策略,今年以来相对基准 策略的超额为 3.1%,相对中证 1000 指数的超额收益达 11.9%。
传统多因子模型基于历史统计规律构建,旨在通过分散化选股获取稳定的超额 收益。然而,其在市场实践中面临周期性失灵的严峻挑战。实证分析显示,自 2021 年以来,公募指数增强产品的 Alpha 呈现显著衰减,获取年度正超额愈发困难。策 略的超额回撤常集中发生于市场风格剧烈切换的时期,此时依赖低波、高盈利因子 的传统模型普遍失效。 模型失效的根源在于其内在的“路径依赖”与市场动态结构的不适配。一方面, 模型假设超额收益正态分布并倚赖分散化持股,但在结构性行情中,收益呈现极端 右偏,分散化策略反而稀释了收益,形成了“收益稀释风险”。另一方面,因子库的构 建长期偏向历史上有效的低估值、低波动风格,导致组合实质上成为一个“Smart Beta 增强组合”,系统性地缺失了对高弹性风格的暴露与捕捉能力,形成了风格频谱上的永久性盲区。 针对上述局限,本文提出了引入高弹性策略,向“多策略”体系进阶的解决方案。 其一,引入 XGBoost 等非线性机器学习模型预测 Alpha,其全市场选股组合年化 超额达 20.0%,信息比率高达 3.78,且与传统线性模型的预测结果相关性低,提供 了差异化的收益来源。其二,专门构建针对高弹性股票域的“卫星策略”。通过采用结 合因子域内表现与分散化价值的配置方法,该策略年化超额达 14.1%,并与核心策 略超额收益的相关性为-10%,在全市场策略失效月份平均提供 1.9%的正向对冲收 益,有效弥补了风格盲区。 最终,通过风险预算模型将传统增强策略、机器学习策略及高弹性策略进行整 合,构建多策略指数增强组合。实证表明,该体系能显著提升绩效。例如,中证全指 增强组合的信息比率从 2.30 提升至 2.80,最大回撤从-8.4%收窄至-6.6%。风格归 因显示,超额提升主要源于选股能力的纯化,而非额外的风格暴露。该方案在沪深 300 等宽基指增中也同样有效,验证了其解决“路径依赖”、提升策略鲁棒性的实用价 值。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)