2025年金工深度研究：ANS，让优化器学会远离噪声交易

华泰证券2025/05/29
举报

导读

“如果总是做显而易见或大家都在做的事，你就赚不到钱。”——本杰明·格雷厄姆有效市场假说（EMH）投资组合优化是金融领域最重要的基本问题之一，其目标是在特定约束下为不同的风险资产分配最佳权重。新古典金融理论中，最具代表性的投资组合优化框架为马科维茨均值-方差模型和冯·诺依曼（VNM）期望效用理论模型。马科维茨均值-方差模型中，投资者知晓资产组合的回报和风险，并在优化时同时考虑两者；冯·诺依曼期望效用理论模型中，优化目标被设定为所有可能收益的加权效用，从而建立了不确定条件下对理性人（rational actor）选择进行分析的框架。两个经典框架虽然简单优美，但实操性并不强，更多地是停留在理论层面。这是因为包含以上两个框架的大多数资产定价模型都使用理性预期均衡框架，该框架不仅假设个人理性，还假设一致的信念，从而对未来做出无偏估计。

现实情况并非如此美好。新古典金融学认为，市场应该满足有效市场假说（EMH），其两个核心假设为“价格反映全部信息，并迅速调整到位”以及“所有投资者都是理性的”。而 Kahneman 和 Tversky（1979）指出，有效市场假说在很多情况下无法解释投资者的实际行为。因此，作为行为经济学的分支，行为金融学于 20 世纪 80 年代开始登上了历史舞台，摆脱理性人的假设约束，致力于研究投资者心理如何影响投资者行为。由于行为金融学对市场异象的强解释性和两次诺贝尔经济学奖的青睐（2002、2017），从而获得了越来越多的关注。行为金融学借助心理学的研究来分析投资者的系统性认知偏差，它们影响了投资者信念以及做出风险决策（是否买 /卖股票）的偏好。非理性信念包含过度自信（Overconfidence）、乐观主义（Optimism）、锚定效应（Anchoring）、确认偏误（Confirmation bias）等；非理性偏好包括前景理论（Prospect Theory）、模糊厌恶（Ambiguity Aversion）等。

我们基于行为金融学中最经典的累积前景理论（Cumulative Prospect Theory，简称 CPT）构建 ANS（Adverse-NoiSe）对抗噪声交易优化器。通过结合外部组合优化器和极小极大优化器，依次输出原始投资组合权重、非理性投资组合权重、对抗投资组合权重。具体来说，与最大化 VNM 效用相比，我们采用最大化 CPT 效用来刻画噪声交易者，输出非理性投资组合权重，从而对实际投资者决策行为产生更现实的预测。通过远离噪声交易者的交易行为，我们对原始投资组合权重进行远离式修正。最后，我们进一步将修正后的投资组合权重作为多阶段优化的子输入，最终得到对抗投资组合权重。本文针对中证 500、中证 1000 两个指数增强场景开展测试，实验结果表明，在回测区间 2018-03 至 2025-04 内，基于 ANS 优化器构建的指数增强策略相较于传统优化器效果明显提升。500 指增、1000 指增年化超额收益在回测区间上分别提升 2.44pct 和 1.67pct，最大回撤显著降低。

前景理论：行为金融学与非理性决策

理论基础

期望效用理论

关于风险决策的最早理论是冯·诺依曼期望效用理论，其被经济学家视为人类决策行为的基本假定。期望效用理论包含以下三方面的内容：Bayes 框架、Savage 公理、Bernoulli 原则。由于篇幅原因不多加赘述，只对其关键公理与原则进行解释： 1) 决策权重=概率：期望效用为各项结果的效用的加权和，决策权重为各项结果的概率。 2) 效用不依赖于参考点。 3) 不变性公理：方案间的偏好顺序不依赖于方案的描述方式。 4) 优势性公理：如果方案 A 在每个方面至少跟方案 B 一样好，而在至少一个方面比 B 更好，那么 A 应该比 B 更可取。 5) 替代性公理：如果方案 B 优于方案 A，那么它们与任一概率 ? ≠ 0 的结合所得的(B,p) 一定优于(A,p)。 6) 风险回避：?’’(?) < 0。

通俗来讲，这六条公式共同构建了一个“绝对理性人”的决策模型：假设人类像精密的数学机器，完全根据客观概率、绝对结果和逻辑公理做选择，不受情绪、描述方式或当前盈亏状态的影响。以投资为例，无论当下处于盈利还是亏损状态，只要数学期望相同，对未来时刻的决策行为就应该完全一致。

前景理论

Kahneman 和 Tversky（1979）提出的前景理论揭示了人类决策行为的非理性特征，他们通过一系列实验表明，人类决策严重依赖于当前的盈亏状态，且对损失的敏感度远高于收益。这一理论对经典期望效用理论的理性交易假设提出了挑战。最早版本的前景理论假设每个选项仅有两个非零结果，令?1和?2代表某风险决策的两个结果， ?1和?2分别代表它们发生的概率。根据前景理论，该风险决策的效用为：

? = ?(?1 )?(?1 )+ ?(?2 )?(?2 )

其中?(·)为决策权重函数，?(·)为价值函数。前景理论的核心，是在期望效用理论的基础上，提出了非线性的决策权重函数和价值函数。

累积前景理论

累积前景理论在前景理论的基础上，主要做出了两点贡献，从而使得前景理论拥有了可实操的理论基础： 1．对决策权重函数进行了修改。我们可以从概率论课本中概率质量函数（PMF）和累积分布函数（CDF）的角度来理解这一处改动。在前景理论中，决策权重函数?(·)类似于 PMF，累积权重函数?(·)类似于 CDF。前景理论的决策权重函数由于与累积权重函数等价，?(?? ) = ?(?? )，相当于直接由累计权重函数直接得到决策权重函数。在累积前景理论中，我们首先计算累积分布函数，通过累积权重函数相减得到决策权重函数。

2．根据心理学实验结果，得到了参数的具体值，为学界研究提供了可参考的锚点，避免了数据探测（data snooping）。参数取值分别为：? = 0.88，? = 2.25，? = 0.61，? = 0.69。 ?和?用于刻画对尾部风险的在意程度，数值越低越在意尾部风险；?代表了敏感度递减的快慢，而?代表了损失厌恶系数，越高表示越厌恶损失。

经典因子实践：表现不佳

如何将累积前景理论落地到实际投资问题上？由于股票收益（也就是风险决策结果?）的分布未知，累积前景理论效用也就无从求解。2016 年学界关于该话题有了相关落地研究： Barberis, Mukherjee, and Wang 指出，普通投资者会使用股票过去五年的历史月收益率（共 60 个样本点）分布作为股票收益的替代分布。在这样的设定下，Barberis, Mukherjee, and Wang (2016) 将股票过去 60 个月的月频收益率按从小到大排列，记为?−?, ?−?+1 , … , ??−1 , ??，即一共有 m 个负收益，n 个正收益。

ANS 优化器：缘何放弃构建传统因子？

纵观全局，累积前景理论并没有稳定预测股票收益率的能力；但当仅聚焦到 Top 层和 Bottom 层时，累积前景理论仍拥有很高的区分度，一定程度上可以刻画非理性交易者的行为，这可能是由两个原因导致的： 1) 非理性交易者是拥挤交易：他们抱团买入高 TK 值（layer 1）的股票，抱团卖出低 TK 值（layer 10）的股票，而 layer 2 至 layer 9 这些中等 TK 值的股票并没有强可解释性，与交易者买卖偏好无关，可能表现为噪音数据。 2) 由于 A股市场的做空限制，非理性交易者在没有仓位的情况下不能卖出低 TK值的股票，但可以买入高 TK 值的股票。这导致低 TK 值（layer 10）的股票虽有解释性，但正向超额不够明显。既然累积前景理论没有预测能力但有解释非理性交易者行为的能力，那我们应该如何将这一理论有效融入到选股策略中呢？

针对上述痛点，本文提出了 ANS 对抗噪声交易优化器。与传统因子投资范式不同，我们将累积前景理论融入投资组合优化过程，用累积前景理论“头尾两端”的强解释性刻画非理性交易者的投资组合。构建非理性交易者投资组合具有以下优点： 1) 相较于直接预测收益率，构建投资组合并不需要其拥有单调分层的预测能力，它只会作为最终理性投资组合负向剔除或正向筛选的参考，而累积前景理论的头尾两端又拥有很强的可解释性，用其构建投资组合逻辑顺畅； 2) 由分层效果可知，低 TK 值（layer 10）的股票没有明显的超额收益，但高 TK 值（layer 1）的股票具有明显的负向超额收益。由于 A 股市场的做空限制，在没有仓位的情况下，非理性交易者只能用到高 TK 值的信息，回测结果显示，这部分信息是有显著负向收益的。综上，TK 因子可能并非前景理论的最佳落地方式。而我们提出构建的非理性投资组合，可以避免 TK 因子分层不单调的缺点，而发挥其强解释性的优点，最大化非理性组合效用函数的方法也确保了高 TK 值的负向组合信息能够得到更好地利用。

ANS 优化器结构：三阶段优化

本文提出的 ANS 优化器，可作为一个“即插即用”的灵活组件，替代传统的优化求解过程。其可作用于任意 Alpha 因子上，亦无需改变任何风险约束。相较传统优化器，ANS 优化器仅额外增加“历史周度收益”一项数据需求，以用作非理性组合的优化求解。 ANS 优化器通过内部三阶段优化，让优化器“学会远离噪声交易行为”。通过结合传统组合优化器和极小极大优化器，完成基于对抗机制的组合优化决策。相较于传统优化器仅输出一次权重，ANS 优化器依次输出四次权重：原始投资组合权重、非理性投资组合权重、对抗投资组合权重、理性投资组合权重（最终输出权重）。

原始投资组合权重输出

ANS 优化器首先输出的是原始组合权重? ???，其构造方式与传统优化器类似，唯一区别在于 ANS 去掉了换手率约束，以避免路径依赖。传统优化器考虑换手率是为了降低换手成本；而 ANS 中的原始投资组合并非最终输出，我们需要准确构建由 Alpha 因子配置的投资组合用于后续流程，考虑换手率约束可能会适得其反。

实验设计与实验结果

此前的业界研究重心集中于 Alpha 模型的改进上。我们将尝试在不改变 Alpha 因子的基础上，引入累积前景理论 ANS 优化器，提升模型的决策能力。

实验设计

理论上 ANS 优化器作为一个即插即用的优化器，可适配任意的上游 Alpha 预测因子。本篇报告采用 GRU 量价因子作为基础 Alpha 因子。基于该因子，我们在不同优化场景下开展对比实验。

对比实验

对比模型包含四个模型，一个基于 ANS 优化器的理性投资组合模型和三个基线模型。 1) 基线模型 1：GRU 预测因子+传统优化器。直接将 GRU 预测因子输入传统优化器，求解得到组合权重。 2) 基线模型 2：GRU 预测因子+负向 TK 因子+传统优化器。将 GRU 预测因子与负向 TK 因子均分别取百分比排序后做加权融合，比例为 9：1，得到理性 GRU 预测因子，作为合成因子输入传统优化器，求解得到组合权重。 3) 基线模型 3：GRU 预测因子+负向 TK 风格暴露+传统优化器。将 GRU 预测因子作为 Alpha 因子，同时将 TK 值作为一种风格，添加其相对基准指数的负向暴露约束，求解得到组合权重。 4) 理性投资组合：GRU 预测因子+ANS 优化器，多阶段优化求解得到理性投资组合权重。其中，基线模型 1 将被用于证明 ANS 优化器本身的有效性。此外，我们构建了基线模型 2、模型 3，这两项实验本质上都是偏好“低 TK 值”的股票资产，而在前文我们曾阐述理性投资组合相较于超配负向 TK 因子的优越性，我们希望通过两组实验来证明这一事实。

时间区间

对比实验的回测区间为 2018-03-27 至 2025-04-30，周频调仓。该回测区间的选择并非随意之举，而是因为构建非理性投资组合需要过去 60 个周度收益，我们的 GRU 基线模型始于 2016-12-31，向后推移 60 周即为 2018-03-27。

实验结果

我们考虑理性投资组合与两个基线模型在给定回测区间中的表现，验证在不改变 Alpha 因子的情况下，ANS 优化器能否带来稳定超额。

中证 500 指数增强

500 指增的回测结果显示，理性投资组合的表现优于基线模型，各项指标均有明显改善；相较于三组基线模型，理性投资组合的信息比率提升最为明显，在全历史区间分别提升 0.47、 0.42、0.34；年化超额收益率绝对值在全历史区间上分别提升 2.44pct、1.90 pct 和 1.63 pct，且在提升收益的同时降低了跟踪误差与最大回撤。

通过分年度超额收益可以看出，除了 2018 年，理性投资组合的年度超额均高于单一 GRU 因子，收益提升较为稳定。基于传统 TK 因子构建的另两项对比组合，虽然个别年份超额收益领先，但收益稳定性、跟踪误差、信息比率等指标落后于理性投资组合。

中证 1000 指数增强

中证 1000 理性投资组合的表现同样优于基线模型。相较于三组基线模型，理性投资组合在 1000 指增年化超额收益在全历史区间上分别提升 1.67 pct、4.14 pct 和 2.37pct，跟踪误差与最大回撤明显改善，信息比率同样提升显著。

总结

本文是行为金融学应用于量化选股的深入实践。行为金融学作为“社会科学皇冠上耀眼的明珠”，通过对非理性心理的研究，修正了主流经济学基于理性人假设的不足，因此使用行为金融学理论改进实际的投资决策是一个自然的选择。在“因子+组合优化”的范式下，我们没有切入较为拥挤的行为金融学因子研究，转而使用行为金融学理论中的累积前景理论改造传统优化过程，提出了 ANS 对抗噪声交易优化器。本研究重塑并系统梳理了累积前景理论在投资中的逻辑。此前的研究更多采用累积前景理论用于构造非理性因子，但因子值的分层打分机制无法很好地刻画累积前景理论，无法做空等限制也使得非理性因子值的大小无法转化为实际的投资行为。我们首次提出并解释了通过求解累积前景理论优化问题来构造非理性投资组合及其权重的合理性，通过权重的变化来构建买入卖出行为，从而刻画非理性交易者的特征。

ANS 优化器结合了经典组合优化器和极小极大优化器的优势。其依次输出原始投资组合权重、非理性投资组合权重、对抗投资组合权重、理性投资组合权重。作为一个即插即用的优化器，可以灵活应用到任何收益预测模型的下游优化任务。基于 ANS 优化器构建的指增策略相比于传统投资组合优化模型效果提升显著。以 GRU 因子为例，在回测区间 2018-03 至 2025-04 内，ANS 优化器相较于传统优化器在中证 500 组合上的年化超额收益由 8.56% 提升到 11.00%，超额最大回撤由 13.40%降低至 9.84%，信息比率由 1.28 提升至 1.74；在中证 1000 组合上年化超额收益由 16.59%提升到 18.26%，超额最大回撤由 12.88%降低至 10.36%，信息比率由 2.17 提升至 2.43。行为金融学未来或有更为丰富的落地与想象空间。累积前景理论仅是行为金融学领域的冰山一角，此外还有很多更加前沿的行为金融学理论用于刻画非理性行为；此外，在高频数据更加丰富的今天，仅使用周度收益刻画非理性交易者特征似乎已经不够“Tech”。基于本报告的基础成果，我们有理由推断，配合更加前沿的行为金融学理论、更加高频的数据及交易行为刻画方式、更先进的优化算法，行为金融学在实际投资领域将有更大的发展空间。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）