1.1 传统择时策略的构建流程
当我们尝试使用量化的思路构建模型对资产进行择时,一般有两种方式: 1、 线性回归拟合。将资产的未来收益率作为因变量,并寻找有解释力度的基础指标作为 自变量,通过回归模型预测未来资产收益率或者涨跌方向。 2、 构建事件驱动模型。统计特定的事件发生时未来资产的涨跌情况,从中筛选出胜率高 的指标与相应事件,从而构建事件因子。这种方式能够更精准地捕捉特定情景下的有 效信号,且能更方便地融入其他信号构建多指标择时体系。因此,目前大多数情况下 我们都是使用事件化的方式来构建策略,辅助我们判断趋势。

通常我们会基于对数据的理解或图像走势的观察作为切入点,在历史区间上对大量信号进 行回测,从中筛选出较有效的一组信号来合成最终信号。这种方法一般都能构造出在测试 集上较有效的策略,但其实会存在以下问题: 1、 容易过拟合。以上步骤中,原始数据的处理、信号的构造与合成等各个步骤都会涉及 到参数寻优的工作,最终筛选出的信号普遍会面临过拟合的问题,在样本外信号快速 失效。 2、 稳健性较弱。通常策略是由优选出的少数几个指标组合而成,任意信号的择时能力变 化都可能导致最终策略效果出现调整;也无法保证新的择时信号能对策略带来整体提 升。 是否存在一种全自动化的择时框架,在确保生成信号的过程符合逻辑的前提下,尽可能降 低过拟合的可能性,同时极大程度简化挖掘有效信号的复杂度,并直接给到最终的择时策 略?
1.2 全自动择时框架结构介绍
我们的择时框架将在以下方面实现全自动优化: 1、 自动筛选有效指标。给定一组指标数据集与我们的择时对象,择时框架可以自动筛选 其中的有效指标,并寻找每个指标对应的最佳数据处理方式(同比、滤波等); 2、 自动构建事件化信号。针对单个指标,择时框架能够找到其最有效的事件化方式,充 分挖掘单指标的择时信息,需要结合不同的事件化方法,生成每个指标的对应信号; 3、 滚动更新有效指标。择时框架定期检验各细分信号有效性,及时调节各信号的权重或 对失效指标进行剔除;4、 智能合成多信号打分结果。在任意指标集内或跨指标集之间,能够基于细分信号构建 加权投票系统,得到最终择时结果。 实现以上效果后,我们的新框架将在以下方面具备一定优势: 1、 指标的处理、信号的构建规则更贴合主观判断逻辑,摒除数据挖掘; 2、 指标与信号筛选过程中严格使用历史数据,无未来函数问题,确保框架稳健性; 3、 全自动的指标优选,可以对未知数据集进行探索; 4、 择时框架对任意标的均适用,无需对模型进行特殊调整即可针对任何资产进行策略构 建。 接下来,我们详细介绍整个择时框架的细节。
从具体细节上,整个框架可大致分为 3 个部分。以下是整个框架的全流程介绍:
2.1 择时框架第一层:数据选择
本次项目中,我们主要使用指数自身量价、宏观、期权、融资融券与成分股的基本面、资 金流数据。
框架会结合后续基于长历史数据的回测表现,选择对原始数据进行滤波等处理的方法。
2.2 择时框架第二层:指标预处理+用法判断
第二层负责对指标进行初步判断与处理,并且此处理方式后续不再更改。为确保检验效果 稳健以及无未来函数,我们推荐使用较长期的历史数据进行第二层判断。本项目中使用 2020 年之前的全部数据进行第二层测试。 具体判断的项目包括:
1、 方向判断
我们首先需要判断该指标与预测资产之间是否是同向关系或反之。直接在指标层面进行方 向判断、而不是事件化之后判断每个信号的方向,主要原因在于我们认为指标层面的方向 更具可解释性与稳定性,后者可能出现同一指标的不同事件化信号方向不同的情况,同时 也可能面临数量不足、过度数据挖掘的问题。具体判断时: a) 偏短期、高频数据使用差分线性回归来判断,将预测资产价格差分作为因变量, 指标数据差分项作为自变量,构建单变量回归,若回归系数显著为负,则判断为反向指标。 在回归时,回归系数不显著的指标会保留,在后续格式变动后进行再次检验。 b) 偏长期、低频数据使用 DTW 配对点方法,从前往后进行峰谷点的匹配,若指标的 波谷与资产波峰之间距离相对更近,则判断为反向指标,反之指标波峰与资产波峰更接近, 判断为正向指标。
2、 数据格式变动
我们会对每个指标数据进行如下操作,并在测试集上观察指标与标的是否会有相关性的提 升。格式变动与上述方向判断同步进行。
具体判断时会考察两项显著性:相关性显著大于 0 且相关性显著大于原指标。
3、 滞后性剔除
判断资产价格在滞后多阶的情况下,与指标之间的双重差分相关性是否出现明显提升。若 相关性出现提升,表明当前指标实际体现的是资产过去的价格变动,以此构造的信号很可 能不具备预示作用,或存在明显的信号滞后问题,因此会被择时框架剔除;无明显滞后的 指标则保留。
通过第二层检验后,择时框架会固定每个指标的使用方式,且后续事件化步骤中不再变更。 接下来的事件化步骤涉及滚动更新机制,会定期对指标的事件化方法与权重进行调整,但 指标本身处理方式不会变动。进行这一约束是为了确保信号的连贯性,防止出现“上一期使用正向的 PMI-YOY 指标,当期改为观测反向的 PMI-RAW 指标”这类情况,提升指标的连 贯性,且能进一步降低数据挖掘的可能。因此,我们需要使用尽可能长的历史数据进行第 二层判断。
2.3 择时框架第三层:事件化处理
择时框架的第三层负责将指标转换为 0、1 构成的多空观点序列,并对信号进行聚合得到 单指标以及整个策略的最终信号结果。择时框架不会考虑单一事件化结果作为该指标的信 号,而是将不同事件化信号进行加权合成得到指标的最终信号。不同事件化处理能够捕捉 指标的不同特征,可以捕捉原始指标在不同时间跨度上的各类特征,进而挖掘出最有效的 指标使用方法。因此,第三层核心目的在于更新不同事件之间的权重。 第三层将以固定的频率运行,在期初确定各事件化的权重并保持到下次调整。本次项目中 使用的是年度频率。
3.1 择时框架效果测试——以中证 A500 指数为例
我们首先以中证 A500 为例,对各细分指标集进行回测检验。以上框架得到的信号依旧是 介于 0、1 之间的数值,因此我们按照以下规则映射到最终的仓位结果:若最终信号大于 0.5,认为指标集整体给出看多判断,全仓;否则为空仓。 回测区间为 2020 年 1 月至 2025 年 7 月,每年初进行事件权重以及指标权重的调整。手续 费设置万分之五。

基本各数据集都能获得超过中证 A500 指数的收益表现,其中基于基本面、宏观数据得到 的信号质量显著较好,区间内年化收益分别达到 8.21%和 8.02%,年化超额收益分别为 7.80% 和 7.45%。而在信号胜率方面,资金流指标表现较突出,看多胜率达到 61.11%。受限于回 测区间的指数表现跌多涨少,因此信号整体的持有天数不长。 在回测前,我们并不清楚每类指标的具体择时效果,自动化择时框架相当于帮助我们进行 了初步的探索。若我们对某指标集的具体情况感兴趣,择时框架也支持输出内部的详细信 息。以其中的宏观指标集为例,我们可以看到其中每一层的指标筛选结果与各细分信号权 重情况。 各细分信号权重相差不大,Softmax 加权可以略微修饰其中的差异,提升整体策略表现。
将各领域的细分信号进行合成,得到最终的合成策略。合成策略年化收益率 10.61%, Sharpe 比率 0.813,各项指标相对基础信号都有一定提升,且分年度来看也有一定的超额 收益。
3.2 各宽基指数上测试效果
我们进一步在各宽基指数上进行择时框架的测试,使用的数据集与中证 A500 保持一致, 观察其在各资产上的择时效果。 在沪深 300 指数上,最终的合成择时策略年化收益 7.67%,年化超额 8.09%。
在中证 500 指数上,合成择时策略年化收益 7.59%,年化超额 5.96%,但分年度来看,策 略对部分上涨区间的把握较弱,相对效果一般。
在中证 800 指数上,合成择时策略年化收益率 9.28%,年化超额收益率 9.26%。回测区间 上大部分时间均为看空信号。
在中证 1000 指数上,合成择时策略年化收益 15.89%,年化超额 14.61%,看多胜率达到 63.16%,择时策略的各项指标在各宽基指数中综合最好。

最后,在创业板指上,合成择时策略的年化收益达到 16.22%,年化超额收益 14.13%。
3.3 行业指数上的回测效果
我们同样在中信一级行业指数上进行择时框架的测试,使用统一的原始数据。
从结果上可以看出,我们统一使用的指标集在部分行业上能有较好的择时效果,但在其他 行业上并无法带来稳定的超额收益。这与各行业的特性有一定关系,部分行业涨跌更依赖 于特定的指标,或走势相对稳定,因此统一的数据集无法起到稳定有效的判断效果,需要 添加有针对性的指标集并对无效的指标集进行整体剔除,才能提升最终择时效果。
本次报告提出了一种全自动化的择时策略生成框架,底层基于事件驱动思路生成信号。该框架可以在任意指标集的基础上挖掘出其中有效的信号,并构建对任意标的资产的择时信 号。整个构建流程中尽量控制了数据挖掘的可能,采用滚动更新的机制避免过拟合情况发 生;确保流程符合逻辑性、可解释性等要求,能输出流程中所有的中间信息;框架也具有 较好的泛化性,无需调整即可对不同标的进行测试,也因此计算速度较快;除了直接构建 策略外,该择时框架也可以帮助我们初步探索未知的数据集,寻找其中具有择时价值的指 标与事件。 我们在各宽基指数与行业指数上进行了回测测试,指标集选择了指数自身量价、宏观、期 权、融资融券与成分股的基本面、资金流数据。以中证 A500 指数为例,各数据集都能获 得超过中证 A500 指数的收益表现,其中基于基本面、宏观数据得到的信号质量显著较好, 区间内年化收益分别达到 8.21%和 8.02%,年化超额收益分别为 7.80%和 7.45%。而在信号 胜率方面,资金流指标表现较突出,看多胜率达到 61.11%。最终合成择时策略年化收益 率 10.61%,Sharpe 比率 0.813,各项指标相对基础信号都有一定提升。在其他宽基上, 也均有较明显的超额收益表现。而在行业指数上,各行业的择时策略表现各有优劣,主要 原因在于部分行业的涨跌更依赖于特定的数据指标,因此统一的数据集无法起到稳定有效 的判断效果,需要添加有针对性的指标集并对无效的指标集进行整体剔除,才能提升最终 择时效果。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)