基于全连接神经网络,以预测未来 5 个交易日收益 率为例,尝试以下 4 种较为基础的方式:
原始 5 日量价合成因子 RankIC 为 12.39%,5 日基本面因子合成因子 RankIC 为 7.32%,可见量价合成因子 的历史选股效果大幅优于基本面合成因子。若截面 ZSCORE 等权结合神经网络输出的量价合成因子与基本面合 成因子,得到的等权因子 RankIC 为 11.64%,年化多头超额为 21.37%,年化多空超为 104.91%,各个评价维度皆 低于原始量价合成因子。

等权因子效果较差的主要原因在于量价因子 RankIC 明显高于基本面因子,若将两者直接等权结合,则较难 战胜原始量价合成因子。因此接下来我们采用 ICIR 加权,尝试给予历史上量价因子更高的权重。 首先回溯历史上量价因子与基本面因子的 ICIR 走势(以过去 126 个交易日滚动计算),由图可见量价因子有 效性在 2016 年之前较高,但之后 ICIR 中枢下移,2023 年下半年开始 ICIR 继续走低降至历史低位。但基本面因 子 ICIR 历史上虽然整体不高,但其较为稳定,ICIR 中枢基本稳定在 1.0 左右,今年以来,基本面因子有效性持 续上升,且超越了 ICIR 下滑的量价因子。
在每个调仓时点,计算过去 126 个交易日量价合成因子与基本面合成因子的 ICIR,根据 ICIR 加权量价与基 本面因子,构建 ICIR 加权因子。ICIR 加权因子全区间 RankIC 与纯量价因子基本持平,多头超额收益略高于纯 量价因子,但多空超额收益低于纯量价因子。可见采用传统线性方式结合神经网络拟合的量价与基本面因子有其 局限性,较难战胜纯量价因子。
既然线性地结合量价与基本面因子较难起到 1+1>2 的效果,因此我们引入神经网络帮助我们进行非线性地 结合。仍然从最简单直观的方法入手,在输入端将 158 个量价因子和 38 个基本面因子拼接起来,形成总共 196 个特征的输入向量,然后输入到【128,64】全连接神经网络中,由神经网络决策输出量价与基本面的合成因子。 通过在输入层拼接量价因子和基本面因子,能够同时利用两种因子的信息。这种特征融合方式可以捕捉到最 基础的量价与基本面因子之间的相互关系,有助于提升模型的预测能力。
在输入层直接拼接量价与基本面因子的方法相较原始量价因子有一定增强,RankIC 均值提升 0.23pct,多头 超额收益提升 1.75pct,多空超额收益提升 4.38pct,同时波动与回撤均有下降。
更进阶一点,我们将量价合成因子和基本面合成因子拟合的过程,与量价基本面结合的过程放到一个网络中 统一进行学习。具体做法为,用【128,64】的全连接神经网络预训练 158 个量价因子,再用【32,16】的全连 接神经网络预训练 38 个基本面因子,拼接两者的隐藏层输出,再进行一次简单的线性加权,得到合成因子。这 个过程中,我们保证两个分支的网络结构与前文拟合量价基本面因子的网络结构相同,拼接后的线性层则类比前 文的等权或者 ICIR 加权,使得该网络与前文的网络结构具有可比性。 这种方式通过分支网络分别处理不同类型的特征,可以更好地针对每种特征的特性进行优化,每个分支可以 专注于特定类型的特征提取,提高特征提取的效果。相较于截面 ZSCORE 等权或者 ICIR 加权神经网络拟合后的 量价与基本面因子,这种方法将量价与基本面子因子到大类因子合成,以及量价与基本面大类因子之间的线性加 权结合放在一个网络中,进行端到端地训练,让模型自行学习子因子合成与大类因子加权的全过程。

分支网络合成因子 RankIC 为 12.9%,相较于原始量价因子提升 0.51pct,多头超额年化收益为 24.99%,提升 2.54pct,多空超额年化收益为 132.21%,提升 9.77pct,同时这几个维度也优于直接输入层拼接的合成因子。