2026年行业主题轮动研究报告:基于卷积神经网络的指数轮动策略

背景介绍

近年来,指数化投资理念愈发受到投资者认可,ETF产品凭借透明、低费率、交易便 捷等优势,成为居民资产配置的重要工具。 广发金工团队于2023年上半年发布《基于卷积神经网络的股价走势AI识别与分类》 专题研究报告,该策略后续同步应用于ETF轮动。样本外持续跟踪至今,测算结果显 示,基于卷积的ETF轮动策略于2025年实现了相对于Wind偏股混基金指数较明显的 超额收益。 当前的策略组合,采取周频调仓,每次持有5只ETF。ETF产品中,虽然有行业主题 类产品,但是部分相对冷门行业的覆盖度相对不足,且部分ETF的覆盖股票范围重合 度较高。Wind行业主题指数有相对较多的细分类型,截至2026年1月底,包括行业、 题材和热门概念类,合计有超1000只指数。 因此,本报告旨在对基于卷积神经网络的ETF轮动策略进行调整,以Wind行业主题 指数作为底层标的,测算基于Wind行业主题指数的轮动效果。

卷积神经网络因子逻辑

(一)标准化价量数据图表

为了能更好地使用卷积神经网络对价量数据图表与未来股价走势进行建模,本方法 对每个个股窗口期内的价量数据构建了标准化的图表。该图表包含了窗口期大小为 20日的价量数据,其由三部分组成: 1.图表的上部分由k线图和移动平均线构成,包含了开、高、低、收价格,以及若干 股价的移动平均线,如MA5、MA10等。 2.图表的中部分由当日对应的成交量构成。 3.图表的下部分由股价的MACD信息构成,其中短期和长期移动平均线的窗口期。 由此构成了信息丰富的标准化价量数据图表。标准化图表构建完毕后,全市场范围 内从2005年至2023年期间的图表数据量达115Gb,远超于同期以序列形式表达的价 量数据,后者数据量仅为2Gb不到。

(二)价量数据图表卷积神经网络

为了对标准化图表和股价未来走势进行建模,本方法构建了卷积神经网络。输入图 片经过卷积结构后得到了512x10x10的特征图,将其摊平后得到51200维度的特征后 送入一个全连接神经网络。模型的最终输出为3个概率,分别对应个股在未来截面日 上收益率的百分位,即后1/3、中1/3、前1/3,以表示跌、平、涨。最终以股票上涨 的概率作为因子进行选股。 在模型的实现细节上,采用Xavier 、 Adam化器等技术对模型进行训练;采用训练数 据外的验证集对训练中的模型进行验证,以确定最优早停(Early Stopping)时点。通过分别训练两个不同的模型,将包含过去20日价量数据的标准化图表,与未来5日、 20日的个股收益情况进行建模。在下文中,这以I{x}R{y}来表示,其中x为价量数据图 表的窗口大小,y为预测未来y日的收益情况,换仓周期与y保持一致。即I20R5表示 使用包含过去20日价量数据的标准化图表来预测未来5个交易日的收益情况。

(三)特征可视化

在完成卷积神经网络的训练后,标准化价量数据图表对模型进行输入,分别对模型 中的4个卷积神经网络结构的输出在特征维度随机抽取9张特征图进行可视化。 从特征可视化结果来看,卷积层1和卷积层2作为低维度特征提取器,其关注到了整 幅标准化价量数据图表中的信息,均同时涵盖了k线图、移动平均线、交易量以及 MACD信息。 而卷积层3和卷积层4作为高维度特征提取器,其对图表中代表不同信息的不同部位 的关注点开始发生分化,有的特征图重点捕捉k线图、移动平均线中的信息,而有的 特征图则重点捕捉交易量以及MACD中的信息。与此同时,也有的特征图关注到了 全局信息。 由此可见,训练后的卷积神经网络能对标准化的价量数据图表进行有效的特征提取, 识别出其中的价格以及交易量形态走势信息,从而与未来的股价走势进行建模,实 现对未来股价的预测。

Wind 行业主题指数信息

(一)基本信息

根据Wind,行业主题指数具体包括行业、题材、热门概念和主题指数4个细类,截至 2026年1月底,分别有250、550、181和65个细分指数类型。

Wind行业指数概况:根据Wind指数编制方案说明,Wind行业指数是Wind资讯根据 Wind行业分类划分中国A股证券市场的行业指数,能够代表中国证券市场各行业表 现。Wind行业指数根据行业划分分为4级,分别是“一级行业指数(行业类别指数)”、 “二级行业指数(行业组指数)”、“三级行业指数(行业指数)”、“四级行业指数(子 行业指数)”。Wind行业指数以流通股本作为权重根据派许加权方式进行计算。

题材:根据Wind指数编制方案说明,万得概念指数定位于跟踪市场热点投资机会, A股市场涉及产业主题、风格、地域、改革、规模、国资委、行业个股精选、机构持 仓、参控股、技术、陆股通、企业行为、政策、券商金股等不同类型的指数。 根据Wind指数编制方案说明,概念指数是具有共性受益逻辑的一系列股票的集合, 其成份样本通常包含一个或一个以上的行业的相关公司,并且二级市场上的股价具 有明显的联动性。 指数成份的维护遵循以下原则: 以主营相关性做为核心。评估上市公司的主营业务收入与指数的相关性,值高者优 先入选,该值30%以上定义为强相关。 以综合评分做为客观依据。根据指数的定义方式,会选用包括不限于总市值、动量、 主营收入、一致评级、成交额、行情相关性等指标进行综合分值计算,评分高者优先 入选,由主观分析进行最终样本确认。 选取代表性标的入选。基于综合评分会选取一定数量的代表性标的进入指数,通常不包含全部样本。

热门概念的编制方案和题材指数一致,主题指数隶属于Wind行业指数体系。

(二)对比 ETF

进一步对比Wind行业主题和ETF产品的数量分布情况,以观察可选标的差异。 对于ETF,以上市日期进行区分,统计ETF产品数量和跟踪指数的历史情况。根据 Wind,2020年以来,ETF产品的数量增长速度增加,截至2026年1月底,合计已有 超1200只权益类ETF,剔除重复类产品,即跟踪的指数合计有419种。

对于Wind行业主题类指数,截至2026年1月底,合计已有1046只指数,相比于ETF 跟踪的指数,数量相对较多。

Wind行业主题类指数,区分细分类型,题材类指数和热门概念类指数数量增长较明 显,行业指数数量相对固定。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告