2026年大模型赋能投研之十九：主观投资框架验证与个股决策Agent

国金证券2026/03/12
举报

大模型 Agent 重塑主动投研体系

1.1 赋能主动权益：动态捕捉行业核心逻辑

近期 OpenClaw 的走红引发了主动投研领域的思考：如何驱动 AI 跨越简单的信息归纳，实现模拟人类专家的深度推理？其核心目标在于引导模型穿透表象数据，触达行业的底层逻辑与驱动因素，从而生成具备实战决策深度的投资洞见。在此前的《大模型赋能投研之十三：基于海外投资大师智能体构建 A 股挖票框架》中，我们模拟已知的数位海外投资大师的投资逻辑，通过定量指标计算与大模型定性分析判断，生成股票投资诊断结果与交易信号，构造了全 A 市场下的选股 Agent。而在当前的 A 股市场环境下，行业轮动速度显著加快，新兴概念与细分赛道层出不穷。尽管通用的研究范式仍具基础价值，但把握一个行业特质性的投资选股逻辑已经成为获取结构性超额收益的关键。同时，在实际应用的过程中，传统的投研模式正面临着“覆盖广度”与“响应速度”的双重挑战。一方面，个人分析师的精力有限，难以对热点行业的数百只个股及快速涌现的新兴赛道（如卫星、脑机接口、AI 应用等）进行实时、深度的逻辑覆盖；另一方面，传统的量化多因子模型虽然擅长处理结构化数据（如价量、财务指标），但在处理研报、纪要等非结构化文本时，往往局限于情感打分或关键词提取，难以真正理解文本背后复杂的 “因果推演逻辑”。这种“信息-逻辑”的缺口导致了一个核心矛盾：市场定价的核心矛盾往往隐藏在复杂的产业链传导逻辑中，而传统的量化手段难以捕捉这种主观逻辑链条。尤其是在 DeepSeek-R1 等推理类大模型出现之前，AI 模型更倾向于“概率性生成”而非“逻辑性推理”，导致输出的投资建议往往缺乏严密的推导过程和纠错能力，难以直接应用于严肃的投资决策。本篇，我们设计的投研框架提取流程有三个主要特点：1、对非结构化的文本数据做了仔细的时序处理，每个时点生成的投研框架仅包含过去数据，屏蔽未来信息；2、将大模型的提取及加工过程可视化，并且可以人为参与框架的定制，以达到加强框架有效性的目的。 3、通过接入公开市场数据对框架有效性进行验证，动态捕捉行业核心逻辑。因此，我们在实现 Agent 自动化提取并时序跟踪行业分析师的投研逻辑的同时，通过设计投资逻辑单链回测机制，动态捕捉行业定价最核心的逻辑，试图启发投资人捕捉市场未被覆盖的 alpha 机会，也为投资决策提供差异化的逻辑补充，以此赋能主动权益。

1.2 增强量化策略效能：向细分特殊化 Beta 方向演进

投研思维链的自动化提取与转化是大模型对量化策略的深度赋能。它不仅极大地丰富了量化库的维度——使其从单一的“因子驱动”转向“逻辑驱动”，更深刻地改变了主动投资与量化投资的范式。量化交易正从单纯的“指标刻画市场”，进化为对“深层逻辑”的语义理解与系统执行。更具体地，在传统的量化指增产品中，核心目标往往是在严格约束行业与风格敞口的前提下挖掘纯粹的选股 Alpha。然而，随着量化赛道拥挤度的提升，基于量价与传统基本面的 Alpha 因子出现显著的收益衰减与周期性失效。2024 年以来，A 股市场的结构性分化加剧。 Wind 数据显示，申万一级行业间的年度收益极差于 2025 年显著扩大，细分概念（如商业航天、AI 应用等）的轮动速度逐渐以周为单位。

在此背景下，部分主动量化策略正逐步向“细分特殊化 Beta”方向演进，通过将行业分析师的深度逻辑引入量化模型，构建基于产业链逻辑而非单纯统计规律的风格暴露，在挖掘到近期有效的投资逻辑后，在已有量化模型中加入主动逻辑。

1.3 推理类模型已成主流，COT 成为提升输出质量的核心

2024 年底至 2025 年，以 DeepSeek-R1、OpenAI o1 为代表的推理类模型（Reasoning Models）迅速崛起。数据显示，在短短一年内，推理类模型在总 Token 消耗中的占比已飙升至 60% 以上。

这一变革的核心在于思维链（Chain of Thought, CoT）技术的成熟。不同于传统模型直接给出预测结果，CoT 技术赋予了模型“慢思考”的能力，它通过增加推理步骤，赋予了模型更严密的逻辑链条和纠错能力，使得模型在处理复杂金融分析和逻辑推演时，结果的准确性与深度得到了阶跃式提升。目前，CoT 已成为提升输出质量的核心驱动力。我们将其作为实现行业核心逻辑提取更新与框架整合的重要介质，设计了全新的工作流。

主观投资框架提取工作流

本报告选取医药生物（一级行业）作为典型案例，旨在全流程展示 AI Agent 的逻辑提取能力与策略实战效果。底层数据源于卖方研报这一公开的分析师投研智慧精华，我们通过构建自动化框架，深度穿透分析师的历史投资逻辑，并对其进行特色的量化验证，最终提

炼出在时间序列上最具实效性的核心投资逻辑链。在后续的实践中，我们将推动 Agent 向二级行业及更微观的子赛道深度下沉, 使投研逻辑不仅停留在行业通识层面，更能精准映射到具体赛道的价值挖掘中。

2.1 工作流设计及主观投资思维链提取

所有研报内容将在研报筛选器中进行特定行业（≥一级）分类以及多维度质量加权（研报长度、权威分析师团队等）的筛选；随后进入思维链组处理器进行投资逻辑链组的生成、合并及更新，得到半年频的行业投研全思维链组的时间序列。在第一层的全思维链组时间序列的基础上，我们加入全部研报信息及新闻数据，得到每组思维链单独滚动回测的全部结果，将其作为输入一起进入投研框架生成器，总结得到完整性、可读性强的同时具有侧重的完整行业投研框架；此外，我们依据框架设计个股投研顾问，形成对个股走势具有判断力和思考力的 AI Agent。全流程所使用的大模型均视计算复杂程度调用 deepseek-r1 及 deepseek-distill-32b（量化版）。

具体地，在思维链组处理器中，我们先设计提示词进行基础的月度投研思维链生成，要求大模型通过识别核心驱动因素、明确由驱动因素到结论的传导路径、验证逻辑链条的严密性并进行环节补充，到最终得出信号强度打分的思考过程，总结出不少于 15 条投资推理链条。随后在时序处理上，将 2015-2016 作为链组基年，思维链组经历了从月度-半年度截面的思维链合并补缺，以及前后半年频链组的迭代更新，确保在每个单位截面上更新的思维链组包含了该时点及之前的所有研报信息（根据信号强度做自适应信号衰减），同时避免未来信息。

根据我们的设计，在投研思维链处理的全过程当中，每条思维链都由固定的三个部分组成：驱动因素（trigger）作为整条推理逻辑的起点，在思维链生成、合并识别与更新判断中起到标志物的作用；COT（链条推理）则负责将驱动因素逐步推导到投资结论的终点（通常为提升长期估值/支撑股价上行等），在每条投研思维链生成的过程中我们尽量保证了推理环节的数量，以便于在思维链组更新的过程中，合并完善相似逻辑、并补缺新逻辑；信号强度（signal）主要用于在思维链更新补缺的过程中，抛弃掉一些信号已经过弱的旧逻辑，以免链组过长或有效性降低。目前，所测一级行业思维链组的容量范围能够稳定在 15 至 20 条，每条思维链的驱动因素识别、合并总结准确，且推理环节充分、逻辑质量较高。

2.2 主观投资思维链验证

在两层工作流之间，我们加入滚动半年频单链回测机制，试图实时筛选出当下最有效的优质投研逻辑进行展示并应用于选股，同时假设投资逻辑动量存在，将其应用于下个半年的个股判断。考虑到研报信息通常较为滞后，仅依据时点研报信息作为个股分析依据时效性较弱。因此在后续的单链测试及选股策略上，我们进一步加入了实时新闻信息，每条思维链会对每个截面上每只个股的汇总信息（研报+新闻）进行符合程度的判断，进而形成持仓决定、生成测试结果。单链测试机制上，我们在相应时序上对每只个股的月度信息进行每条单链符合程度的判断（不符合/较符合/完全符合）及置信程度（0%-100%）打分，根据阈值筛选得到时序上每条单链的符合个股持仓（0-12 只），得到相对于基准（医药全指）的年化超额收益率、跟踪误差、信息比率等结果。半年频的测试结果往往波动较大但切换灵活，适用于选股策略的构建；而年频的测试结果则更加稳定，用于作为最终投研框架生成的输入部分之一。

可见在同一时间截面上，即使由大模型判断文字信号强度达标，但在实际选股过程中，不同思维链展现出截然不同的选股效果。而在不同时间截面上，同一/相近投资思维链也面临短暂/永久失效的风险，因此单一思维链难以给出稳定的有效信号。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）