2025年金融工程研究：“逐鹿”Alpha专题报告，多智能体投资决策框架

中信建投证券2025/06/26
举报

一、简介

本文主要介绍一个基于多智能体（Multi-Agent）系统的投资决策框架。该框架通过高度模拟化的方式，构建了一个由分析师、投资经理和风控官组成的 AI 智能体团队，旨在应对现代金融市场日益增长的复杂性、数据冗余及高频变化。该框架的核心优势体现在其精密的角色分工、多维度的分析视角、风格化的策略生成、以及独立的闭环风险监控机制上。整个系统由一个中央工作流编排器（Orchestrator）进行高效驱动，实现了从多模态数据输入、并行深度分析、多元策略整合、到最终风险审核的自动化无缝衔接。在数据层面，我们不仅采用了传统的新闻，研报，技术指标等文本数据，还融入了 K 线图，公司财务报告 PDF 等多模态数据，提供了更加全面且丰富的信息。技术架构上，该框架采用异步并发处理，显著提升了分析效率；其模块化的设计和可动态配置的大语言模型（LLM）接口，则赋予了系统极高的灵活性和可扩展性。我们认为，这种高度结构化、自动化和智能化的多智能体系统，不仅是对传统投资研究方法的颠覆性升级，更代表了未来资产管理领域技术演进的核心方向。它能够在提升 Alpha 收益、降低运营成本和强化风险控制三个层面为投资机构创造显著的商业价值。

二、相关工作

在之前的系列报告《“逐鹿”Alpha 专题报告（二十）——基于数亿新闻上下文的本地 RAG系统用于市场择时及行业轮动》《“逐鹿”Alpha 专题报告（二十一）——基于新闻、研报、财务、技术指标的大模型个股分析框架初探》《“逐鹿”Alpha 专题报告（二十五）——DeepSeek+RAG 行业轮动策略》我们曾经介绍过如何使用单一智能体结合各类信息对金融市场进行分析。虽然单一智能体能够对资产进行分析并提供有价值的见解，但在实际应用中，单一智能体在处理多元数据时，可能会因为信息过载、模型偏差或数据维度不足而难以达到最优的分析效果。为了进一步提升市场分析和预测的准确性和鲁棒性，我们考虑引入多智能体系统（Multi-Agent System, MAS）来协同处理复杂的金融市场数据。关于多智能体在金融领域的应用，目前的研究和实践已经取得了显著进展。多智能体系统通过多个智能体的协同合作，能够更高效地处理复杂多变的金融市场数据，克服单一智能体的局限性。在论文[1]中，作者提出了一种新颖的多智能体协作系统，旨在增强金融投资研究中的决策能力。该系统引入了可配置大小的智能体组和协作结构，以利用不同智能体组的优势。通过使用次优组合策略，系统能够动态适应不同的市场条件和投资场景，优化不同任务的性能。研究重点关注基本面、市场情绪和风险分析三个子任务，分析了 2023 年道琼斯指数中 30 家公司的 SEC 10-K 表格。研究结果表明，多智能体协作系统在复杂金融环境中比传统单智能体模型具有更高的准确性、效率和适应性。

在论文[2]中探讨了多智能体系统（MAS）在协作投资策略设计中的应用。MAS 由自主和协作的智能体组成，提供了解决现代金融决策复杂性的转型框架。MAS 能够实现去中心化、自适应和高效的智能体协作，模拟人类投资团队的综合决策过程。这些系统集成了先进的算法，如强化学习和分布式优化，通过利用多样化的数据源和适应不断变化的市场条件来增强投资策略。文章讨论了 MAS 在投资组合管理、交易策略优化和风险评估方面的应用，并强调了其在促进透明度、效率和可扩展性方面的潜力。论文[3]介绍了一种创新的多智能体系统 HedgeAgents，旨在通过“对冲”策略增强系统稳健性。在该平衡系统中，设计了一系列对冲智能体，包括一个中央基金经理和多个专门从事不同金融资产类别的对冲专家。这些智能体利用大语言模型（LLM）的认知能力进行决策，并通过三种类型的会议进行协调。由于 LLM 的强大理解能力，HedgeAgents 在三年内实现了较高的总回报率。

TradingAgents[4]通过多个由大型语言模型（LLM）驱动的智能体，模拟专业交易公司的运作流程。这些智能体具有不同的角色和职责，包括基本面分析师、情绪分析师、技术分析师、交易员、研究员和风险管理团队。通过结构化的沟通和辩论，这些智能体协同工作，优化交易策略。

三、多智能体投资决策框架

结合相关的工作，本文我们构建了一个模拟真实投研团队的、自成体系的多智能体框架。该投资决策框架的设计理念源于对真实投资公司运作模式的深度抽象。输入的数据包括 K 线图像，技术指标，新闻文本，财务报告 PDF，研究报告等多模态数据，系统的核心由三大层次、共计八种类型的 AI 智能体构成，并通过一个中央工作流编排器 (orchestrator) 进行统一的生命周期管理和任务调度。

3.1 多模态数据

与真实研究相同，在进行金融分析时，我们采用全面的多模态数据。包括 K 线图像，技术指标，新闻文本，上市公司财务报告以及券商分析师研究报告。每一类数据均由对应的专业分析师进行分析。其中 K 线图采用近一年的行情数据生成，同时在 K 线图中加入均线，成交量，布林带，MACD 以及 KDJ 等信息，便于 AI 进行全面的分析。

对于技术指标，我们利用 TA-LIB 计算常见的 MA,MACD,KDJ,RSI,BOLL,VOL,BIAS 等指标，将其整合成一段文本输入给 LLM。财务报告我们直接从上交所以及新闻数据与研报数据与之前类似，对新闻数据我们采用向量数据库进行处理以及存储，便于高效的语义检索。研报数据来自公开的研报摘要信息，对其进行整合。最后我们通过巨潮网下载公司历史的财务报告，以上便是我们分析的数据基础。

3.2 分析师智能体

分析层是整个决策流程的基石，负责将庞杂的原始数据转化为结构化的、富有洞察的分析观点。本文中我们构建了四类智能体：技术分析师，新闻分析师，基本面分析师以及研报分析师，分别处理 K 线和技术指标，新闻文本，财务报告以及券商研究报告。

3.2.1 技术分析师

技术分析师运用经典的量价分析理论，用以识别图表形态（如头肩顶/底、双重顶/底），并解读关键技术指标。为了能够同时处理 K 线图以及技术指标的文本信息，需要使用多模态大模型，目前常用的多模态大模型包括 GPT-4o，Gemini-2.5 系列，Claude 系列，QW EN-VL/QW EN-QVQ 系列等。这里我们采用 QW EN-VL-MAX 进行分析。通义千问 VL-Max（qwen-vl-max），即通义千问超大规模视觉语言模型。相比增强版，再次提升视觉推理能力和指令遵循能力，提供更高的视觉感知和认知水平。在更多复杂任务上提供最佳的性能。图片信息可以通过图像 URL 或者本地文件的方式传入 API 中，传入本地图像时，如果采用 OpenAI SDK 或 HTTP 方式时，需要将本地文件编码为 Base64 格式后再传入；使用阿里的 DashScope SDK 时，直接传入本地文件的路径即可。

结合 K 线图像以及技术指标，智能体能够从中提取人类分析师关注的视觉模式以及关键的形态信息，生成一份包含趋势判断、关键价位、指标解读和成交量分析的核心观点。

3.2.2 新闻分析师

新闻分析师扮演着舆情监控专家的角色。它通过情绪分析，量化市场对特定公司的看法是积极、消极还是中性，并能识别和提取可能驱动股价的关键事件，如并购重组、高管变动、新品发布等。新闻分析师智能体采用 Deepseek-chat 即 deepseek-v3 模型，Deepseek-v3 是一个混合专家（MoE）语言模型，具有总计 6710 亿个参数，每个 token 激活 370 亿个参数。该模型在 14.8 万亿个多样且高质量的 tokens 上进行了预训练，并通过监督微调和强化学习阶段进一步优化。利用上市公司最新的新闻数据，新闻分析师最终输出一份关于当前个股情绪、关键舆情催化剂和潜在公关风险的摘要。

3.2.3 基本面分析师

基本面分析师专注于挖掘公司的内在价值。其分析核心围绕上市公司的财务报告展开。原始的上市公司公告为 PDF 文件，利用大模型分析 PDF 文档时，通常有两种方案，一是使用专门的 PDF 解析库，从 PDF 中提取文本内容。这些库可以处理文本层，并尝试保持原始文档的结构。再将文本内容交由大模型进行分析。但是此方法提取出的文本可能包含格式错误、多余的空格、页眉页脚、页码、不完整的句子，表格数据提取错误，无法分析图片内容，以及无法理解文档布局等缺陷。另外一种方式是采用多模态大模型，多模态模型可以直接“看到”PDF 中的图片、图表、表格布局等视觉元素并从中提取信息，同时也能理解 PDF 的页面布局，例如识别标题、段落、列表、表格的位置和关系，这对于结构化信息提取至关重要。其缺点在于处理信息过多时容易出现幻觉，对模型能力要求较高。本文我们采用 Gemini-2.5-Flash 直接处理 PDF 文档数据，Gemini-2.5-Flash 是 Google 推出的最新高效、低成本且具备强大推理能力的 AI 模型。支持 100 万个 token 的上下文窗口，最高支持 1000 页长文档输入，并且支持支持原生多模态输入，对于 PDF 文件，Gemini 能够直接理解文档中的文本和图片内容。 Gemini API 支持本地文档或者 URL 输入，采用本地文档输入时，将文档路径填入 API 参数中即可。

利用上市公司的财务报告，智能体最终生成一份关于公司财务状况、竞争优势、成长潜力和估值水平的深度观点。

3.2.4 研报分析师

研报分析师通过分析总结来自券商的研究报告，来把握市场对于公司的整体预期。研报分析师采用 GPT-4.1，GPT-4.1 在各个方面都优于 GPT-4o，尤其在编程和指令理解方面有显著提升。而且 GPT-4.1 还支持更大的上下文窗口：100 万个 token，并具备更强的长文本理解能力。利用最新的公司研究报告，研报分析师综合提炼研报中的主流观点、关键分歧点以及盈利预测的变动趋势。生成一份详尽的分析报告。

3.3 基金经理智能体

决策层由三类代表不同投资哲学的基金经理智能体组成。它们是分析结果的"消费者"和投资策略的"生产者 "，负责将所有分析师们提供的研究观点加工成具体的、可执行的投资建议。本文中我们构建了三类基金经理智能体：成长型基金经理，价值型基金经理以及量化基金经理。

3.3.1 价值型基金经理

价值型基金经理偏好具有稳定盈利历史、强大品牌护城河、低负债和持续分红能力的成熟企业。它会重点采纳基本面分析师的低估值信号，并对新闻分析师报告的短期负面情绪持审慎态度，认为这可能是买入良机。其核心是寻找价格显著低于其内在价值的优质公司，即寻找具备足够"安全边际"的投资标的。价值型基金经理智能体在 Gemini-2.5-Flash 模型的基础上，融合了 4 个分析师智能体的研究观点，最终给出投资建议。

3.3.2 成长型基金经理

成长型基金经理高度关注新兴行业和技术创新。它会优先采纳基本面分析师关于高增长率的结论，并积极寻找新闻分析师报告中能验证其成长逻辑的催化剂（如市场份额扩大、新产品成功等）。对于技术分析师的短期回调信号，它可能视为增持机会。专注于投资那些处于高速发展阶段、营收和利润增长迅猛的公司。成长型基金经理在 Qwen-plus 模型的基础上，融合了 4 个分析师智能体的研究观点，最终给出投资建议。

3.3.3 量化基金经理

量化基金经理以量化策略为投资依据，它对技术分析师和市场数据的依赖性最强。可能会忽略分析师的主观观点，是一个纯粹的数据驱动决策者。它不关心公司的故事或质地，只相信模型和数据。量化基金经理采用 Deepseek-chat 模型，融合了 4 个分析师智能体的研究观点，最终给出投资建议。

3.4 风控智能体

风控层是整个系统的"首席风险官"和"合规官"，由一位独立的"风控官"智能体担当，为整个自动化流程提供至关重要的安全保障。风控官会对投资建议进行全面的风险分析，包括市场风险，流动性风险，信用风险以及操作风险。风控智能体基于 GPT-4.1 实现，确保了系统的决策不仅追求高收益，更是在一个纪律严明、风险可控的框架内运行，有效防止了自动化系统可能出现的极端行为。

3.5 工作流编排器

上述投资决策智能体框架采用模块化的设计理念，所有模块的运行由中央工作流编排器负责调度。通过此工作流编排器，不仅能够实现通用的投资分析过程，也能够根据具体需求进行调整，例如增加智能体（宏观/行业分析师智能体，消费基金经理），调整大模型类型等等，只需在工作流编排器中配置相应的 config 文件即可。使得系统具备较好的维护性以及扩展性。将所有智能体的观点进行综合整理，系统会生成一份完整的投资分析报告，包含 Json/markdown/word/pdf 等多类型格式输出，便于不同场景下的应用。

在多智能体分析报告中，不仅罗列了每个智能体的主观观点，还包含置信度，趋势预测，支持位，阻力位，情感分析，影响度，预测区间，市场反应，信用度，操作建议，目标价，建议仓位，风险等级等量化指标，可以用于量化分析策略。

四、总结与展望

本文构建了一个包含分析师，基金经理，风控官的全流程，多智能体投资决策框架，它通过模拟一个高效、理性且纪律严明的投研组织，通过分析 K 线图像，技术指标，新闻文本，财务报告 PDF，研究报告等多模态信息，生成投资建议，为投资决策提供了强大的技术支持。通过此框架，能够快速生成全面的投资分析报告，结果不仅包含不同类型智能体的研究观点，还包含了多种类型的量化指标。未来展望与挑战: 智能体进化: 未来可以引入更多专业角色，如宏观策略分析师（负责分析利率、通胀等）、行业分析师、甚至 ESG分析师，使决策依据更加全面。人机协同: 探索人类专家与智能体团队的最佳协作模式。人类专家的经验和直觉，可以作为顶层策略指导或在关键决策点上进行干预。持续学习与适应: 理想的系统应该能够从历史决策的成败中学习，动态调整其模型和策略，以适应不断变化的市场风格。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）