2025年金融机构应用DeepSeek指南与案例

国金证券2025/03/14
举报

一、 DeepSeek-R1 模型重磅发布，金融机构纷纷布局

1.1 DeepSeek 产品不断丰富，推动技术革新

深度求索公司（DeepSeek）成立于 2023 年 7 月 17 日，是一家专注于开发先进大语言模型及相关技术的创新型科技公司，为知名量化私募巨头幻方的分公司。幻方量化当前为国内少数几家拥有超万卡集群算力的公司。DeepSeek 自成立以来专注于大模型的迭代研发，坚持技术创新路线，致力于为各行业提供智能化解决方案，并推动 AI 技术在各个领域的应用。 DeepSeek 自成立以来，模型已迭代了多个版本，产品体系逐渐丰富。2024 年 1 月，公司发布首个大模型 DeepSeek LLM，随后又推出了 V2、V2.5,、R1 Lite 和 V3 等多个版本。下图展示了 DeepSeek 模型各版本的情况，涵盖了从初版 DeepSeek-V1 到最新的 DeepSeek-R1 版本。每个版本在不同的领域和任务中展现了独特优势和性能优势。下表时间线展示了模型在训练成本、推理能力和多模态等多个维度上的持续迭代与提升过程。

1.2 DeepSeek 热度飙升，影响力持续扩大

目前，DeepSeek 最新的模型版本为 DeepSeek-R1，该模型于 2025 年 1 月 20 日正式发布。相较于前代版本，其推理能力大幅度提升，并在数学、代码和自然语言推理任务上达到了可比肩 OpenAI o1 正式版的水平。其核心技术特点包括强化学习优化推理能力、开源生态、高效成本控制以及长上下文窗口支持等，以提升复杂推理任务的精准度。同时，该模型及其衍生版本 DeepSeek-R1-Zero 完全开源，并采用 MIT License 允许用户使用模型输出训练新模型。此外，DeepSeek-R1 在训练过程中仅消耗 280 万 GPU 计算时长，远低于 GPT-4 训练所需的 3080 万 GPU 计算时长，整体训练成本仅为 557.6 万美元。模型支持 64K 的长上下文窗口，尽管低于 OpenAI o1 的 200K 上下文窗口，但足以满足大多数任务需求。

自 DeepSeek APP 上线以来，仅 20 天便突破 2000 万日活，1 月 26 日一举登上苹果 App Store 全球下载榜榜首，展现了惊人的用户增长势能。在 2025 年 1 月，DeepSeek 超越 ChatGPT，成功登顶美国区应用商店下载榜，进一步确立了其在全球市场的领先地位。此外，英伟达、微软、亚马逊 AWS 等国际科技巨头正在将 DeepSeek 纳入核心技术架构。

1.3 金融机构纷纷部署，赋能智能化转型

截至 2025 年 2 月，已有多家金融机构完成 DeepSeek 的本地化部署工作，其中包括中信建投、国泰君安、国金证券、兴业证券、北京银行、江苏银行、汇添富基金、富国基金、博时基金、新华保险、九方智投等多家知名金融机构。从具体应用场景看，券商、基金等金融机构主要将 DeepSeek 模型应用于投研投顾服务、产品推广、风险控制、客户支持及投资者教育等关键业务领域。而银行则主要出于安全合规等因素的考量，多将该模型用于内部流程效率优化。

二、大模型发展历程：技术迭代、规模升级与开源崛起

21 世纪初以来，人工智能在自然语言处理（NLP）领域经历了从基础探索到多模态智能的跨越式发展。深度学习作为核心驱动力，推动关键技术不断迭代突破，逐步构建出现代大模型的技术生态。

2.1 1999 年：第一款 GPU 横空出世

在 1999 年首款 GPU（Nvidia GeForce 256）问世之前，大语言模型完全依赖 CPU 进行推理。然而，CPU 在处理大型文本数据和复杂计算任务时面临着效率有限、高计算成本等诸多问题。GPU 凭借其强大的并行计算能力，显著提升了任务处理效率，推动了机器翻译和文本生成等领域的重大进展，在人工智能发展历史中起到了非常重要的作用。

2.2 2006 年：逐层无监督预训练显著提升性能

2006 年以前神经网络的训练以监督学习为主，算法上强调通过少量数据获得较强的性能，在算力上较为匮乏，而且由于性能有限，难以处理复杂任务。2006 年，Geoffrey Hinton 创造性提出了逐层无监督训练，在算法上缓解了梯度消失问题。此外，GPU 加速神经网络的方法也被提出，模型应用场景也逐渐丰富，比如无人驾驶、语音识别等。但是深度模型的性能并没有显著提升，真正的大规模突破还需要进一步的技术积累与优化。

2.3 2013 年： Word2Vec 模型带来的技术突破

2013 年，Tomas Mikolov 团队提出了从大规模数据集中学习高质量词向量的 Word2Vec 技术。Word2Vec 采用了连续词袋（CBOW）和跳字模型（Skip-gram）这两种模型架构可以捕捉到词语之间的细微语义和语法关系，比如词语类比、同义词检测、句法结构学习等。 Word2Vec 被广泛用于机器翻译、情感分析、信息检索和语音识别等领域。

2.4 2014 年: GANs 的诞生，生成式模型的重要里程碑

生成式对抗网络（GANs）由 Goodfellow 等人在 2014 年首次提出，是生成式模型的重要里程碑。模型的核心在于通过生成器和判别器的对抗博弈实现数据质量提升，推动了无监督学习的发展。GANs 可以生成高保真图像和文本，且对传统的标注数据较少。尽管面临模式崩溃和数据不稳定等问题，后续的优化模型 DCGAN、WGAN 和 WGAN-GP 等有效提升了生成效果和训练稳定性，推动了生成式模型在多个领域的广泛应用。

2.5 2017 年：Transformer 模型开启大模型时代

2017 年，Google 提出的 Transformer 替代了 RNN 和 CNN 的序列建模方式开启了大模型时代。此架构采用通过多头注意力机制和位置编码，实现了更高效的并行训练。在 Transformer 架构问世一年后，基于无监督学习的 BERT、GPT-1 大规模语言模型相继问世，并提出了沿用至今的自回归、MLM、NSP 等无监督学习方法。在实际应用上，BERT 更擅长于深度理解、文本推断等任务，而 GPT-1 更侧重于文本对话生成方面。

2.6 2020 年：规模即能力，GPT-3 的问世

2020 年 5 月，OpenAI 发布了 GPT-3，这是一个包含了 1750 亿参数的大型自回归语言模型，规模的大幅提升使其可以捕捉到复杂的语言特征知识，拥有更强的语言理解和生成能力。GPT-3 关键技术亮点为少样本学习（Few-shot Learning）能力，由于在预训练过程中学习了大量的知识，无需在特定任务上进行微调或梯度更新，仅提供少量的示例和上下文信息即可理解并执行自然语言任务，如机器翻译、问题回答、文本生成等。

2.7 ChatGPT 发布，智能对话的平民化

2022 年，ChatGPT 在原有的 GPT 模型框架上，引入了人类反馈强化学习（RLHF）算法，通过人工标注数据优化了对话的流畅性与安全性。相较于以往的对话系统，ChatGPT 支持多轮对话上下文记忆，使其可以更加自然和连贯的交流。此外，ChatGPT 在生成内容时也更加注重符合人类的价值观，特别是对于敏感话题的拒绝回答，保证了更高的安全性。随后，行业进入大模型快速迭代期，Claude、LLaMA、ChatGPT-4o、o1 等模型相继推出，激烈的竞争推动了大语言模型的快速发展与创新。

2.8 DeepSeek-R1 发布，金融行业 AI 赋能正式启航

2025 年春节前，深度求索公司先后发布了 DeepSeek-V3 和 DeepSeek-R1 模型，并迅速爆火。DeepSeek 大模型可以广泛应用于金融各个业务领域，赋能投研、投顾、风控、合规、运营、员工助手等多个场景，助力行业智能化升级，为金融机构提供更智能、更精准、更合规的 AI 解决方案。金融机构需要处理海量的结构化和非结构化数据，包括市场行情、财务报表、新闻资讯、投研报告、客户交易记录等。这些数据不仅具有高时效性，还涉及跨模态的信息融合，要求模型具备精准的推理能力、强大的数据适配能力以及高效的计算性能。因此，除了高性能、低成本、对开发者友好以外，DeepSeek 的优势还在于以下几个方面：

精准推理，加速复杂任务处理速度

在模型架构上，DeepSeek-R1 结合了多头潜在注意力（MLA）、混合专家（MoE）以及多 Token 并行预测（MTP）三大模块，形成了同时具备超大模型容量和高训练效率并行的 Transformer 变体，可以在长序列和复杂演绎中保持性能不衰减，减少冗余计算，提升推理效率和深度逻辑能力。

领域适配，满足垂直化领域定制化需求

DeepSeek-R1 在训练时包括了两个监督微调阶段。模型通过学习标注数据来调整模型，以在特定任务上表现得更精准。 DeepSeek-R1 采用监督微调（SFT）和直接偏好优化（DPO）的训练流程，大大提升了模型在特定任务上的表现，增强了领域适配能力。首先，模型通过第一阶段 SFT 对高质量标注数据进行微调，使其在基础任务上表现更精准。在第二阶段 SFT 训练中，模型进一步针对复杂场景进行优化，以提升对多样化任务的适应能力。最终，模型通过 DPO 训练，利用对比学习策略筛选出更符合用户偏好的答案，提升生成质量和可控性。这种训练方式不仅增强了模型的泛化能力，还让其在金融、法律等垂直领域的定制化任务中具备更强的适应性和精准度。

多模态协同，提升数据处理和分析效率

DeepSeek-R1 支持文本、表格、时序的联合建模，并能提供数据处理框架，降低开发门槛。DeepSeek-R1 的多模态模型能够同时处理和理解视觉与文本数据，此外，DeepSeekR1 的多模态训练不仅在视觉理解任务上表现优异，还在文本模态任务上有所提升，如在 ARC-Challenge（5-shot）测试中，DeepSeek-R1 的成绩从单模态的 21.4 提升到了多模态的 40.5，显示出模态穿透对模型推理能力的增强效果。

DeepSeek 团队还提出了支持多模态输入输出的 Align-Anything 框架，致力于使全模态大模型与人类意图和价值观对齐。 Align-Anything 框架设计高度模块化，通过对不同算法类型的抽象和精心设计的 API，用户可以灵活地修改代码以适应不同任务，进行定制化模型和数据集注册等高级扩展操作。此外，该框架支持跨任意模态模型的微调，涵盖 LLaMA3.2、LLaVA、Chameleon、Qwen2-VL、Qwen2-Audio、Diffusion 等多个大模型，覆盖图像、文本、音频和视频等多种模态的生成与理解。与此同时，框架集成了丰富的对齐方法，不仅包括经典的 SFT、DPO、PPO 等技术，还引入了 ORPO、SimPO 和 KTO 等前沿对齐算法，进一步提升模型的对齐效果。整体而言，该框架采用高度模块化的设计，具备出色的扩展性和易用性，能够支持由文本、图片、视频、音频四大基础模态衍生出的任意模态模型的对齐微调，并成功验证了框架对齐算法的合理性与稳定性。

轻量化部署，为提效降本提供助力

R1-Distill 采用蒸馏技术。大模型（老师）把自己的知识和推理能力教给小模型（学生），通过高质量的数据和训练方法，让小模型学会大模型的推理技巧。这种技术的核心目标是在保持模型性能的同时，显著降低模型的计算复杂度和存储需求，使其更适合在资源受限的环境中部署。通过这种方式，小模型能够有效继承教师模型的泛化能力，在性能上明显优于单独训练的小模型。通过将知识从大型复杂模型迁移到小型高效模型， DeepSeek-R1 的蒸馏模型在计算资源、内存使用和推理速度方面都实现了显著的优化。

三、金融机构如何部署 AI 大模型：从规划到落地的全流程解析

在完成基础架构确立后的技术兴起阶段之后，，当前大模型正逐步从通用产品建设向垂直行业应用阶段过渡。2010 年至 2017 年，Transformer 架构的提出为后续大语言模型和生成式模型奠定了基础，Diffusion 等视觉生成技术也在这一阶段兴起。2018 年至 2022 年，大模型技术进入快速迭代期，逐步从单一模态扩展至多模态应用。当前，大模型正逐步迈向产业化应用阶段，各大企业在通用大模型的基础上，针对特定行业开发更加细分的专业化产品，即垂直领域大模型。这些模型通常经过特定领域的数据调优和量级缩小，专业适应型更强，正加速推动人工智能技术的深度融合和产业化进程。金融企业在部署大模型时，建议选择全栈式一体架构、低代码开发和专注于行业的解决方案的技术供应商。这些平台由于可以提供现成的行业和功能模块，企业能够避免从零开始开发。此外，公司在选择解决方案时，还需要考虑到自身的资源条件和实施环境，从而得以根据实际需要组合不同的模块，为将来可能的升级或扩展留出空间。总体而言，部署大模型是一个系统化的过程，涉及多个关键环节，通常可分为规划与准备、模型部署、迭代优化和正式上线四个阶段。

3.1 计划准备阶段

计划准备阶段包括资源投入、模型选择、效果评估和算力准备等。首先，公司需要整合大模型开发、调优时需要的各类人才，比如数据科学家、机器学习工程师、金融专家和安全专家等。同时还需要保证资金可以持续投入，制定数据获取和清洗计划。随后，可以从训练推理效率、硬件支持水平以及调用成本方面挑选最合适规格的大模型，需要重点考虑与企业目标业务场景的匹配度。在算力准备上，金融机构需要评估资源需求，制订阶段化、梯度上升的算力准备策略，选择可以实现瞬时响应和扩缩容的服务，根据自身体量选择公有或私有云方式。在计划准备阶段，数据的获取和处理是大模型训练的关键环节之一。金融行业本质上是一个数据密集型行业，对信息汇总、数据处理能力有着较高要求，因此，在制定大模型训练方案时，数据的收集与增强尤为重要。

3.2 模型部署阶段

模型部署阶段包括搭建开发平台和模型接入。在搭建阶段，企业需要构建全栈的开发平台，确保 AI 大模型的开发、管理和部署工作，涵盖数据采集、模型训练到应用落地等各个环节。同时，企业可以利用外部 AI 厂商提供的成熟 Agent 工具和垂直场景化模板，缩短开发周期并提高应用效率。随着模型版本和应用场景的增多，机构要统一 API 接口管理，确保不同版本的模型和应用场景能够无缝协同工作。最后，数据平台底座的搭建可以为训练和推理提供强有力的支撑。常见的接入方式有云端接入、API 管理或线下部署，当前云端接入以其低成本和高兼容性成为多数企业的首要选择。在金融行业，企业在部署生成式大模型时，会根据自身的技术能力、业务需求和合规要求，选择合适的技术策略。当前金融机构在采用大模型时，主要有自主研发、工程化适配和直接采购三种模式，每种模式在定制化程度、算力成本、合规性和业务适配性上各有优劣。

（1）深度研发大模型

对于头部银行、证券公司、资产管理机构等资金充足、技术能力领先的金融企业而言，自主研发专属金融大模型是一种高定制化、高控制力的选择。这一模式通常意味着从零开始构建模型或基于开源框架深度定制，具有资金投入高、技术难度大、研发周期长等特点，并可能面临性能优化难、项目延期甚至失败的风险。但成熟的金融机构具备较强的抗风险能力，能够有效缓解这些挑战。凭借丰富的业务数据、成熟的风控体系和稳定的技术团队，它们能够持续优化模型，打造具备行业壁垒的智能化体系，从而提升长期竞争力。

（2）工程化适配

工程化适配是一种成本可控、效率较高的技术路径。这一模式主要依托提示词工程、检索增强生成（RAG）、微调技术等手段，使大模型能够更精准地适应智能投研、财富管理、合规审核、客户服务等特定金融业务场景。此外，企业还可以通过知识蒸馏、模型剪枝、量化处理等方式减少计算资源消耗，提高推理效率，从而降低大规模模型在实时交易分析、信用风险评估、个性化投顾等任务中的算力成本。这种技术路线的开发门槛相对较低，能够在较短时间内实现模型落地，因此成为大多数中大型金融机构的优选方案。

（3）直接使用大模型

对于技术能力有限、成本预算不多的中小微金融机构而言，直接采购大模型是一种低门槛、快速落地的选择。通过云端 API 调用或本地私有化部署的方式，这些机构可以无须自建大模型训练体系。然而，直接采购的大模型通用性较强，定制化能力不高，可能无法完全匹配特定金融业务需求。此外，金融行业对数据安全、隐私保护和合规性要求严格，机构在应用过程中需加强数据管理，避免敏感信息外泄，并结合自身业务特点进行策略优化，以确保模型能够安全、高效地服务于业务场景。

3.3 迭代优化阶段

在大模型的迭代优化阶段，金融机构首先依托大模型工具链，通过低代码的 Prompt 工程和 RAG 知识库技术快速优化模型的性能。同时，为进一步提升模型的专业性，机构会结合垂类业务场景训练，利用行业 Know-how、私域数据积累、业务规则嵌入等方式，使模型具备更高的精准度和可解释性。

此外，针对复杂的调优需求，企业通常采用 SFT（监督微调）和 RLHF（强化学习）对模型参数、架构和数据进行深入调整，确保模型在交易策略优化、信用评估、资产配置等业务中具备更强的决策能力。另外，为确保模型的稳定性和安全性，在上线前，金融机构需进行 TPM（吞吐量测试）和 RPM（响应速度测试），以尽量确保模型的相应速度和稳定性。

3.4 正式上线阶段

到了最后的正式上线阶段，金融机构需要构建一套适配业务特性的全生命周期管理体系，确保模型能够稳定运行，并持续优化。在系统集成层面，机构需要打通核心业务系统与 AI 中台的交互通道，采用标准化接口实现跨平台数据流转。同时，根据业务需求设计轻量化交互界面，既要满足金融从业者的操作习惯，也要确保模型功能的高效调用，提升智能化业务流程的顺畅度。数据治理方面，金融机构需建立多源异构数据的分级分类标准，依托动态权限管理、实时脱敏技术和访问日志审计，确保客户信息、交易记录等敏感数据在合规框架下安全调用，实现严格的数据闭环管理，防止隐私泄露和合规风险。模型运维与迭代上，机构需要搭建版本控制仓库和自动化测试管道，支持多版本模型的并行测试与灰度发布，以确保新模型上线不会影响原有业务稳定性。同时，通过埋点监控关键指标（如预测偏差率、响应延迟等），结合业务反馈建立自适应更新机制，确保模型在面对市场变化时能持续优化，同时满足监管合规要求，保持长期竞争力。

四、大语言模型赋能投资研究

4.1 基于 AI 驱动的主动和量化投研框架

投资方法论总体上分为主观和量化两大类。主动投研指的是基于投资经理的主观判断、过往经验和深入分析灵活应对市场，通过研究行业趋势、公司基本面、宏观经济等因素，能够较为灵活地调整投资组合，解释性强。然而，主观投资的决策很大程度上依赖于主观意识，可能受到个人偏见或情绪波动的影响，导致决策偏差。对应地，量化投资通过数学模型算法以及数据驱动来进行投资决策，优点在于能够避免人为情绪的干扰，处理规模数据更大，短板在于解释性弱，同时需要较高的计算和维护成本。在主观投研赋能方面，研究人员可以使用大模型辅助信息获取，比如从海量的资料里快速整理出纪要报告，进行网络搜索汇总文献资料或新闻报道。大模型还可以协助撰写报告和 PPT，提升工作效率等。对于量化投资决策而言，传统的量化和基本面因子已经被广泛挖掘，获取超额收益的难度日益逐渐增大。但是，政策新闻、机构和散户观点等另类数据在目前还被研究的相对较少。大模型对这些文本的解析正渐入佳境，有望破解 Alpha 困境。

4.2 主动投研赋能

4.2.1 自动编程辅助

传统 IDE 主要依赖预设规则和静态代码分析，在代码补全和调试能力表现上有限，开发者需要手动编写和优化程序。GitHub Copilot 等 AI 辅助插件虽然引入了智能补全，但仍然局限于局部代码片段，缺乏全局视角。 Cursor 基于开源的 VS Code，整合了包括 Claude3.5 sonnet、 GPT-4o 和 o1 等多种大语言模型，将 AI 功能深度嵌入到开发环境中。与传统的辅助插件相比， Cursor 不仅提供了更强大的代码补全功能，还引入了 Chat 、 Composer 等新功能，大幅提升了开发者的编程体验。 2025 年 2 月 25 日，Anthropic 发布了大语言模型 Claude 3.7 Sonnet，相较于前代版本 Claude 3.5 在编程能力上提升突出。Anthropic 基于 Claude 3.7 Sonnet 开发了终端级 AI 编程工具 Claude Code，将 AI 功能深度嵌入到开发环境中，支持从程序生成到调试优化的全流程代码开发。Claude 3.7 Sonnet 在网页爬虫、数据分析、回测系统构建等任务中展现出更强的代码生成能力、单元测试能力和自动调试能力，能够在提示词较少的情况下完成项目构建、代码生成、自动执行、调试改错和迭代优化。

4.2.2 核心信息提取

在研究领域，投资者需要阅读大量的研报、市场分析、会议纪要和学术文献，以获取关键信息进行决策。然而，面对海量的非结构化数据，依靠人工阅读不仅耗时费力，还容易因信息过载而忽略重要内容。AI 大模型可以把握关键信息，提炼核心思想，还能识别潜在的逻辑关系，极大提升信息处理效率。下图展示了 FundRecLLM 对新闻和研报解析的工作流程，体现了大模型在信息提取和整合方面的强大能力。FundRecLLM 的新闻解析模块会提取出关键信息，分析市场影响，并识别出涉及的资产标的。研报分析模块则对报告的文本、表格和图表等多类型数据进行解读，通过映射和归纳提炼出核心内容。最终，调解模块在确保数据关联性的基础上整合新闻和研报的信息，并生成结构化摘要，为后续资产推荐提供信息支持。

在具体应用上，DeepSeek 等大模型可以阅读多篇基金经理的调研纪要和历史访谈记录，智能化提炼出基金经理的投资框架，包括投资理念、资产配置、行业风格配置和交易风控等，为 FOF 基金经理提供系统化的决策支持和高效的投资洞察。

4.2.3 文本情感识别

情感分析是大模型重要应用方向之一，大模型不仅能够理解字面语义，还能提取和分析其中蕴含的情感信息。在投资研究中，情感分析可用于解析市场情绪、监测投资者情感波动，并从新闻、公告及社交媒体数据中提取关键信息，辅助投资决策和市场趋势预测。 EmoLLM 是一个基于指令数据微调不同 LLMs 的开源情感分析模型系列。EmoLLaMA 结合了分类和回归方法，能够执行情感识别、分类和回归等多项任务，实现颗粒度更细的情感理解和分析。

在实际研究中，我们尝试使用 FinGPT 对金融论坛股民主贴文本数据的情感分为消极、积极和中性三类。从提取的实际效果来看，模型能够较准确地识别股评的主要情感信息，为情绪分析和投资策略提供一定的参考价值。

4.2.4 可视化图表生成

大模型结合思维链（CoT）技术和信息检索生成（RAG）方法，能够将复杂的金融数据转变为直观的可视化信息，比如产业链图谱、资金流向图、概念股关联网络等，帮助投资者快速理解市场动态，显著提升决策效率。 ICKG（集成上下文知识图生成器）是一种专门用于动态知识图谱（DKG）生成的大语言模型，旨在从金融新闻、市场报告等非结构化文本数据中提取可视化信息。该模型首先从金融新闻文章中提取关键信息。然后，基于知识图谱构建的提示工程（Prompt Engineering），识别预定义的实体和关系，建立起联系，最终组成动态化知识图谱。

通过整合思维链（CoT）与检索增强生成（RAG）技术，DeepSeek 能够迅速从大量新闻与研报中提炼出与当前热点概念高度相关的标的，构建出产业链图谱。面对当下行业轮动和风格漂移不断加快的市场环境，传统分析手段往往无法及时应对，而借助这一技术，投资者可以更加精准地把握热点带来的上涨行情。

4.3 投资决策生成

4.3.1 大模型助力量化因子挖掘

传统的 Alpha 挖掘方法依赖手工设计或算法搜索，然而手工方法高度依赖研究员的经验，效率低且成本高。此外，虽然算法搜索能够自动生成大量因子，却往往缺乏直观的可解释性，并且计算成本巨大。 Alpha-GPT 是一种基于大语言模型的交互式 Alpha 挖掘系统，旨在提升量化研究中的因子挖掘效率和质量。Alpha-GPT 通过引入人机交互，帮助研究员更高效地表达交易想法，并将其转化为可计算的因子表达式。此外，系统还能自动总结和解释生成的 Alpha，降低因子筛选和理解的难度。另外，Alpha-GPT 允许用户在交互过程中调整搜索方向，模型能够据此优化后续的 Alpha 生成，使因子挖掘变得更加智能化和高效。在实际回测过程中，Alpha-GPT 首先基于美国股市的日内行情数据生成的因子，然后经过基因编程（Genetic Programming）技术进行优化，并在不同市场环境下进行检验。回测时采用信息比率 IC 作为核心指标，结合年化收益、夏普比率等标准化绩效指标进行评估。 Alpha-GPT 生成的因子在多种交易策略下均表现优异，优化后的因子不仅在 IC 指标上较初始因子大幅提升，而且在回测时的净值曲线更为平稳，波动性明显降低，尤其在趋势跟踪、均值回归、资金流动分析等策略中，Alpha-GPT 生成的因子相较传统方法具备更强的鲁棒性和适应性，可以在不同市场周期下维持稳定的超额收益。

GPT 能够帮助量化研究员高效挖掘因子，快速识别市场中具备预测能力的信号。通过深度数据分析，它能够揭示隐藏信息，筛选出稳定且具备较强有效性的因子。借助 GPT 强大的计算与优化能力，研究员可以更高效地发现超额收益元素，提升策略的 Alpha 质量，增强投资决策的科学性与可靠性。

4.3.2 大模型驱动投资策略构建

尽管深度学习在金融投资领域中取得了显著进展，许多现有模型仍面临不稳定性和高不确定性的挑战。这些问题通常源于市场环境的复杂多变，致使决策的不确定度加大，影响其实际应用的效果。大语言模型和多智能体架构相结合的新框架可以应用于量化股票投资、资产组合管理和多元 Alpha 挖掘，以期获得对市场的深入理解。首先，大语言模型对学术论文进行过滤分类，生成潜在的阿尔法因子，这些因子经过评估后，进入“种子阿尔法工厂”阶段。随后，工厂里的因子会进行回测，并基于市场实时状况和多个数据源（文本、音频、视频、数字）展开多模态选择工作。每个智能体根据自身的专业知识评估因子的相关性和有效性，同时结合置信度和风险偏好对因子进行加权筛选。最终，阿尔法因子会经过深度神经网络被加权整合，形成最优的投资策略。该策略通过动态调整不同因子的权重来适应不断变化的市场环境，大大提升了模型的稳定性和准确度。

在融合思维链等技术后，ChatGPT 等生成式大语言模型在处理非结构化文本时，兼具强大的逻辑推理能力和广泛的预训练知识，从而提供更符合逻辑的分析。通过解读机构调研数据，大模型能够从发展阶段、行业地位、行业周期等多个维度理解公司，并评估其投资价值。基于这一能力，我们构建的 ChatGPT 调研事件优选策略表现优异，较基准实现了显著的超额收益。

五、大语言模型赋能高效交易

5.1 大模型助力智能交易决策优化

大模型凭借其强大的数据分析与文本理解能力，在处理复杂的非结构化数据时表现突出，能够为交易决策提供有力支持。智能交易代理系统 FinAgent 通过多层次的数据分析和反思模块来优化交易决策。首先，系统利用价格变化和 K 线图与技术指标来分析股票的市场趋势，提供直观的价格和技术面数据支持。接着，低级反思模块（Low-level Reflection）通过回顾过去几天的市场变化，结合文本查询和历史数据的检索，进行初步的数据分析。而高级反思模块（Highlevel Reflection）则在更长的时间尺度上总结和优化市场智能。系统通过对历史数据的归纳，生成有价值的市场智能，为决策提供支持。最后，在决策制定阶段，系统根据收集到的市场信息和用户偏好（如激进或保守的交易策略）做出买卖决策。整个流程通过多维度的反思与优化，使 FinAgent 能够不断优化和调整交易策略。

虽然大语言模型在新闻信息、市场报告、政策文件等自然语言处理和推理方面表现出色，但在数值推理的泛化能力上仍有较大提升空间。当 LLM 与可视化数据（如散点图、K 线图等）相结合时，大模型能够更精准地预测市场走势，优化交易策略，并在复杂且动态的市场环境中快速反应，从而在实际执行中展现卓越能力。

在对智能体的评估中，基于视觉数据的方法表现优于纯文本，两者结合时达到最佳效果。结合后的大模型在总回报率（TR）和夏普比率（SR）上展现出显著优势，其中视觉数据输入的改进幅度远超文本信息。

5.2 AI 驱动交易革新：大模型应用案例解析

大模型能够解析交易员的询价需求，精准匹配市场交易条件并提供实时反馈，从而提升交易效率。同时，依托智能定价算法，大模型可自主调整策略，快速响应市场变化，优化报价流程。此外，大模型还能辅助交易风控，实时监测交易合规性，识别潜在风险，确保交易行为符合监管要求。AI 技术在交易中的应用不仅提升了执行效率，还有效降低了交易成本和对人工操作的依赖。

Broadridge 是一家成立于 1962 年的美国金融科技公司，其子公司 LTX 推出的 BondGPT 是一款基于 GPT-4 的大模型聊天机器人，主要面向对冲基金、交易商等公司债投资者，可解答各类债券相关问题。BondGPT 依托人工智能驱动的数据分析与整合能力，帮助投资者高效筛选符合交易标准的债券，并识别市场中流动性最佳的选项，从而优化交易决策。

六、大语言模型赋能投顾业务

6.1 大模型智能投顾优化投资决策

智能化投资顾问业务正成为未来机构竞争的关键领域。近年来，金融机构持续推动财富管理转型，强化投顾专业服务能力。大模型在智能投顾场景中的应用，必然成为行业关注的焦点。在“投”的部分，大模型有望提升市场分析的准确性和投资决策的效率，在“顾”的部分，大模型有望提供个性化服务和客户互动，增强用户的参与度和满意度。 GPT 可根据投资者的风险偏好提供定制化投资建议。在下图的问答模板中，大模型基于投资者的具体需求，结合反思与辩论等环节进行评估和模拟。例如，对于风险厌恶型投资者，大模型可能认为企业面临激烈的市场竞争，因此建议投资人保持谨慎。

6.2 AI 驱动投顾创新：大模型应用案例解析

我们整理了金融机构在智能投顾领域应用大模型的情况，涵盖客户服务与互动、智能投顾问答、投资决策支持、咨询建议生成等多个方面。未来，智能投顾 Agent 将推动金融服务实现“千人千面”的个性化普惠发展，并深度融合专业化能力，成为金融机构数字化转型的重要核心引擎。

云上交行是交通银行基于音视频技术打造的一款线上线下一体化金融服务渠道。客户可以通过线上“屏对屏”的方式连线交行的远程视频坐席，让云上交行的客户足不出户即可完成各项金融业务的办理，实现线下网点服务的延伸，为基层网点减负增能。交通银行云上交行客智能客服大模型主要基于交通银行通用大模型的技术底座，形成面向金融领域大模型工程化落地的完整解决方案。在数据准备方面，通过数据清洗、数据增强、知识抽取和数据标注等方式快速构建高质量标注数据集。在算力基础方面，一是综合考虑了信创适配与成本效益，构建高性能算力集群；二是引入多维混合并行加速策略，降低内存消耗，提高计算效率，优化大模型在小内存显卡上的推理适配，节省算力成本。在模型训练与推理方面，采用量化、蒸馏、裁剪等模型压缩技术降低显存需求，同时配套 Prompt 工程平台、训练工作流等工具辅助大模型微调，并探索生成式大模型的评测体系，以完善模型评估标准。云上交行智能客服大模型具备丰富且全面的应用场景：首先，通过智能问答功能，客服坐席可在服务客户过程中直接调用大模型进行业务规则查询，大模型则根据知识库快速生成相应答案，提升服务效率。同时，大模型具备语音识别和自动翻译能力，可实时处理客户的音频和文本数据，实现席间音视频服务中语音流的精准识别、分析与翻译，保障跨语言沟通顺畅。此外，通过智能质检能力，大模型能实时转写服务过程中的语音并精准定位关键流程，快速发现和呈现可能存在合规风险的视频画面及沟通话术，确保服务的合规性和质量。而在业务管理方面，大模型运用时间序列算法预测业务量，并基于人均产能与并发量测算人力需求，再通过运筹学模型求解，给出排班最优方案，有效提升资源配置效率。最后，基于大模型知识库构建的数字人，可为客户提供智能引导与问答服务，打造与人工客服协同配合的云上交行坐席数字分身，显著增强客户体验。

七、大语言模型赋能运维开发

7.1 AI 赋能运维智能化提升管理效率

随着金融科技的快速发展，传统金融服务与管理模式正经历深刻变革，数字化转型已成为行业发展的核心驱动力。然而，伴随数据中心的扩张与运维规模的扩大，金融机构面临的挑战也日益加剧。系统运行与人员操作的风险逐步显现，任何服务中断都可能造成难以估量的经济损失，使运维开发团队承受更大压力。因此，如何高效、安全地管理和维护庞大的金融系统，已成为金融机构亟待解决的问题。在此背景下，大模型技术的快速发展为解决运维中的难题提供了新的方向，它能够通过智能化分析、预测和优化，帮助金融机构提升运维效率，确保系统稳定与合规性。下图展示了大模型在金融系统运维中的应用流程。用户首先提交日常故障处理、业务变更保障、系统避险等需求，模型随后协同资源管理与告警代理完成任务。接着，模型集成各类工具与外部系统，执行实时监控、异常预警、自动化脚本等运维任务，实现高效智能化运维。

在实际操作中，大模型可在代码开发管理、知识库建设维护和工单管理三个维度提升运维人员的工作效率。AI 可以自动化生成修改代码，提升开发人员编程速度，还能够自动翻译不同编程语言之间的程序，提高团队跨语言协作效率。此外，通过建立运维知识库，大模型能够对历史文档和运维案例进行智能检索，快速获取解决方案，减少重复劳动。在工单管理方面，Agent 能够优化智能工单流程，自动生成与分配工单，并进行智能分类与优先级排序。通过一系列自动化与智能化手段，运维人员能够更加高效地完成日常工作。

7.2 AI 驱动运维升级：大模型应用案例解析

大模型在运维领域的应用涵盖知识问答、任务处置、信息查询、代码辅助等多个方面，可结合知识库提供精准解答，优化任务处理流程，提升运维效率，减少搜索成本。在代码开发方面，AI 可以覆盖开发、集成、测试和投产全流程，众多金融机构纷纷展开布局。

在软件开发过程中常常会面临代码质量不均、单元测试覆盖率低、文档不足以及重复代码较多等问题。为提升工程师的开发效率并减少重复性工作，国金证券引入 AI 编程助手优化开发流程，显著提升了运维开发的效率和质量，加速软件开发智能化转型。

八、大模型赋能合规风控

8.1 大模型助力合规管理

金融业是监管合规要求较高的信息密集型行业，受到中国人民银行、国家金融监督总局和证监会的严格管理，涉及到了公平、透明、隐私数据保护、前沿技术产品设计等多个方面。在法律制度建设上，我国制定了《网络安全法》、《数据安全法》、《个人信息保护法》等一系列配套法规，打造了高质量、多层次的监管体系。因此，金融服务机构展业时必须确保符合相关要求，否则可能面临法律风险、财务处罚和声誉损失。金融机构需要建立完善的合规管理体系，包括模型审计、风险评估、合规培训等环节，另外，还需要与监管机构保持密切沟通，以便及时了解监管动态，调整技术策略等。尽管金融机构在合规管理方面做出了努力，但仍面临诸多挑战。首先，法规的不断变化和复杂性使得合规要求日益提高，机构需要不断更新和完善合规框架。其次，部分机构的合规管理体系尚不健全，存在制度不完善和执行不到位的情况。再者，技术和数据管理上也存在瓶颈，例如系统之间不互通和数据孤岛问题，增加了合规操作的复杂度和成本。另外，合规文化需要企业投入大量的资源进行建设，员工的合规意识在实际操作中经常无法得到有效落实，亟待加强。大模型有能力优化合规业务流程环节，完善合规应用的技术应用，具有产业化和垂类应用的价值。生成式大模型 AI 当前已进入技术发展曲线的膨胀阶段，随着模型能力的不断提升，已经能够在多个领域提供创新解决方案。尤其在智能文本生成、合规知识问答等场景中。

合规知识问答：大模型可以对法律文件进行快速查询，搜索最新的法律条文，还可以通过问答模式对比推荐历史案例为当前问题提供有价值借鉴。

智能文本生成：大模型可以解读交易数据、工商数据、裁判数据、处罚决定书数据等协助机构编写调查报告，审查报告和整改措施文件等。

8.2 大模型优化风险控制

RiskLabs 框架是一种融合大语言模型的多源数据金融风险预测系统。该框架整合不同来源的数据，全面分析市场动态，并提供精准的风险预测。首先，大模型接收电话会议音频文本、每日新闻、时间序列数据等多源信息。随后，系统采用多头自注意力机制进行深度解析，并通过特征融合模块整合数据，提取关键特征，生成更高维度的数据表示。最终，模型输出市场波动预测与风险价值（VaR）评估，为金融机构提供全面的市场风险分析，助力更高效地应对市场波动与不确定性。

8.3 AI 驱动风控合规提效：大模型应用案例解析

金融行业正广泛应用大模型于合规管理、风险控制、数据安全等领域。在合规审计方面，大模型可自动审核合同、生成可疑报告、监控市场风险及内部合规情况，帮助机构降低法律与运营风险。在风险管理方面，大模型能够动态评估信用风险，执行贷前评估与贷后预警，并智能识别投保欺诈及异常交易，有效提升风控能力。此外，在数据安全与隐私合规领域，大模型可分析 APP 隐私合规性、监测企业信息安全，确保数据处理符合监管要求。

在金融机构的内控合规管理中，合规制度、合规手册等文档的查询和解答往往依赖人工翻阅，传统方式不仅效率低下，还耗费大量人力成本。为提升内部合规问答的智能化水平，工商银行依托大模型技术推出内控数字员工“工毅控”，为员工提供智能化的合规知识查询与问答服务。该系统覆盖制度规范、合规信息、违规处理流程等核心内容，并支持合规文化传播、政策解读等功能，进一步提高合规工作的便捷性和准确性，有效减轻基层员工负担。此外，工商银行在“数字工行”建设总体规划下推出“工银融安 e 控”沟通交流平台，为基层员工提供智能问答与实时合规支持，确保内控工作高效推进。自平台上线以来，该系统已在全国多个分行业务场景落地应用，实现 92.8% 的自动解答率，进一步提升了合规管理的智能化与精准化水平。

九、大模型赋能员工助手

员工助手系统是一款智能化集合办公工具，涵盖办公助手、职场提效、营销文案、创意写作和辅助编程等多个内容，旨在提升员工的工作效率，优化企业内部协作，减少重复任务带来的负荷。传统员工助手主要依赖预设流程和固定逻辑，只能按照预定义的指令执行任务，而 AI 赋能的员工助手具备更强的智能化和自主学习功能，可以结合企业知识库和上下文信息提供精准答案，同时具备强大的逻辑推理能力。

9.1 智慧办公——DeepSeek在 Office 中集成

Office 是投研人员必备软件，通过在 office 中集成 DeepSeek 插件，能够极大的提升工作效率。研究人员可以在 Word、PPT、Excel 中使用 VBA 代码调用大模型接口进行 DeepSeek 插件的集成，助力实现自动化投研办公。

在选择指定内容后，DeepSeek 的 Word 插件可实现错别字修改、格式调整和智能内容生成，提升文档编辑的便捷性和创作效率。插件可自动检测并修正错别字和语法错误，确保内容规范准确。对于排版混乱的文档，它能优化段落结构、调整字体样式，使排版更加清晰美观。此外，用户可列出报告提纲或关键词，插件即可自动生成相关内容，减少重复性工作，提高写作效率。

DeepSeek 的 PPT 插件支持智能文本生成和内容改写，用户可在空白文本框内一键生成所需内容，输入需求后，插件会自动生成文本，并在完成后提供更新提醒。此外，插件还可对已有文本进行改写或总结，根据需求优化内容，使表达更精准流畅，并同步更新至 PPT。

9.2 文案生成助手

文案生成助手是一款智能创作工具，能够帮助用户高效生成各类文本，以满足不同场景的需求。它可以精准提炼卖点，打造吸引消费者的宣传语用于产品推广。此外，小助手还可以结合市场趋势，塑造独特的品牌形象，实现差异化营销。而在演讲发言方面，能够快速生成流畅且重点突出的稿件，让表达更具感染力。此外，在短视频创作时，还能快速生成的文稿，增加创作效率。文案生成助手广泛用于电商、社交媒体和公关传播等诸多领域。

9.3 差旅报销自动化

AI 赋能的员工助手可自动进行差旅报销流程，减少人工审核负担。它能智能解析发票信息、核对报销标准、自动填充报销单，避免手动输入的错误。同时，AI 可识别异常报销项，提高审核准确性，并与财务系统对接，实现快速审批和数据同步。

十、金融大模型的未来：从智能协同迈向自主决策新阶段

10.1 DeepSeek 的发展对大模型领域带来的启示

DeepSeek-R1 通过结果导向的强化学习（Outcome-Reward RL）与动态稀疏化 MoE 架构，实现了训练效率的指数级提升，大幅优化了推理速度，重构了大模型技术发展的底层逻辑。DeepSeek 对全球 AI 大模型领域带来的影响如下：

（1）从闭源走向开放

传统国际大模型（如 GPT、Claude 等）通过闭源 API 构建技术壁垒，既限制学术界对模型机理的深入研究，也迫使企业依赖少数厂商的“黑箱服务”，形成“算力-数据-生态” 的闭环垄断。而 DeepSeek 采用 MIT 开源许可，彻底打破这一范式，允许全球开发者自由下载、修改和商用模型，推动技术从“中心化控制”转向“分布式创新”不断演进。长期来看，开源大模型将催生基于公共智能基座的多样化应用生态，削弱单一厂商的议价权，使 AI 技术成为驱动全球数字平等的开放共创平台。

（2）对数据价值的重定义：从 Scaling Law 到“策略提纯”

传统 Scaling Law 认为模型性能提升会随着数据规模增长而边际递减。然而， DeepSeek-R1 通过主动数据价值挖掘，一定程度上突破了对算力的依赖，大幅提升了数据效用密度。基于强化学习的实时反馈机制，模型自动识别高价值的数据片段，降低了低质量数据对模型的干扰，展示了在无需大量监督的情况下如何实现低成本高效能的训练范式，降低了中小初创企业的入门门槛，使 AI 技术更容易被各行业快速应用并深度融合

（3）DeepSeek 或重塑 AI 全球生态系统

DeepSeek 的突破表明企业的技术可以通过优化算法和数据策略实现性能飞跃。这一模式促使全球企业重新思考如何在计算资源有限的情况下提升大模型竞争力。未来，随着新兴市场借助消费级 GPU 和分布式数据协作参与 AI 训练，技术创新将更加去中心化，全球 AI 生态从或将从少数科技巨头主导逐步迈向更加开放和多元化的发展格局。

10.2 金融 AI 大模型的应用发展趋势

当前，金融大模型正呈现先内后外、由易到难的发展趋势。未来，金融 AI 智能体会从 AI Agent 不断向自主决策能力更强的 Agentic AI 进化。在模型架构上，大模型和小模型会协同优化，迭代升级，构建智能闭环。在主要运用场景中，大模型会逐步从数据分析助手向更核心的资产定价和投资决策转变。未来，更高级的智能化投顾或落地，应用于数字人路演，视频舆情策略开发等。

（1）智能体的跃迁：AI Agent 到 Agentic AI 的进化

AI Agent 是一种具备自主决策、环境感知和任务执行能力的智能系统，能够在较长时间内独立运行，主动感知周围环境并获取信息，利用工具完成复杂任务。AI Agent 的爆发源于技术进步和商业需求双重驱动，可以应用于内容生成、数据分析、工具分析和 Web 使用等多个方面，相较于传统的 Chatbot，更加拟人化的 AI Agent 可以深入理解外界信息，进行自主任务规划和观察纠错。然而，虽然各类 AI Agent 层出不穷，当前依然处于初级阶段，有着交互能力受限、随机输出、数据依赖大、集成兼容难等诸多问题，离自主 Agent 还有比较远的距离。可以预见，在未来 AI Agent 的使用率将会进一步提升，甚至可能集群形成 AI Agent 网络。最终， AI Agent 将打破传统人工智能的工具的范式，进化为真正具备自主决策、环境感知、目标驱动、跨领域协同的高度智能体 Agentic AI。

（2） AI 驱动金融智能化：从数据分析助手到决策引擎的转变

OpenAI o1 和 DeepSeek-R1 等推理大模型的发布，标志着 AI 在推理能力上的重大突破，为金融行业带来了前所未有的变革契机。金融投资的核心在于精准定价、风险度量和未来预测。然而目前，大模型的垂直应用深度仍然不足，离专业的研究人员还有很大差距。大模型在面对复杂金融环境时，难以精准衡量各类因素权重，难建立稳健的因果推理机制。最后，大模型的“黑箱”特性使得投资机构难以直接使用其决策，而缺乏透明度的投资策略难以赢得客户的信任。未来，随着大模型在实时学习、因果推理和可解释性方面的持续优化，在金融核心业务中的应用深度将不断提升，推动金融行业迈向更智能化的时代。

（3）模型演进：大小模型协同优化，构建智能闭环

大模型凭借全局视野和深度学习能力，在未来将进一步提升多模态融合能力，强化人机交互，拓展更复杂的推理任务。然而，随着参数规模的增长，其性能提升的边际收益逐渐下降，促使行业探索更加高效的模型架构。相比之下，小模型虽然参数规模更小，但在特定专业任务上的表现已接近大模型，尤其适用于受限或离线推理环境，以高效、低资源消耗和低成本展现巨大应用潜力。未来，大小模型的协同优化将成为主流趋势。大模型通过提供高质量的预训练权重、知识蒸馏和任务指导，可以有效优化小模型，使其在特定场景下具备更精准的推理能力。与此同时，小模型在应用过程中会将执行结果实时反馈给大模型，持续优化大模型的决策逻辑和适应能力，形成一个动态进化的智能闭环。这种交互优化机制促进了大小模型之间的迭代升级，构建出更加智能、高效的 AI 生态。在具体应用场景上，大小模型的协同将助力更高级智能化投顾落地，比如数字人路演、通过视频任务解析市场情绪，优化舆情策略等。

十一、总结

深度求索公司（DeepSeek）于 2025 年 1 月 20 日重磅发布了 DeepSeek-R1 模型，凭借其卓越的推理能力、极低的使用成本、开源可控的特性，迅速引发了市场关注，成为当前金融行业 AI 发展的重要里程碑。多家金融机构已快速部署并接入该模型，积极探索其在各个业务场景的应用潜力。在本篇报告中，我们首先回顾了大模型的发展历史，探讨了其在硬件突破、算法改进和训练方法上的核心突破，并详细梳理了金融机构部署大模型的关键流程，对比了不同方式（工程研发、自主适配、直接接入）使用大模型的优劣势，为机构选择方案提供了决策依据。接下来，我们结合海外文献与行业案例，深入解析大语言模型如何赋能金融机构的全业务线，涵盖 AI 在投资研究、投资交易、投顾业务、运维开发、合规风控、员工助手等关键领域的应用，系统展示了大模型在金融业务全流程中的实践价值。最后，我们分析了 DeepSeek-R1 的推出对全球大模型市场的影响，同时前瞻了金融大模型未来的发展趋势，即从智能协同的 AI Agent 向具备更强自主决策能力的 Agentic AI 阶段转型，以更深入地服务金融机构的核心业务。总体而言，大语言模型的持续发展与应用将推动金融行业迈入更加智能化、自动化和精准化的新时代，助力金融机构实现更高效、更精准的智能决策和业务创新。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）