2025年金融工程专题报告:基金量化观察,Gemini 3模型金融文本分析深度评测

一、Gemini 3 系列模型发布,主推 Agent 规划能力

谷歌 DeepMind 已于 2025 年 11 月 18 日正式发布了 Gemini 3 系列模型,包括 Gemini 3 Pro 标准版模型和 Gemini 3 Deep Think 增强推理两个版本。模型在推理能力、多模态理解、 编程开发和任务执行方面实现全面的能力提升,大幅刷新此前 OpenAI 和 Anthropic 旗下 模型在各项测试中的成绩,成为当前最强通用大模型。

谷歌同步推出智能体开发平台 Google Antigravity,进军智能编程领域,进一步完善其 大模型应用产品生态。

1.1 Gemini 3:多模态能力与长期规划能力断崖式领先

作为谷歌最新的旗舰级模型,Gemini 3在多项行业基准测试上实现登顶,显著优于GPT-5.1 和 Claude Sonnet 4.5 的评测结果。 Gemini 3 模型在核心的推理能力方面提升明显。在考察学术级推理能力的 Humanity’s Last Exam(不使用工具)中实现了 37.5%的得分,大幅刷新此前 GPT-5.1 的最高分数, 展示出博士级别的推理能力;在主要考察多模态理解与推理能力的 ARC-AGI-2、MMMU-Pro、 Video-MMMU 等测试项目中,Gemini 3 Pro 也都位列第一,展现其对文本、图像、视频和 音频的整合理解能力。

模型在长期规划方面也表现出色,拓宽了 Agent 应用的能力边界。Gemini 3 在 Vending-Bench 2 测试中以稳定更高的利润超越其他模型,该测试通过让模型模拟运营自 动贩卖机来观察模型的长期决策能力。这表明 Gemini 3 确实具有更优秀的长期推理与工 具调用能力,可以按指令实现复杂的多步骤工作流。这一点对于在应用端开发更先进的 Agent 来说非常重要。 当前 Agentic Workflow 已成为大模型应用的主要载体形式,这对模型的规划、工具使用 与长期记忆能力提出了更高要求。当前多数大模型在长期规划任务中的出错概率较高,在 涉及多步骤执行时常常陷入循环导致无法完成任务。Gemini 3 有望能带来更好的 Agent 应用体验。

Gemini 3 Deep Think 模式则在 Pro 的基础上更进一步,分别在 Humanity’s Last Exam 上取得 41%、ARC-AGI-2 上取得 45.1%的高分,达到 GPT-5.1 得分的 1.55 倍和 2.56 倍, 实现更高的智能水平。

当前,Gemini 3 Pro 已全面上线,可在网页端与 API 接口中进行调用;Deep Think 模式 还未正式发布。

1.2 Antigravity:可支持并发的 Agent 开发 IDE

与 Gemini 3 同步发布的还有谷歌推出的智能开发平台 Google Antigravity。该软件对标 Cursor,可免费使用 Gemini 3 Pro、Claude Sonnet 4.5 等作为底层模型,实现智能编程 的效果。但与 Cursor 等其他智能编程 IDE 不同的是,Antigravity 能够支持开发者编排 多个 AI Agent 并行运行,且能够自主访问文件编辑器、电脑命令终端和浏览器,甚至自 主规划与执行电脑软件的任务,进一步向 Agent 自主行动的模式靠近。

1.3 模型 API 调用示例与参数详解

以 Python 为例,在通过 api 调用 Gemini 3 Pro 之前有以下准备工作: 1)安装谷歌提供的 google 和 google-genai 依赖包。 2)需要进入 Google AI Studio 获取 api 密钥。 完成基础配置后,即可按照如下格式调用 Gemini 3 Pro 回答。可实现以下功能: 1). thinking_level 参数可来调整模型在生成回答之前进行内部推理过程的最大深度, 共分为 high、medium(暂不支持)、low 三档。Gemini 3 Pro 默认使用“高/动态思考模式”, 能够完成较复杂的推理任务。

2). temperature 参数建议保留为默认值 1。虽然之前的其他模型可以通过调整 temperature 来控制创造性与确定性,但 Gemini 3 的推理能力已针对默认设置进行了优 化。更改此参数可能会导致意外行为,例如循环或性能下降,尤其是在复杂的数学或推理 任务中。若需更改,可通过”config=types.GenerateContentConfig(temperature=0.9)” 来进行控制。

3). 多模态输入。Gemini 3 支持多模态输入,我们可以按如下格式将图片上传并让大模 型进行分析。案例中,我们将上证综指的日度 k 线图上传,并让 Gemini 3 Pro 进行描述。 从回答中可以看出,模型能对基础的信息进行准确提取(如最低点、最高点、形态等)。

4). 工具调用。Gemini 3 Pro 作为 Agent 的核心组件,可实现对工具的精准调用。我们 首先需要对工具及其参数进行声明,再在调用 api 时声明使用模型。Gemini 3 Pro 还支 持对工具的并行与串行调用,可让模型同时返回多个工具调用结果,实现复杂的调用机制。

1.4 Gemini 3 Pro 解析金融文本测试

我们对 Gemini 3 Pro 在金融文本解析方面的能力进行测试。首先,我们设计了以下问题, 来考察模型能否给出符合预期的回答。在有标准答案的部分中,Gemini 3 Pro 均能够给 出正确回答,且输出符合格式要求,在问题三提取框架的任务中,可以看到模型总结框架 非常详细,更接近一个完整的框架结构。

我们对 Gemini 3 Pro 的长文本输入与推理能力进行测试,输入 2 万字符以上包括中文、 数据报表、英文名词、权责说明在内的某行业公司研报内容,让模型输出精炼的 1500 字 以内的整体研究框架,并与 GPT-5 模型进行对比。从输出来看,且 Gemini 3 Pro 给出的 结果更加贴合研报,在输出的框架中会提及原文中的具体内容,内容更有针对性而非专业 词汇的简单堆砌,结构上更符合框架形式。

总体来看,Gemini 3 在推理能力、长期规划能力和多模态方面实现了全方位技术突破与 体验升级,叠加 Google 在大模型应用生态构建、产品迭代及企业级部署能力上的持续深 耕,其有望进一步拓宽在金融领域的落地边界,推动多源信息整合与结构化、动态策略跟 踪与优化、自动化编码、知识库管理等高价值场景的规模化落地,赋能金融多场景创新。

二、ETF 市场回顾

截至 2025 年 11 月 21 日,全市场已上市非货币 ETF 共 1328 只,上周共 4 只 ETF 上市。

2.1 一级市场资金流动情况(2025.11.17-2025.11.21)

我们按每日份额较前一日增加额乘以前一日净值的方式计算了 ETF 每日的净申购/赎回额, 并对发生份额拆分的 ETF 进行处理。 从一级市场资金流动情况来看,上周已上市 ETF 资金净流入合计 791.54 亿元,其中股票 型 ETF 资金净流入 391.61 亿元,跨境 ETF 资金净流入 198.40 亿元,债券型 ETF 资金净流 入 138.40 亿元,商品型 ETF 资金净流入 63.13 亿元。 在股票型 ETF 中,宽基 ETF 上周资金净流入 277.23 亿元,上周中证 500ETF 资金净流入 60.64 亿元,科创 50ETF 资金净流入 54.77 亿元,中证 1000ETF 资金净流入 35.97 亿元, 上证综指 ETF 资金净流入 32.57 亿元,沪深 300ETF 资金净流入 30.29 亿元。 主题行业 ETF 上周资金净流入 86.67 亿元。上周高端制造、科技、医药生物板块 ETF 资金 净流入额分别为 43.75 亿元、36.09 亿元、21.47 亿元,周期、消费、金融地产板块 ETF 资金净流出额分别为 3.19 亿元、3.78 亿元、10.91 亿元。

2.2 二级市场交易情况(2025.11.17-2025.11.21)

2.2.1 ETF 交易情况

上周非货币 ETF 的成交金额合计为 21742.49 亿元。其中股票型 ETF 的周成交额为 5991.26 亿元。在股票型 ETF 中,宽基 ETF 的成交额最高,其中 A500ETF 周成交额最高。在主题/ 行业 ETF 中,科技 ETF 周成交额最高。 从 ETF 融资融券情况来看,上周 ETF 融资净买入额为 30.20 亿元,其中科创 50ETF 融资净 买入额为 4.18 亿元,金融地产 ETF 融资净买入额为 3.13 亿元,相对更获杠杆资金青睐。

2.3 增强策略 ETF 业绩跟踪(2025.11.17-2025.11.21)

截至 2025 年 11 月 21 日,已有 51 只增强策略 ETF 上市交易(不含联接基金),覆盖沪深 300、中证 500、中证 1000、上证科创板 50、科创创业 50、创业板指、中证 2000 等指数。 上周各类增强策略 ETF 中,27 只增强策略 ETF 的表现超过业绩比较基准。近 1 年以来,成立满 1 年的 33 只增强策略 ETF 中有 30 只取得正超额。2025 年以来,招商中证 2000 增 强策略 ETF 业绩均最佳,近 1 年以来获得 24.33%的超额收益率,2025 年以来获得 19.79% 的超额收益率。

2.4 本周非货币 ETF 申报、认购及上市情况(2025.11.24-2025.11.28)

2.4.1 上周非货币 ETF 基金申报情况

上周共有 19 只 ETF 产品申报,多类行业 ETF 集中申报。易方达基金、鹏华基金、广发基 金、天弘基金均申报了上证科创板芯片设计主题 ETF;易方达基金、广发基金、华宝基金 申报了上证科创板芯片 ETF;南方基金、东财基金、申报了中证电池主题 ETF;摩根基金 与鹏华基金均申报了中证科创创业人工智能 ETF。

2.4.2 本周新发行非货币 ETF 情况

本周 2 只 ETF 发行,涉及宽基、行业 ETF。

2.4.3 本周非货币 ETF 上市情况

本周共有 5 只 ETF 上市,包含跨境 ETF、行业 ETF。

三、主动权益及增强指数型基金表现跟踪

3.1 绩优基金跟踪(2025.11.17-2025.11.21)

剔除成立不满 1 年的基金,截至 2025 年 11 月 21 日,近一年以来,灵活配置型基金中, 交银优择回报 A(519770.OF)收益最高,近一年取得 111.12%的收益率,排名第一。偏股混 合型基金中,永赢科技智选 A(022364.OF)业绩优异,过去一年以来取得 180.97%的收益率, 排名第一。在普通股票型基金中,易方达战略新兴产业 A(010391.OF)收益率达到 82.84%, 排名第一。

上周主动量化基金上周收益率中位数为-4.89%,近 1 年以来收益率中位数为 18.95%。 上周各类主题基金表现均不理想,消费主题基金业绩相对较好,收益率中位数为-3.39%。 近 1 年以来,TMT 与制造主题基金业绩领先,收益率中位数分别为 34.33%、20.33%。

3.2 基金发行跟踪(2025.11.24-2025.11.28)

本周共 5 只主动权益及增强指数型基金开始发行,包括 2 只偏股混合型基金和 3 只增强指 数型基金。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告