2025年计算机行业分析：科技引领主线，AI应用加速落地，国产软件加速突围

中国银河证券2025/11/07
举报

市场行情回顾

（一）整体行情

A 股人工智能指数（884201.WI）截至 10 月 31 日收盘价为 11122.38，月涨跌幅为-2.28%。计算机行业指数（801750.SI）截至 10 月 31 日收盘价为 5514.4，月涨跌幅为-2.28%。

（二）代表企业

A 股 Wind 人工智能指数（884201.WI）截至 10 月 31 日总市值 32064.3 亿，含成分股 85 支，权重等分。板块上市公司分布为主板 16 支，创业板 34 支，科创板 13 支，中小板 22 支。

（三）板块估值

人工智能指数（884201.WI）重要成分股 2021-2024 年近三年整体营业收入复合增长率 15.62%，净利润复合增长率-2.63%，截至 10 月 31 日平均估值 PE（TTM）74.88 倍，PS（TTM）4.76 倍。

前沿行业动态

（一）前沿技术动态

1.中国科学院 NeurIPS 推出 SpaceServe

在中国科学院计算技术研究所入选 NeurIPS 2025 的新论文中，提出了 SpaceServe 的突破性架构，首次将 LLM 推理中的 P/D 分离扩展至多模态场景，通过 EPD 三阶解耦与「空分复用」，系统性地解决了 MLLM 推理中的行头阻塞难题。该研究由中国科学院计算技术研究所处理器芯片全国重点实验室编译与编程团队博士生李志成与副研究员赵家程等人共同完成。其核心洞察源于对 MLLM 资源消耗的定量分析：视觉编码器，计算密集，内存带宽需求低；文本解码器，内存密集，严重依赖 HBM 带宽存储 KV Cache。二者资源需求高度互补，却在时间复用架构下被迫串行执行，造成 GPU 资源严重浪费。 SpaceServe 的关键创新在于： 1. EPD 三阶段逻辑解耦+物理共置。将所有模态编码器从共享文本解码器中完全解耦，支持独立调度；利用现代 GPU 运行时（如 NVIDIA libsmctrl / green-ctx, AMD cumask）提供的细粒度 SM 分区能力，将编码器与解码器共置在同一 GPU 上，实现并发执行。 2. TWSRFT 编码器调度策略。在时间窗口内，按「剩余工作量最短优先」批处理编码请求；避免大图阻塞小图，平滑解码器输入流，提升吞吐稳定性。 3. 基于资源利用曲线的资源动态分配运行时。离线构建资源-效用曲线，刻画不同输入（如图像分辨率）下编码器/解码器的延迟与 SM 占用关系；在线根据请求元数据（patch 数、上下文长度），动态分配 SM 计算单元，最小化端到端延迟。

在 Qwen2-VL 系列模型（2B–72B）上，SpaceServe 显著优于 vLLMv1。根本原因：vLLM 中，编码器独占 GPU 时，解码器无法推进；而 SpaceServe 通过空分复用，让解码器在编码器运行的同时持续生成 token，彻底解耦执行流。

2.DeepMind 再登 Nature：AI Agent 造出了最强 RL 算法

DeepMind 最新研究 DiscoRL，让智能体在多环境交互中自主发现强化学习规则——无需人类设计算法。它在 Atari 基准中击败 MuZero，在从未见过的游戏中依旧稳定高效。人工智能（AI）的主要目标之一，是设计出能够像人类一样在复杂环境中自主预测、行动、最终实现目标的智能体（Agent）。智能体的训练离不开强化学习（RL），相关研究也已经持续了几十年，但让智能体自主开发高效的 RL 算法的目标始终难以实现。针对这一痛点，Google DeepMind 团队提出了一种通过多代智能体在不同环境中的交互经验来自主发现 RL 规则的方法。在大型实验中，DiscoRL 不仅在 Atari 基准测试中超越所有现有规则，更在未曾接触过的挑战性基准测试中超越人工设计，击败了多项主流 RL 算法。这表明，未来用于构建高级 AI 的 RL 算法，可能不再需要人工设计，而是能够由智能体自身的经验自动发现。据论文描述，他们的发现方法涉及两种优化：智能体优化与元优化。智能体参数通过更新其策略和预测来优化，使其趋向于 RL 规则生成的目标。同时，通过更新 RL 规则的目标来优化其元参数，从而最大化智能体的累积奖励。

在智能体优化方面，研究团队使用 Kullback–Leibler 散度衡量两者之间的差距，以确保训练过程的稳定性与普适性。智能体会输出策略、观测预测和动作预测三类结果，元网络为其生成相应的学习目标。智能体再根据这些目标更新自身，从而逐步改进策略。同时，模型还引入了一个辅助损失，用于优化预定义的动作价值与策略预测，使学习过程更稳定、更高效。在元优化方面，研究团队让多个智能体在不同环境中独立学习，元网络则根据它们的整体表现计算元梯度，并调整自身参数。智能体的参数会定期重置，使学习规则能在有限时间内迅速提升表现。元梯度的计算结合了智能体的更新过程与标准强化学习目标的优化，具体由反向传播与优势行动者-评论家（A2C）算法完成，并配合一个专用于元学习阶段的价值函数进行评估。为验证 DiscoRL，团队评估时采用四分位数平均值（IQM）作为综合性能指标，该指标基于多任务基准测试的标准化分数，已被证实具有统计学可靠性。 Atari 测试：Atari 基准测试是强化学习领域最具代表性的评估标准之一。为验证算法自动发现的能力，团队基于 57 款 Atari 游戏元训练出 Disco57 规则，并在相同游戏中评估。评估时使用与 MuZero 相当规模的网络架构，结果显示，Disco57 的 IQM 达 13.86，在 Atari 基准上超越了包括 MuZero、Dreamer 在内的所有现有强化学习规则，并且在实际运行效率（wall-clock efficiency）上显著优于最先进的 MuZero。Disco57 在 Atari 实验中的评估结果。横轴表示环境交互步数（以百万为单位），纵轴表示在基准测试中 IQM 得分。

泛化能力：研究团队进一步评估了 Disco57 的通用性，在多个它从未见过的独立基准测试上进行测试。在 16 个 ProcGen 二维游戏上，Disco57 超越了包括 MuZero 和 PPO 在内的所有已发表方法；在 Crafter 基准测试中也表现出竞争力；在 NetHack NeurIPS 2021 挑战赛中获得第三名，且未使用任何领域特定知识。对比在相同设置下训练的 IMPALA 智能体，Disco57 明显更高效。此外，它在网络规模、重放比例和超参数调整等多种设置下也表现鲁棒。Disco57 在 ProcGen、Crafter、 NetHack NeurIPS 中的评估结果。

环境的复杂性和多样性：研究团队基于 Atari、ProcGen 和 DMLab-30 三个基准，共 103 个环境，发现了另一种 RL 规则 Disco103。Disco103 在 Atari 基准上的表现与 Disco57 相当，尤其是在 Crafter 、基准上达到了人类水平的表现，并在 Sokoban 上接近了 MuZero 的最先进性能。这些结果表明：用于发现的环境越复杂、越多样，所发现的强化学习规则就越强大、越具泛化能力，即使是在训练过程中从未见过的环境中也能保持出色表现。Disco103 与 Disco57 在相同测试中的对比结果。蓝线（Disco57）表示在 Atari 基准上发现的规则，橙线（Disco103）表示在 Atari、 ProcGen 和 DMLab-30 基准上共同发现的规则。高效率和稳定性：研究团队对多个 Disco57 的版本进行了评估。最优表现是在每个 Atari 游戏约 6 亿步内被发现，相当于在 57 个 Atari 游戏上进行 3 轮实验，这相比传统的人工设计 RL 规则要高效得多——后者往往需要更多实验次数，以及大量研究人员的时间投入。此外，随着用于实验的 Atari 游戏数量增加，DiscoRL 在未见过的 ProcGen 基准上的表现也随之提升，这表明所发现的 RL 规则能够随着参与实验的环境数量与多样性的增加而得到扩展。换句话说，所发现 RL 的性能取决于数据（即环境）与计算量。DiscoRL 最佳规则在每款游戏约 6 亿步内被发现；随着用于发现的训练环境数量的增加，DiscoRL 在未见过的 ProcGen 基准测试上的性能也变得更强。研究团队表示，未来高级 AI 的 RL 算法设计，可能将由能高效扩展数据与计算能力的机器主导，不再需要人类设计。

前沿企业动态

（一）前沿产品动态

1.奥特曼官宣 ChatGPT「终极 OS 入口」

OpenAI 2025 开发者日上，奥特曼重磅官宣四大更新：首发 Apps SDK 要把 ChatGPT 打造为「操作系统终极入口」，一键拖拽构建智能体 AgentKit，无代码 Codex 开发，以及 Sora 2 等三大 API 登场。 Apps SDK：与外部应用无缝集成，OpenAI 最大野心——把 ChatGPT 打造成未来的操作系统； AgentKit：无需编码，拖放搭建智能体。人人都可快速开发智能体，还能评估智能体能力； Codex 全面可用：不写一行代码，打造爆款 APP； API 更新：三大 API 更新，Sora 2 API 同步上线。最重磅的，还是 Apps SDK，所有人皆可在 ChatGPT 中构建原生应用，其意义堪比 2023 年首发的 GPTs。借助 Apps SDK，ChatGPT 可以集成各种应用。目前公布支持的 APP 包括：Booking.com、 Canva、coursera、Expedia、Figma、Spotify 和 Zillow。OpenAI 的软件工程师 Alexi 现场展示了如何在 ChatGPT 直接调用这些外部应用。比如只需要输入「Coursera」，ChatGPT 就能自动识别并调用 Coursera 的功能。可以直接在 ChatGPT 中要求「Canva」制作海报，而不需要额外跳转。可以直接在 ChatGPT 中使用 Zillow 查询周边房价，并使用 Zillow 的 UI 来直接呈现。

2.蚂蚁集团重磅推出万亿参数思考模型 Ring-1T

10 月 14 日凌晨，蚂蚁集团正式发布万亿参数思考模型 Ring-1T。在数学竞赛（AIME 25、 HMMT 25），代码生成（CodeForces）、逻辑推理（ARC-AGI-v1），Ring-1T 取得开源领先水平。

在 OpenAI 的医疗问答 HealthBench 测评中，Ring-1T 表现惊艳。与此前发布的预览版 Ring1T-preview 相比，正式版 Ring-1T 在数学竞赛、逻辑推理、医疗问答上表现更出色、推理更准确。 Ring-1T 虽然是思考模型，但也具备极强的通用能力：在综合榜单（Arena-Hard-v2）、创意写作（CreativeWriting-v3）上，表现强劲，与 DeepSeek、Qwen 等最新思考模型同属开源第一梯队。特别是，在「高难度真实用户查询」Arena-Hard V2 基准测试中，Ring-1T 成功率高达 81.59%，登上开源模型榜首——直逼 OpenAI 的 GPT-5-Thinking(High)的成绩 82.91%。目前，普通用户可在蚂蚁百宝箱选择 Ring-1T 直接体验。

3.谷歌更新 Veo 3.1，主打更强叙事与音频控制、首尾帧与多图参考等精控

谷歌更新 Veo 3.1，主打更强叙事与音频控制、首尾帧与多图参考等精控。可合成多人物场景、音画同步，片段最长约 148 秒；规格至 1080p/24fps。 Veo 3.1 目前已接入 Gemini API 与 Vertex AI。普通用户也可以直接在 Flow 或者 Gemini 中体验。

4.百川智能重磅发布「首个循证增强的医疗大模型」——Baichuan-M2 Plus

10 月 22 日，百川智能重磅发布「首个循证增强的医疗大模型」——Baichuan-M2 Plus。新模型将「循证医学」理念深度融入训练和推理，通过首创「六源循证范式」，模拟人类医生思维，有效辨别不同层级医学证据、评估其可靠性，并在回答中优先引用高等级证据。在多项权威医学考试中，M2 Plus 成绩直接拉满，医学知识运用能力远超人类平均线。

此外，这种「循证驱动」的生成逻辑，使其有效避免了无中生有的幻觉，让可信度比肩资深临床专家的水平。在多场景医疗评测中，M2 Plus 幻觉率指标，较 Deepseek-R1 低 3 倍，并且显著领先美国最火医疗产品 OpenEvidence。

5.Cursor 发布首款自研编码模型 Composer

Cursor 迎来重大升级，发布了首款自研编码模型 Composer。Composer 的速度是同等模型的 4 倍。Cursor 说这是一款专门为低延迟智能编码打造的模型，大部分任务都可以在 30 秒以内完成。在 Speed 一栏，Composer 的速度达到了 200 Tokens/秒。

除了自研模型，Cursor 这次重构了交互逻辑，带来了多智能体模式，在单个提示下，可最多并行运行 8 个智能体。此功能使用 git worktrees 或远程机器来防止文件冲突。这次 2.0 版本还将浏览器嵌入编辑器内，这对于前端开发非常友好。可以直接选择元素并将 DOM 信息转发给 Cursor。这次一个更大的更新是引入了语音模式（Voice Mode）。同时，改进了带有标记上下文的复制 /粘贴提示，已从上下文菜单中移除了许多显式项，包括 @Definitions、@Web、@Link、@Recent Changes、@Linter Errors 等。Agent 现在可以自我收集上下文，无需在提示输入中手动附加。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）