2026年软件与服务行业:从智谱与MiniMax看大模型商业化路径

历史复盘:基因差异决定的商业化分野

2025 年中国大模型行业从百模大战逐步收敛至头部玩家梯队,智谱 AI 与 MiniMax 作为 不同商业化路线的代表,将于 2026 年 1 月 8 日、9 日相继在港 IPO,作为全球第一批 上市的大模型公司,对产业具有风向标意义。

智谱:清华系学院派基因——技术长期主义+全栈自主 平台思维

智谱成立于 2019 年,是中国最早开始研发 LLM 的公司,也是中国首家发布自研大模型 的人工智能公司。由清华大学计算机系的技术成果 AMiner 转化而来,核心团队源自清 华大学知识工程实验室(KEG)。 我们认为公司成立至今发展可划分为三个阶段:(1)初创探索期(2019-2022): 避开 主流的 GPT 架构,坚持研发 GLM(General Language Model)架构,实现中英双语高 效融合。(2)成长期(2023-2024):率先发布 ChatGLM 系列,通过“开源基座+闭座 增强”的策略,迅速占领国内开发者生态。(3)商业化加速期(2025 年):随 GLM 核 心版本的快速迭代,智谱商业化落地不断加速,从模型供应商向 Agent 生态运营商转型。

清华班底带队,截至 2025 年 6 月 30 日研发人员占比 74%以上。KEG 实验室成立于 1996 年,是国内最早开展自然语言处理、知识图谱研究的实验室之一,公司核心团队 成员基本来自清华大学计算机系知识工程实验室,长期从事大规模预训练模型、语义大数据分析、智能问答等领域的研究。(1)董事长刘德兵,中科院计算所博士,师从中国 工程院院士、中国计算机领域权威专家高文。(2)CEO 张鹏,清华大学 2018 创新领军 工程博士,毕业于清华大学计算机科学与技术系,负责公司整体运营与战略规划,主导 GLM 系列大模型、ChatGLM 对话模型等核心产品的研发与商业化。(3)首席科学家唐 杰,是清华大学计算机系教授、系副主任、清华-工程院知识智能联合实验室主任,国家 杰出青年科学基金获得者,也是 KEG 实验室的核心人物。他的研究方向包括社会网络 分析、数据挖掘、机器学习、知识图谱等。

押注 AGI 长期目标,首提 GLM 架构(General Language Model)。从路线上看,智谱 在 GPT 的影响下,选择从底层架构出发,构建一套原创、可控、可持续演进的通用模 型体系。具体技术上看,以“自回归填空”作为通用预训练范式,在结构上不同于 GPT 所 采用的单向注意力机制,后者更强调生成效率与规模扩展,而 GLM 在设计之初便将鲁 棒性、可控性与幻觉抑制纳入核心目标。这一差异决定了智谱要构建一套更偏向工程可 靠性与长期演进的技术底座,而不是单一服从 Scaling Law 法则快速堆积参数以推升模 型性能。

智谱研究团队认为,衡量 AGI 的第一性原理,是在不损失原有能力的前提下融合更多 通用智能能力。衡量真正通才模型的标准应包括以下三项相互关联的关键能力:(1)与 外部工具和现实世界互动的智能体(Agentic)能力;(2)在数学和科学等领域解决多步 骤问题的复杂推理(Reasoning)能力;(3)应对现实世界软件工程任务的高级代码 (Coding)能力。这三项能力可合称为 ARC 能力。 尽管 OpenAI 的 o1/o3 和 Anthropic 的 Claude Sonnet4 等 SOTA 专有模型在数学推理 或代码修复等特定 ARC 领域展现了突破性性能,但仍未有一个同时在上述所有三个领 域均表现卓越的强大开源模型。GLM 正在为此努力,力求在一个模型中集成所有这些 不同的能力。以 GLM-4.5 为例,其采用了混合推理模式,复杂推理和智能体任务采用思 考模式,即时响应采用非思考模式。

大模型混战中逐渐展现出其独特优势。自成立以来,智谱陆续推出中国首个百亿模型、 首个开源千亿模型、首个对话模型、首个多模态模型和全球首个设备操控智能体,并打 造了世界范围内先进且全面的模型组合及智能体(AI Agent)产品。2025 年,随着 GLM4.5、GLM-4.6 到 GLM-4.7 的快速迭代,智谱再次在融合推理、编码与智能体能力的统 一模型中实现突破。最新发布的 GLM-4.7 不仅在 Code Arena 中位列开源第一、国产 第一,并超越了 GPT-5.2,还在全球知名的权威大模型评测榜单 Artificial Analysis Intelligence Index(AA 智能指数)中,以 68 分综合成绩荣登开源模型与国产模型双料 榜首。此外,GLM-4.7 前端审美提升,模型迈向更加“好用”的阶段,并进一步强化了 GLM-4.5 以来就支持的交错式思考能力,引入保留式思考与轮级思考,使复杂任务执行 更稳、更可控。

模型可靠性不断提升,在 ToB 侧容错率低的生产力场景中竞争力较强。2025 年休斯幻 觉评估模型排行榜中,GLM-4-9B 是顶级 LLM 中幻觉率最低的模型之一,仅为 1.3%。 这一指标并不容易通过参数规模堆叠获得,却直接关系到模型是否能够被企业视为生产 系统的一部分。对于金融、能源、制造等高风险行业而言,低幻觉率意味着模型可以从 助手走向决策影响,成为可以被纳入关键决策流程的基础设施。截至 2025 年 9 月,GLM-4.5 幻觉率为全球第二低、中国最低。

基于学院派人才构成与全栈式的技术路线,智谱的基因是产学研一体化的,其发展历史 显示出极强的平台思维,其商业化的目的在于最大化其技术资产的利用率,通过开发者 生态构建网络效应,打造如同 Android 般的底层生态。这种基因决定了其商业化选择大 概率走向与自身更加契合的 MaaS 和 ToB 私有化部署的重资产、高壁垒路线。

MiniMax:商业产品基因——效率至上与交互美学

公司成立于 2021 年,由商汤科技前副总裁闫俊杰创立。MiniMax 带有极强的“商业化 产品”的基因,团队背景多具游戏、内容社区基因,使得公司对用户体验(UX)、留存 率和多模态交互具备优势。 我们认为公司发展历程可以分为以下几个阶段,(1)起步期(2022 年 4 月-2023 年 5 月):完成文本搭模型底座快速迭代,B 端市场初步进行商业化;(2)C 端应用验证期 (2023 年 6 月-2024 年 4 月):密集投放 Talkie 与星野两大原生 AI 交互平台,通过 C 端真实流量构建数据反馈回路,2024 年 4 月 MAU 破千万,PMF 初步跑通;(3)产品 与生态扩张期(2024 年 8 月-至今):产品从纯文本转向全感官,海螺 AI(视频)、Music01(音乐)及 MiniMax Audio(语音)的连续发布,完成对视觉、听觉模态的全面覆盖, 技术面通过“线性注意力”机制试图在长文本与推理效率上建立差异化技术护城河。

管理层与研发团队年轻,研发团队平均年龄不足 30 岁;具备商汤系基因,核心灵魂人 物曾任商汤科技副总裁。CEO 兼创始人闫俊杰年仅 36 岁,2015 年博士毕业于中科院, 曾于清华担任博士后,并于商汤科技从实习生晋升至副总裁;COO 兼联合创始人贠烨 祎 31 岁,曾于商汤科技担任战略负责人;其他高管年龄基本在 30 岁左右,如大语言模 型负责人赵鹏宇 29 岁、视觉模型负责人周彧聪 32 岁。

截至 2025 年 9 月 30 日,公司研发团队约 284 人,研发人员占比近 74%,分为专注文 本、视觉、音频、AI 基础架构(训练和推理优化)及产品开发的专业小组。核心研发团 队由来自微软、谷歌、Meta、阿里巴巴、ByteDance 及 DeepSeek 等企业的专家组成。 根据招股说明书,公司计划在未来五年内继续在全球招聘 150 名顶级大模型和 AI 基础 设施研究人员、工程师和科学家。

MiniMax 定位全模态 AI 公司,基于自研大模型打造了覆盖 B 端和 C 端的 AI 原生产品 矩阵,包括海螺 AI、Talkie、星野等,同时也为企业用户和开发者提供开放平台服务。 MiniMax 的目标是“做好多模态融合,打造真正的通用人工智能,成为其中的推动者”, 具体到商业化路径上呈现出明显的“应用先行,以场定模”特征。

模型能力方面,MiniMax 凭借在长上下文模型和可扩展的多模态架构设计方面的技术重 点脱颖而出,构建了可处理跨文本、视频和音频的多维度复杂交互的模型,为商业效率 服务。MiniMax 是全球第十大大模型技术公司,市场份额为 0.3%。此外,按 2024 年基 于模型的收入计算,是全球第四大 pureplay 大模型技术公司。(1)MiniMax-M1(2025 年 6 月推出):2025 年初 MiniMax 发布首个开源模型 MiniMax-01 系列时,其首次在 4000 亿以上参数的大模型中使用了不同于传统 Transformer 架构的自创线性 Attention 机制架构,能高效处理的上下文长达 400 万 token,达到了全球最长的水平,曾被国外人士 评价为“来自中国的 AI 变革”。(2)MiniMax-M2(2025 年 10 月推出):在模型性能、推 理速度与推理成本的综合平衡上表现突出,如果说 M1 是为长文本和复杂推理场景而生, 那么 M2 则完全面向 Agent 时代的执行任务,全注意力+MoE,使用了 1/8 的自注意力 机制,另外 7/8 使用了线性注意力。从产品思路来看,信奉“技术即产品”。MiniMax 技 术亮点是采用线性注意力机制(Linear Attention)降低计算复杂度,NCR 架构提升视 频生成效率 2.5 倍,处理长上下文时成本更低。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告