2026年软件与服务行业：从智谱与MiniMax看大模型商业化路径

长江证券2026/01/16
举报

历史复盘：基因差异决定的商业化分野

2025 年中国大模型行业从百模大战逐步收敛至头部玩家梯队，智谱 AI 与 MiniMax 作为不同商业化路线的代表，将于 2026 年 1 月 8 日、9 日相继在港 IPO，作为全球第一批上市的大模型公司，对产业具有风向标意义。

智谱：清华系学院派基因——技术长期主义+全栈自主平台思维

智谱成立于 2019 年，是中国最早开始研发 LLM 的公司，也是中国首家发布自研大模型的人工智能公司。由清华大学计算机系的技术成果 AMiner 转化而来，核心团队源自清华大学知识工程实验室（KEG）。我们认为公司成立至今发展可划分为三个阶段：（1）初创探索期（2019-2022）：避开主流的 GPT 架构，坚持研发 GLM（General Language Model）架构，实现中英双语高效融合。（2）成长期（2023-2024）：率先发布 ChatGLM 系列，通过“开源基座+闭座增强”的策略，迅速占领国内开发者生态。（3）商业化加速期（2025 年）：随 GLM 核心版本的快速迭代，智谱商业化落地不断加速，从模型供应商向 Agent 生态运营商转型。

清华班底带队，截至 2025 年 6 月 30 日研发人员占比 74%以上。KEG 实验室成立于 1996 年，是国内最早开展自然语言处理、知识图谱研究的实验室之一，公司核心团队成员基本来自清华大学计算机系知识工程实验室，长期从事大规模预训练模型、语义大数据分析、智能问答等领域的研究。（1）董事长刘德兵，中科院计算所博士，师从中国工程院院士、中国计算机领域权威专家高文。（2）CEO 张鹏，清华大学 2018 创新领军工程博士，毕业于清华大学计算机科学与技术系，负责公司整体运营与战略规划，主导 GLM 系列大模型、ChatGLM 对话模型等核心产品的研发与商业化。（3）首席科学家唐杰，是清华大学计算机系教授、系副主任、清华-工程院知识智能联合实验室主任，国家杰出青年科学基金获得者，也是 KEG 实验室的核心人物。他的研究方向包括社会网络分析、数据挖掘、机器学习、知识图谱等。

押注 AGI 长期目标，首提 GLM 架构（General Language Model）。从路线上看，智谱在 GPT 的影响下，选择从底层架构出发，构建一套原创、可控、可持续演进的通用模型体系。具体技术上看，以“自回归填空”作为通用预训练范式，在结构上不同于 GPT 所采用的单向注意力机制，后者更强调生成效率与规模扩展，而 GLM 在设计之初便将鲁棒性、可控性与幻觉抑制纳入核心目标。这一差异决定了智谱要构建一套更偏向工程可靠性与长期演进的技术底座，而不是单一服从 Scaling Law 法则快速堆积参数以推升模型性能。

智谱研究团队认为，衡量 AGI 的第一性原理，是在不损失原有能力的前提下融合更多通用智能能力。衡量真正通才模型的标准应包括以下三项相互关联的关键能力：（1）与外部工具和现实世界互动的智能体（Agentic）能力；（2）在数学和科学等领域解决多步骤问题的复杂推理（Reasoning）能力；（3）应对现实世界软件工程任务的高级代码（Coding）能力。这三项能力可合称为 ARC 能力。尽管 OpenAI 的 o1/o3 和 Anthropic 的 Claude Sonnet4 等 SOTA 专有模型在数学推理或代码修复等特定 ARC 领域展现了突破性性能，但仍未有一个同时在上述所有三个领域均表现卓越的强大开源模型。GLM 正在为此努力，力求在一个模型中集成所有这些不同的能力。以 GLM-4.5 为例，其采用了混合推理模式，复杂推理和智能体任务采用思考模式，即时响应采用非思考模式。

大模型混战中逐渐展现出其独特优势。自成立以来，智谱陆续推出中国首个百亿模型、首个开源千亿模型、首个对话模型、首个多模态模型和全球首个设备操控智能体，并打造了世界范围内先进且全面的模型组合及智能体（AI Agent）产品。2025 年，随着 GLM4.5、GLM-4.6 到 GLM-4.7 的快速迭代，智谱再次在融合推理、编码与智能体能力的统一模型中实现突破。最新发布的 GLM-4.7 不仅在 Code Arena 中位列开源第一、国产第一，并超越了 GPT-5.2，还在全球知名的权威大模型评测榜单 Artificial Analysis Intelligence Index（AA 智能指数）中，以 68 分综合成绩荣登开源模型与国产模型双料榜首。此外，GLM-4.7 前端审美提升，模型迈向更加“好用”的阶段，并进一步强化了 GLM-4.5 以来就支持的交错式思考能力，引入保留式思考与轮级思考，使复杂任务执行更稳、更可控。

模型可靠性不断提升，在 ToB 侧容错率低的生产力场景中竞争力较强。2025 年休斯幻觉评估模型排行榜中，GLM-4-9B 是顶级 LLM 中幻觉率最低的模型之一，仅为 1.3%。这一指标并不容易通过参数规模堆叠获得，却直接关系到模型是否能够被企业视为生产系统的一部分。对于金融、能源、制造等高风险行业而言，低幻觉率意味着模型可以从助手走向决策影响，成为可以被纳入关键决策流程的基础设施。截至 2025 年 9 月，GLM-4.5 幻觉率为全球第二低、中国最低。

基于学院派人才构成与全栈式的技术路线，智谱的基因是产学研一体化的，其发展历史显示出极强的平台思维，其商业化的目的在于最大化其技术资产的利用率，通过开发者生态构建网络效应，打造如同 Android 般的底层生态。这种基因决定了其商业化选择大概率走向与自身更加契合的 MaaS 和 ToB 私有化部署的重资产、高壁垒路线。

MiniMax：商业产品基因——效率至上与交互美学

公司成立于 2021 年，由商汤科技前副总裁闫俊杰创立。MiniMax 带有极强的“商业化产品”的基因，团队背景多具游戏、内容社区基因，使得公司对用户体验（UX）、留存率和多模态交互具备优势。我们认为公司发展历程可以分为以下几个阶段，（1）起步期（2022 年 4 月-2023 年 5 月）：完成文本搭模型底座快速迭代，B 端市场初步进行商业化；（2）C 端应用验证期（2023 年 6 月-2024 年 4 月）：密集投放 Talkie 与星野两大原生 AI 交互平台，通过 C 端真实流量构建数据反馈回路，2024 年 4 月 MAU 破千万，PMF 初步跑通；（3）产品与生态扩张期（2024 年 8 月-至今）：产品从纯文本转向全感官，海螺 AI（视频）、Music01（音乐）及 MiniMax Audio（语音）的连续发布，完成对视觉、听觉模态的全面覆盖，技术面通过“线性注意力”机制试图在长文本与推理效率上建立差异化技术护城河。

管理层与研发团队年轻，研发团队平均年龄不足 30 岁；具备商汤系基因，核心灵魂人物曾任商汤科技副总裁。CEO 兼创始人闫俊杰年仅 36 岁，2015 年博士毕业于中科院，曾于清华担任博士后，并于商汤科技从实习生晋升至副总裁；COO 兼联合创始人贠烨祎 31 岁，曾于商汤科技担任战略负责人；其他高管年龄基本在 30 岁左右，如大语言模型负责人赵鹏宇 29 岁、视觉模型负责人周彧聪 32 岁。

截至 2025 年 9 月 30 日，公司研发团队约 284 人，研发人员占比近 74%，分为专注文本、视觉、音频、AI 基础架构（训练和推理优化）及产品开发的专业小组。核心研发团队由来自微软、谷歌、Meta、阿里巴巴、ByteDance 及 DeepSeek 等企业的专家组成。根据招股说明书，公司计划在未来五年内继续在全球招聘 150 名顶级大模型和 AI 基础设施研究人员、工程师和科学家。

MiniMax 定位全模态 AI 公司，基于自研大模型打造了覆盖 B 端和 C 端的 AI 原生产品矩阵，包括海螺 AI、Talkie、星野等，同时也为企业用户和开发者提供开放平台服务。 MiniMax 的目标是“做好多模态融合，打造真正的通用人工智能，成为其中的推动者”，具体到商业化路径上呈现出明显的“应用先行，以场定模”特征。

模型能力方面，MiniMax 凭借在长上下文模型和可扩展的多模态架构设计方面的技术重点脱颖而出，构建了可处理跨文本、视频和音频的多维度复杂交互的模型，为商业效率服务。MiniMax 是全球第十大大模型技术公司，市场份额为 0.3%。此外，按 2024 年基于模型的收入计算，是全球第四大 pureplay 大模型技术公司。（1）MiniMax-M1(2025 年 6 月推出)：2025 年初 MiniMax 发布首个开源模型 MiniMax-01 系列时，其首次在 4000 亿以上参数的大模型中使用了不同于传统 Transformer 架构的自创线性 Attention 机制架构，能高效处理的上下文长达 400 万 token，达到了全球最长的水平，曾被国外人士评价为“来自中国的 AI 变革”。（2）MiniMax-M2（2025 年 10 月推出）：在模型性能、推理速度与推理成本的综合平衡上表现突出，如果说 M1 是为长文本和复杂推理场景而生，那么 M2 则完全面向 Agent 时代的执行任务，全注意力+MoE，使用了 1/8 的自注意力机制，另外 7/8 使用了线性注意力。从产品思路来看，信奉“技术即产品”。MiniMax 技术亮点是采用线性注意力机制（Linear Attention）降低计算复杂度，NCR 架构提升视频生成效率 2.5 倍，处理长上下文时成本更低。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）