2026年海外TMT行业:领先的通用多模态大模型平台,AI原生应用矩阵+开放式生态驱动商业化落地一文读懂Minimax招股说明书

公司概况

成长复盘:MiniMax发展历史——通用多模态大模型能力持续迭代

国内较早布局通用大模型的AI公司之一,围绕多模态能力持续演进:公司成立于2021年,聚焦通用人工智能方向,核心研 发自研大语言模型及多模态模型,覆盖文本、语音、图像等核心能力。自成立以来,公司持续推进模型能力升级与产品化 落地,逐步构建起较为完整的通用多模态模型体系与应用矩阵。

成长复盘:公司已历多轮融资,累计融资规模超15亿美元

截至IPO前,MiniMax已完成约7轮融资,累计融资金额超过15亿美元。公司在早期即获得头部财务投资机构支持,随后引入 多家产业资本,股东结构兼具长期资金稳定性与产业协同属性。最近一轮融资发生于2025年12月,融资金额约3.5亿美元, 投后估值超过42亿美元。招股书披露,公司股东中已形成多家头部互联网及内容平台的交叉持股结构:本次公开发售前,阿 里巴巴持股13.66%,为第一大外部股东;米哈游持股约6.4%,为最具业务协同意义的战略投资方;腾讯持股2.58%,以战 略布局为主;其余股权由 IDG、高瓴、红杉、经纬、明势、云启等机构及创始团队持有。

成长复盘:创始人闫俊杰为公司实际控制人,阿里巴巴为第一大外部机构股东

闫俊杰博士通过其直接及间接控制的持股平台(包括 Alpha EXP、Local Linearity等),并结合贠女士通过 Apricity Investment Limited等持有的股份,作为一致行动方,合计持有公司约30.75%的已发行股本权益 (以全球发售完成前计算)。作为公司最大的单一一致行动方,该一致行动人组合在股东大会及董事会层面 对公司拥有实质性影响力与控制力,闫俊杰博士为MiniMax的实际控制人。

主营业务:AI 原生产品(ToC 为主)

公司围绕自研通用大模型与多模态技术能力,面向个人用户推出多款 AI 原生应用(AI-native Apps),以“智能交互+内容生成+个性化陪伴”为核心,构建以Agent、对话、语音、 多模态内容创作为特征的消费级 AI 产品矩阵。该业务以用户规模与使用频率增长为核心目标,当前以产品打磨与生态扩张为主,中长期通过订阅制、虚拟内容消费及能力外溢实现商 业化。 MiniMax(智能 Agent):MiniMax是公司面向个人用户推出的通用型智能 Agent 产品,基于自研通用大模型,为用户提供自然语言交互下的智能辅助服务。该产品能够理解用户复 杂意图,并在多轮对话中完成信息整合、任务拆解与内容生成,覆盖学习、写作、信息查询与日常效率工具等高频场景。MiniMax以提升用户使用频率和长期留存为核心目标,通过 持续交互积累用户偏好与上下文数据,为后续高级功能订阅及能力延展奠定基础。 海螺 AI:海螺AI是公司在 AIGC 方向推出的多模态内容创作类应用,主要面向泛内容创作者及普通用户,提供低门槛的文本与创意内容生成服务。该产品支持多风格、多角色的内容 输出,强调情绪化、人格化表达与互动式创作体验,广泛应用于故事创作、脚本生成、文案辅助等场景。海螺 AI 通过提升用户创作效率与娱乐属性,增强用户黏性,并探索以会员订 阅和内容增值为核心的商业化路径。 MiniMax 语音:MiniMax语音是公司在语音合成与语音交互领域的重要 AI 原生产品形态,体现其多模态大模型在语音维度的落地能力。该产品能够提供高自然度、多音色及多情绪的 语音生成效果,适配内容朗读、虚拟角色配音及语音互动等多类应用场景。MiniMax 语音既作为独立的用户产品存在,也为公司其他内容类与陪伴类应用提供语音能力支持,为未来 语音订阅及相关能力输出提供基础。 Talkie / 星野:Talkie / 星野定位于 AI 角色陪伴与互动应用,以虚拟角色为核心载体,为用户提供长期、连续的情感交流与沉浸式互动体验。产品通过人格设定、剧情化对话及长期 记忆机制,使 AI 角色能够与用户形成稳定关系,具备较高的用户停留时长与情感黏性。该类产品在 ToC 业务中具备较强的内容消费与虚拟付费潜力,是公司探索虚拟 IP、角色订阅 及衍生内容商业模式的重要载体。

行业概况

大模型训练与推理:技术流程与产业共性

大模型训练流程:大模型训练是一个高投入、强工程化、分阶段推进的系统性 过程,核心目标是在可控成本与稳定性前提下,最大化模型智能水平与泛化能 力。整体可拆分为以下关键环节:

数据准备与预处理:大模型训练依赖覆盖多行业、多模态、多语言的海量数 据。在正式训练前,数据需经过系统性的筛选、清洗、去噪、去重与质量评 估,以确保训练样本的可靠性与代表性。数据质量与多样性直接决定模型能 力上限,是影响训练效果的关键基础。

模型架构设计:当前主流大模型普遍基于 Transformer 架构,并引入 MoE (混合专家)、稀疏激活等机制,以提升计算效率与扩展性。模型架构设计 需在参数规模、训练与推理效率以及长期成本之间取得平衡,长上下文处理 能力与多模态统一建模已成为重要发展方向。

预训练:预训练阶段通常在大规模无监督或弱监督数据上进行,用于初始化 模型参数并学习通用统计规律与结构特征。该阶段消耗绝大部分算力资源与 训练时间,是大模型研发中成本最高、资源最密集的核心环节。 

后训练与对齐:在预训练基础上,模型通过监督微调(SFT)与大规模强化学 习(RL)进一步优化,引入人工标注与偏好反馈,使模型输出更符合人类意 图、安全与合规要求。该阶段显著提升模型在真实应用场景中的可用性、稳 定性与可靠性。

高性能计算与训练框架:大模型训练高度依赖大规模高性能计算集群,对并 行计算能力、通信效率及系统稳定性要求极高。行业头部厂商通常自研或深 度定制训练框架,以提升算力利用率、降低单位训练成本,并支撑模型的持 续迭代升级。 推理阶段指模型训练完成后对外提供实时或准实时服务的过程,是模型价值转 化为商业收入的关键环节。相比训练,推理更强调低延迟、高并发与成本效率, 行业普遍通过稀疏激活、注意力机制优化及算力调度等方式,降低单位推理成 本并提升响应效率。随着大模型应用规模扩大,推理效率已成为影响商业化可 持续性的核心因素之一。

核心竞争力

全模态统一底座+工程化效率优势构筑长期壁垒

全模态能力:以“统一底座模型”支撑多场景落地。公司自成立起即采用全模态一体化路线,围绕文本、语音、图像、视 频等多种模态进行统一建模与协同优化,而非单点模型拼接。这一策略使公司能够在AI原生产品(ToC)与企业级API/项 目交付(ToB)场景中,持续输出具备一致性、可扩展性的智能能力,显著降低跨模态开发与集成成本。全模态能力不仅 提升模型通用性,也为 Agent、交互式内容生成、沉浸式应用等下一代 AI 形态奠定基础,构成长期技术护城河。

战略与商业化:可扩展架构+ToC/ToB 双轮驱动放大规模效应

可扩展架构:支撑模型、客户与调用规模的持续放大。公司采用高度模块化、可横向扩展的系统架构,包括模型层、算力层 与应用层相对解耦,支持多模型并行演进与版本快速迭代,以及可根据客户需求灵活扩展推理资源池。该架构使公司能够在 token调用量快速增长、客户数持续扩张的情况下,保持系统稳定性与交付质量。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告