底层技术平台+垂类解决方案+AIGS 形成合力赋能“AI+”。
第四范式在算法层深耕,强化软硬协同,从算力+平台+模型+应用赋能企业智能化:以底层技术 平台结合垂类解决方案,并运用生成式 AI 提升平台使用效率、赋能 AI 应用开发。 先知 AI 平台 - 4Paradigm Sage:行业大模型平台。以 AutoML、迁移学习等为技术核心, 从底层算力平台、提供企业级特性的 AIOS 操作系统到顶层全套软件 SageSuite,提供 AI 数 字化转型基础设施和全流程的模型及软件开发工具链。 智能解决方案 - 4Paradigm SHIFT:基于平台向细分场景深挖扩展,构建多行业方案,面 向银行、保险、证券、零售、能源、医疗、制造等领域,根据业务需要开发具备行业特性的 人工智能应用。 式说 AIGS 服务 - 4Paradigm AIGS:AI 赋能软件开发(AI-Generated System),提升应用 开发效率。例如持续优化迭代企业软件重构助手 AIGS Builder 降低开发门槛,以及编程助 手 AIGS CodeX 实现代码提效。 以先知平台为核心的系统化、平台化交付趋势显现。公司整体年收入稳定增长,先知平台收入占 比持续提升,2025H1 占比为 81.8%,2025Q2 达 86.8%。
首先从整体产品架构及交付形式来看: 第四范式通过本地化一体机的交付形式私有化部署,保障企业数据安全。先知平台可以理解为一 个类似 Windows/MacOS 的人工智能操作系统,帮助企业客户实现快速、规模化部署,用于设计、 开发、操作及管理人工智能应用。平台上提供两类供开发人员使用的套件,分别是无代码开发工 具 HyperCycle 系列及低代码和无代码开发工具 SageStudio 系列,根据不同应用场景选择不同 类型的算法工具,例如 HyperCycle ML、HyperCycle CV、HyperCycle OCR、HyperCycle KB、ML Studio、CV Studio、NLP Studio、Speech Studio 等。 HyperCycle 是一种方法论,结合各类 AI 技术栈帮助企业简化人工智能应用开发流程。具体来看 HyperCycle 包含行为、反馈、学习及应用四个步骤,不断循环优化智能效果。
HyperCycle ML 集成全流程 AutoML 能力,覆盖从数据自动处理、自动拼表、自动特征衍生、 自动特征筛选到算法自动调优、模型自动选择的全流程。其中多表自动拼接打破 AutoML 与 真实业务数据的屏障,将机器学习问题转换为数据准备问题,实现业务人员可用。应用场景 包含:精准营销、智能推荐、销售预测、客户流失预警、逾期预测、反欺诈、反洗钱、故障 预测等。
HyperCycle CV 将原本繁琐的模型构建过程提炼为图像、标注、学习和应用四个步骤,针对 图片分类、物体检测、图像分割等多种场景进行深度神经网络模型构建。应用场景包括:城 管治理、制造设备升级、车辆检测、工程监理、发动机破碎检查、货架检测、智能称重秤等。
HyperCycle OCR 内置多种 OCR 文字识别版式预制模型,覆盖身份证、驾驶证、银行卡等 40 余种常见的应用场景(身份识别验证、票据录入、文档核对、签名认证、存档检索等)。

2025 年 3 月,公司联合华为共同发布一体机 SageOne IA,实现从芯片、框架到服务的全链国产 化。2025 年 4 月,公司推出“模型弹性伸缩”以应对流量波动。系统会根据负载状况,自动灵活 切换同一系列下不同参数大小的模型提供模型服务,无需额外扩展计算节点,为企业客户节省算 力成本,提升资源使用效率的同时还能降低运维工作量。 SageOne IA 一体机的“模型弹性伸缩”技术更新进一步提升模型与算力运用效率和顺畅度,而 这个技术过程本身也是决策 AI 的一次经典应用。在大模型推理场景下,负载较小时,满血版模 型提供高精度的推理服务;进入高峰时段时,系统会自动将满血版降级为一个或多个蒸馏版/量 化版模型实例,来处理大量并发请求。结合模型预加载等技术,可避免模型服务切换时,导致服 务中断或输出质量波动问题,做到用户无感知的平滑切换;当流量回归常态后,系统再自动升级 到满血版模型服务,并释放多余的较小参数模型实例。同时,系统可预设多种基于负载的触发条 件,如结合 GPU 使用率、请求队列长度、响应延迟等资源健康度指标,形成动态切换策略和任 务路由机制,使弹性方案在实际应用中更贴近业务需求。
其次,关注赋能算法规模化落地的底层核心技术栈: 为提升实际机器学习模型的开发和优化效率,第四范式也针对底层数据及运行管理研发专用组 件,分别为机器学习数据库——OpenMLDB 和开源 AI 操作系统内核——OpenAIOS。
OpenMLDB:在人工智能工程化落地过程中,企业的数据和工程化团队 95% 的时间精力会耗 费在数据处理、数据校验等相关工作上。为此第四范式推出 OpenMLDB(已开源)解决 AI 工 程化落地的数据治理难题,为企业级机器学习应用提供线上线下计算一致、高性能低门槛的生产级特征平台。在例如个性化推荐、风控、反欺诈等需要毫秒级实时度计算、线上线下 一致的场景中应用,实现开发即上线的快速部署。
OpenAIOS:为优化人工智能应用的开发效率,第四范式推出 OpenAIOS 用于多级计算、存储 和通信的集中管理,旨在不影响用户使用体验的情况下自动调度及管理异构资源以提高计 算资源利用率。例如自动拆分任务进行并行计算、通过自动扩容策略扩大内存容量、提供低 延迟、高吞吐的通信框架并结合硬件虚拟化技术提升 GPU 利用率。
在底层算力管理方面,第四范式的 vGPU 资源池化技术持续创新,通过动态资源切分、智能任务 调度和弹性扩张能力的提升,实现 GPU 资源利用率的提升(30%+),单机多任务处理效率提升 3 倍。基于自研的大模型推理框架 SLXLLM 及推理加速卡 SLX,利用多任务共享及处理优化技术, 推理性能提升 5-10 倍。
在顶层的软件应用层: 第四范式为企业客户提供快速部署可用的 AI 应用矩阵及定制软件,满足企业的通用及个性化需 求。通过预装智能应用套件加速通用 AI 工具落地,包括 AIGC、智能办公、数字员工、AI 本地 搜索、分析决策等(2024 年 11 月推出 SageSuite)。同时根据行业特性提供特定功能模块,发布 多个行业应用方案,覆盖银行、房产经纪、医疗、水利、工业和法律等业务场景。
第四范式技术迭代深度融合并受益于各类人工智能进展,包括生成式 AI 的多模态能力、Agent 产品形态、世界模型等。
1. 生成式 AI 为决策式 AI 提供更多模态且理解力更强的交互能力
决策式 AI 对于软件和业务环节的优化在于:通过收集历史数据,用机器学习总结规律,经由行 为-反馈-学习-应用四个步骤循环优化(HyperCycle 方法论),提升决策水平。生成式 AI 带来的 自然语言、图片、视频等多模态交互与理解能力的提升也促进了第四范式决策 AI 的运用和产品 的革新。其推出的 4Paradigm SageGPT 专注于通过多模态交互、企业级知识库整合和业务流程自 动化,帮助企业提升效率、优化决策,即基于机器学习和大模型技术,重构企业软件交互方式。 以集装箱货物摆放规划为例,SageGPT 会根据一个“装箱任务规划”的需求,沟通了解集装箱尺 寸、货物尺寸与件数及其他特殊需求,自动计算出最优堆叠结果,以 3D 图形展示,且推理过程 可见。
2. 通用大模型可被灵活部署在本地
2025 年 2 月,第四范式推出 Model Hub AIOT,客户可在端侧直接部署各类小尺寸蒸馏模型,包 括 DeepSeek、Qwen、Llama 等。端侧小模型的优势包括:1)离线运行,可灵活在多个模型之间切换;2)兼顾了模型压缩、推理性能,解决了部署与优化的复杂性;3)不仅能够满足用户对隐 私和实时性的需求,还极大降低了 AI 大模型推理成本。 9 月公司针对部署模型与芯片架构互不兼容的痛点推出 Model Hub XC。目前市面上运行的 ModelHub 中,很多国外模型和软件是针对他们的硬件(如英伟达 GPU)对应优化的,而国产硬件 会有“不适配”问题,导致在国产算力生态中,不同模型往往需要分别适配,耗时长且重复工作 量大。Model Hub XC 通过基础算法架构适配驱动批量化模型支持,并能缩短模型上国产算力平 台的部署周期。上线时已适配认证的模型数量达上百个,并将在一年内达到十万数级,已适配的 信创算力包括:华为昇腾、寒武纪、天数智芯、昆仑芯、沐曦和曦望等(按英文名排序,排名不 分先后),未来将覆盖市面所有主流信创算力。
3. 先知 AI 平台逐步打造全面 AI 生产力体系,构建垂类行业大模型能力
先知 AI 平台从底层算力平台、提供企业级特性的 AIOS 操作系统,到顶层全套软件 SageSuite, 提供全方位、高效率及高性价比的 AI 数字化转型基础设施和全流程的模型及软件开发工具链。 先知平台的发展过程可以总结为三个阶段。早期聚焦于提升模型本身的精度和自动化水平,降低 开发门槛让企业“用起来”。中期关注 AI 如何真正在业务中落地并产生可衡量的商业价值,解决 “用得好”和“有价值”的问题。上市以来加速融合生成式 AI 技术、提出 AIGS 战略,强调通过 Predict the Next "X" 的理念处理多模态数据,构建行业大模型,并通过资源池化和模型生态 建设,实现规模化应用和成本优化,让 AI 高效普惠。 2015 年,先知 AIOS 1.0 首次发布,通过高维、实时、自学习框架大幅提升模型精度; 2017 年,先知 AIOS 2.0 利用自动建模工具 HyperCycle,降低模型开发门槛; 2020 年,先知 AIOS 3.0 规范 AI 数据治理和上线投产,连通建模与应用落地; 2022 年,先知 AIOS 4.0 引入北极星指标来刻画企业的核心竞争力与目标 例如:希望以用户体验取胜的企业可以把“用户留存率”作为北极星指标;以服务效率 取胜的企业可以把“边际成本”作为北极星指标;以销售取胜给的企业可以把“客户经 理人均贡献利润” 作为北极星指标等。 2024 年,先知 AIOS 5.0 升级预测下一个 X 的能力,核心特点是基于各行各业场景的 X 模态数 据,构建行业基座大模型。
第四范式 AIGS 迭代结合 CoT 思维链,使企业级 Copilot 能够进行推理和任务拆解,增强 AI 自 动执行的能力。 AIGS 1.0 阶段是 Copilot,能调动各类信息、数据、应用,作为助手完成用户的指令。 AIGS 2.0 阶段是 Copilot+知识库,可以通过查询知识库,参照规则做更复杂的工作。 AIGS 3.0 阶段是 Copilot+CoT(思维链),大模型不断学习软件系统的使用行为,形成针对这个 领域的思维链,实现 AI 能自动地按照步骤完成某个任务而非依靠指令和既定规则。
AI Agent 理解人的需求+垂直世界模型解决问题是第四范式实现 AGI 的核心理念。Agent+世界模 型的架构即是以行业 Know-How 提炼垂类世界模型,Agent 为与人交互的产品形式。优势在: 更高效的复杂问题解决能力:通过 Agent 理解人类意图并进行任务分解,再调用世界模型执 行,能够处理比单一大模型更复杂、专业性更强的业务场景。 更好地平衡通用性与专业性:大语言模型提供通用对话和理解能力(由 Agent 体现),而世 界模型则深耕垂直行业,解决了大模型在专业领域深度不足及幻觉问题。 持续进化与自我强化:AI Agent 在与人的交互中不断学习优化沟通能力,世界模型在解决实 际问题的过程中持续迭代增强专业能力,两者形成正向循环。 降低开发门槛与成本:第四范式提供的大模型工具链和开发平台,支持可视化编排和低代码 开发,缩短企业 AI 应用的开发周期。
Agent 是大模型实现在企业与个人工作流长驻与应用的重要媒介。每一个 Agent 都封装或打包了 一定的模型能力,并且过程可追溯、可审计,未来也将更加可控。Agent 突破传统规则执行,结合细分行业世界大模型主动感知、自主决策及执行复杂任务。具体来看,Agent 可充分理解使用 者指令与意图,对复杂任务目标进行分解与排序,并帮助使用者执行。 在理解垂直/行业世界模型前,我们先通过 Genie3 图像——即模拟真实人类视角的世界模型来 理解更广义或更全面的世界模型概念。 在 《 Recurrent World Models Facilitate Policy Evolution ( David Ha,Jurgen Schmidhuber,2018)》中提出,世界模型有三个核心部分:感知、记忆、决策。世界模型通过感 知组件与记忆组件,所学习到的关于环境的表征与对于未来的预测能有效地帮助模型理解现实, 构建强大的复杂因果推理能力,提升 AI 在动态环境中的自主决策能力。例如在生产流程中,如 果设备某个部件出现故障,需通过记忆与学习预测会受到影响的各个环节,并将实际发生情况返 回、反馈,以优化下一次预测。 谷歌 DeepMind2025 年 8 月发布的 Genie3 很直观地展现了模拟人类认知现实世界的通用世界模 型能力,在保持场景和物理一致性上有较大突破(实现数分钟级环境一致),包括结合记忆和过 往结果的下一帧预测、长视野推理与反事实推理。反事实推理(“What-If”)是通过思考过往认 知,来判断“假如发生了某件事情”的影响,而非“对着题集找答案”。

通用世界模型的建立是一个“人类”多维度的常识积累,垂类/行业世界模型的建立是一个行业专家的专用知识积累。通用世界模型的关键技术与能力包含因果推理能力、场景重建时空一致性、 多模数据物理规则准确描述、执行与实时反馈。以上核心能力亦可被抽象应用于行业世界模型中。
行业模型的反馈与自学能力使其效用与效率超越人工。在早期第四范式的银行反欺诈方案案例 中就展现了行业模型能力:制定传统反欺诈方案需要业务专家总结经验,而通常顶尖的专家团队 最多能制定出一千条专家规则,仅能覆盖重点区域的典型欺诈场景。但在某全国性股份制商业银 行与第四范式的合作案例中,仅基于一年的交易数据,银行就通过机器学习制定出了 25 亿条反 欺诈规则,不仅涵盖“非典型区域”的“非典型特征”,对于更新的欺诈方式也具备一定洞察能 力。该案例实际上线效果较传统专家规则提升 7.6 倍。反欺诈模型事后验证,对客户打扰率相比 专家规则下降 57%。 解决企业核心业务痛点的行业大模型具备如下特征:1.使用不限于开源的数据来源,运用企业内 部的结构与非结构化数据;2.认知和理解特定行业或领域运行规律;3.在进行企业核心价值与业 务逻辑的梳理后,结合行业知识图谱(+思维链能力)、决策 AI、生成式 AI 形成垂类行业大模型 辅助优化决策。
第四范式的 AI Agent+行业大模型已在多类业务中落地实践并实际创造企业价值,包括港口业 务、房产中介、法律、制造业、医疗等(截至 2025H1)。
在港口业务中,智能体自主分析上月数据,提醒业务人员因货船卸货顺序不合理导致某泊位效率偏低(例如翻箱率高了 20%),提出调整堆放策略的建议并根据实时货物状态给出最 优堆放方案。
在房产中介的日常业务中,智能体通过房产知识库与政策法规模型,对内提升经纪人专业 服务能力(理解经纪人在日常咨询、合同解读、政策适配等方面的即时学习需求,提供 7× 24 小时的专业知识问答与业务场景培训);对外提升客户个性化服务能力(通过客户行为分 析与推荐模型,基于客户浏览、询盘、历史交易数据,理解客户购房需求与偏好,智能匹配 房源信息,提供个性化房产推荐)。
在法律行业,智能体加速合同扫描与风险检测,几分钟就能完成原本耗时数小时的人工合 同审阅,既避免人为疏漏、确保审查覆盖所有关键风险点,又能基于统一标准审核,避免不 同人审核标准不一的问题。
在制造业,智能体帮助某飞机制造集团将零件生命周期成本降低上亿元;某半导体集成电 路企业通过半导体制造智能排产派工,产能提升 13%。
在医疗业,智能体助力医疗机构实现接诊能力及效率的实际提升:理解医患需求,并链接丰 富细分的医疗行业垂直模型,实现医疗资源利用率提升 60%、每年手术台次数提升 14.5%、 平均每台手术节省时间 0.25 小时等。
因此总结来看,第四范式以决策 AI 为基础,融合生成式 AI 帮助企业实现智能化,解决各行业 企业“不知道 AI 能力边界”、“不知道怎么用 AI”、“内部部署需投入大量人力与时间”等问题: 1. 本地化部署:SageOne IA 本地化一体机形式部署,支持全国产链落地。 2. 结合通用 AI 能力:使用 SageGPT 进行自然语言交互、使用 Sage CodeX 进行代码辅助、 使用 Sage Builder 快速生成 AI 应用部署 Agent 等。并且实现不同模型满血版与蒸馏版 的“智能切换”,提升算力使用效率与使用体感。 3. 决策 AI + 行业世界模型(行业知识图谱+思维链 CoT)+ Agent 构成各领域企业的业务 定制化大模型。