AI Agent商业化进展如何？ - 问答集锦

最佳答案由匿名用户编辑于2025/02/26 15:05

大模型推理需求显现，AI Agent商业化推进。

OpenAI发布o1模型，开启大模型新范式。OpenAI 于24年9月推出全新o1系列AI模型，复杂推理能力显著增强，在一系列高难基准测试中表现相比 GPT-4o提升明显，特别在数学、编码和科学方面。 o1模型技术关键在于强化学习（RL）的搜索和学习机制，基于LLM已有推理能力，迭代式的 Bootstrap模型产生合理推理过程（Rationales）的能力并融入到训练过程中，进而让模型学会推理，运用足够强大的计算量实现后训练（Post-Training）阶段的扩展。o1模型通过内置思维链（CoT）逐步解决问题的方式一定程度上模拟了人类慢思考过程， AI进入L2"推理者"阶段，有望加速向AGI迈进，同时模型性能随着强化学习时间（训练时计算量）和推理时间（测试时计算量）的增加而显著提高，不同于传统的大规模预训练方式（通过增加参数量和数据量），具有独特的扩展性优势，带来新的 Scaling Law。

国内陆续发布类o1推理模型。DeepSeek推出R1- Lite 推理模型；Kimi（月之暗面）推出主打数学能力的推理能力强化模型 k0-math；阿里先后推出 Marco-o1、QwQ 两款推理模型；昆仑万维推出 Skywork o1 推理模型。高校方面，北大、鹏城实验室发布能够自主进行多阶段推理的视觉语言模型模型 LLaVA-o1；上交大 GAIR 研究组发布 o1 复现项目。部分公司模型数据集评分效果超越o1模型。

国内外AI Agent发展加速。一个基于LLM的AI Agent系统可以拆分为LLM、规划、记忆、工具使用四个组件部分，其中LLM扮演了Agent的 “大脑”，在系统中提供推理、规划等能力。Agent核心在于自主性的增强，有望成为垂直应用的超级入口。

海外方面，24年6月，苹果在开发者大会上展示Apple Intelligence；根据彭博社信息，OpenAI正在开发AI Agent“Operator”，计划2025年1月发布；24年10月，Anthropic推出“Computer Use”，能够与浏览器互动，并直接控制用户计算机上的多个应用程序；微软宣布将为Dynamics365 系列业务应用推出10个新的AI Agent；谷歌正在研发AI Agent“Jarvis”，可接管用户的网络浏览器，自动执行购买产品等任务；Salesforce等应用公司同样计划推出定制化的AI Agent。

同时期国内方面，智谱发布AutoGLM，通过接收文字/语音指令，可以模仿人类操作手机，11月升级发布，支持自主执行超过54步的长步骤操作，跨App执行任务，同时发布基于PC的自主Agent GLM-PC，可以自主完成会议替身、文档处理等功能。

推理算力需求占比提升。随着训练模型完善与成熟，模型和应用产品逐步进入投产模式，处理推理工作负载的 AI服务器占比将随之提升，IDC预计国内到2027年用于推理的工作负载占比将达到约73%。根据Barclays预测，推理算力规模有望在2026年超过训练侧，并在此后每年保持数倍扩张，相关资本开支保持同比翻倍以上增长。

参考报告

通信行业专题报告：AI进入推理时代，重塑网络与终端链价值.pdf
- 查看报告