AI Agent商业化进展如何?

最佳答案 匿名用户编辑于2025/02/26 15:05

大模型推理需求显现,AI Agent商业化推进。

OpenAI发布o1模型,开启大模型新范式。OpenAI 于24年9月推出全新o1系列AI模型,复杂推理能力 显著增强,在一系列高难基准测试中表现相比 GPT-4o提升明显,特别在数学、编码和科学方面。 o1模型技术关键在于强化学习(RL)的搜索和学 习机制,基于LLM已有推理能力,迭代式的 Bootstrap模型产生合理推理过程(Rationales)的 能力并融入到训练过程中,进而让模型学会推理, 运用足够强大的计算量实现后训练(Post-Training) 阶段的扩展。o1模型通过内置思维链(CoT)逐步 解决问题的方式一定程度上模拟了人类慢思考过程, AI进入L2"推理者"阶段,有望加速向AGI迈进,同 时模型性能随着强化学习时间(训练时计算量)和 推理时间(测试时计算量)的增加而显著提高,不 同于传统的大规模预训练方式(通过增加参数量和 数据量),具有独特的扩展性优势,带来新的 Scaling Law。

国内陆续发布类o1推理模型。DeepSeek推出R1- Lite 推理模型;Kimi(月之暗面)推出主打数学能 力的推理能力强化模型 k0-math;阿里先后推出 Marco-o1、QwQ 两款推理模型;昆仑万维推出 Skywork o1 推理模型。高校方面,北大、鹏城实 验室发布能够自主进行多阶段推理的视觉语言模型 模型 LLaVA-o1;上交大 GAIR 研究组发布 o1 复现 项目。部分公司模型数据集评分效果超越o1模型。

国内外AI Agent发展加速。一个基于LLM的AI Agent系统可以拆分为LLM、规划、记忆、工具使用四个组件部分,其中LLM扮演了Agent的 “大脑”,在系统中提供推理、规划等能力。Agent核心在于自主性的增强,有望成为垂直应用的超级入口。

海外方面,24年6月,苹果在开发者大会上展示Apple Intelligence;根据彭博社信息,OpenAI正在开发AI Agent“Operator”,计划2025年1月发 布;24年10月,Anthropic推出“Computer Use”,能够与浏览器互动,并直接控制用户计算机上的多个应用程序;微软宣布将为Dynamics365 系列业务应用推出10个新的AI Agent;谷歌正在研发AI Agent“Jarvis”,可接管用户的网络浏览器,自动执行购买产品等任务;Salesforce等应 用公司同样计划推出定制化的AI Agent。

同时期国内方面,智谱发布AutoGLM,通过接收文字/语音指令,可以模仿人类操作手机,11月升级发布,支持自主执行超过54步的长步骤 操作,跨App执行任务,同时发布基于PC的自主Agent GLM-PC,可以自主完成会议替身、文档处理等功能。

推理算力需求占比提升。随着训练模型完善与成熟,模 型和应用产品逐步进入投产模式,处理推理工作负载的 AI服务器占比将随之提升,IDC预计国内到2027年用于 推理的工作负载占比将达到约73%。根据Barclays预测, 推理算力规模有望在2026年超过训练侧,并在此后每年 保持数倍扩张,相关资本开支保持同比翻倍以上增长。