2025年传媒互联网行业年度策略报告:2025Agent元年,AI从L2向L3发展

一、为什么说2025年是Agent元年?

我们认为2025年将是Agent之年

OpenAI将AI发展阶段分为L1到L5五个阶段。我们认为,AI正从L2(推理者)向L3(Agent)进化,Agent代表了AI从“思考”走向“行动”的关键一 步,是继大模型之后的下一个重要发展阶段和业界寻求的新突破口。驱动力来自:技术、产品、需求。 L1 - 聊天机器人 (Chatbot) :以ChatGPT(2022年底发布)为代表,具备自然语言交互能力。机器直接输出文字或回答。相较于机器学习时代,AI Chatbot 实现了“通用性” ,不再局限于特定场景或单一问题,而是能处理广泛的语言任务。这是从基于规则、机器学习、神经网络、Transformer架构 一路发展过来的通用大模型阶段。在这一阶段,交互模式是主要是输入-输出模式,用户提问,模型回答。 L2 - 推理者 (Reasoner):具备更强的推理能力,能够处理更复杂的问题。用户能看见模型的推理过程。代表产品如OpenAI的o1系列、DeepSeek R1。相 较于L1阶段,引入了强化学习和思维链(CoT)技术,模型在输出最终答案前会进行多步思考。 L3 - 智能体 (Agent):能够自主规划和执行复杂任务的智能体。具备记忆、规划、工具使用和行为记忆四大核心能力。相较于L2阶段,AI从被动的“信 息处理/推理”走向主动的“与外部世界交互和执行”。能调用工具(如浏览器、API)、操作软件界面,形成“指令->思考->交互->观察->再思考...”的 闭环系统。

Why Now?——技术成熟度达到临界点

驱动力一:技术成熟度达到临界点。支撑通用Agent发展的关键技术要素,特别是强大的多模态基础模型(能理解视觉信息如屏幕内容)和成熟的强化 学习训练方法(能训练Agent与环境交互),已经发展到相对成熟的阶段。从L0到L1:标志GPT-3、ChatGPT(2022年底)为标志。背后的技术驱动力是Transformer架构的出现,使得训练更大、更通用的语言模型成为可能。 在这一阶段,实现了 “通用性” (Generality),模型不再局限于特定场景,而是能够处理广泛的自然语言任务,像一个巨大的知识库。

从L2到L3:关键的技术要素(强大的多模态基础模型和成熟的强化学习训练方法)已经趋于成熟,达到了可以支撑通用 Agent 发展的阶段。 OpenAI在2025年1月发布Operator,更是印证和点燃了这一行业共识。具体来说,关键的成熟要素包括: 强大的基础模型:像Claude Sonnet 3.5这样强大的、原生的多模态基础模型已经出现。这些模型具备了足够好的视觉理解、语言 理解和基础推理能力,能够“看懂”图形界面(如网页、操作系统界面),这是构建基于GUI(图形用户界面)的Agent的前提。 而在过去(例如OpenAI在2016年尝试类似项目时),缺乏这样强大的基础模型是导致失败的关键原因。 成熟的强化学习技术与框架:以强化学习为核心的 Post-training技术在2024年通过O1、O3等模型在纯文本领域被证明是极其有效 的,能够显著激发和提升基础模型的深层推理和规划能力。行业将这种成功的范式应用到多模态领域,以训练出能够与环境交互、 执行任务的Agent。

Why Now?——行业领导者推动,标杆产品验证

驱动力二:行业领导者推动,标杆产品验证。 OpenAI、Anthropic、Google等头部公司发布关键产品(如Operator, DeepResearch)和 技术协议(如MCP),并投入研发,起到了引领和示范作用。相对成型的Agent产品开始涌现(例如Manus、AutoGLM、Genspark 等),验证了技术可行性,并点燃了行业共识,标志着Agent从设想走向相对成熟的产品阶段。

Why Now?——MCP的普及助推Agent互联互通

在MCP出现之前,Agent 想利用外部工具或数据源(例如调用一个API、查询数据库、读取Slack消息、 操作某个软件),面临着巨大挑战:接口各异、定制开发成本高、生态割裂。 MCP的普及有助于推动Agent行业互联互通。MCP (Model Context Protocol,模型上下文协议),是由 Anthropic提出的一个开放协议,旨在统一大型语言模型(LLM)/Agent与外部工具、数据源之间的通信 方式。MCP通过提供一个开放、统一的通信标准,可以解决Agent与外部世界交互的碎片化和高成本问 题。它的普及将极大地降低集成门槛,增强不同模型、Agent和工具间的互操作性,催生出一个更加繁荣、 开放和互联互通的Agent生态系统,最终赋能更强大、更通用的AI Agent应用。

Why Now?——市场需求驱动

驱动力三:市场需求驱动。 回顾AI发展历程,如果说2023年是“模型竞赛年”(以LLM本身性能竞赛为标志),那么2024年则是“应用探索年”。在2024年,涌现了大量基于 LLM的应用,例如各种聊天机器人、写作助手、简单的Copilot等。企业投入资源进行尝试,希望将AI能力融入业务流程。 然而,2024年的应用探索也暴露出一些局限性。许多应用可能只是“薄封装”,未能深入解决核心业务痛点;或者其自动化能力仅限于相对简单的单 点任务,难以应对跨系统、多步骤的复杂工作流;带来的生产力提升往往是局部的、渐进式的,未能完全达到市场最初的高期望,也使得AI投入的 ROI不够清晰。 进入2025年,市场心态发生了转变,特别是对于需要为AI投资寻求明确商业价值的To B而言: ① 从“尝试”到“落地”:企业不再满足于概念验证(PoC)或小范围试点。他们需要能够真正部署到生产环境中、稳定可靠、能与现有系统集成、 并产生可衡量业务成果的AI解决方案。市场渴望看到AI技术从“玩具”或“助手”变成真正能干活、能解决问题的“员工”或“自动化引擎”。 ② 渴望自动化“更复杂任务”:简单的问答、基础的内容生成等“低垂果实”已被初步采摘。企业现在关注的是那些更耗时、更繁琐、涉及多个步骤、 需要调用不同工具或信息源的复杂流程。例如,自动完成一份包含数据搜集、分析、图表生成和报告撰写的市场研究报告;或者自动化处理一个需要 查询订单系统、物流系统、与客户沟通并执行退款操作的客服请求;亦或是完成整个软件开发周期中的部分环节。这些是传统自动化或简单AI应用难 以触及的领域。 ③ 期待“更显著”的生产力提升:市场不再满足于10%或20%的效率提升。他们期待的是数量级(例如数倍甚至更高)的生产力飞跃,能够真正重塑 工作方式、显著降低成本、或者将人力解放出来从事更高价值的创造性或战略性工作。 而AI Agent(智能体)的出现,恰好精准地契合了市场的这种新期待:①为复杂任务而生:Agent的核心能力(如自主规划、记忆、工具使用)使其天 然适合处理多步骤、需要与外部环境(如网页、软件、API)交互的复杂任务,这正是市场所需要的。②强调“执行”与“行动”:不同于L1/L2主要 停留在“对话”或“推理”,L3 Agent的设计目标就是完成任务、采取行动,这与企业追求“落地”和实际效果的需求高度一致。③潜力巨大:通过自 动化更复杂、更耗时的工作流,Agent有望带来指数级的效率提升和生产力解放,满足市场对“显著”价值回报的期待。

二、Agent为何重要?解放生产力、走向AGI和具身智能、挑战入口格局

Agent将带来革命性的变化——深度自动化

AI Agent作为下一代AI应用形态,将带来革命性的变化,远超简单的信息检索或内容生成。Agent是能够主动执行任务、解决问题的 数字化劳动力或超级助理,其核心价值体现在: ①深度自动化: 超越简单重复:不同于RPA或传统脚本主要处理固定流程的重复性任务,Agent能够理解模糊指令,自主规划并执行复杂的、多 步骤的、甚至需要适应变化的认知型任务。例如,Operator能模拟人类操作任意GUI界面完成预订或购物,Devin能自主完成软 件开发中的编码、调试、测试等系列环节。 端到端流程: Agent有潜力打通原本需要多个人类角色、多个软件系统协作才能完成的端到端工作流,实现更高层次的自动化。 认知自动化: 其核心是自动化需要思考、判断、与数字世界交互的“知识工作”,而不仅仅是体力或简单的点击操作。

②指数级效率提升: 速度与规模: 对于特定任务,Agent的处理速度可以远超人类(如RE-Bench短时限测试表现)。更重要的是,Agent可以7x24小时不间断工作,并 且可以轻松扩展(理论上增加算力即可增加Agent数量),实现人力无法比拟的规模化效率。 成本优化潜力: 虽然当前推理成本较高,但通过自动化高价值、高成本的人类劳动(尤其是专业知识工作,如软件开发、法律咨询),长期来看 具有巨大的成本节约潜力。一个高效的Agent理论上可以替代或增强多个人类员工的生产力。减少错误与提升一致性: 对于定义清晰的任务,Agent有望减少人为错误,提高执行的一致性和标准化水平(尽管当前可靠性仍是挑战)。 ③解放人类生产力与创造力: 人机协作新范式: Agent不仅仅是替代,更是强大的增强工具和协作伙伴。它们可以承担复杂流程中繁琐、耗时的部分,让人类专家(开发者、研究员、 律师等)从重复性劳动中解放出来。 聚焦高价值活动: 人类可以将时间和精力投入到更需要创造力、战略思考、复杂决策、情感沟通和人际协作等AI尚不擅长的高阶任务上。 赋能创新: 通过自动化原本难以完成或成本过高的复杂分析与操作,Agent可能催生新的科学发现、商业模式或艺术创作,拓展人类能力的边界。

三、竞争格局:模型即产品,通用Agent将由大厂主导

AI Agent的竞争格局是典型的“巨头环伺,新锐突围”

AI Agent的竞争格局是典型的“巨头环伺,新锐突围”。大型科技平台凭借模型、数据、资金和生态优势占据主导地位,并致力于构建平台和生态系 统。然而,在基础设施、工具链以及需要深度领域知识的垂直应用方面,仍然存在创业公司和专业厂商的机会。成本、效率、交互体验和商业模式的 创新将是未来竞争的关键。后续续密切关注技术演进、平台战略以及细分市场的动态。

模型即产品:浅层套壳产品终将被颠覆

我们认为浅层套壳产品终将被颠覆。为什么?根本原因在于这类产品缺乏可持续的竞争壁垒,极易受到快速迭代的AI技术和市场格局的冲击:过度依赖底层模型,易受到模型迭代的降维打击。浅层产品的能力上限完全由底层模型决定。一旦底层模型升级换代缓慢、API提价、调整服务策 略甚至停止服务,这些产品将立刻失去竞争力甚至无法生存。它们的命运完全掌握在模型提供商手中。然而,基础大模型的能力迭代速度极快。今 天需要一个“套壳”应用才能实现的功能,明天可能通过调用新一代模型的一个简单Prompt就能直接完成。模型能力的提升会不断“内化”原本属 于应用层的功能,使得那些仅仅是对旧模型能力进行封装的浅层应用迅速变得多余和过时。 缺乏核心壁垒,易被复制:由于没有构建真正的技术或产品壁垒,竞争对手可以轻易地通过调用相同或类似的底层模型API,快速复制出一个功能 相近的产品,导致市场迅速陷入同质化竞争和价格战。 平台整合的挤压效应: 拥有强大基础模型和生态系统的平台公司(如微软、谷歌)倾向于将AI能力深度整合进其操作系统、办公套件、浏览器等核 心产品中(如Windows Copilot, M365 Copilot)。用户在熟悉的、高频使用的平台内就能便捷地获得类似甚至更好的功能,这将极大挤压独立的、 功能单一的浅层套壳应用的生存空间。

四、Agent将最先落地于知识工作(尤其是代码)

Agent最先落地的行业和场景可能是知识工作(尤其是代码)

我们认为,AI Agent早期落地场景将是通用办公场景、专业开发领域或特定垂直行业。在这些场景中,Agent可以发挥其不断增强的推理、规划及工具 使用能力(尤其是编码和操作数字界面),去自动化目前由人类执行的相对标准化、流程化的数字任务。而且在这些场景中,Agent提升效率、解放生 产力的价值能最快体现。而更复杂、需高度创造力(L4)或涉及复杂物理世界交互的任务,是更长远的目标。自动化重复性、流程化的数字/知识工作:这是Agent最容易发挥核心价值的场景,也是我们最看好的早期落地场景。因为:这类任务通常流程相对 固定,适合当前Agent 的规划和工具使用能力;能显著提升效率、解放人力(节省注意力),价值明确。 软件开发与编程辅助:这是Agent能力(特别是代码能力)能展现突出优势,且已经有成功产品的领域。因为:编程环境本就是高度结构化、规则 明确的数字环境,非常适合Agent发挥作用;且模型在编码任务上进步显著,对开发者生产提升价值巨大。 垂直领域的专业Agent(如营销/人力资源):对于创业公司而言,这是更容易切入和建立壁垒的方向。因为:任务边界相对清晰,更容易整合领域 知识;相比通用Agent,技术门槛和投入相对较低;商业需求明确。

Agent最先落地的行业和场景可能是知识工作

在法律AI Agent中,Harvey AI是目前估值最高的公司,25年1月完成3亿美元融资,估值达30亿美元;截至25年初,ARR达5000万美元。 相较于其他法律Agent,Harvey AI全面且高效,适用于大型律所(可以处理复杂的跨司法辖区案件)。其他产品则有不同侧重点,例如CoCounsel擅长 文档总结或问答功能;Spellbook经济实惠,在合同工作方面表现出色,适合中小型律所;而Tucan.ai则以“完全符合GDPR合规要求”为卖点,主要面 向需要严格数据保护的欧洲客户群体。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告