当前,我们在广告平台、企 业决策、企业客户管理 CRM 等领域均看到了 AI 能力迭代的体现。
盘点 2024,Anthropic、智谱、苹果、荣耀等多家企业围绕 Agent 能力都取得了相应突 破。展望 2025,我们认为,AI Agent 功能有望在各家大模型和硬件公司的迭代之下,在 PC、手机以及更多软硬件场景得到落地和完善。
1.1 电脑端:Computer Use 场景快速落地
2024 年 10 月 22 日,Anthropic 公司发布了全新的大模型——Claude 3.5 Sonnet,被 Anthropic 的产品经理 Michael Gerstenhaber 誉为迄今为止最智能的模型;并推出了一款 新模型 Claude 3.5 Haiku。 Claude 3.5 Sonnet 最引人注目的功能是其计算机使用能力——通过相应 API,电脑可以 模拟人类操作,完成读屏、移动光标、点击按键、输入文本等等任务动作。
根据公司官网介绍,这一能力的实现主要依靠如下步骤: 屏幕识别:读屏能力依然是重要前提。 逻辑推理:针对所识别出的屏幕内容,推理出何时、如何进行相应的操作。 定位执行:准确计算像素定位非常重要:为了正确点击相应的位置、需要垂直或水 平移动多少像素。 快速泛化并持续迭代:研究团队观察到模型泛化非常迅速,在遇到困难的时候还会 自我修正后重新尝试任务。 在 OSWorld 这一评估计算机使用能力的基准测试中,Claude 3.5 Sonnet 的准确度达到 14.9%,在给予更多步骤的情况下达到 22.0%,位列行业首位。
1.2 手机端:Phone Use 场景成为现实,功能望快速完善
2024 年 10 月 25 日,智谱推出一款创新 Agent 工具 AutoGLM,它能够接收简单的文字 或语音指令,模拟人类操作手机,完成一系列复杂的任务。比如,在淘宝上购买历史订 单中的商品、在美团点外卖、在 12306 购买火车票等等任务,AutoGLM 都能轻松完成。
根据智谱 AutoGLM 团队的论文解释,这一强大功能的实现依托如下核心步骤:多模态读屏:传统的 RPA“(机器人流程自动化)中通过 OCR 进行 GUI“(图形用户界 面)的识别,但难以被泛化。而大型多模态模型则可以进行模糊匹配和长任务规划, 因此对 GUI 理解很有帮助。 模拟操作:Behavior Cloning“(行为克、、操作模拟)对于 Agent 训练非常重要,当 然一个基础的问题是 agent 可能仅仅是在模仿而非理解。 课程学习(Curriculum Learning):Agent 任务通常很复杂,因此渐进式的课程学习 非常重要。 奖励建模(Reward Modeling,RM)和强化学习(Reinforcement Learning,RL): 相对于过去的特定任务训练,现在 agents 在所处的开放世界中要进行泛化的任务, 需要有更加泛化的奖励建模和强化学习。 AutoGLM 之所以如此强大,得益于其两大核心技术创新: 首先,通过中间界面设计(Intermediate Interface Design),AutoGLM 实现了 任 务规划”和 动作执行”前后两个阶段的解耦合,这使得智能体在任务规划和动作 执行时更加精确和灵活。 其次,AutoGLM 采用了 自进化在线课程强化学习框架”来训练和提升大模型智能 体的能力。这一框架通过自进化学习策略,实现不断的自我考察、鞭策、提升。

在性能表现上,AutoGLM 在 Phone Use 和 Web Browser Use 上都取得了显著的提升。 在 AndroidLab 评测基准上,其成功率达到 36.2%,显著超越了 GPT-4o 和 Claude-3.5- Sonnet 两者的水平。在 WebArena-Lite 评测基准中,其更是相对 GPT-4o 取得了约 200% 的性能提升。
我们看到 Claude 3.5 Sonnet/AutoGLM 作为 AI Agent 在电脑端/手机端的典型案例,具 备广泛的应用前景和潜力。我们预期 2025 年会看到更多 Agents 在更广泛的场景中得到 应用、功能也将更加完善。
AI 模型的迭代、数据的积累,在企业服务场景中作用突出。当前,我们在广告平台、企 业决策、企业客户管理 CRM 等领域均看到了 AI 能力迭代的体现。
2.1 广告平台:模型与数据能力助力广告精准投放
模型的迭代、数据的积累,对于广告精准投放以及智能出价帮助明显。以 Applovin 为例, Applovin 的 Axon 广告引擎以及全生态的数据和信息优势,对广告投放和平台变现带来 了显著的驱动。 作为全球领先的移动营销平台,Applovin 帮助广告主触达应用内、移动端、CTV 等多渠 道的超过 14 亿的日活跃用户,让业务拥有更多可能,增速更快,并取得实质性的广告收 入增长。Applovin 主要业务分为软件平台和应用程序。其中:1)软件平台由公司基于人 工智能的推荐引擎 AXON 提供支持,使广告商能够自动化营销、参与和变现;2)应用程 序包含了以休闲、三消和卡牌为主的 200 多款免费手机游戏。 自推出人工智能广告推荐引擎 AXON 以来,AppLovin 的软件平台收入迅速增长。2023 年 软件平台收入同比增长 76%、2024Q3 软件平台收入增长 66%。软件平台的业务由基于 AI 的推荐引擎 AXON 提供支持,帮助广告主优化其营销和变现: 精准匹配:营销技术的提供使广告商能够通过个性化内容接触到更多最合适的用户, 从而增加下载并参与其内容的用户数量。 智能定价:为广告商提供货币化和分析技术,通过获得每个曝光量的高价来最大化 其广告库存的价值。 流程优化:为开发者提供一套优化应用和简化业务的功能。 AI 模型的迭代、数据的持续积累,对于 AppDiscovery 实现精准投放而言非常重要。 作为 AppLovin 软件平台的主要收益来源,AppDiscovery 是一款帮助移动应用触达大规模优质用户,并发掘新的增量受众,促进增长的软件平台,由 AXON 的预测算法提供支 持。模型迭代以及数据积累对于该平台的运作和变现起到关键驱动作用: AXON 的升级帮助提升公司变现能力。AXON 的算法赋能精准用户定向,使广告商 能够将他们的应用与更有可能下载的用户进行匹配,从而提高广告效果、并推动了 现有广告商的支出增加,从而进一步推动了 AppLovin 的增长。
公司的应用生态、数据积累反哺 AI 效率提升。从 2018 年初到 2022 年底,公司投 资了近 40 亿美元,进行了 29 项战略收购,并与移动应用开发商建立了合作伙伴关 系。公司的 MAX 聚合平台、大量的游戏应用为广告投放积攒了必需的数据和信息优 势。公司官网表示 AppLovin 已有超过 14 亿的日活跃用户,这些数据和信息优势反 过来又提高了软件平台解决方案的效率和增长。 从实际效果上来看,2024Q3 Applovin 总收入为 12 亿美元,同比增长 39%;较 2023 年 公司收入的 17%增速提升明显。其中, 收入层面,2024Q3 软件平台收入增长至 8.4 亿美元,同比增长 66%;应用程序收 入为 3.6 亿美元,同比增长 1%。软件平台收入贡献了总收入的 70%。 利润层面,2024Q3 公司实现利润 4.3 亿美元,同比增长高达 298%,调整后利润率 60%。 在 Applovin 的案例中,通过 AI 驱动的广告推荐引擎 AXON,AppLovin 不仅提升了广告 商投放的变现能力,也优化了用户体验,带来了业务增长。 我们看到,更多广告平台企业如汇量科技、Unity 等,都有望继续利用其 AI 模型迭代和 数据积累的优势,继续扩大其全球用户基础和完善产品生态,进一步为广告主创造更多 价值。
2.2 CRM:Agentforce 等代理系统赋能 CRM 实现智能交互
在 CRM 领域,AI 模型的应用效果也日益凸显。以 Salesforce 为例,公司最新推出 AI 代 理系统 Agentforce,通过自动化处理服务、销售、营销和商务等任务,提升员工工作效 率和客户满意度。 Salesforce 作为领先的企业服务平台,致力于为企业提供全面的客户关系管理(CRM)解 决方案。公司通过其强大的 CRM 平台,为企业提供销售、服务、营销和商务智能等领域 的定制化解决方案,帮助企业提升客户体验和业务效率。Salesforce 还提供丰富的数据 分析和应用开发工具,帮助企业实现数据驱动的决策优化,推动业务创新和增长。公司 业务主要分为两个版块: 订阅和支持:Salesforce 的核心业务,主要提供基于云的 CRM 软件订阅服务,以及 相关的技术支持和维护服务。
专业服务和其它:这一板块涵盖 Salesforce 提供的咨询服务、定制开发、培训等增 值服务等。 Agentforce 的推理引擎(Agentforce Reasoning Engine)旨在通过多轮对话、主题分类、 指令和操作、知识检索等功能,增强用户交互,提供更精准、更有效的服务。Agentforce 在 Salesforce 的客户实际业务场景中中展现了巨大实际的潜力: 出版公司 Wiley 选择采用 Agentforce 和 Service Cloud with Einstein AI,来处理新 学期学生使用教育资源时服务请求激增的挑战。Agentforce 的 AI 智能代理让客户能自行解决常见问题,在最初几周内将案例解决率提高 40%以上。同时,AI 生产力 工具使季节性客服人员入职速度加快 50%,实现 213%的投资回报率; 奢侈品连锁百货公司 Saks 利用 Agentforce 进行订单状态管理和退单查询,有效提 供了个性化服务,并加强了客户关系,提升了奢侈品购物体验; 团体订餐服务公司 ezCater 则借助 Agentforce 改变客户体验,实现客户服务自动化, 简化食品订购流程。 这些成功案例充分彰显了 Agentforce 在助力企业利用 AI 功能实现业务升级方面的卓越 能力。我们认为,随着 AI 能力的迭代,各类代理系统可以赋能企业在 CRM 领域实现更 多的智能交互。