AI Coding 产品持续提升,GPT-5 有望再次推动AI 编程加速发展。
模型端持续进展,GPT-5 有望再次推动 AI 编程加速发展。2025 年 5 月,知名 AI 创业公司 Anthropic 正式推出 Claude 4 系列大模型。先期推出的型号包括Claude Opus4 和 Claude Sonnet 4,其中 Claude Opus 4 是一款全球领先的编码模型,它在复杂、长时间运行任务和智能体工作流中拥有持续的高性能,在 SWE-bench(72.5%)和 Terminal-bench(43.2%)基准上均处于领先地位。同时,第三方公司也给出了积极反馈,GitHub 表示,Claude Sonnet 4 在智能体场景中表现出色,并将它作为
在产品端,Anthropic 发布 ClaudeCode,支持通过 GitHub Actions 执行后台任务,与VS Code 和JetBrains 原生集成,可直接在文件中显示编辑内容,实现无缝结对编程。 GPT-5 前瞻:AI 编程依然是 AI 应用的核心领域之一。OpenAI 在 8 月正式发布新一代GPT-5 模型,首席执行官萨姆·奥特曼(SamAltman)已在 X 平台透露,GPT-5 将推出 mini 和 nano 等不同版本,并通过API 向外部开放。根据新智元报道,目前在 LMarena 上,已上线了 GPT-5-pro(zenith)。开发者用最强版 zenith,一键生成「星云」单页网站,速度质量都有较大改善,并可以用于修改游戏、搭建网站、生成动画等。
Cursor 引领产品端革新,智能体助力 AI 编程。2025 年 6 月,Cursor1.0 正式发布,推出多项重磅功能,其中包括代码审查工具、面向所有用户的后台智能体等等。代码审查工具 BugBot 可自动审查 Pull Request,找出潜在 bug 和问题,在GitHub 的PR上留言;面向所有用户的后台智能体能长时间进行构建、研究和调试代码工作,流畅高效。
AI 编程的商业化潜力不容忽视。根据华尔街见闻、彭博报道,成立仅三年的 Anysphere 于今年6 月完成9 亿美元新一轮融资,公司估值超过 90 亿美元。截至 2025 年 6 月,Anysphere 的ARR 已突破5 亿美元大关,核心驱动力是其开发的 AI 代码编辑软件 Cursor。从其官网信息看,Cursor 目前面向个人、团体有不同的收费模式。个人端基础版免费但存在一定限制(两周试用期、代码补全等功能的使用次数有限等),Pro 版和 Ultra 版的费用分别为每个月 20/200 美元;团体端,面对团队有每月40 美元的使用费用,同时也有针对企业端的定制化服务方式。
国内科技大厂重点发力 AI 编程,已在内部大量应用。(1)阿里:通义灵码 AI 程序员。2024 云栖大会期间,通义灵码 AI 程序员正式发布。通义灵码 AI 程序员是全球首个同时支持VS Code、JetBrains IDEs 开发工具的 AI 编程辅助工具。良好的兼容性使得开发者在熟悉的开发环境中即可便捷地调用 AI 编程功能,无需为适应新的开发平台而重新学习,降低了使用门槛。通义灵码 AI 程序员的功能特性包括:多开发工具支持:全球首个同时支持 VS Code、JetBrains IDEs开发工具的 AI 编程辅助工具。多文件代码修改能力:开发者只需提出需求,如在特定项目中添加新功能、修复问题或进行代码优化,AI 程序员就能自动完成多文件级的编码任务。单元测试生成功能:可以针对当前代码变更、单个或多个代码文件批量生成单元测试。多种开发能力拓展:包括上下文感知、意图理解、反思迭代、工具使用等多种开发能力。 根据阿里云官方公众号,三方基准测试平台 Chatbot Arena 公布了最新的大模型盲测榜单,通义千问Qwen2.5-Max 超越 DeepSeek-V3、OpenAIo1-mini 和 Claude-3.5-Sonnet 等模型,以1332 分位列全球第七名,也是非推理类的中国大模型冠军。同时,Qwen2.5-Max 在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。

(2)百度:Baidu Comate。2022 年 9 月,Baidu Comate 开启了其在软件开发领域的征程,主要承担代码推荐工作,通过接入文心大模型,学习 GitHub 公开代码数据以及百度内部全厂代码库,为开发者提供代码推荐服务,每天被采纳的代码超过 2.6 万行,展示出其在代码辅助方面的潜力。2023 年初,Comate 从单纯的代码推荐工具升级为更具实用性的代码生成助手,后续则发布 SaaS 版,使更多开发者能够使用其功能,应用于金融、科技、汽车、机械制造、软件服务等领域,代码采纳率超过 50%。2024 年 Baidu Comate 推出Comate+开放平台,通过 Github、GitLab、Gitee 插件,实现企业自己的知识、第三方能力与编程的深度结合。后续 Baidu Comate 迎来重大升级,进化为 Comate2.0 版本,并面向所有个人开发者免费服务。
其取得的成果包括以下几点:赋能内部应用:根据百度官方公众号,截至 2024 年Q1,Baidu Comate深度融入开发流程,参与了大量项目的开发工作,编写了百度内部四分之一的代码。企业级应用BaiduComate 已被 1 万多家企业应用,涵盖多个行业。个人开发者应用:面向个人开发者免费服务的Comate2.0,为个人开发者提供了强大的编程支持。
(3)火山引擎:豆包 MarsCode。火山引擎协同豆包 MarsCode 为开发者提供了智能 AI IDE,在代码补全、Bug 修复、代码问答等各编程阶段为开发者提供协助支持。在关注代码生成 AI 化的同时,豆包 MarsCode 也关注开发工具本身的AI化,通过交互方式的转变和多种大模型能力的接入,为开发者提供更好的用户体验。在字节内部,豆包 MarsCode 已经覆盖了 70%以上的开发者,从编码阶段就开始为开发者贡献代码和技术解决方案。在代码提交后,AI 也会参与代码评审,自动生成测试用例提升覆盖率,上线后也用于辅助线上问题的定位和解决等等。 AI 编程的重要探索:代码补全:核心是让模型预测下一个字符,这要求模型理解现有代码上下文并推测开发者续写逻辑。实现这一目标依赖于强大的模型性能和精心设计的 Prompt 工程。代码补全Pro:主要针对修改、编辑已有代码的场景。例如在 Python 打印日志函数增加参数的场景中,它能够自动在多个调用该函数的地方补齐参数,提升开发效率。
AI 编程参与者众多,竞争较为激烈。当前布局 AI 编程业务的企业主要有以下2 类:大型科技企业:通常具有雄厚的资金实力、庞大的用户基础、深厚的技术积累、优秀的AI 研发人才储备,可投入大量资源进行 AI 编程工具的研发和推广,在 AI 编程领域具有技术领先、生态完善、市场影响力强等优势,包括字节跳动(Trae)、百度(Comate)、微软(GitHub Copilot)、谷歌(Jules)等。以微软为例,旗下 GitHub Copilot 基于 OpenAI 技术,嵌入 VSCode 和 GitHub 平台,为开发者提供实时代码补全、功能生成和调试建议,覆盖超 20 种编程语言,同时通过 Azure 云服务与企业级工具链深度整合,成为开发者生态的重要入口。 初创企业:具有创新性强、专注度高、产品迭代迅速、定价模式灵活、注重特定场景优化等优势,可针对特定开发场景或编程语言提供定制化解决方案,快速响应特定用户群体的需求,包括新言意码(Youware)、硅心科技(aiXcoder)、Anysphere(Cursor)、StackBlitz(Bolt.new)等。以Anysphere 的 Cursor 为例,其基于 Anthropic 的 Claude 3.5 Sonnet、OpenAI 的 GPT-4o 等大模型,提供智能代码补全、对话式编程、代码库检索等功能,适合独立开发者和中小团队。中国和美国是全球 AI 编程领域的领先者,但二者的技术路径有所差异。中国在本土化与行业场景落地方面更具有优势。例如,字节跳动的 Trae 支持原生中文,集成 Claude 和 GPT 等主流AI 模型,用户可免费使用部分功能;美团在近日发布首款 AI Coding Agent(AI 编程智能体)产品NoCode,助力中小商户降低 IT 化和数字化门槛。美国则在通用性与开发者体验方面更具优势,其在通用AI、多模态技术等领域仍占据领先地位。例如,Claude Opus 4 在 SWE-bench 基准测试中的准确率达73.2%,支持连续7小时自主编程。Cursor 也仍是全球最受欢迎的 AI 编程工具之一,据非凡产研数据,2025 年5 月其WEB访问量为 2127 万,仅次于 lovable 的 3033 万;月活跃用户数为 789 万,位列第一。