商汤日日新·代码小浣熊成为软件开发新时代的创新基石。
代码小浣熊是基于商汤自研大语言模型的 AI 编程助手,提供集成开发环境插件形态的产品服务及 Web 端的代码对话服务。其不但具备卓越的代码生成能力,还拥有强大的语言理解能力,让开发者更好地通过自然语言交互,降低编程开发门槛,提升工作效率。代码小浣熊在 HumanEval 测试集中一次通过率高达 76.8%。在实际应用中,可帮助开发者提升编程效率提升最高达到 78%,代码采纳率超过 30%,单日人均生产 300+行代码。代码小浣熊还成为首批通过中国信通院可信 AI 代码大模型评估的产品,在通用能力、专用场景能力、应用成熟度三个维度 100 多个能力指标中表现优秀,获得当前最高评级(见图16)32。截止2024 年 6 月,商汤代码小浣熊已经拥有超过 20 万开发者用户,200 多个企业客户,每天Token数超 4 亿。具体来看,代码小浣熊拥有以下优势特点:
强大的基模型能力支撑代码小浣熊产品应用的有效落地。基模型是保障AI 编程助手有长远发展的关键条件。商汤自研的“日日新 5.0”大模型体系通过训练数据的全面升级与训练方法的有效提升,获得了出色的语言能力及多模态能力。为了突破数据层面的瓶颈,使用了超过 10T 的 tokens 确保了高质量数据的完整性。大规模采用思维型的合成数据(数千亿 Tokens 量级),极大提升了推理、计算工具使用方面的能力。在训练阶段,采用了自研的多阶段训练链路,包括三阶段预训练、双阶段监督微调和在线人类反馈强化学习。这一系列创新措施保障了商汤日日新 5.0 的领先能力,使其成为首个超越GPT-4-Turbo 的中文大模型,并在中文主观综合能力上超过GPT-4o 33。借助大模型,代码小浣熊把代码理解、生成、优化等能力无缝集成到研发流程的各个环节,为开发者提供了一个 7*24 小时的 AI 助手。
面向企业级 BizDevOps 全过程,覆盖软件开发全生命周期,支持主流语言与IDE。代码小浣熊实现了软件开发生命周期全赋能,从需求分析、架构涉及、代码编写、软件测试再到部署上线和维护等环节,助力开发者代码生成&补全、代码翻译&优化、代码重构、代码纠错、代码问答、代码翻译、代码添加注释、测试用例生成以及技术文档生成等多个应用场景,同时还满足用户数据分析、编程学习等各应用场景(见图18)。借助日日新大模型体系最新的函数调用(function calling)能力,代码小浣熊与IDE 深度集成,实现了大语言模型与 IDE 的互操作,为开发者带来了更顺滑的编程体验,支持Visual Studio Code、IntelliJ IDEA、Android Studio 等主流 IDE;支持 Python、Java、JavaScript、C#、C、C++、Go、SQL 等 90+主流编程语言。

打造企业级功能,满足企业客户的高要求和针对性需求,实现企业代码资产有效融合。企业部署 AI 编程助手不仅仅从开发者使用的角度出发,还会从组织层面关注是否符合业务规范和属性,从组织的管理和运营角度去考量 AI 编程助手的能力。代码小浣熊充分将大模型与 RAG 技术结合运用,使企业已有代码库、内部规范、过程数据等资产能够充分融合运用,进而将企业自身的代码管理规范,代码输出格式、文档输出的格式,产品文档、技术文档、企业代码仓库等现有知识与代码小浣熊打通,使生成代码更加贴合企业业务、更符合企业内部的管理要求。企业自有的代码和规范、自主设计的编程风格等,产品如何与之适配和调优,真正为企业所适用。代码小浣熊与企业内部的工程化流程逐步结合,实现资产沉淀、规范落地、知识共享,让相关的赋能经验和最佳实践能够被更多开发者复用。举例来说,代码小浣熊支持输入企业内部统一模板要求的产品需求文档,并与相关功能绑定,使得用户在与小浣熊进行交互生成的产品需求文档符合企业内部的格式和颗粒度,通过代码小浣熊约束生成的产品需求文档格式。其次,通过代码小浣熊,企业也可以更加便捷的将高价值的“内部知识库”让软件开发团队更加便捷的访问、学习理解、以及关联应用,让企业的初级开发者迅速成长,让开发者日常工作无需大量翻阅文档类资料,实现一键式编程。
提供端到端的数据安全与隐私保护解决方案,打消企业风险顾虑。企业对于自身的代码安全一向看得很重,包括代码、文档资料都是企业的核心资产。代码小浣熊通过提供端到端的安全措施,保障数据安全与隐私保护。代码小浣熊通过用户身份验证、授权和权限管理确保只有授权人员能够访问敏感数据,并对敏感数据如身份信息、登录信息,保密数据如设备安装包或升级包、License 和密钥等,都使用可靠机制加密后存储。另外,代码小浣熊还提供传输加密、漏洞管理、审计和监控等保障措施。在数据隐私方面,小浣熊支持建立数据中心内所有运维和用户操作行为的日志记录制度,并使用审计系统进行管理和分析,及时发现和制止异常行为。对于数据进行分级处理,明确审批、存储和传输要求,确保敏感数据湖得到适当的保护和管理。对于个人信息的处理,符合个人信息保护相关法规,并对个人信息进行脱敏处理,以实现去标识化。
支持多样化部署和交付模式,实现国产化适配。除了公有云 SaaS 的部署模式以外,代码小浣熊还提供了包括软硬一体机和私有化等更多类型的部署模式支持。SaaS 部署模式提供企业版、团队版、个人版等多个选项,供客户根据自身需求进行不同权益的选择。对于依然想追求公有云弹性,但是安全可控要求较高的企业,可以使用公有云专区,开辟独有的隔离的资源供客户使用。私有化部署则包括完整版和轻量版,前者针对的是自身有较强算力的企业客户,配置全套的代码小浣熊服务和参数量最大的基础模型;后者则针对的是自身算力不强的中小企业客户,保证模型能力的同时采取轻量化配置。代码小浣熊提供一体机的部署模式,企业客户无需专门采购硬件就能私有化部署AI 编程助手,并且更能保护好企业的代码等核心资产,数据不出域安全有保障。针对大语言模型设计了一个高性能推理后端,该后端对显存进行了最细粒度的规划,极大的减少了推理时的显存碎片化,从而保证系统能够支持更高的并发,在同等硬件配置和同样参数的模型条件下,能够比友商支撑更多的用户使用,进一步提升企业部署的整体ROI。提供基于国产化芯片的一体机,实现全栈国产化,满足企业自主可控的部署要求。

提供原子指标体系和效能评测方法,供企业用户随时量化监控部署效果。如何量化收益是企业采用 AI 编程助手后最关心的问题,尤其是拥有庞大软件开发团队且开发流程复杂的大型企业,也是 CIO 决策扩大 AI 编程助手应用规模的参考依据。但是,企业很难实现 AI 编程助手收益的量化监控,因为内部用户开发水平不一导致效果反馈无法拉齐相关书指标进行衡量。代码小浣熊提供了可量化的效能评估体系,帮助企业在使用产品过程中对开发环节、测试环节、交付环节的效能提升情况形成数据洞察。代码小浣熊自带指标埋点功能,通过量化代码采纳率、日活、使用时长、代码生成数量、人机交互频次、以及用户对生成的代码复制和收藏的次数等数据,形成指标跟踪,为企业提供系统性评估提供数据基础。还支持根据企业客户的需求进行定制对比功能,对比使用代码小浣熊和不使用代码小浣熊之间的差别,观测对比之下的效能和质量。