2025年商汤研究报告:AI领军企业,“大装置+大模型”构筑稀缺底层优势

商汤:原创技术布局前沿研究的人工智能领先企业

10 年深耕领跑行业变革,人工智能蓬勃发展探索虚实连接

商汤是人工智能软件公司的领军企业之一。作为全球领先的人工智能平台公司,商汤科技自 2014 年成立以来,始终以技术创新为核心驱动力,在计算机视觉、深度学习、大模型等领域取得了一系列突破性成果。通过持续的技术积累和生态构建,商汤科技不仅推动了人工智能技术的产业化落地,更在智慧城市、智能汽车、具身智能等多个领域成为行业标杆,为社会发展和产业升级注入了强劲动力。

公司发展历程总体经历三个阶段:

第一阶段 2014-2016 年:2014 年,商汤创始团队自主研发的DeepID系列人脸识别算法准确率达到 98.52%,在全球首次超过人眼识别准确率。同年 10 月,商汤科技成立,随后持续在深度学习框架、自动驾驶等领域开展技术研发。2016 年,公司开始研发 Smart Auto 自动驾驶平台,并于KITTI2016 刷新了行人及车辆识别领域的世界纪录。

第二阶段 2017-2019 年:公司依托人脸识别、自动驾驶等人工智能技术,实现市场范围的逐步拓展。2017 年,商汤为vivo 等手机品牌提供人脸解锁等技术,并与本田汽车达成长期合作。2018 年,商汤成为继阿里云、百度、腾讯、科大讯飞公司之后第五大国家人工智能开放创新平台,并在新加坡、美国等地达成多项科研合作。2019 年,商汤集团中国总部暨全球研发总部落户上海。 

第三阶段 2020-至今:公司逐渐位列行业前列,引领人工智能领域深度发展。2020 年,商汤科技成为亚洲收入排名最高的人工智能软件公司与中国最大的计算机视觉软件提供商。2021 年 12 月,公司正式在港交所主板挂牌上市。公司持续以 AI 技术赋能多个领域,2022 年推出元萝卜SenseRobot AI下棋机器人、通用视觉开源平台 OpenGVLab;2023 年推出图像生成平台“秒画 SenseMirage”等 AI 产品。2024 年,商汤“日日新SenseNova5.0”全面升级,不断突破大模型的能力边界。

公司股权结构调整后较为稳定。2023 年 12 月15 日,商汤联合创始人汤晓鸥教授因病逝世。据 2024 中期报告披露,汤教授由Amind 持有的6,906,080,602 股 A 类股份的不同投票权已终止。根据适用法律作出的继承安排已于 2024 年 8 月 19 日完成。2024 年8 月27 日,Amind所持有的A类股份已转换为 B 类股份。

公司业务主要分为生成式 AI、视觉 AI(传统AI)与智能汽车三大板块,全方位渗透人工智能领域:

生成式 AI:商汤发现了 AI 模型性能提升与基础设施能力之间的相互增强关系,一直秉承着“AI 基础设施(大装置)—大模型(日日新)—应用”三位一体的战略。业务提供业界性能领先的AI 基础设施和模型服务,模型训练、微调及推理需求增长迅速,基于SenseCore 商汤大装置与SenseNova 商汤日日新大模型体系,公司提供了企业助手、金融数据先兵、政务助手等生产力工具,并在智能陪伴、智能硬件交互与智能营销等领域以交互工具改善人机交互,形成“一基两翼”的应用布局。

视觉 AI:2023 年,公司将传统智慧城市、智慧商业与智慧生活的非生成式AI 业务纳入传统 AI 板块。该板块业务以通用视觉大模型为基础,持续深耕各类视觉 AI 的应用场景。

智能汽车:该板块基于视觉感知、多模态大模型与大装置强化公司业务在智能汽车领域的差异化能力,包含智能驾驶与智能座舱等业务范畴。2024年发布的“开悟”世界模型作为行业标杆,可构建千万级自动驾驶场景库,支持多样化场景和极端场景的可控生成。

公司核心业务为生成式 AI 业务。2024 年,生成式AI 业务营收突破人民币24 亿元,同比增长 103.1%,占集团收入比例提升至63.7%;其次为视觉AI(传统 AI)业务,其收入占集团全部营收的29.5%。智能汽车业务实现收入 2.56 亿元,占集团全部营收的 6.8%。

组织结构调整拆分多条业务,“1+X”构建生态企业矩阵

商汤以“1+X”组织架构重组推动资源的战略聚焦。2024 年12月,商汤完成新一轮组织结构调整,以“1”聚焦以生成式AI 为代表的集团核心业务,而计划将智能汽车”绝影”、家庭机器人“元罗卜”、智慧医疗、智慧零售等业务拆分为独立公司进行运营与融资,形成“X”的生态企业矩阵,抓住垂直行业的市场机会。

商汤宣布分拆后,相关业务相继获得独立融资。2024 年7 月,元萝卜智能获得由商汤国香资本投资的天使融资,成为首个分拆后获得独立融资的业务。2025 年 1 月,商汤善惠宣布完成 A 轮融资,本轮融资由金沙江创投数千万元领投,微木资本、嘉实基金和金弘基金等资管平台和产业资本跟投,鞍羽资本担任长期财务顾问,成为首个分拆后获得外部融资的业务。2025年2月,商汤医疗宣布拿到超亿元的 Pre-A 轮融资,本轮融资由盈峰资本和人民卫生出版社旗下投资平台人卫科技发展公司联合领投,多家投资机构跟投。

财务分析:生成式 AI 引领营收增长,经营效率向好发展

公司总营收增速转正。2022 年,受疫情影响,部分行业客户数字化转型力度疲弱,智慧城市项目建设进度不及预期,对智慧商业、智慧城市的业务板块营收造成影响。2023 年,公司进行业务重组。2024 年,公司坚持“AI基础设施(大装置)-大模型(日日新)-应用”三位一体战略,以“1+X”组织架构重组推动资源战略聚焦,营业总收入达到37.7 亿元,同比增长10.8%。

业务架构调整,毛利率近两年维持稳定。2024 年,公司完成了“1+X”的组织架构重组,将集团资源聚焦投入至核心业务生成式AI。2023年受客户需求推动,硬件及 AIDC 相关成本占收入比重上升,公司毛利率下滑至44.1%,随后 2024 年毛利率略微下降至 42.9%,相对维持稳定。

专注原创技术投入,研发费用持续提升。2024 年,公司增加投资于基模型的训练与微调与开发生成式 AI 应用产生折旧摊销,服务器运营和云服务费有所增加,研发费用同比增长 19.2%至 41.32 亿元,研发费用率达约110%。

费用管控有所成效。2024 年公司销售费用率从24%下降至17.4%,在收入增长的情况下降幅明显;同年管理费用率从2023 年的44.3%降至38.8%,费用管控成效显著。

公司归母净利润亏损幅度收窄。公司 2024 年归母净利润为-42.8亿元,亏损同比收窄 33.6%。

2024 年人效显著提升。2023 年,公司人均创收为75.17 万元;2024年公司人均创收 100.43 万元,同比增长 34%。

GenAI 带动基础设施和应用层需求,智驾赛道迎来拐点

基础设施端:后训练+推理范式成为主线,助推IaaS/PaaS 需求高增

生成式人工智能正在快速发展。IDC 数据显示,2024 年全球人工智能(AI)IT 总投资规模为 3,158 亿美元,并有望在2028 年增至8,159亿美元,五年复合增长率(CAGR)为 32.9%。对于生成式AI,IDC预测全球生成式AI市场五年复合增长率或达 63.8%,且 2028 年全球生成式AI 市场规模将达2,842 亿美元,占 AI 市场投资总规模的 35%。

中国人工智能支出也将快速增长。根据 IDC 预测,2028 年中国人工智能总投资规模将突破 1,000 亿美元,五年复合增长率为35.2%。2024年中国生成式 AI 占 AI 市场投资总规模的 18.9%。随着生成式AI 技术的快速发展,2028 年生成式 AI 投资占比将达到 30.6%,投资规模超300 亿美元,五年复合增长率为 51.5%。

GenAI 行业正从预训练范式转向“后训练+推理”范式。黄仁勋于CES2025对 Scaling Law 的三个阶段进行阐述:预训练,即人工智能模型基于大量数据进行模式学习的初始训练阶段;后训练,即以人工反馈等方式对人工智能模型的生成答案进行微调;以及推理计算,即让人工智能模型在作答后拥有更多时间进行“思考”。当下,人工智能产业正在迎来后训练(Post-TrainingScaling)与推理(Test-time Scaling)阶段,进一步拓展模型潜力以适配更为复杂多元的应用场景。

GenAI 带动人工智能基础设施市场快速增长。生成式AI 的潜力挖掘与规模发展带动了相关基础设施需求的提升。IDC 数据显示,基于AI 部署服务器的投资推动,人工智能基础设施市场自 2019 年以来连续保持两位数增长。2024 年上半年,全球各组织在人工智能计算与存储硬件基础设施上的支出同比增长 97%,达到 474 亿美元。2028 年,AI 基础设施支出预测将达到2230 亿美元。

我国AI训练部署需求推动公有云IaaS+PaaS大幅增长。2023年中国IaaS市场规模为 3121 亿元,增速 17.7%;PaaS 市场规模为750亿元,增速为29.5%。

海外巨头科技公司纷纷加大 Capex 投入。Bloomberg 计算表明,科技巨头企业将资本支出优先用于扩展数据中心和构建AI,2024 年将额外花费550亿美元,次年将额外花费 350 亿美元,2025 年总计花费可能达2000亿美元。资本支出的大部分可能会用于扩展 AI 基础设施,包括创建或改造数据中心以及购买 GPU。2025 年 Q1,亚马逊、谷歌、微软、Meta等国际科技巨头公司的资本开支均显著增加,且主要用于AI 和云服务的基础设施建设。

国内大厂在 AI 基础设施领域的资本开支显著提升。腾讯在AI 基础设施及应用生态的投入持续增加,2024 年 Q4,腾讯资本开支同比增长386%,达到 365.8 亿元;2025 年 Q1,腾讯资本开支同比增长91%,达到274.8亿元。阿里巴巴也表示未来三年将投入超过3800 亿元用于建设云和AI 硬件基础设施,总额超越过去十年总和。

应用端:B 端付费天花板快速扩张,AI+SaaS 成中小企业部署首选

营销、办公、代码等 B 端场景应用广阔,在GenAI 市场规模中占据主导地位。观研天下整理的相关数据显示,2023 年国内B 端AI Agent 的市场规模为 550 亿元,占比达到 99.3%;C 端 AI Agent 市场规模约4亿元,占比仅为 0.7%。据预测,2028 年国内 B 端 AI Agent 的市场规模将达到8390亿元,占比 98.5%;C 端 AI Agent 市场规模为130.35 亿元,占比达到1.53%。

基模大厂和 SaaS 巨头纷纷布局 AI Agent,平台服务+SaaS差异化服务将成未来趋势。2024 年,谷歌宣布的 Project Astra 能够实现文本处理,理解与生成图像、音频等内容。微软宣布建立全球规模最大的企业级AI Agent生态系统,企业用户可通过 Azure AI 目录访问超过1800 个AI 模型以支持各类 AI Agent 的部署和运行,其 Copilot Studio 平台目前已支持用户创建自主 Agent。国内厂商亦持续推动 AI Agent 布局。2025 年,字节跳动推出的“扣子”(Cog)支持用户自定义 Agent 工作流,通过模块化组件实现个性化任务自动化。阿里巴巴的应用夸克已从“AI+搜索”工具向多模态Agent平台转型。

GenAI 走 向 Agent 时 代 , SaaS 公司正在将服务转化为软件(Service-as-a-Software)。这意味着应用的目标市场不是软件市场,而是以数万亿美元计的服务市场。这种模式下,SaaS 厂商为客户交付的内容从软件产品转向 Agent 等“数字人力”。过去交付服务等,乙方主要与甲方 IT 团队交互;如今 AI 原生企业、SaaS 服务商交付“数字员工”,涉及多领域,类似人力资源外包(外包数字人),可能定义流程并创造价值。

最重要的是,这种价值创造得到下游客户一致的认同,软件行业下游付费意愿和规模不足的问题有望得到改善。当下AI 的人力替代已经成为产业共识,国央企为代表的企业开始进行大规模实质性的AI 投入;也有93%中小企业认同 AI 的价值创造,83%有计划在未来一年内投入AI。

智能汽车走向 AI 定义的下半程,中高阶智驾渗透率拐点正在到来

智能汽车最终将走向 AI 定义的下半程。汽车行业经历了上世纪的“大工业”时代和电气化时代,逐渐走入了智能化时代的下半程。如果说上半程的迭代在于“软件定义汽车”,是基于电子电气架构的软硬解耦和功能迭代,那么下半程就是 AI 定义汽车,以神经网络模型、城区NOA为代表的高级别智驾功能及智能交互功能将引领产业。

中高阶智能驾驶渗透率正迎来拐点,以高速NOA、城市NOA为代表的高阶智能驾驶加速落地。2024 年中国乘用车智能驾驶系统装配率突破65%,实现新的里程碑,其中代表行业最高水平的高阶领航辅助驾驶系统渗透率达到 11.7%。高速 NOA 与城市 NOA 功能的搭载量和渗透率均稳步攀升。高速 NOA 标配渗透率从 2022 年全年的 1.0%,快速跃升至2025年1-4月的12.6%,搭载量达 83.6 万套。城市 NOA 尽管起步时普及率较低,但其发展态势强劲,标配渗透率从 2022 年全年的0.04%提升至2025年1-4月的2.8% ,搭载量达 18.5 万套。当下部分头部企业已实现日均接管率下降超75%。预计到 2030 年,高速 NOA 渗透率将接近100%,城市NOA渗透率有望突破 50%。

随着规模化效应、软硬件成本的进一步降低,2025 年将正式迈入智能驾驶技术普惠化的历史性拐点。“硬件预埋+OTA 升级模式”推动智驾成为汽车标配,供应链成熟度提升与路测数据积累形成双轮驱动,使高阶智驾部署成本年均下降超 20%,行业预测显示未来 3 年ADAS 将成为汽车标配,NOA功能渗透率将突破 50%。如比亚迪发布“天神之眼”系统,通过三目纯视觉与激光雷达融合方案,将高速 NOA、无图城市领航等功能下沉至十万元级车型。

L4 级智能驾驶正从技术示范迈向可持续盈利的新阶段。其在封闭场景如矿区、港口等已实现商业化应用验证,正向城市复杂环境加速拓展,如无人驾驶出租车、无人驾驶公交、无人驾驶环卫、无人驾驶配送等多个垂直细分领域呈现快速发展态势。

未来空间:底层技术积累优越,产品商业化提速可期

生成式 AI:“大装置+大模型”构筑底层技术优势

SenseCore 大装置:作为高效率、低成本、规模化的新型人工智能基础设施,全面构建了物理空间数字化搜索引擎与推荐系统。大装置以模型层、深度 学 习 平 台 与 计 算 基 础 设 施 为 核 心 架构,联合打造算法开源计划OpenMMLab 于与 OpenDILab 决策智能开源平台,基于集大规模AI 算力管理、专业的 AI 工具链、开放式 AI 算法于一体的工业级AI 生产开放平台,实现了从数据标注,算法设计,到模型训练、部署的全链路、批量化过程。

SenseCore 商汤大装置以“自持+运营”模式扩大算力储备和服务规模,其管理算力已实现全国联网的统一调度。当前,智算节点完成了覆盖长三角、粤港澳、京津冀、中西部重点区域的全国布局,位于上海临港的商汤科技人工智能计算中心(商汤 AIDC)支持基于云端的全方位AI 模型生产及部署服务,预计能够产生每秒 3.74 百亿亿次浮点运算的总算力,是目前亚洲最大的人工智能算力中心之一。

SenseCore 2.0 的推出以极致性价比推动了大模型技术的高效落地与规模化应用。通过基础设施、模型优化和动态负载均衡优化,商汤大装置实现了多模态大模型推理成本与大语言模型的持平,并于推理性能上领先头部厂商,在线推理性能较头部厂商提升 15%,离线推理Prefill 阶段实现提速5倍、Decode 阶段提速 3.5 倍。在国产芯片领域,商汤大装置异构训练效率可达同构训练的 95%,有力推动了国产算力的规模化商用进程。

2024 年下半年,商汤在中国基础设施集成服务厂商份额中占据第五。基础设施集成服务市场一超多强特征尚未改变,但随着智算中心项目的不断落地,中腰部玩家正逐渐站稳阵脚。

SenseNova 大模型:以技术引领持续位列中国大模型的第一梯队。自2023年 4 月首次发布以来,商汤日日新大模型已正式推出多个版本迭代。公司在日日新 5.0 率先整合多模态功能,形成了统一的模型架构,并在性能上成为首个对标 GPT-4 Turbo 的国产大模型。2024 年7 月推出的日日新5.5其综合性能较日日新 5.0 平均提升 30%,在数学推理、英文能力和指令跟随能力等领域实现明显增强,交互效果和多项核心指标对标GPT-4o。SuperCLUE 发布的《中文大模型基准测评2024 年度报告》显示,商汤日日新 5.5 大模型与 DeepSeek V3 并列国内榜首。商汤正式推出全新升级的“日日新 SenseNova V6”大模型体系。在 SuperCLUE 最新的《中文大模型基准测评 2025 年 5 月报告》中,商汤 SenseNova V6 Reasoner 模型处于国内第一梯队水平。

SenseNova V6 大模型进一步实现多模态长思维链训练、数理能力、推理能力与全局记忆的技术突破。基于超过 200B 的高质量多模态长思维链数据,日日新 V6 通过多智能体协作进行长思维链合成和验证,得以形成突出的多模态推理能力,支持合成最长 64K 的多模态长思维链与模型长时间思考能力。此外,日日新 V6 能够将视觉信息(画面)、听觉信息(语音、音效)、语言信息(字幕、口语)与时间轴逻辑进行对齐,形成多模态统一时序表征,实现 10 分钟级视频全帧率解析。2025 年6 月,中国信通院完成可信AI 多模态大模型首轮评估。商汤日日新 SenseNova 融合模态大模型在所有模型中,获得当前最高评级 4+级,成为国内首家获得最高评级的大模型。

以日日新多模态大模型为基石,公司沿“生产力工具”与“交互工具”两种垂直方向形成了“一基两翼”的应用布局。

生产力工具:在企业助手、金融数据先兵、政务助手等应用场景下,生产力工具赋能中国移动、上海电信、金山办公、宁波银行、招商银行、海通证券、联想、360、零跑科技等各行业头部企业,提升生产效率。2024年,以订单金额为代表的客户付费意愿同步增长了6 倍,办公助手产品与代码助手产品在智能办公领域加速渗透,用户数突破150 万,日调用量达上百万次。

交互工具:依托日日新优异的多模态大模型能力,交互工具在智能陪伴、智能硬件交互与智能营销场景持续改善人机交互体验,拟人陪伴模型在深度聊天率和付费转化率等关键指标上稳居行业第一梯队,智能硬件于机器人、智能眼镜、智能车舱等领域实现深度布局,多模态模型结合数字人技术助力电商营销。据公司 2024 年报,头部拟人陪伴APP 的月调用量一年内增长了 833%,次日留存率达到 50%,日均使用时长高达130 分钟,为交互工具商业化奠定了良好基础。

四大行业解决方案,构筑垂类差异化竞争优势

SenseCore 2.0 打造零成本、零门槛、零开发的一站式模型服务,面向具身智能、AIGC、AI4S 以及传统企业智能化转型推出四大行业解决方案。通过 OpenAPI 兼容、K8S 原生平台适配、开源大模型托管服务、全栈开源工具链及丰富的开源组件等,商汤大装置顺应开源趋势,实现了技术栈的无缝整合与敏捷迭代,回应快速发展的技术栈应用诉求,进一步打通从产品到多模态场景的端到端行业解决方案,针对不同行业客户提供了从场景定义到业务落地的全链路赋能。

据 IDC 预测,AI 大模型解决方案市场前五的厂商约占整体市场约一半份额,商汤以 14%的市占率位居市场第二。

智能汽车:绝影依托 CV 能力打造“驾-舱-云”多元产品线

商汤绝影实现了前沿 CV 技术与汽车产业的深度融合。依托商汤大装置算力储备、原生汽车垂类大模型、软硬件架构与全栈数据生产管线四大技术基座,商汤绝影以“驾-舱-云”三位一体的通用人工智能(AGI)技术架构打造了智能驾驶、智能座舱和 AI 云的多元产品体系。2024 年,绝影新增交付超167 万辆,同比增长 29.2%,新增交付车型42 个;累计交付车辆数超360万辆,覆盖超过 130 个车型。公司新增定点车型41 款,新增定点车辆数超过 1100 万辆。

商汤绝影全栈量产智驾解决方案覆盖高速领航、城区领航、泊车辅助等各类场景,满足全场景智驾需求。公司作为首个提出感知决策一体化自动驾驶通用模型的公司,已实车部署面向量产的端到端自动驾驶解决方案UniAD,并推出首个针对驾驶决策规划设计的智驾大模型DriveAGI。2025年 2 月,公司发布业内首个与世界模型协同交互的端到端自动驾驶技术路线 R-UniAD,预期大幅降低端到端自动驾驶数据门槛,实现性能提升与场景泛化能力的突破。

商汤绝影提供一站式座舱解决方案,座舱AI 软件的市场份额连续5年位列第一。商汤绝影智能座舱包含驾驶员感知系统(DMS)Sense AutoCabin-D、座舱感知系统(OMS)SenseAuto Cabin-O、车外进场感知系统SenseAutoCabin-N 与座舱大脑 Cabin Brain SenseAuto Cabin-B 等产品体系,以中文语言大模型“商量”、文生图大模型“秒画”、数字人视频生成大模型“如影”、医疗大模型“大医”、多模态大模型“书生”等自研大模型体系全方位提升座舱感知、决策推荐和交互体验。

依托多模态能力打造领先世界模型,布局具身智能底座

商汤拥有业内领先的世界模型“开悟”。2024 年,公司发布的“开悟”世界模型成为行业标杆,支持 150 秒超长场景视频生成、1080P分辨率及11V视角。“绝影开悟”2.0 版本面向量产的数据生成,能够实现复杂场景的自由复现,感知结果接近真实精标数据的 98%,能避免因数据风格差异带来的 Sim-to-Real 迁移时能力退化问题,为端到端模型打造“云端虚拟训练场”。

“ 开 悟 ” 生 成 效 果 的 各 项 指 标 开 源 均 达SOTA ,优于包括GAIA-1、DriveDreamer 在内的国内外主流世界模型。此外,从2023 年开始,在全球知名的自动驾驶仿真模拟任务竞赛 Waymo SimAgents 的比拼中,“开悟”连续两年获得第一名,是当之无愧的行业标杆。

通过多模态大模型,“开悟”世界模型可以支持多样化的自动驾驶场景及Corner case 的可控生成。目前商汤绝影基于1024 类场景,能够泛化出更多的平行世界,打造了千万级的生成场景库,预计2025 年对行业开放。

联合清华大学发布业内领先的 InfinityDrive 模型。商汤与清华大学联合推出了 InfinityDrive,是首个具有卓越泛化能力的驾驶世界模型,能够在分钟级视频生成中提供高保真度、一致性和多样性方面的领先性能。

从技术上看,1)InfinityDrive 引入了高效的时空协同建模模块,并结合了扩展的时间训练策略,从而能够生成高分辨率(576×1024)视频生成,并保持空间和时间的一致性。2)通过结合记忆注入和保留机制以及自适应记忆曲线损失,最大限度地减少累积误差,实现了持续超过1500帧(超过2分钟)的一致视频生成。InfinityDrive 拥有生成复杂多样场景的能力和作为下一代驾驶世界模型的潜力,未来也将满足自动驾驶不断发展的需求。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告