大装置+大模型前瞻布局,率先打通生成式AI业务 闭环。
商汤推出 AI 基础设施产品与解决方案——SenseCore 商汤大装置,是中国首个提出并 实施新一代 AI 基础设施的厂商。2022 年,商汤人工智能计算中心(AIDC)正式投入 运营。 商汤 SenseCore 大装置搭建了完善的 AI 原生基础设施,包括算力基础架构、大模型 生产平台、模型即服务,辅以 AI 专家服务和数据服务助力相关技术举措的落地。
SenseCore 商汤大装置具有高效率、低成本、规模化的特点,以 AI 大模型开发、生成、 应用为核心,赋能人工智能生产新范式。数据、算力、模型的量变,引发了 AI 行业的 质变。在这一趋势下,以基础算力、网络、存储服务为核心的传统云架构,已难以满足 AI 行业的需求。AI 时代的基础设施,需要做到“数据、算力、算法”三要素的一体化。 截至 2024 年 7 月,商汤运营总算力规模高达 20000 petaFLOPS,有超 5.4 万块 GPU。 大装置管理的算力实现了全国联网的统一调度,在上海、深圳、广州、福州、济南、 重庆等地都拓展了新的计算节点,其中上海临港 AIDC 达到 14000 petaFLOPS,稳居 行业领先,为商汤自身以及外部客户的大模型研发和应用部署提供了强大的支持,能 支持 2 万亿参数 MoE 多模态模型稳定高效训练和推理。 国际知名调研机构 Frost & Sullivan 联合头豹研究院发布的《2023 年中国 AI 开发平台 市场报告》给出结论,商汤科技在增长指数和创新指数两大评估维度综合评分中位列 国内第一。2024 年 7 月,IDC 发布报告《中国智算服务市场(2023 下半年)跟踪》, 商汤科技与火山引擎、阿里巴巴共同跻身 2023 年下半年中国 GenAI IaaS 服务厂商 TOP 3,以显著的市场份额优势位居 GenAI IaaS 领域的第一梯队;在 GenAI IaaS 市 场云巨头与新势力厂商的市场份额方面,商汤科技以 46.4%市场份额的绝对优势,位 居新势力厂商第一,为国内 AI 基础设施引领者。
商汤自研深度学习训练框架支持寒武纪、华为、海光、天数、燧原在内的多家国产芯 片。不仅在大模型的训练环节通过与国产化芯片进行合作适配,加速落地大模型训练 标杆项目,同时,在推理环节,也积极适配进而支持大模型的推理和生成式 AI 应用 的发展。

在数据管理方面,商汤科技构建了一个百亿级非结构化的 AI 数据管理平台,支持秒级的 数据可视检索,并提供数据安全解决方案和优质公开数据集,使数据管理更加便捷,模 型训练更加高效。AI 数据管理平台覆盖数据产生、数据获取、检索分析、可视化、数据使用、 合规审核等环节。大规模非结构化数据的检索功能,能实现秒级返回,快速挖掘出新样本。 平台还提供高质量业内公开数据集,支持使用 PythonSDK 工具快速加载数据。数据标注服务 可面向大模型微调、RLHF、AIGC、自动驾驶等场景,并支持图片、视频、点云等数据格式。
算法方面,除了发布国内性能顶尖的大模型,商汤还构建了高效、完备、易用的大模型 生产工具链,实现了基础层、模型层、串联层、应用层的标准化体系。商汤与香港中文大学商汤联合实验室共同打造了算法开源计划 OpenMMLab,并与上海人工智能创新中心 发布了 OpenDILab 决策智能开源平台;同时,商汤打造了集大规模 AI 算力管理、专业的 AI 工具链、开放式 AI 算法于一体的工业级 AI 生产开放平台,实现从数据标注,算法设 计,到模型训练、部署的全链路、批量化过程。
自 2023 年 4 月首次发布以来,商汤的“日日新 SenseNova”大模型体系已推出了五个大版 本迭代。最初发布的 SenseNova 大模型提供了自然语言处理、内容生成、自动化数据标 注、自定义模型训练等多种大模型及能力,是国内最全面的多种生成式 AI 模型系列。 2023 年 7 月,商汤进行了多项升级,推出了 SenseChat 2.0、SenseMirage 3.0、 SenseAvatar 2.0 等新版本,进一步提升了各项功能 2024 年 2 月,商汤发布了“商汤 SenseNova 4.0”,进一步提升了模型训练和推理能力,并推出了通用版本的 SenseChat V4, 其综合评测成绩已比肩 GPT-4,相较 GPT-3.5 实现了全面超越。与此同时,商汤新增了 Function call & Assistants API 版本,降低了开发者使用大模型的门槛。2024 年 4 月,商汤 发布了 SenseNova 5.0(SenseChat V5),在知识、数学、推理及代码能力上有了显著提升, 全面对标 GPT-4 Turbo,并在主流客观评测中达到或超越 GPT-4 Turbo。
日日新 5.0 基于超过 10TB 的 tokens 训练,采用混合专家架构(MoE),参数量高达 6000 亿,支持 200K 的上下文窗口。混合专家架构(MoE)能够激活少量参数即可完成推理, 推理时上下文窗口可达 200K;同时,日日新 5.0 基于超过 10TB 的 tokens 训练,覆盖数 千亿量级的逻辑型合成思维链数据,算力与算法优化利用商汤 AI 大装置 SenseCore 的算 力设施和算法设计的联合调优。 在文科能力方面,SenseNova 5.0 在创意写作、推理以及总结能力上有了显著提升,可以 更好地理解和总结中文知识,为教育、内容产业等垂直应用场景提供有力支持。在理科 方面,其数理和代码能力达到业内领先水平,为金融、数据分析等场景的落地应用提供 了坚实基础。主流测试结果显示,日日新 5.0 全面对标 GPT-4 Turbo,在权威榜单 SuperCLUE 综合基准上表现优异,以总分 80.03 分刷新了国内最好成绩,并在中文综合 成绩上超过 GPT-4-Turbo-0125。
2024 年 7 月,商汤在 WAIC 2024 上发布国内首个具备流式原生多模态交互能力大模型 “日日新 SenseNova 5.5”,综合性能较两个月前的 5.0 提升 30%,交互效果和多项核心指 标向 GPT-4o 看齐。 · 日日新 5.5 的 6000 亿参数基模型性能全面提升,大量使用合成高阶思维链数据,推理能 力提升,在数理逻辑、英文、指令跟随等方面能力增强明显;同时,日日新 5.5 采用的是 混合端边云协同专家架构,推理成本降低。 · 日日新 5o 交互能力优秀,是国内首个“所见即所得”模型,通过整合声音、文本、图像 和视频等跨模态信息,可以实现场景分析、物体信息描述、书籍图文总结等功能,比如 当演示者用手机对着桌上小狗玩偶,日日新 5o 可以在讲出小狗的表情,并识别出帽子上 的文字和背景,多轮对话丝滑流畅。此外,日日新 5o 还能理解粗糙的简笔画和简笔画上 的面部表情,展现出极强的多模态理解能力。
日日新 5o 能实现较为自然流畅的交互,但存在一定的延迟;语言风格大方幽默,符合人 类的交流习惯。日日新 5o 可以通过手机摄像头与外界交互,实时回答使用者问题。例如, 对准桌子上的小狗玩偶时,日日新 5o 可以认出玩偶的形状,并且识别出帽子上的字符, 同时分析小狗的表情;在户外,日日新 5o 可以识别建筑和其周边环境并对进行特征描述, 它还可以准确地判断天气情况,反馈给使用者。日日新 5o 还可以利用已有的数据信息, 对镜头识别的内容进行科普介绍,例如在演示中日日新 5o 识别出演示者给出的书籍名称, 且能对其内容做简介。此外,日日新 5o 还可以识别演示者绘制的简笔画形状和表情。
我们认为在大模型迭代过程中,性能提高固然重要,但交互的升级也同样具有重大价值, 商汤 CEO 徐立认为“行业要变化,交互模式一定是先行的”,交互的升级是加速大模型超 级时刻到来以及超级应用出现的核心,日日新 5o 在交互上的突破更新具有重大意义。 大模型商业化进程领先,根据 IDC 数据,商汤位居中国大模型平台及应用市场份额第二 位。2023 年,根据 IDC 统计,百度智能云位居模型平台及应用市场第一,市场份额达 19.9%;商汤科技受益于其对大模型的专注投入,以及其所建设的上海 AIDC 能够为客户 提供一体化的大模型计算与应用解决方案,位居第二,市场份额达 16.0%;智谱 AI 则是 2023 年初创企业中的胜出者,位居市场第三;其次是百川智能、第四范式等。
商汤 AI 产品矩阵丰富,2C+2B 体系较为完善。2023 年,商汤科技在生成式人工智能领 域收入大幅增长,并确立了“模型即服务”的商业模式,客户群迅速扩大。
基于自研的日日新大模型体系以及开源开放的第三方大模型,商汤深化打造 MaaS 平台, 构建一套完整的大模型生产力工具,包括模型微调、模型推理、内容安全等关键功能, 支持不同的应用场景,使得企业客户能够低成本的、快速的接入大模型研发体系。为行业用户提供基模型和开发者工具,帮助行业用户实现针对自身业务场景、领域知识的大 模型微调,更好的赋能自身业务场景的智能化转型。AI Studio 则为 AI 开发者提供一系列 的 AI 开发工具套件,帮助开发者完成大模型的开发工作。

商汤大模型 B 端客户包括金融、互联网、医疗等多个领域,已与超过 500 家客户建立深 度合作,覆盖办公等核心场景。根据商汤 2024 年中期报告: 1)在金融领域中,以中国银行、招商银行、宁波银行、上海银行、海通证券为代表的企 业客户使用公司金融大模型能力构建金融垂类场景应用,覆盖员工助手、合规风控、编 程助手、数字人、营销等业务场景。 2)在医疗领域中,上海瑞金医院、上海新华医院、郑州大学第一附属医院等大型医院采 用公司 “大医”医疗大模型,将大模型建设为医院智能化中枢,实现智能导诊、预问诊、 用药咨询、诊后随访、多模态数据治理等功能,赋能患者诊前-诊中-诊后就医全流程 及专病科研工作。 3)在 Copilot 助手领域中,商汤代码助手、办公助手产品“小浣熊”成为国内增长最快的 Copilot 产品之一。用户包括中国电信、金山办公等大型企业用户,以及数十万个人用户 和开发者。 4)在拟人交互领域中,商汤的拟人大模型支持了微博、阅文筑梦岛、爱奇艺、想法流等 互联网应用,用户粘性和活跃用户数量持续保持在行业前列,日调用量在半年内上涨了 近 22 倍。
“云端边”全栈布局,持续探索 AI 落地场景。商汤科技领先业内首次推出“云、端、边”全 栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型 SenseChat-Lite”,以及 面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。此外, 商汤还推出端云协同解决方案,可以通过智能化判断协同发挥端云各自优势,需要联网 搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过 80%,从而显著降 低推理成本。 端侧 AI 不同于传统的云端 AI,而是直接在设备端运行的大模型。由于参数量更小,端 侧 AI 能够在任何网络条件下生成回答,无需担心隐私泄露,更无需依赖云端算力,从而 大大降低了成本。除此之外,端侧模型,在断网条件下基于生成能力和隐私保护可以扩 展出新的 AI 使用场景,例如在无网络条件下办公。相对于手机端有限的计算和存储资源, 云端 AI 拥有更强大的算力,支持大规模 AI 模型的部署和训练。目前一些复杂的生成式 AI 任务主要依赖云端大模型来实现。因此,未来端云结合将成为生成式 AI 在手机端部 署的主流模式。端侧 AI 的发展前景非常广阔,未来几年本地大模型的规模和效率将持续 提升,用户可以从本地获取大部分生成式 AI 服务,同时云端服务也会不断增强,提供更 高质量的内容输出和智能协同平台。
2024 年 4 月,商汤发布日日新 5.0 端侧大模型 SenseChat-Lite 1.8B,Benchmark 成绩显示, SenseChat-Lite 1.8B 在大部分测试中跨级击败了 Llama2-7B、13B 模型;推理速度快,对 比人眼 20 字/秒的阅读速度,可在中端性能手机上达到 18.3 字/秒的推理速度,在高端旗 舰手机上达到 78.3 字/s。端侧 LDM-AI 扩图技术在某主流平台上推理速度小于 1.5 秒,支 持输出 1200 万像素及以上的高清图片。
2024 年 7 月,商汤推出全面升级的端侧模型日日新 5.5 Lite,性能指标更优,推理速度提 高至 90.2 字/秒,端侧模型矩阵更完善,且性价比较高,接入商汤日日新•商量端侧大模 型,单台设备成本低至 9.9 元/每年。目前,商汤日日新端侧模型已深入各个行业,与超 过 150+客户启动商业对接,覆盖智能手机、平板电脑、VR 一体机、车载电脑、智能台 灯等诸多 IoT 设备部署应用。 商汤端侧大模型在小米的小爱同学应用中展现了领先的性能优势和较低的延时。此外, 商汤大模型具备检索能力,能够引用高质量的信息来源,提升内容的可靠性,增强用户 对生成内容的信任度。在综合能力和定制化需求方面,商汤针对小米特定需求能够迅速 反馈并调整优化模型,以确保提供的信息准确无误。