SenseCore 商汤大装置技术发展优势。
SenseCore 商汤大装置致力于建设高效率、低成本、规模化的新一代AI 基础设施,以人工智能大模型开发、生成、应用为核心,打造一站式、自主研发的AI 云、AI 平台、AI 服务解决方案,赋能 AI 生产新范式。商汤大装置完善技术储备和创新,打造算力资源、MaaS 平台、数据服务和国产化适配生态,基于全国范围的算力中心和节点,面向大模型、生成式 AI 场景构建产品:
AI 原生云算力基础设施,使能极致大模型开发体验。商汤大装置在算力层围绕着大模型开发和实践进行了全面打造,包括计算、存储、网络与管理平台。打造高稳定性的算力池,实现千卡并行训练线性加速比超过90%,实现 30 天长时间训练不间断,实现分钟级的异常检测和断点续训。优化存储系统,实现 IOPS 缓存系统高于 500 万,存储处理达千亿级别,应对视觉、多模态数据管理需求。高性能无损训练网络,单节点训练网达到1.6T的带宽并向 3.2T 发展。提供云管理平台,实现公有、专有、私有、混合等多云部署模式,并支持 Web 控制台、移动控制台、CLI 命令行、API 调用等多种方式,提供涵盖监控、运维、计费、消费等可视化平台。商汤大装置将会进一步升级算力基础设施,实现 2-3 倍性能提升,提升50%性价比
结合 SenseNova 商汤日日新大模型体系,MaaS 平台输出大模型时代的AI 生产工具。基于商汤自研的日日新大模型体系以及开源开放的第三方大模型,深化打造 MaaS 平台,构建一套完整的大模型生产力工具,包括模型微调、模型推理、内容安全等关键功能,支持不同的应用场景,使得企业客户能够低成本的、快速的接入大模型研发体系。为行业用户提供基模型和开发者工具,帮助行业用户实现针对自身业务场景、领域知识的大模型微调,更好的赋能自身业务场景的智能化转型。AI Studio 则为AI 开发者提供一系列的 AI 开发工具套件,帮助开发者完成大模型的开发工作。商汤大装置将会探索嵌入模型、搜索增强生成、提示工程等能力,逐步构建AI 智能体生态,助力各行业重构企业应用。
提供开放、一站式、低成本的 AI 数据管理与标注平台。商汤大装置提供面向海量训练数据,开放、易用、高效的 AI 数据管理平台(AIDMP),覆盖数据产生、数据获取、检索分析、可视化、数据使用、合规审核等各个环节,提升数据管理的效率和便利性,严格的访问控制,确保数据安全。提供大规模非结构化数据的检索功能,达到秒级返回,可快速挖掘出新样本。提供高质量业内公开数据集,使用 PythonSDK 工具快速加载数据。面向大模型微调、RLHF、AIGC、自动驾驶等场景,为企业提供一站式的高质量、低成本的数据标注服务,并针对性支持图片、视频、点云等数据格式。
国产化芯片适配进入深耕领域,打造 AI 国产化大生态。商汤自研深度学习训练框架支持寒武纪、华为、海光、天数、燧原在内的多家国产芯片训练。在算力层面,通过国产化适配,不仅在训练环节通过与国产化芯片进行合作适配,加速落地大模型训练标杆项目,同时,在推理环节,也积极适配进而支持大模型的推理和生成式 AI 应用。在 2023 年,商汤大装置实现多个国产化落地案例,通过与国产化芯片厂商合作,基于领先的算法能力平台和国产硬件资源,打造坚实的新一代 AI 基础设施。2021 年,商汤联合工信部电子标准院及头部算力生态合作企业制定芯片及算力评测标准。

2023 年以来,共有超过 1,000 个参数量数十亿到上千亿的大模型在商汤大装置上完成了训练,实现了领跑行业的技术迭代速度,并且支持了数十款生成式AI 应用的落地与部署。大装置沉淀了算法和工程上的经验知识,建立了一套工程化的体系来支撑大模型的快速迭代,相关的软件、系统和硬件都以服务大模型快速迭代为目标做研发配合。 储备领先的 AI 算力资源,并着眼长远规划。大模型、生成式AI 的发展离不开超大规模的算力。商汤建设的上海临港 AIDC 已经是目前全国范围内最大的人工智能算力中心之一。截止 2023 年 Q4,已经上架的GPU数量30,000张,总体算力规模达到了 6,800P,在支持商汤科技自身大模型研发的同时,支持外部客户训练大模型和应用部署。2023 年以来,共有超1,000 个参数量数十亿至上千亿的大模型在大装置上完成训练,实现了领跑行业的技术迭代进度,并支持了数十款生成式 AI 应用。在服务内部与外部客户的同时,商汤大装置积累了大模型训练和推理的算法、工程层面的优秀经验,以及不断优化完善相应的配套软件系统。商汤还在规划AIDC的二期建设,其算力规模也和当前的一期规模类似,将进一步拓展算力储备规模。
推动智算中心跨区域多点布局,聚焦区域 AI 产业生态,做实业务运营。除了自建的上海临港 AIDC,商汤还在积极布局区域算力节点,以需求为导向,立足当地区域的产业生态,共同参与承接地方政府的智算中心建设,并重点加强建成后的运营机制打造,面向当地 AI 相关需求企业进行相关服务的运营,帮助当地政府打造区域智能化产业高地。商汤大装置会结合自身的软件平台能力、专家服务能力,支持区域智能化产业转型/升级,帮助当地企业闭环落地。商汤大装置已经在广州、重庆、深圳和福建成并运营了当地的智算中心,还有更多的区域智算中心在建设中
提供 AI 专家服务,协助客户训练大模型、落地生成式AI 应用。基于经验积累,商汤大装置围绕大模型的训练对外提供专家服务,覆盖大模型规划和大模型训练两个阶段。在大模型规划阶段,通过提供大模型开发咨询服务和大模型代训练服务,能够让客户快速理解大模型开发训练的关键节点和潜在痛点。进入大模型训练阶段,商汤大装置提供了全面的,从数据、训练到推理的大模型全生命周期服务,保障大模型开发成果落地。更关键的是,针对不同行业的客户,通过 AI 专家服务,为客户基于大模型端到端设计整个系统,极大降低复杂度,帮助客户提升产品在行业中竞争力。