海光 CPU 和 DCU 产品基于 X86 架构和类 CUDA 生态, 具备较好的兼容性。
指令集是计算机软硬件系统的重要接口,但其对外体现出来的是一套“规则”,真 正支撑指令集系统繁荣发展的是兼容该类指令集的计算机产业生态。根据 IDC 数据, 2020 年中国服务器市场出货量为 353.4 万台,其中 x86 服务器出货量为 343.9 万 台,占比 97.3%;非 x86 服务器出货量仅为 9.5 万台,占比 2.7%。 x86 指令集具有业界最好的产业生态支持,现有运行中以及开发中的绝大部分 服务器、硬件设备、软件系统均基于或兼容 x86 指令集。公司通过与 AMD 合作,获 得了 x86 处理器设计核心技术,使得公司得以成功跨越 x86 处理器核心技术屏障, 进入到 x86 处理器设计领域,研制出符合中国用户使用需求、兼具“生态、性能、安 全”三大特点的国产 x86 架构处理器产品。研发自主指令集虽然可以大幅度提升技术 上的自主可控比例,但同时会带来现有产业生态环境难以支持、用户应用迁移成本 代价高、应用体验不佳等诸多问题。现阶段公司未选择该技术路线。
海光 CPU 兼容 x86 指令集,处理器性能参数与国际同类型主流处理器产品相 当,支持国内外主流操作系统、数据库、虚拟化平台或云计算平台,能够有效兼容目 前存在的数百万款基于 x86 指令集的系统软件和应用软件,具有优异的生态系统优 势。 海光 DCU 兼容“类 CUDA”环境,软硬件生态丰富,典型应用场景下性能指标达 到国际上同类型高端产品的水平。海光 DCU 主要面向大数据处理、商业计算等计算 密集型应用领域,以及人工智能、泛人工智能类运算加速领域。
海光 CPU 主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼 容国际主流 x86 处理器架构和技术路线,具有先进的工艺制程、优异的系统架构、 丰富的软硬件生态等优势。此外,海光 CPU 支持国密算法,扩充了安全算法指令, 集成了安全算法专用加速电路,支持可信计算,大幅度地提升了高端处理器的安全 性,可以在数据处理过程中为用户提供更高效的安全保障。 海光 CPU 根据不同的产品规格定义,需要在一块基板上封装 1 至 4 颗裸片。裸 片的内部结构非常复杂,主要功能模块包括处理器核心(Core)、片上网络、各类接口 控制器等;除硬件电路外,裸片中还集成了复杂的程序代码(“微码系统”)。
从海光 CPU 应用场景角度看,公司将海光 CPU 产品规划为海光 7000 系列、海光5000 系列和海光 3000 系列。三个系列产品技术设计同源,处理器核心等具有相似的技 术特征。
海光 CPU 主要应用于服务器和工作站。使用海光 CPU 的服务器主要应用与电 信运营商、金融、互联网等领域,例如,电信运营商云服务资源池系统支撑云业务应 用,银行和证券公司查询、交易系统,互联网的搜索、计算服务、存储等应用;使用 海光 CPU 的工作站主要应用场景为工业设计和应用、图形图像处理,例如 VR、AR 图形渲染场景,以及智能工厂数字孪生应用等。海光 CPU 在国产处理器中具有非常 广泛的通用性和产业生态,已经大规模应用于电信、金融、互联网、教育、交通等多 个行业或领域。
海光 DCU 属于 GPGPU 的一种。CUDA 是一种由 NVIDIA 推出的通用并行计 算架构,包含了应用于 NVIDIAGPU 的指令集(ISA)以及 GPU 内部并行计算引擎。 海光 DCU 协处理器全面兼容 ROCm GPU 计算生态,由于 ROCm 和 CUDA 在生 态、编程环境等方面具有高度的相似性,CUDA 用户可以以较低代价快速迁移至 ROCm 平台,因此 ROCm 也被称为“类 CUDA”。因此,海光 DCU 协处理器能够较 好地适配、适应国际主流商业计算软件和人工智能软件,软硬件生态丰富,可广泛 应用于大数据处理、人工智能、商业计算等计算密集类应用领域,主要部署在服务 器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高 吞吐量的数据处理任务。 GPU 最初的设计目标是为了提升计算机对图形、图像、视频等数据的处理性能, 解决 CPU 在图形图像领域处理效率低的难题。随着 GPU 在并行计算方面性能优势 的逐步显现以及并行计算应用范围的逐步拓展,GPU 逐渐分化成两条分支,一条是 传统意义的 GPU,延续专门用于图形图像处理用途,内置了视频编解码加速引擎、 2D 加速引擎、3D 加速引擎、图像渲染等专用运算模块;另一分支是 GPGPU,作为 运算协处理器,并针对不同应用领域的需求,增加了专用向量、张量、矩阵运算指 令,提升了浮点运算的精度和性能,以满足不同计算场景的需要。

海光 DCU 的构成与 CPU 类似,其结构逻辑相对 CPU 简单,但计算单元数量 较多。海光 DCU 的主要功能模块包括计算单元(CU)、片上网络、高速缓存、各类接 口控制器等。
海光 8100 能够充分挖掘应用的并行性,发挥其大规模并行计算的能力,快速开发 高能效的应用程序。海光 8100 采用先进的 FinFET 工艺,典型应用场景下性能指标可以 达到国际同类型高端产品的同期水平。
随着 GPGPU 的技术发展和相关生态环境的逐步完善,其用途被进一步发掘。目前, GPGPU 已经广泛用于商业计算和大数据处理,如天气预报、工业设计、基因工程、药 物发现、金融工程等。在人工智能领域,使用 GPGPU 在云端运行模型训练算法,可以 显著缩短海量训练数据的训练时长,减少能源消耗,从而进一步降低人工智能的应用成 本。与此同时,GPGPU 能够提供完善的软件生态系统,便于各种已有应用程序的移植 和新算法的开发,因此全球人工智能相关处理器解决方案仍然是以 GPGPU 为主。因此, GPGPU 是人工智能领域最主要的协处理器解决方案,占据人工智能 90%以上的市场份 额,在智能工厂、无人驾驶、智慧城市等领域具有广泛的市场空间。