CDMA 芯片技术乘 3G 之风,弯道超车主要竞争对手。
公司在 1989 年推出 CDMA 技术,该技术后成为 3G 时代的三大技术“TD-SCDMA、WCDMA、CDMA2000” 的基础,这意味着公司掌握了 3G 技术的核心专利。2005-2006 年,公司接连推 出“Scorpion CPU 微架构”、“Hexagon DSP”架构,并于 2007 年推出首个 SoC 平台“骁龙 S1”,意味着主要竞争对手德州仪器的“CPU+DSP”异构计算 技术的独特优势丧失。另外,公司也受益于市场对于 EV-DO 和 WCDMA/HSPA 等 3G 芯片的强劲需求。与此同时,最大的竞争对手德州仪器却受制于大客户诺 基亚的“多供应商战略”,面临意法半导体和英飞凌的价格竞争。2007 年,公 司首次超过德州仪器,在全球半导体市占率(按销售收入划分)排名第一。多方 因素影响下,德州仪器于 2008 年出售基带业务,并于 2012 年退出手机芯片业 务。后来意法爱立信、博通接连宣布退出手机芯片业务,英伟达也因通信基带的 原因退出智能手机市场。 调制解调器(基带)+GPU+CPU 共同维持公司 SoC 领先地位。1)调制解调器 技术持续引领行业,为强势的专利授权协议打下基础:先后推出 MDM9X00(全 球首款 LTE/3G 整合的多模调制解调器)、MDM9X15(弥补 MDM9X00 不能支 持中国移动 TD-SCDMA 制式的不足,并被集成进 SoC)、MDM9X25(全网通, 被集成至 800/600/400 系列)。于 2016 年推出首款 5G 调制解调器,并于 2017 年在 28GHz 毫米波频段上完成了 5G 数据连接。公司在调制解调器技术上的强 势表现,为强势的专利授权协议打下基础。2)Adreno GPU 浮点性能持续暴涨, 功耗和性能表现优异:2009 年高通正式收购 AMD 的移动 GPU 业务,Adreno 200 的浮点性能为 2.1GFLOPS,2011 年 Adreno 320 的浮点性能达到约 60 GFLOPS, 为大型移动游戏做好了硬件准备。2014 年底发布的骁龙 810 搭载的 Adreno 430 的浮点性能达到约 280 GFLOPS。3)CPU 自主构架持续迭代:公司分别于 2005、 2012、2015 年发布“Scorpion”、“Krait”、“Kryo”架构,2008 年的新 Scorpion 成为了首个 1G 主频的移动 CPU、2014 年 Krait450 主频高达 2.7GHz。
“没有授权,就没有芯片”——公司专利授权协议对下游客户和竞争者保持强势。 公司凭借积累的大量专利和领先的调制解调器技术,和客户签订专利授权协议, 条款要求客户对销售的每部手机支付专利使用费,而不仅仅是含有公司无线芯片 的手机。这使得公司面对其他手机芯片制造商的竞争中获得优势——1)价格竞 争中获得优势:如果竞争对手试图以低于公司芯片的价格出售芯片,公司可以降 低自己芯片的价格,与此同时客户仍将为每部手机支付高额的专利授权费,在激 烈的价格竞争下,公司的代价要小于竞争对手。2)激励性报酬进一步巩固公司 产品销路:客户使用公司芯片超过一定比例,才可获得激励性报酬(其中可能包 含专利使用费的减免)。实质上阻止客户采用非公司芯片并销售对应的产品。 综合 1)CDMA 技术积累并在专利方面持续投入;2)调制解调器技术和 SoC 整 体性能领先;3)强势的专利授权协议,造就高通手机 SoC 芯片领域的领先地位。
云端 AI 成本高昂,混合 AI 降本增效,百亿参数大模型未来有望于端侧运行。混 合 AI 指将 AI 计算的工作负载分配至终端 AI 与云端 AI,实现两者协作。根据高 通 AI 白皮书,单一云端生成式 AI 的查询成本是传统搜索的 10 倍,LLM 每年的 新增成本或高达数十亿美元。随着 AI 模型使用量与复杂性的大幅增长,巨大的 云端推理成本将限制生成式 AI 的规模化拓展。混合 AI 将部分计算负载从云端转 移至边缘终端,降低数据中心基础设施成本与网络传输成本、节约能耗。随着未 来终端 AI 处理能力的进一步增强,终端将承担更大比重的 AI 推理,以低成本优 势赋能生成式 AI 的规模化拓展。云端和边缘终端如智能手机、PC、汽车等协同 合作,有望实现更强大、更高效且高度优化的生成式 AI。
混合 AI 与单一云端 AI 相比,还拥有更高的可靠性、隐私性与个性化程度。1) 可靠性:在云端服务器拥挤或弱网络连接的情况下,混合 AI 架构中的终端处理 可以保障生成式 AI 应用的正常运行。2)隐私和安全:企业信息、个人隐私和模 型参数等数据将完全保留在终端,用户隐私得到有效保障。3)个性化:端侧 AI 能在不牺牲隐私的前提下,生成数字用户画像并不断学习和优化演进。
生成式 AI 有不同的端侧和云端分布协作机制,适应不同工作任务的需要。1)以 终端为中心的混合 AI:云端仅用于分流处理终端无法充分运行的 AI 任务。其快 速响应的特征适用于处理图像生成、起草邮件等工作。2)基于终端感知的混合 AI:终端 AI 通过自动语音识别或计算机视觉技术将语音转化为文本,随后文本 形式的请求提示传送至云端,由云端大语言模型进行处理生成文本回答并传回终 端,终端文本转语音模型输出语音回答。3)终端云端协同处理的混合 AI:适用 于大语言模型。内存读取受限影响大语言模型推理性能,通过同时运行多个大语 言模型生成多个 token、并从 DRAM 一次性读取全部参数更为高效。终端云端 协同处理能有效解决生成 token 时的能耗和发热问题,在性能和能耗上实现双 赢。
公司的 SoC 解决方案具有处理器集成优势,满足生成式 AI 多样化计算需求。生 成式 AI 的用例需求主要分为三类。1)由用户触发,需立即响应:拍摄、图像生 成/编辑、代码生成等;2)持续型用例,需要长时间运行:语音识别、实时翻译 等;3)在后台持续运行(泛在型用例):始终开启的 AI 预测助手、基于情境感 知的 AI 个性化等等。不同工作特性催生对不同处理器的需求,CPU 擅长顺序控 制和即时处理,GPU 擅长并行数据流处理,NPU 擅长标量、向量和张量数学运 算。早期智能手机系统由 CPU 和环绕 CPU 分布的分立芯片组成。现今各芯片已 集成到 SoC(系统级芯片)的单个芯片体中,能够改善峰值性能、能效、单位 面积性能、芯片尺寸和成本。分立的芯片会占用更多的电路板空间,会导致性能 降低、能耗增加,因此在智能手机、笔记本电脑等具有严格功率和散热限制的便 携式终端上,处理器集成于 SoC 更为必要
NPU 牺牲部分易编程性以实现更高的峰值性能、能效和面积效率,能以低功耗 加速 AI 推理,第三代骁龙 8 中的 Hexagon NPU 性能领先。早期的 NPU 面向基 于简单卷积神经网络(CNN)和标量与向量数学运算的音频和语音 AI。2016 年 基于 Transformer、循环神经网络(RNN)等更复杂模型出现后,NPU 增加了 张量加速器和卷积加速,在提高性能的同时降低了内存带宽占用和能耗。2023 年大语言模型(LLM)和大视觉模型(LVM)赋能的 AI 模型大幅提升模型规模, 并对内存与系统设计提出了更高要求。对于上文提到的“持续型”和“泛在型” 用例,电池续航和能效往往更重要,NPU 是最佳选择。以“PC 个人助手”为例, 需要始终开启运行,考虑到性能和能效,应尽可能在 NPU 上运行。第三代骁龙 8 中的 Hexagon NPU 是公司面向生成式 AI 最新的设计,为持续 AI 推理带来相 比于上一代 98%性能提升和 40%能效提升,能够模仿最主流模型的神经网络层 和运算,比如卷积、全连接层、Transformer 以及主流激活函数,以低功耗实现 持续稳定的高性能表现。
公司的各处理器性能强劲,异构计算高效“分配任务”,全力支持端侧生成式 AI 不断增强的多模态趋势。异构计算可根据任务特性,动态分配 CPU、GPU、 NPU 等计算单元的算力。在集成硬件方面,高通 AI 引擎具有业界最领先的异构 计算架构, 除前文所述 Hexagon NPU,还包括 Adreno GPU、Kryo / Oryon CPU、传感器中枢等。其中,1)Adreno GPU 能以低功耗进行高性能图形处理, 可用于以高精度格式进行 AI 并行处理。基于 Adreno GPU,Llama 2-7B 每秒可 生成超过 13 个 tokens。2)Oryon CPU:根据高通 AI 白皮书,骁龙 X Elite 平 台中的 Oryon CPU 作为 PC 领域的全新 CPU 领军者,可提供高达竞品两倍的 CPU 性能,达到竞品峰值性能时功耗仅为竞品的三分之一。3)传感器中枢:适 用于需全天候运行的小型神经网络和泛在型应用,所需电流通常不超过 1mA, 具备专用电源传输轨道,可在 SoC 其余部分关闭时运行,大幅节省电量。
手机端侧生成式 AI 应用涌现,未来有望强化用户“手机依赖”。根据 Reviews.org 进行的一项调查显示,在 2024 年美国人均查看手机频率高达 205 次/日。智能 手机集社交、购物、娱乐、信息获取等功能于一体,是现代人数字生活的载体与 核心,绝大多数消费者具有“手机依赖”。目前豆包、文小言、通义等手机端生 成式 AI 应用涌现,兼具 AI 搜索、AI 创作、AI 对话、AI 绘图等众多功能,提高 学习工作的便利性并增强娱乐体验。随着更多基于端侧和云端的生成式 AI 应用 的渗透与升级,消费者的手机使用频率与“手机依赖”将持续增加。

受高端和中低端智能手机市场推动,全球智能手机出货量强劲复苏,AI 智能手 机潜力巨大。自 2022 年起,由于技术创新乏力与经济环境疲软,全球智能手机 出货量连续两年下滑,市场进入寒冬期。根据 IDC 的统计,受益于厂商保持高 端化并提升低端产品份额的战略调整、在多个价格区间推出新产品、提供免息分 期计划以及积极的以旧换新策略,24 年全球智能手机出货量同比增长 6.4%至 12.4 亿台。根据 Counterpoint 的统计,2024 年高端智能手机 SoC 营收同比增 长 34%,贡献了安卓手机 Soc 总营收的 52%。同时,更多支持支持本地或云端 部署 AI 大模型的智能手机有望问世。Counterpoint 预测,2028 年在售价超过 250 美元的智能手机中,生成式 AI 智能手机将占 90%,出货量预计将超过 7.3 亿部。
骁龙 8 Elite 积极拥抱生成式 AI 趋势,处理 AI 任务性能大幅提升。2024 年 10 月 22 日,高通于骁龙峰会上正式发布新一代旗舰 SoC—— 骁龙 8 Elite,并表示 骁龙 8 Elite 将支持 8 年安卓版本更新。与第三代骁龙 8 相比,骁龙 8 Elite 在 单线程和多线程基准测试中,实现了高达 45%的大幅性能提升,能效提升也高 达 44%,Oryon CPU 在 Chrome 浏览器上的性能提升超过 62%,在整个 Android 生态系统中处于领先地位;Adreno GPU 性能提升 40%;Hexagon NPU 可将 AI 性能提升 45%,能效也提升 45%,支持多模态生成式 AI 和更长 token 输入。 在 GeekBench 6 测试中,骁龙 8 Elite 的单核成绩为 3228,多核成绩为 10688, 对比天玑 9400 分别提升 14%、16%左右;安兔兔测试中,骁龙 8 Elite 的成绩 达到 3081152,对比天玑 9400 领先约 9%。除了以上生成式 AI 加持,高通采用 的 Spectra 图像信号处理器(ISP)和骁龙 X80 5G 调制解调器-RF 系统也得到 AI 技术助力,支持无限实时语义分割、超暗光照片和视频拍摄等功能,支持 Wi-Fi 7 与集成 AI,实现 40% 以上功耗降低。
以价格带划分,公司在中高端手机 SoC 市场独占鳌头,骁龙 8Elite 被品牌旗舰 机型广泛采用。根据 Counterpoint 的统计,手机芯片出货量方面,2024 年 Q1- Q4 联发科的市场份额均位列全球第一,高通份额仅次于联发科位列第二,苹果 份额位列第三;高端安卓手机芯片销售收入方面,2024 年公司以 59%的市场份 额位列第一,并在中高端安卓市场占据主导地位。OPPO、华硕、小米、三星等 品牌的旗舰机型已采用骁龙 8Elite,其中骁龙 8 Elite for Galaxy 专供三星旗舰 机型 Galaxy S25 系列。 骁龙旗舰芯片性能不断升级,价格持续攀升,骁龙 8 Elite 价格约为 180-190 美 元。随着制程工艺的不断进步与核心架构的优化,骁龙芯片的价格在 2016 年到 2024 年间稳步增长,8 年间价格增长近 5 倍。2020 年,高通推出采用三星 5nm 制程工艺的骁龙 888,5G 下载速度与 GPU 性能大幅提升,芯片价格上升至 140 美元;之后发布的骁龙 8 系列价格均高于 150 美元。骁龙 8 Gen 3 价格较前代 已上涨超过 20%,骁龙 8 Elite 处理器价格相比骁龙 8 Gen 3 基本持平,但有可 能因关税等不确定因素阶段性上涨,带动公司手机 SoC ASP 提升。
ARM 和 x86 是目前计算领域中最常见的两种微处理器架构。x86 架构广泛应用 于个人计算机和服务器市场;而 ARM 架构则因其低功耗、高能效的特点,在移 动设备和嵌入式系统中占据主导地位。随着技术发展,ARM 架构不断向高性能 计算领域拓展。ARM 架构采用的是 RISC(精简指令集计算),特点是指令种类 少、格式统一,每条指令执行时间短,CPU 硬件结构设计简单。x86 架构采用 的是 CISC(复杂指令集计算),允许单条指令执行更复杂的操作,也意味着每 条指令的执行需要更多的硬件资源和更复杂的逻辑电路。因此 ARM 为代表的精 简指令集对晶体管的数量需求也少,相对应的也是更低的功耗、更长的电池续航、 更小的体积、更轻薄的外观,在手机、平板、物联网等功耗敏感领域得到了更广 泛的应用。x86 架构则更多应用于 PC、服务器和高性能计算中,因其功耗相对 较高,需要更多的散热和冷却系统来维持性能表现。
以 Intel 芯片为代表的 X86 架构曾与 Windows 操作系统深度捆绑,至今仍是 PC 主流选择。1978 年,Intel 推出 8086 处理器,首个 x86 架构问世。8086 的衍 生处理器 8088 在三年后为 IBM PC 所选用,从此 x86 便成为 PC 的标准平台。 1998-2005 年,x86 架构的 Intel 底层芯片和 windows 操作系统组成的 WIntel 联盟主导了 PC 市场,占据 96%的市场份额。每当微软发布新的操作系统,Intel 的芯片也会有大的更新,在协同更新下 WIntel 联盟不断巩固加强。时至今日 WIntel 的 x86 架构仍是 PC 市场的主流选择。2018 年前,x86 架构的服务器占 据全球服务器 99%以上市场份额;Intel 至今仍然占据台式机 CPU 市场近 70% 的市场份额。 ARM 架构芯片在手机端被广泛采用,苹果 M 系列芯片是 PC 端 ARM 架构较为成 功的案例。上世纪 80 年代,Acorn(ARM 公司前身)推出了首个 ARM 架构的 芯片 ARM1,并未引起广泛关注,后因其功耗低、续航长的特性,在移动手机市 场逐渐崛起。2005 年,全球 98%的手机都搭载了至少一颗 ARM 芯片;截至 2022 年 12 月 31 日,ARM 的 CPU 在全球智能手机市场的占有率超过了 99%,累计 出货量达到 2500 亿个。微软早期曾多次做出 ARM 的尝试,如 2012 年的Windows RT、2019 年的 Surface Pro X 等,但因为软件兼容性和性能问题并未 得到市场认可。相比之下苹果在 ARM 架构的上的尝试较为成功,采用 ARM 架 构的 A 系列芯片被广泛应用于 iPad 和 iPhone,在性能和能耗方面表现优异。 2020 年苹果 M1 芯片的成功,推动 ARM 架构芯片在 PC 领域的发展。目前苹果 占有 Arm 架构芯片的 PC 市场约 90%份额。 ARM 架构软件生态短板改善, Windows on ARM 份额有望持续扩大。ARM 架 构因发展时间较短,面临着软件生态的短板:ARM 架构的软件和系统版本需要 针对特定的芯片和主板进行适配和定制化开发,直接使用通用的版本较不可行, 软件的迁移和开发比较困难。Windows 相比目前 ARM 架构 PC 主流采用的 macOS 系统来说,原有的软件库更庞大,所以通过转译可支持的软件数量远超 macOS。微软已经相继推出 ARM64EC 和转译层 Prism,支持 ARM 与 x86 转译 混用,并且改进了在ARM设备上运行x86和x64应用的性能,Windows on ARM 已经可以支持生产力、社交媒体、娱乐、开发工具等多个领域的主流软件。随着 ARM 在 PC 生态上的号召力进一步扩大,软硬件厂商将引起重视,Windows on ARM 的 OEM 生态有望持续改善。
收购 NUVIA 推出自研 Oryon 架构,减轻对 ARM 公版架构的依赖。ARM 的授权 许可主要有两种:(1)架构许可协议(Architecture License Agreement,ALA), 允许客户基于 ARM 的指令集架构来自行定制设计处理器 IP 核,即获取 Arm 的 架构许可证,独立开发;(2)技术许可协议(Technology License Agreement, TLA)允许客户直接购买 ARM 设计好的 IP 核来用,并作少量修改。TLA 收费高 于 ALA,苹果从 A5 开始自研,采用的是 ALA 许可;公司采用 TLA 许可。2021 年年初,公司收购 CPU 内核架构设计公司 NUVIA,创始人 Gerard Williams 参 与了苹果从 A4 到 M1 芯片的整个开发过程,是核心架构师之一。NUVIA 的 CPU 核心设计基于 Arm 的底层架构,但定制化程度高,这意味着高通可以减少对 Arm 公版核心的依赖。公司基于 NUVIA 的“Phoenix”推出自研 Oryon 架构,标志 着公司从传统的 Arm 公版方案转向独立研发。 Oryon CPU 是骁龙 X Elite 的核心组件,针对 PC 平台进行深度优化,强调性能 与功耗的平衡。1)指令获取管道优化,确保每个指令类都能得到充分处理。2) CPU 的执行单元配置丰富,对于高性能计算任务具有显著优势,如视频编码、 AI 推理等。3)加载存储单元支持超过 200 个并行的加载存储操作,预取机制的 优化大幅减少内存延迟。测试表明,Oryon 在 Linux 和 Windows Subsystem for Linux 环境中的表现明显优于原生 Windows,针对多平台优化的表现好;单线 程内存带宽测试表现优异,接近 100GB/s 的单核传输速率对于需要高吞吐量的 应用场景,如大型数据库管理和实时数据分析尤为重要。 Oryon CPU 有望扩展至手机 SoC 等更广泛的计算平台。Oryon CPU 的最早搭载 于 2023 年推出的骁龙 X Elite 平台,并沿用至 2024 年发布的骁龙 X PLUS。2024 年 10 月 22 日,公司推出搭载 Oryon CPU 的骁龙 8 Elite(骁龙 8 Gen 3 中搭载 的是上一代 Kyro CPU),是 Oryon 在手机端的首次尝试。随着 AI 和边缘计算 的崛起,Oryon 架构有望扩展至更广泛的计算平台,如嵌入式系统和工业自动 化设备。
AI PC 加速渗透,Windows AI PC 出货高增。根据 Canalys 统计,2024Q4 AI PC 出货量达 1540 万台,占 PC 出货量 23%,2024 全年 AI PC 占市场总量的 17%, 其中搭载 Windows 系统的 AI PC 占总体 AI PC 出货达 46%。根据 Canalys2025 年最新预测,PC 市场将加速增长,企业正为微软对 Windows10 系统结束服务 做准备,同时受换机需求和端侧生成式 AI 需求推动,AI PC 占比有望于 2025 年 达到 35%。
“骁龙 X”系列获得先发优势,受到下游 PC 厂商广泛支持。2016 年公司与微 软签订 Windows on ARM 的排他性独家协议,成为微软 Windows on ARM 的独 家供应商。微软将满足“Copilot+AI PC”的 NPU 算力门槛设定为 40 TOPS,在 发布“Copilot+AI PC”时仅有骁龙 X Elite 和 X Plus 搭载的 Hexagon NPU 满足 要求,成为发布时的唯二可选项。公司合作方微软以及下游 PC 厂商戴尔、惠普、 联想等推出带有“Copilot+PC”功能的 AI PC,均搭载骁龙 X 系列平台。
骁龙 X 市场份额突破性增长,在欧美市场份额增长较快。骁龙 X 全系标配 45TOPs NPU(业界首个集成式方案),专业软件 AI 加速性能高于竞品 50%-1400%(vs 酷睿 Ultra 7),并将携手 Docker 引入 Model Runner 工具链,转型为轻量级 AI 开发平台,构建端侧 AI 护城河;开发者生态持续优化,与微软携手改进在 Windows 系统下的驱动和功能适配,原生应用数量 1 年内增加 3 倍至 750 个, 全 球 Top200 流行应用 100%原 生 适 配 ,1400 款 游 戏 完 成 优 化 。根 据 Semiconductors 25Q1 统计数据:在美国 800 美元以上高端 Windows PC 市场, 骁龙 X 系列斩获 10%份额,在欧洲前五大市场,目前高通骁龙 X 系列的市占率 达到了 9%。截至 2025 年年中,有 85+款骁龙本已量产/开发中,覆盖联想、微 软 Surface 等头部品牌,预计 2026 年产品矩阵将超 100 款。