2024年英特尔研究报告:制程的追赶,份额的收复

英特尔的华丽转身:制程的追赶,份额的收复

区别于市场的观点:我们认为市场对英特尔的创新和技术研发能力存在认知差。市场普遍 质疑,公司在制程上基本从 2016 年开始落后,为何目前突然就能“华丽转身”?我们认为, 首先,市场忽略了公司在过去几年管理层的变化,并低估了现任 CEO 的能力;另外,市场 对于英特尔在制程追赶上所采取的“与敌同行”策略也感到困惑。最后,我们认为英特尔 的估值提升,除了基于业务的增长外,更重要的是在制程方面有望重回王者地位。

在 2023 年 11 月 7 日 Intel Innovation Taipei 2023 科技论坛上,英特尔 CEO Pat Gelsinger 再次强调“四年五节点”计划将准时完成。我们认为英特尔有望实现此计划,原因有四:

(1)现任管理层的能力:2016 年起,英特尔 CEO 在 Brian Krzanich 的领导下逐渐失去了 对台积电的制程优势,芯片工艺在 14nm 停滞不前。到 2018 年时任 CFO Bob Swan 临时 上任 CEO 后,更多关注成本和利润表现而非工程卓越,导致公司在技术上继续落后于竞争 对手。老臣子 Pat Gelsinger 于 2021 年临危受命成为 CEO。Gelsinger 于 1979 年首次加 入英特尔,他也是公司“开国功臣”之一安迪·葛洛夫(Andy Grove)的得意门生,经历 过公司的黄金时代,于 2001-2005 年出任公司的 CTO,负责多项重要产品,包括第四代处 理器 80486。Gelsinger 于 2009 年离开英特尔后,曾于 EMC(当年的服务器巨头)和 VMWare (云计算巨头之一)担任 CXO 位置,因此熟知芯片设计与制造、以及云和数据中心的运作。 上任英特尔 CEO 后花了两年时间重整旗鼓,不但致力于拓展数据中心业务,并提出 IDM2.0 策略,将代工业务开放,从成本中心变为盈利中心,同时集中火力研发 CPU 的制程,推进 “四年五节点”计划,外包非核心技术到台积电,志在重回英特尔在制程的领导地位。

(2)改良芯片设计:与 IDM 1.0 包办芯片设计和制造的模式不同,英特尔在 IDM 2.0 模式 中使用良品率较高和可集多家优势于一身的 chiplet 技术,将一些非核心的 chiplet 交给台积 电代工,并通过自身的 Fovoros 和 EMIB 工艺将 chiplet 封装一起,从而集中火力专注于自 身最擅长的先进 CPU 制程工艺研发。

(3)采用 EUV 技术:英特尔的 10nm 工艺开始较早,当时 EUV 技术尚未成熟,导致英特 尔“起了大早赶了晚集”,原定 2016 年量产的 10nm 工艺延后至 2019 年量产,使得公司 在制程端的优势被逐渐追平,甚至被超越。直至 2022 年公司在 Intel 4 制程中首次采用 EUV 技术,不仅能降低工艺复杂性,公司也预计相比 Intel 7,Intel 4 将有 20%的每瓦性能提升, 成为公司推进先进制程的又一里程碑。

(4)通过 RibbonFET 和 PowerVia 背部供电技术,堆叠更多的晶体管:RibbonFET 通过 环绕栅极的设计提高了晶体管的电流控制效率,并允许垂直堆叠,从而在更小的空间内实 现更高性能,解决了 FinFET 技术面临的电流泄露和物理极限问题;PowerVia 通过将电源 线移至晶圆背面,并通过纳米级硅通孔直接向晶体管层供电,降低了电阻并减轻了电源干 扰,从而可实现更高的晶体密度和性能。

NEX(Network and Edge,网络与边缘)业务:我们预网络与边缘业务 2024/2025/2026 的营业收入为 61/70/76 亿美元,对应营业收入同比增速为 6%/15%/8%。公司从 2022 年起 将NEX业务作为独立的核算部分。2022年NEX业务的营收为89亿美元,在Mount Evans、 Raptor Lake P&S、Alder Lake N 和 Sapphire Rapids 等产品的推动下实现了 11%的营收同 比增长。但由于网络和边缘市场的需求持续疲软和库存水平上升,23 年 NEX 业务的应收未 58 亿美元,同比下降了 31%。我们认为鉴于延时和成本问题,AI 将向边缘转移带动边缘计 算市场需求。据 Gartner 预测,2025 年,将有多达 75%的企业数据会在传统数据中心以外 生成。此外,传统 RAN 基础设施只能采取一家供应商的一体式设施,增加了运营商的成本, 因此,各大运营商正在积极推动 Open RAN 布局,以优化供应商体系。英特尔正在与爱立 信合作使用 Intel 18A 制程开发 5G 虚拟 RAN 芯片,有望凭借制程优势将性能提升至基于 ARM 架构的低功耗专用芯片相似水平,以此赢得市场份额。

公司股权结构较为分散,机构投资者为主要股东。截至 2024 年 1 月 31 日,机构投资者持 有流通股占比为 66.24%,当中最大六家占 29.54 %,其中包括 VANGUARD 集团持股 9.01%, 为公司第一大股东;贝莱德持股 8.07%,为第二大股东。

IFS 业务:代工业务增长迅速,IDM2.0 战略未来可期

2021 年英特尔宣布 IDM2.0 战略,未来英特尔的制造将变革为:“强化全球内部工厂网络+ 扩大第三方产能利用+发展世界一流代工服务”组合。在 Fabless+Foundry 模式盛行的如今, 老对手 AMD 与台积电合作走上逆袭之路,而英特尔却尝到了 IDM 模式的苦涩。鉴于 10nm 工艺延期近三年,英特尔的先进制程已落后于台积电和三星,因此 CPU 性能也逐渐落后于 AMD。我们认为英特尔此次战略转型旨在重回先进制程的领导地位,并开放其代工业务, 让代工厂从成本中心转型为盈利中心。英特尔希望凭借其先进制程和封装业务吸引新订单, 并降低生成成本,从而提升整体盈利能力,并预计在 2025 年对收入出现较大贡献。

我们预计英特尔代工服务 2024/2025/2026 年营业收入为 11/19/38 亿美元,对应营收同比 增长 20%/68%/100%。我们认为,英特尔的 IFS 业务目前正处于导入期,收入增长主要取 决于先进制程节点的推出、工厂的产能增长、以及客户订单的获取,因此,公司预计 2025 年将出现较大的收入贡献。英特尔计划在 2024 年开始量产 20A 和 18A 制程芯片,客户认 可方面也是捷报频传:如新思科技已经和 Intel 达成战略合作协议,共同开发基于 Intel 3 和 Intel 18A 制程节点的 IP;Arm 与 Intel 签署了涉及多代前沿系统芯片设计的协议,旨在利用 Intel 18A 开发低功耗计算系统级芯片;瑞典电信设备商爱立信也宣布,将使用 Intel 18A 打 造定制化的 5G 系统级芯片。2025 年英特尔在亚利桑那州和俄亥俄州的 20A 和 18A 工厂将 投入运营,预期会对收入有较大的贡献,成为公司提升晶圆厂产能利用率、分摊先进制程 研发成本与建设投入的重要业务。

英特尔正积极扩张全球先进制程芯片制造能力。在美国,英特尔正在俄亥俄州利金县建设 Fab27 工厂,以及在亚利桑那州钱德勒市建设 Fab62 和 Fab52 工厂,计划在 2025 年投产, 总投资额达 400 亿美元。同时,英特尔在德国马格德堡和以色列加特镇分别建设 Fab29 和 Fab38 工厂,预计在 2027 年投产,总投资额高达 330 和 250 亿美元,将用于生产 Intel 4/Intel 3/20A/18A 等先进制程芯片。根据 Tom’s Hardware 2024 年 1 月报道,英特尔位于德国 马格德堡的工厂将用于生产 18A 及以后先进制程节点(如 1.5nm)。

英特尔四年五个制程节点进展顺利,2025 年或将超越台积电

公司在“四年五节点”路线图中表示将会在 2021 下半年完成 Intel 7(台积电 N10)、2022 下半年完成 Intel 4(台积电 N7-N5)、2023 年下半年完成 Intel 3(台积电 N5-N3)、 2024 年上半年完成 Intel 20A(台积电 N3-N2)及 2024 年下半年完成 Intel 18A(超台积电 N2) 共计五代工艺节点的量产准备,目前已官宣按时完成了三个节点,我们认为英特尔有望持 续兑现承诺。台积电则表示 N2 制程(2nm)将在 2025 如期量产,Intel 20A 和 Intel 18A 计划 2024 年开始量产,若二者计划顺利实施,2025 年英特尔将重新获得半导体领先优势。

技术 CEO 回归并重整旗鼓,有望带领英特尔回归创新本源

英特尔当年不敌 AMD,或与管理层决策有关。回顾历史,2016 年以来,英特尔在 AMD 与 台积电联手的攻势下失去了在 X86 领域保持多年的领先优势。时任 CEO 的 Brian Krzanich (布莱恩·科再奇)欲扭转局面,但在 10nm 节点中采取了激进目标(英特尔在 10nm 工 艺上的最初规划是 14nm 的 2.7 倍,性能接近三星和台积电 7nm)和保守技术(选择 DUV 方案,而三星与台积电在 7nm 均采用 EUV 方案)的错误路线,导致 10nm 制程迟迟无法 落地,而台积电在 2017 年和 2018 年分别推出 10nm 与 7nm 节点,对比英特尔 10nm 节点 直至 2019 年才姗姗来迟。此外其在包括平板电脑、智能穿戴、无人机等移动处理器市场也 频繁试错却均黯淡收场。在科再奇于 18 年 6 月离任后,原任英特尔 CFO 的 Bob Swan(鲍 勃·斯旺)成为临时 CEO,并在 7 个月后成为正式 CEO,但财务出身的斯旺几欲放弃晶圆 制造业务,以节省资本开支及促进业务灵活性。直至 2021 年初,帕特·基辛格(Pat Gelsinger) 回归英特尔担任 CEO,并重整旗鼓,英特尔自此迈入了一个崭新的阶段。

2021 年 2 月众望所归的帕特·基辛格成为英特尔第八任首席执行官,技术出身的他也是英 特尔历史上唯一担任过 CTO 的 CEO。基辛格具有扎实的技术背景,他 16 岁被提前录取至 林肯技术学院并获得副学士学位,24 岁获得斯坦福大学电气工程和计算机科学硕士学位。 1979 年年仅 18 岁的帕特·基辛格就加入了英特尔成为了一名技术员,在英特尔工作的 30 年里曾担任过高级副总裁及首席技术官,也是英特尔创办人之一安迪·葛洛夫(Andy Grove) 的门生。1989 年,基辛格作为首席架构师带领团队开发出第四代 80486 处理器,在 2001 年成为 CTO 后,他曾带领公司研发 Wi-Fi、USB 等行业关键技术,在包括 Intel Core(酷 睿)和 Intel Xeon(至强)处理器等 14 个微处理器项目发挥了关键作用,经历及见证了英 特尔最辉煌的年代。2009 年基辛格离开英特尔,先后担任 EMC(后被戴尔收购)总裁兼 首席运营官及 VMware(后给博通收购)首席执行官,两家均为当时数据中心业务的巨头, 因此基辛格对数据中心业务非常熟识。基辛格的 CEO 生涯成绩斐然,在 VMware 的九年中 使公司的年营收几乎翻了三倍。2019 年美国 Glassdoor 的年度调查中,基辛格荣膺“美国最 佳 CEO”。我们认为 2021 年基辛格于英特尔内外交困之际回归并执掌帅印,或将带领英特 尔回归技术本源,为创新和技术引领的新时代开辟航道,并有望重回制程领导者宝座。

参考英特尔的竞争对手 AMD 可知,一位优秀的 CEO 对公司成败具有决定性的作用。工科 出身的苏姿丰(Lisa Su)曾凭借对技术创新方向的准确把握和果决的领导风格令 AMD 绝 处逢生。我们认为同样技术出身的基辛格此次回归英特尔出任 CEO,将发挥其技术远见和 领导才能,有望带领英特尔回归创新本源,重拾增长动力。苏姿丰 17 岁被麻省理工学院电 机工程系录取,并先后于该校获得电机工程学士、硕士、博士(本硕博三个学位),后于德 州仪器、IBM、Freescale 等公司担任研发主管、CTO 等要职。她于 2012 年加入 AMD, 2014 年成为 CEO,彼时的 AMD 内部正深陷财务危机,外部又面临来自英特尔激烈的竞争 压力,英特尔因提前布局企业级数据中心 CPU,垄断了利润丰厚的高端数据中心市场,市 占率一度高达 99%,而 AMD 却由于晶圆制造子公司格罗方德(Global Foundries)制程落 后导致新产品一再延期,市占率倍受挤压。值此内外交困之际,苏姿丰认为最重要的是找 到 AMD 的核心竞争力并发扬光大,即便市场风向正逐渐偏向手机、平板等移动端芯片及物 联网技术,她仍选择巩固 AMD 在个人电脑、数据中心 CPU 及游戏显卡业务上的优势。她 背水一战历时 5 年主导设计 Zen CPU 核心架构,研发投入约 50 亿美元,最终于 2016 年 成功推出 Zen 架构,2017 年推出基于 Zen 架构的 Ryzen PC CPU 和 EPYC 数据中心 CPU 产品组合。针对制程掣肘及债务危机,她于 2014 年果断剥离格罗方德,并借此转移了 12 亿美元的外债,AMD 由此正式转向 Fabless 模式,将芯片制造外包给台积电,保证了产品 制程迭代的稳定性。正是由于苏姿丰对核心优势的准确判断和对技术创新的坚守,以及果 断剥离格罗方德的战略决策,才使得 AMD 在 2016 年英特尔深陷 10nm 制程停滞泥淖之时 逆势赶超,截至 2023Q3 AMD 在数据中心 CPU 市场份额升至 23.3%,PC CPU 市场份额 升至约 20%。

迭代目标较激进,英特尔 10nm 迟到三年

复盘英特尔从毋庸置疑的制程领先地位到逐渐被赶超的过程,我们认为 10nm 的多次延迟 难辞其咎,而落后的原因可归咎于: 1)过于激进的迭代目标。英特尔在 10nm 节点上使用了许多先进技术,因此在提升性能的 同时,也大幅降低了芯片的良率。早在 2013 年英特尔路线图中已计划提供 2.7 倍密度,并 计划采用四重曝光技术(SAQP,Self-Aligned Quadruple Patterning)、有源栅极触点(COAG, Contact Over Active Gate)、单虚拟栅极(SDG,Single Dummy Gate)、钴局部互联、以 及 EMIB 和 Forveros 封装等新技术。英特尔最终在 2016 实现 10nm 制程芯片,反观台积 电在 2018 年第二季度率先开始量产 7nm 芯片,英特尔 2019 年才推出 10nm 芯片。根据 Digitimes 测算,台积电 7nm 芯片晶体管密度为 0.97 亿/mm2而英特尔 10nm 芯片则为 1.06 亿/mm2实际上略微领先于台积电,但是晶体管密度高达1.73亿/mm2的台积电5nm 在2020 年上半年开始量产,在先进制程研发超越了英特尔。

2)DUV 光刻路线选择导致英特尔 10nm 进展缓慢。英特尔在 10nm 中选择 DUV 的原因有 二:1)技术考量,英特尔的 10nm 工艺开始较早,当时 EUV 技术尚未成熟;2)成本考量, DUV 技术相对较成熟,成本较低。但 DUV 的波长更长,因而使得光源更容易发生衍射, 从而影响精度。英特尔选择了DUV后就需要搭配SAQP四重曝光技术,从而提高光刻精度。 多技术同时代入导致 10nm 最终良率仅为 50%~60%,无法满足量产要求,使得量产推迟。

Intel 4 开创 EUV 时代,作为半代工艺为 Intel 3 铺平道路

7nm 更名为 Intel 4,是首次使用 EUV 技术的英特尔 FinFET 节点,每瓦性能可提升 20%, 相比上一代在各方面的性能都有较大提升。根据英特尔数据显示,Intel 4 高性能库密度比 Intel 7 增加了两倍,晶体管尺寸减少了一半,在该制程下能效比有大幅提升,较前一代提 升了 20%以上。半导体咨询机构 IC Knowledge 指出,Intel 4 制程性能优于台积电 5nm, 接近台积电和三星的3nm工艺,可见该制程的命名就是为了对标另外两家厂商的4nm标准。 根据英特尔发布的良率对比图中可知, Intel 4 拥有较高良率,这证明了英特尔晶圆厂的技 术,并希望借此吸引客户使用其主力节点 Intel 3。Intel 4 作为过渡节点,唯一使用该节点 的 Meteor Lake 移动端处理器已于 23 年 12 月上市。 Intel 3 作为 Intel 4 的后续产品,提高了性能库的密度,同时加入高密度库,增加了 EUV 技术的使用,对比 Intel 4 每瓦性能提高 18%。Intel 3 采用 7nm+节点,比台积电 5nm 至 3nm 制程迭代提升幅度高 10-15%,工艺性能提升较大。目前该制程仅针对 Sierra Forest 和 Granite Rapids 的数据中心产品,用于及时补强英特尔数据中心算力和功耗的短板。据 韩媒 ChosunBiz 报道三星和台积电的 3nm 工艺良率都在 50%左右,良率底导致台积电 3nm 芯片供不应求,因此对标台积电 5nm-3nm 制程的 Intel 3 意义重大。目前英特尔已与联发 科和同级大型 IC 设计客户达成合作,而 Intel 3 在 23 年年底已顺利投入生产,英特尔芯片 或将以更低的成本和更高的性能成为客户高性价比的选择。

Intel 20A 使用 PowerVia 和 RibbonFET 两项突破性技术开创埃米时代(angstrom era)

Intel 20A 较 Intel 3 每瓦性能提升 15%,2024 年若能准时量产则有望反超台积电,重夺制 程领先优势。RibbonFET 是英特尔基于全环绕栅极(Gate all around, GAA)晶体管的最新 技术。随着晶体管尺寸和栅极宽度的减小,FinFET 技术逐渐逼近物理极限,电流泄露问题 愈加严重(台积电 3nm 采用 FinFET 技术,我们认为,搭载了其的 iPhone 15 系列手机或 因而出现漏电和发热严重)。GAA 技术应运而生,RibbonFET 让带状的晶体管沟道整个被 栅极环绕,更有效的控制电流流通,同时水平沟道可以进行垂直堆叠占用空间更小,带来 更高性能。GAA 工艺作为公认的新一代半导体解决方案,三星已在其 3nm 制程中引入 GAA 架构,但是目前良品率较低,台积电也计划在 2025 年量产使用 GAA 架构的 2nm 芯片。我 们认为如果一切进展顺利,英特尔芯片将会较台积电和三星提前进入 2nm 时代。Intel 20A 仅作为过渡节点在英特尔消费级处理器 Arrow Lake 上使用。

背部供电技术 PowerVia 将成 2nm 以上先进制程基石及制胜重要因素

PowerVia 作为一种背面供电方案(BSPDN,Back Side Power Delivery Network)开创性 的将电源线移至晶圆背面,通过纳米级硅通孔(TSV,Through-Silicon Via)直接向晶体管 层供电,可减少布线长度,同时在充足的空间里,电源线可做的更宽,更低的电阻能缓解 电压下降。相比前向供电的传统方案,PowerVia 的互联层显著降低了电源干扰的影响,更 紧凑的设计可有效提升晶体密度,进一步推动性能上升。同时,导线复杂度的降低减少了 EUV 光刻次数,也能有效降低成本。在应用背面供电技术上,台积电计划于 2026 年推出 的 N2P 工艺上将会采用该技术,若 2024 年 Intel 20A 顺利量产,则在该技术上也领先台积 电。

Intel 18A 蓄势待发,英特尔或将在 2025 年重登先进制程主导者宝座

Intel 18A 将背负着重振英特尔制程荣光的重任,也代表着英特尔代工业务的未来。Intel 18A 在制程上跟 20A 相似,都应用了带状架构创新(RibbonFET,通过用栅极包围沟道,可更 有效控制晶体管中的电流,缩小晶体管的同时并保持性能和能效),但通过金属线距减少(金 属线连接芯片的各个部分,例如晶体管、缓存和其他组件,通过减小金属线间距,可将更 多的组件连接封装到同一芯片中,实现更密集的芯片设计),从而较上一代提升 10%性能。 另外,PowerVia 在 Intel 4 的测试中也提升了芯片 6%的频率,我们认为,接近半代制程提 升幅度,为 Intel 18A 工艺性能提供了稳固的保障。 根据 Tom’s Hardware 在 2023 年 3 月报道,英特尔已完成 20A 和 18A 制造工艺的开发阶 段,并实现芯片流片,正在最终确定这两种技术的规格、材料和性能目标。接着,英特尔 在 Intel Innovation 2023 conference 和 23Q3 业绩会也透露,公司发布了 18A 工艺设计套 件(PDK,process design kit)0.9 版本,并即将向外部客户开放。

模块化(chiplet)可扩展设计和拥抱第三方代工厂,IDM 2.0 又一利器

在 2021 年的 Intel Architecture Day,英特尔介绍了模块化可扩展设计的技术,能将芯片分 为 P-Core (高性能核心)、E-Core (高效能核心)、Display (显示控制单元)、PCIe (外设组件 互连单元)、TBT (Thunderbolt,高速外部硬件接口)、GNA (Gaussian Neural Accelerator, 用于低功耗 AI 任务的神经网络加速器单元)、IPU (Image Processing Unit,图像处理单元)、 LLC (Last Level Cache,缓存单元)、Media (媒体处理单元)、32EU/96EU (图形处理单元)、 Memory (内存单元)、SOC (System on a Chip,集成多种功能的单一芯片单元)等模块,从 而提升芯片设计的灵活性和可扩展性,并易于为每个模块选择和升级最佳解决方案,进而 提升良率与性能。同时,从功耗方面考虑也可选择开关不同模块以降低不必要能耗。而通 过 2.5D EMIB 和 3D Foveros 封装工艺,使得英特尔能封装不同制程的芯片模块,并将异 构芯片(CPU、GPU、NPU、FPGA 等)在单一封装中集成,从而支持英特尔芯片的模块 化和可扩展设计。

英特尔 Intel 18A 客户渐增,代工服务或将开启新盈利来源

公司通过不断突破的先进制程和不断完备的芯片设计生态吸引客户代工订单。2021 年 8 月, 与美国国防部签署代工协议,为 RAMP-C 计划提供 Intel 18A 代工服务。2023 年 4 月,与 ARM 达成合作推动 18A 工艺的低功耗 SoC,通过设计技术共优化(Design Technology Co-Optimization),以改善 SoC 功耗、性能、面积和成本。2023 年 7 月,与爱立信合作使 用 18A 制程开发 5G 芯片。在 23Q4 业绩电话会,公司宣布与 4 家客户签约,当中已有客 户支付了一笔较大的预付款。我们认为现阶段寻找足够高质量客户是 Intel 18A 成功的关键, 短期来看客户的增加,尤其是支付预付款的客户,体现了对于英特尔制程追赶计划的信心。

我们认为长期来看先进制程将逐渐引领营收和盈利的增长。假设“四年五节点”能顺利按 时完成,英特尔将重回先进制程领先地位,凭借其丰富的技术积累有望保持优势。届时, 公司将尽量把代工厂的产能填满,提高产能利用率,进而大幅降低成本。英特尔首席财务 官 David Zinsner 在 2023 年 6 月的在线研讨会上表示,在 2026 及 2027 年先进制程取得领 导地位之后,有望大幅提升代工服务营收,最终毛利率有望达到 60%。

先进封装技术积累为代工业务锦上添花和产生协同

随着高性能 AI 芯片的崛起,先进封装逐渐成为提高晶体管密度的关键。根据咨询公司 Yole Group 2023 年的预测,先进封装的市场规模在 2022 年达 443 亿美元,预计到 2028 年将 超过 780 亿美元,年复合增长率为 10%。我们认为先进封装的作用在于:1)通过多层堆 叠在不改变制程的前提下有效提高晶体管密度;2)实现 Chiplet 异构集成,连接不同种类 不同制程的芯片,提高整体良率及降低成本。英特尔在先进封装领域一直处在行业领先地 位,拥有 2.5D 封装 EMIB(embedded multi-die interconnect bridge,嵌入式多芯片互联桥) 和 3D 封装技术 Foveros,这些技术均迭代多次。公司在 23Q3 电话会中提到,封装和代工 服务之间具协同效应,目前已获两家 AI 芯片客户并和六家客户积极推进。在 23Q4 电话会, 公司表示 23 年先进封装客户总数达 5 家,其中大部分将于 2025 年开始贡献收入;在晶 圆和先进封装领域为 IFS 提供的生命周期交易价值现已超过 100 亿美元。

EMIB 主打低成本异构集成,Foveros 突出高性能 3D 堆叠

与台积电 CoWoS 传统 2.5D 封装采用的硅中介层结构不同,英特尔直接将小型硅桥嵌入基 板中实现芯片之间的互联,在互联效率相似的基础上不需要花较高成本来制造足够大的硅 中介层。我们认为相比 2.5D CoWoS 封装,EMIB 有如下提升良率和降低成本的优势:1) 采用硅桥而不是整片硅中介层;2)无需使用硅通孔技术(TSV);3)设计简单,灵活度高, 芯片封装不会受制于硅中介层的大小。经过多年沉淀该技术凸点间距不断缩小,第三代 EMIB 凸点间距将从 55μm 缩至 45μm,传输效率不断提高。目前,该封装技术已应用至 Ponte Vecchio GPU 和第四代服务器 CPU Sapphire Rapids。 Foveros 3D 封装是英特尔在 2019 年推出的芯片到芯片(die-to-die)堆叠技术,通过硅通 孔(TSV)技术和微凸块实现逻辑芯片间直接互联。Foveros Omni 将承载功率的 TSV 引至 顶部芯片边缘,减少其对信号的干扰,同时结构的改变取消了顶部芯片面积必须小于底部 芯片的限制。Forveros Direct 使用混合键合技术,凸点间距降低至 10μm 以下,带来更低 的电阻和功耗,相对于同样采用混合键合技术的台积电 SoIC N5,其凸点距离为 6μm。另 外,英特尔 Co-EMIB 技术使用 EMIB 连接多个 Foveros 封装,实现在水平和垂直方向的高 密度互联和芯片设计灵活性。Meteor Lake 就使用了 Co-EMIB 集成 Base Tile(Intel 16)、 Compute Tile(Intel 4)、GPU Tile(TSMC N5)、SoC Tile(TSMC N6)和 I/O Tile(TSMC N6)。

四大关键因素助力英特尔在 2030 年实现集成一万亿个晶体管目标

英特尔 CEO Pat Gelsinger 在 2023 年 3 月于麻省理工学院的访谈里做了一个很好的总结。 他表示摩尔定律中描述的晶体管数量两年翻一倍的黄金时代或虽暂告一段落,但技术创新 仍能持续挑战摩尔定律的底线。他认为目前业界发展的可见度将维持在十年。随着与摩尔 定律相关的经济效应减缓,他预计未来晶体管数量翻倍速度或延缓至三年一次,而他也认 为晶体管的数量,将会从目前的 1000 亿个,至 2030 年前增加至一万亿,4 大关键因素为: 1)新型栅极 Gate-All-Around 技术的采用:解决了晶体管漏电流的问题;2)背部供电技 术:通过 RibbonFET 和 PowerVia 工艺从背面而非顶面进行功率传输,创建了三明治晶圆 结构,能有效解决功率和晶体管密度的问题;3)光刻技术:通过采用 13.5 nm EUV 和下 一代 High NA 光刻技术打造芯片;4)3D 封装技术:芯片从传统的二维转变为三维堆叠, 能进一步增加晶体管数量。

磨杵成针,成熟制程合作终成定果

英特尔与 UMC(联华电子公司)达成协议合作代工成熟制程,实现产能利用率与毛利率双 增。在 IDM 1.0 模式中,服务器与桌面 CPU 制程迅速迭代,导致成熟制程利用率较低。英 特尔在 2022 年 2 月曾欲通过并购 Tower 扩张成熟制程芯片代工业务,但交易未获批准并 于 2023 年 8 月终止。英特尔此后未放弃扩张成熟制程代工业务,并最终于 2024 年 1 月与 UMC 达成合作协议。合作将利用英特尔在美国亚利桑那州 Fab 12、22、32 工厂的大批量 生产能力和成熟的 FinFET 生产技术,以及 UMC 数十年的芯片代工经验,协作开展 12nm 代工业务。我们认为,此举将帮助英特尔利用 UMC 丰富的代工经验,开展成熟制程芯片代 工业务,提升工厂厂能利用率并改善毛利率。

美国制造大趋势下英特尔适逢其会,借补贴加速扩产欲在 2030 年成为世界第二代工厂

最后,芯片产业逆全球化之风盛行,美国急需本土企业提振本地制造水平,英特尔扩产计 划恰逢其时。英特尔的制程追赶也迎合了美国希望重塑全球半导体产业链,将制造重心转 移回本土的需求,英特尔或将成为主要补助对象。 2020 年疫情以来,半导体产业链的阴霾让各国加码重视芯片行业的本地化。欧洲《芯片法 案》2023 年 9 月 21 日正式生效,预计累计投入 430 亿欧元用于支持欧洲半导体产业,旨 在实现 2030 年将市场份额翻倍至 20%。2022 年拜登正式签署《芯片与科学法案》(Chips and Science Act)为美国半导体产业提供了 527 亿美元补贴,计划在 2030 年推动半导体 产业回流美国,重掌主导权。根据华尔街日报官网 1 月 27 日的报道,拜登政府计划 3 月底 前宣布发放《芯片与科学法案》的第三笔补贴,预计英特尔、台积电和其他半导体龙头公 司将获得数十亿美元,来加快推进全美各地新工厂的建设。因此,巨头们包括台积电、三 星和英特尔争相宣告扩建计划。根据美国商务部预计,《芯片与科学法案》补贴的金额将占 芯片制造商资本支出的 5%-15%。

英特尔参与美国国防部先进芯片代工与制造 RAMP-C、SHIP 项目,IFS 业务因此受益。国 际半导体产业协会数据显示,截至 2020 年,亚洲占全球芯片产能的 79%,这使得美国国 防部在获取确保国家安全的芯片代工能力受限。RAMP-C 项目旨在促进使用美国本土的商 业半导体晶圆厂生态系统,制造对国防部至关重要的先进半导体产品。英特尔与 IBM、 Cadence、Synopsys 等厂商合作,通过建立半导体生态系统来支持美国政府设计和制造先 进处理器的需求,并在 18A 工艺上开发和制造芯片。此外,美国国防部与英特尔在 SHIP 二期项目达成合作,将政府专用芯片与英特尔的商用产品(包括 FPGA、ASIC、CPU)结 合,利用公司的美国制造能力为政府提供芯片。 然而,美国政府为了确保公司正确使用资金,在申请补贴时要求公司提供详细的企业运营 数据,包括按晶圆类型的产能、利用率、预期晶圆良率、生产第一年的售价、每年的产量 和价格上的变化等机密数据。我们认为,方案的实施将对英特尔美国工厂的建设、高质量 人才培养、财务表现的提升、供应链稳定性等产生重大益处。

竞争格局:台积电市占率遥遥领先,英特尔将依靠先进制程奋起直追

全球半导体行业的运营模式主要分为三种:(1)Fabless 模式:专注于芯片设计而不参与制 造过程,代表公司包括 AMD、苹果、高通、英伟达等;(2)Foundry 模式:专注于为其他 企业生产芯片,而不涉及设计,一般跟客户没有正面竞争关系,代表性企业有台积电、中 芯国际和格芯等;(3)IDM 模式:既设计芯片也负责制造,三星和英特尔是此模式的代表 性企业。IDM 模式不仅能提供全面的生产控制权,在供应链管理方面也更具灵活性和稳定 性,尤其在市场产能紧张时期,同时还能紧贴市场响应和技术创新,并有助于长期成本控 制,保护知识产权,并减少技术泄露风险等好处。反过来,前期大量成本的投放也不是所 有企业能承受。英特尔通过 IFS 业务开放自身代工能力,能提升晶圆厂产能利用率,进而 为公司带来规模效益,提升运营效率。

AI 浪潮激发了高性能计算(HPC)芯片的强劲需求,台积电、三星和英特尔在先进制程上 三足鼎立。根据 2023 年 10 月 23 日 DIGITIMES 研究中心发展报告中指出,23 年半导体 行业下行周期导致全球晶圆代工产业营收下滑至 1215 亿美元,同比减少 13.8%。但长远来 看半导体市场仍然充满潜力,预计 2023-28 年全球晶圆代工营收年复合增长率(CAGR) 将达 11.3%,生成式 AI 将带动 HPC 结构性需求持续增长。虽然台积电 22 年 AI 收入占比 仅 6%,但公司预期 22-27 年 AI 业务收入 CAGR 将为 50%,到 27 年收入占比将接近 10%, 算力的需求加剧了晶圆厂巨头研发先进制程的竞争。在半导体行业,先进制程技术的发展 呈现出资金和技术壁垒不断提高的趋势,导致行业格局逐渐向少数领导者集中。随着制程 领先的缩小,晶圆代工厂也面临着必须投入高额资本,用于采购更高级的设备和新建产线, 以维持在市场中的竞争地位。

半导体巨头纷纷参与 2nm 工艺竞赛,竞争白热化

先进制程为未来芯片发展方向,竞争优势明显。在服务器芯片中,通过在相同面积的芯片 上实现更小、更紧密的晶体管布局,不仅能实现处理速度和计算能力的显著提升,还降低 了芯片的功耗与发热,增强了能源效率。而在终端设备中,晶体管尺寸的缩减进一步推动 了包括智能手机和笔记本电脑等更轻便、便携设备的发展。此外,提高的晶体管密度不仅 意味着尺寸和能效的优化,还使得集成更多高级功能(如先进的图形处理单元和人工智能 处理器)成为可能。而对于芯片制造厂商来说,先进制程芯片的单位面积价格更高,创收 能力更强,因此成为半导体制造三巨头白热化竞争的领域。

目前晶圆代工市场中,台积电凭借制程和产能的领先地位一骑绝尘。我们认为,未来晶圆 代工市场的竞争将围绕先进制程研发和对逆全球化局势的应用。 在市场研究机构 Counterpoint Research2023 年 11 月 30 日发布的全球晶圆代工市场报告中,台积电市场份 额达 57%,三星市场份额为 14%,前五大晶圆厂营收占比 92%。晶圆代工行业呈现一超多 强的竞争格局,台积电稳坐首位占据绝大部分先进制程订单,三星承接其溢出部分,以及 生产内部的 SoC 和储存芯片,剩下的竞争者则聚焦成熟制程,关注产品差异化竞争。随着 中美芯片竞争白热化,晶圆产业也面临愈更多地缘政治问题,同时美国欧洲纷纷出台半导 体补贴法案,促使该产业未来进行区域转移。我们认为地缘政治是危也是机,代工厂可利 用各国补贴政策扩大全球晶圆厂布局和产能,分散及规避地缘风险。

台积电:晶圆代工模式的开创者,慎终于始的制程开发者

台积电成立于 1987 年,作为全球首家晶圆代工厂,通过制程的不断超越成为晶圆代工龙头。 在 28nm 节点选择后闸极(Gate-last)方案率先完成突破,超越三星和格芯。2018 年使用 氟化氩完成 7nm 制程,超越英特尔开启了台积电的领先时代。我们认为台积电竞争优势有 三:1)先进制程的领先地位:代工模式不需要芯片设计,而工艺研发经费达营收的 8%, 台积电能集中发展先进制程,推动研发速度;2)凭借规模效应降低成本:作为代工厂商不 断扩产提升产能和规模效应,提升良率并降低成本;3)与客户间的信任关系:代工厂商与 IDM 厂商不同,与客户没有竞争关系,而台积电与客户是利益共同体。 如今台积电拥有全球绝大部份先进制程产能,其营收占比也逐年提高,同时越先进的制程 营收增速越高。代工生态和客户基础也共同构筑台积电护城河。台积电和各大代工客户, 以及许多 EDA(如 Synopsys、Siemens EDA 等)、IP 设计公司(如 ARM 等)有着长期和 紧密合作,深度绑定代工生态。在人工智能的迅猛发展下,高算力芯片需求暴涨。AMD、 英伟达、联发科、高通等都宣布在下一代产品使用台积电 3nm 制程。苹果作为第一大客户, 目前更占据了台积电 90%的 3nm 产能。

台积电正与苹果、联发科、高通和英伟达合作,开发基于其先进的 3nm 和 2nm 工艺的芯 片。苹果采用台积电的 3nm(N3)工艺,用于其 iPhone 15 Pro 和 Pro Max 型号中的 A17 Pro 芯片,以及搭载 M3 处理器的 Mac 系列产品;Digitimes Asia 于 2022 年 4 月 22 日报 道,苹果还计划采用台积电的 2nm 工艺,并可能成为其 N2 节点的首批客户之一。另一方 面,联发科于 2023 年 9 月 7 日宣布其已成功与台积电共同开发了一款 3nm 芯片,用于其 Dimensity 5G 智能手机芯片组,预计 2024 年进入大规模生产。2023 年 10 月 25 日高通在 2023 骁龙峰会中推出 Snapdragon 8 Gen 3,基于台积电的 4nm 节点,根据 wccftech 官网 在 23 年 12 月 1 日的报告,其 Snapdragon 8 Gen 4 将在 2024 年转移到台积电 3nm 节点。 而据 Digitimes Asia 于 2023 年 9 月 26 日进一步报道,英伟达的 B100 GPU 将会采用 3nm 工艺,并准备在 24 年 4 季度推出。

各国政府半导体补贴或将成为双刃剑。随着半导体产业逆全球化不断发展,各国对半导体 产补贴不断,台积电也迅速在全球开展扩产计划。2021 年起在美国亚利桑那州新建两座晶 圆厂、在日本熊本县新建两座晶圆厂、在德国新建一座晶圆厂,以上将于 2025 年起陆续开 始量产,巩固领先地位。不过,我们也应注意到半导体补贴对台积电的限制,日本欧洲的 限制条例中规定了要首先保证该国半导体的供应,美国出台的条例更是限制了补贴公司在 受关注国家扩大先进制程产能。此外,台积电坚持将最顶尖的制程放在中国台湾,根据路 透社报道,公司首席执行官 2023 年 7 月表示将继续扎根中国台湾,2014 年 1月 Taipei Times 报道,台积电重申中国台湾是台积电全球扩张的中心,公司正在新竹县宝山兴建一座 2nm 晶圆厂,预计 2025 年开始商业化生产,并计划在高雄新建两座 2nm 晶圆厂,以及在台中 市建设一座 2nm 后节点圆晶厂,同时考虑在嘉义县建设 1nm 圆晶厂,相比之下,公司在美 国亚利桑那州的 3nm 圆晶厂预计将在 2027-2028 年才姗姗来迟。我们认为,各国的半导体 补贴均要求将工厂建设于补贴国内,全球扩张进展缓慢或不利于台积电获取半导体补贴。

三星:依托自家芯片设计部门,追赶台积电先进制程承接溢出需求

三星常年稳坐晶圆代工的第二把交椅,其能达到台积电三分之一的市场份额全靠对先进制 程的不断追逐。2022 年 6 月 30 日,三星宣布使用 GAA 工艺的 3nm 芯片开始量产,但目 前良率不高,对比台积电在 3nm 里依然采用 FinFET 工艺。三星先进制程的持续突破为其 争得高通的订单和其他台积电外溢订单,同时依托三星 LSI(系统半导体事业部门)的稳定 需求,得以保持其市场份额。三星的竞争优势在于:1)与台积电相似的先进制程:三星可 缓解台积电产能不足问题,作为客户的替代厂商;2)更低的芯片价格:台积电代工费用多 次涨价,3nm 代工费用约为 19865 美元一片晶圆,三星则以其有竞争力的报价争取到部分 订单;3)制衡台积电:作为现阶段台积电的竞争对手,在价格和性能相似的情况下,厂商 们有理由去支持三星以此来约束台积电继续上涨代工价格。

三星工艺规划:2025 年量产 2nm 节点,2027 年量产 1.4nm 节点。根据三星在年度三星 代工论坛(SFF 2023)上公布的最新工艺技术路线图,三星的 SF2 节点预计于 2025 年量 产,并于 2027 年大规模生产 1.4nm 节点。SF2 工艺比前一代 SF3 在芯片面积上缩减 5%, 同时实现了25%的功效提升与12%的性能增强。三星还为SF2工艺配置了包括LPDDR5x、 HBM3P、PCIe Gen6 和 112G SerDes 等先进的 IP 组合。继 SF2 之后,三星计划在 2026 年推出专为高性能计算(HPC)优化的 SF2P 工艺,并在 2027 年引入专为汽车应用优化的 SF2A 工艺。在 2027 年,三星预期 SF1.4 制程技术进行量产。就 2nm 工艺量产时间对比, 三星与台积电相近,二者均较英特尔的 20A 工艺晚约一年。

格芯:放弃先进制程针对成熟制程,差异化竞争渐入佳境

格芯 2018 年宣布放弃 7nm 及更先进的制程开发,将主要业务转移到成熟的 14nm 工艺上, 走上特色工艺之路。鉴于台积电和三星在先进制程领域已构筑了较高的技术壁垒,即使继 续投入研发经费取得突破也难以追赶,倒不如集中火力将资金用于改良现有节点,专注需 求明显的物联网、5G 和汽车领域。格芯通过七个半导体工艺平台,来满足客户的多元化需 求。在地缘政治紧张加剧的时代背景下中格芯作为美国的本土企业,美国的需求有望对其 业绩产生积极影响,增加其市场份额。

DCAI 业务:产品布局完善,制程差距有望收窄

我们预计英特尔 DCAI 业务 2024/2025/2026 年的营业收入为 166/193/223 亿美元,对应营 收同比增速为 7%/16%/16%。DCAI 业务 2021~22 年营收下降主要受 AMD 竞争压力及制 程落后,以及数据中心 CPU Sapphire Rapids 多番推迟至 1H23 所影响。2023 年起营收同 比降幅逐渐收窄,主要由于 Xeon CPU 竞争力提升及 ASP 上升,从而增强了盈利能力。展 望未来,考虑到英特尔在制程上进展稳健,最快有望于 2024 年底前能赶超台积电,加上 Xeon CPU 在性能和能耗双线布局,能弥补以往短板,并有望与注重每瓦性能的 AMD 和具 有较强能耗优势的 ARM 匹敌,我们认为 2024~25 年 DCAI 业务将重回增长轨道。

英特尔在数据中心与 AI 业务的布局广泛,主要产品包括:1)英特尔 Xeon(至强)服务器 CPU,包括 P 核和 E 核(尚未推出,预计 24 年上半年);2)Gaudi 系列 ASIC;及 3)FPGA。 其中,我们认为 Xeon 系列将随着基于 Intel 3 的 E 核产品推出,应与 AMD 制程渐进,而 Habana Gaudi 系列,作为 AI 加速器与 CPU 搭配起来,在 AI 推理端具备较强竞争力,或 也能与 GPU 在 AI 训练端有一战之力。GPU 产品 Falcon Shores(预计 2025 年推出)曾 被规划为 CPU+GPU 架构,本应可与同为异构架构的 AMD MI300A 及英伟达 Grace Hopper 在 AI 训练端展开较量,但现在只为纯 GPU 产品。我们将着重对 Xeon 和 Habana Gaudi 系列产品进行分析。 DCAI 业务也迎新领军人物。2024 年 1 月 5 日,英特尔任命 Justin Hotard 为 DCAI 业务的 新任总经理,该任命自 2024 年 2 月 1 日起生效。Hotard 在计算和数据中心转型方面有 20 多年的深厚经验,以及在提供可扩展人工智能系统方面的领先经验。他 Hotard 将负责监督 包括英特尔至强处理器、GPU 和加速器在内的关键产品线。他的任命标志着英特尔在数据 中心和人工智能领域的战略加强。Hotard 持有 UIUC(伊利诺伊大学厄巴纳-香槟分校)的 电气工程学士学位和 MIT(麻省理工学院)的工商管理硕士学位。加入英特尔之前,他在 慧与科技(HPE)担任高级职位,专注于人工智能和高性能计算领域。他的背景包括在 NCR Small Business、美国讯宝科技公司和摩托罗拉公司的企业发展和运营经历。

服务器 CPU: 制程加速追赶,E-Core 策略下有望从 AMD 收复失地

英特尔原来的“Tick-Tock”芯片制造与设计迭代模式被打破,10nm 量产深陷良率问题不断 推迟,与此同时,AMD 联手台积电,在制程上不断取得突破,在服务器端 CPU 制程上弯 道超车,致使英特尔市场份额持续下滑。

AMD 联手台积电突破制程弯道超车,提升在服务器 CPU 份额

由于在制造更先进制程芯片的过程中遭遇技术困难,英特尔 10nm 芯片良率不佳,过去十 几年沿用的“Tick-Tock”模式——一年微架构的处理器晶片制程的更新(Tick),一年微处理 器架构和性能的提升(Tock)的两年一循环的芯片制造与设计迭代模式被打破,制程停滞 于 14nm,而原定于 2016 年下半年的 10nm(相当于台积电 7nm)量产多番推迟至 19 年 下半年。观其原因,我们认为“Tick-Tock”模式的失效与英特尔 IDM 模式工序长、成本高, 且两阶段互相牵制的缺陷相关,一旦制程进展停滞,芯片设计的更新也必然受到掣肘;而 AMD 早在 2008 年卖掉晶圆厂格芯后,专攻芯片设计,并将晶圆代工外包给行业龙头台积 电,这种分工合作的模式相对效率更高且风险较低。

反观彼时的 AMD,2016 年上半年发布了企业端 CPU 技术路线图,其中明确表示制程上的 突破,基于台积电 7nm 的 CPU 将于 2018/19 年推出。随后 6 月,AMD 发表了 Zen 架构, 涵盖 PC 端及服务器端 CPU 产品,并在 2017 年宣布以 Zen 架构重新整合其 PC 及服务器 产品。在该 Zen 架构技术路线图中,AMD 进一步明确了 2018/19 年将有 7nm 产品推出, 2020 年将向更先进制程迈进。2016 年 6 月,AMD 宣布推出 Zen x86-64 微架构。对比彼 时英特尔的 Skylake 架构,Zen 的 CPU 部分面积较小,缓存空间有所提升,且散热片间距 加宽,默认频率更高,功耗更低,价格也较低。随后在 17 年推出,同样基于 Zen 架构的 EPYC CPU 产品,采用了 14nm 制程及 8 核 16 线程工艺,对标同为 14nm 制程的英特尔 Xeon CPU。EPYC 凭借高性能表现及高能耗效率,开始在数据中心的市场份额上攻城略地。

2020 年 7 月底,英特尔宣布将推迟 7nm(后更名为 Intel 4)制程至 2022 年以后。反观 AMD 在 20Q2 财报中 PC 端业务营收大涨 45%,并进一步上调了全年营收预期。当月 AMD 股价 大涨 47%并首度超越英特尔的股价。同年 10 月,AMD 宣布收购头部可编程逻辑器件(FPGA) 生产商赛灵思(Xilinx),并于 22Q1 完成并表。对比英特尔在 2015 年收购了 FPGA 生产商 Altera,收购赛灵思能为 AMD 带来 FGPA、可编程 SoC 及自适应计算加速平台产品,并将 AMD 的产品矩阵扩充至与英特尔看齐。 2021 年,英特尔推出了采用 10nm 制程的第三代 Xeon 可扩展 CPU,而此时的 AMD 则已 率先推出了基于台积电 7nm 制程的 Zen 3 架构,并推出了 EPYC Milan 服务器 CPU。随 后的 2022 和 2023 年,AMD 接连推出基于台积电 5nm 制程的 EPYC Genoa、EPYC Bergamo 和 EPYC Sienna,再次拉开与英特尔服务器端制程的距离。

在 16Q1,AMD 的服务器 CPU 份额仅为 0.3%,市场基本被英特尔所垄断,但 2017 年 EPYC 推出后,服务器 CPU 的份额也开始一路上涨。截至 23Q3,AMD 服务器端 CPU 市场份额 达到 23.3%,而英特尔跌至 76.7%。AMD 23Q3 份额相比上季度增长 4.7Pct,相比 22Q3 增长 5.8 个百分点,市场份额上升较快,或主要由 2023 年推出的第四代 EPYC Genoa-X 和 Bergamo 贡献的增量推动,其已成为 AMD 三季度最受欢迎的数据中心产品,并被几乎 所有主要云厂商采用;而英特尔对标 EPYC Bergamo 的数据中心产品 Sierra Forest 预计将 于 2024 年上半年面世。

英特尔在制程上的反击:“四年五节点”先进制程赶超计划

英特尔的“四年五节点”产品路线图能否顺利落地成反败为胜的关键。早在 14nm 工艺时, 英特尔占据着领先优势,但在 10nm 的关口却停滞不前。2019 年,AMD 在服务器端 CPU 采用的工艺制程首次超越英特尔,而英特尔采用 10nm 工艺的服务器版 Ice Lake 于 2021 年 4 月姗姗来迟,此时距离 AMD 在 2019 年推出 7nm 工艺的 EPYC Rome 已有两年(AMD 采用的台积电工艺 7nm 大致相当于英特尔 10nm,也就是 Intel 7)。 此后,英特尔一直处于艰难的追赶状态。英特尔于 2021 年 7 月公布了工艺制程的赶超战略 “四年五节点”,指的是公司希望能在 2025 年以前实现 Intel 7(10nm)、Intel 4(7nm)、Intel 3(7nm+)、Intel 20A(2nm)及 Intel 18A(1.8nm)5 代工艺节点。在这五代节点中,前 三个节点的目的是追赶上台积电的进度,后两个则是英特尔进入“安米时代(Angstrom Era)”, 在 2025 年超越台积电重返制程领先地位的关键。2021 年计划发布时,英特尔预计 Intel 18A 将于 2025 年推出;在 2022 年,英特尔将 18A 时间点提前到了 2024 年下半年。目前看到 的服务器端进度显示,基于 Intel 7 的 Sapphire Rapids 在 23 年已批量出货,同样基于 Intel 7 的 Emerald Rapids 也在 23 年推出;而基于 Intel 3 的 Sierra Forest 和 Granite Rapids 将 会在 2024 上半年相继推出,最后,18A 已开展内部测试以及与潜在代工客户的产品测试。

力求在 24 上半年开始提升在服务器 CPU 的市占率,或全靠 E 核 Sierra Forest

性能与功耗双管齐下,Xeon Scalable“大核”(P-Core)与“小核”(E-Core)策略或是 反击关键。P-Core(Performance Core),强调高性能;E-Core(Efficiency Core),着 眼低能耗,公司对服务器端产品的战略规划思路或来自其遭 AMD 撬动份额的反思。

我们观察到,2023 年 Q1 和 Q2 英特尔和 AMD 在服务器 CPU 市场的市占率维持了稳定而 Q3 英特尔市占率再次下滑。我们认为随着英特尔基于 Intel 3 制程的 E 核 CPU 处理器 Sierra Forest 于 24 上半年推出后,该产品面向低功耗需求,将有助公司抢回服务器 CPU 的份额。英特尔在 23Q1 业绩电话会上称当季服务器市场份额维持稳定的原因之一是 “Sapphire Rapids 带来的贡献”,这也是 CEO Pat Gelsinger 掌舵英特尔后第一次维持住服 务器市占率大致平稳不降,而第三季度的下滑仍来自 AMD 的竞争压力,主要是 EPYC Bergamo 及 Genoa-X 的推出。据 Mercury 于 2023 年 11 月测算,从 2016 年到 23Q3,AMD 已“从零开始”抢占 23.3%服务器 CPU 市场份额,英特尔则降至 76.7%。我们认为,公司在 服务器方面落后 AMD 的重要一环在于英特尔关注“每核性能(performance per core)”, 而 AMD 则将重点放在“每瓦性能(performance per watt)”,前者指的是提高 CPU 的单核 性能,而后者则考虑能耗效率。我们认为,随着 AI 模型规模的持续扩大,面对数据中心 降本增效及解决高能耗问题的发展趋势,单位能源带来的经济效益越趋重要,服务器 CPU 客户的关注重点更多转向功耗。英特尔另一主要竞争对手 ARM 架构几年前就推出了基于 Neoverse 架构的高密度内核设计,AMD 也于 23 年 6 月推出了 Zen 4C 架构和最大支持 128 核的 EPYC "Bergamo"处理器。

英特尔 P 核产品稳步推进。另一 P 核产品第五代 Xeon CPU Emerald Rapids AI,性能与 能效双升级,或为英特尔抢滩 AMD 增加胜算。英特尔最新 P 核 Xeon CPU Emerald Rapids 于 2023 年 12 月 14 日推出,与 23 年 1 月推出的 Sapphire Rapids 同样基于 Intel 7 节点, 核心架构升级至Raptor Cove,并将最大核心数提升至64核,最大三级缓存提升至320MB, HPC性能提升至1.3倍。此外,Emerald Rapids还重点提升了AI性能,沿用Sapphire Rapids 中使用的 AMX 技术加强 AI 任务中的矩阵运算能力,并内置 AI 加速器,使得 AI 推荐系统 和自然语言处理性能提升至 1.4 倍,大数据吞吐量提升至 1.7 倍。与上一代产品相比,在相 同的热设计功率范围内,第五代英特尔至强可扩展处理器平均性能提升 21%,并在一系列 工作负载中将每瓦性能提升高达 36%。对于遵循典型的五年更新周期并从更前一代处理器 进行升级的客户,总体拥有成本最多可降低 77%。 而第六代 Xeon CPU Granite Rapids 将迈入 Intel 3 制程,性能与能效进一步提升。公司 预计于 2024 上半年推出的 Granite Rapids 将基于 Intel 3 节点、经优化的微架构设计及更 高核心数,将与下一代 Birch Stream 平台兼容并搭载 Intel AMX,预计将带来显著性能提 升。根据英特尔内部测算,Granite Rapids 相比目前的 Sapphire Rapids 内存带宽将提升 2.8 倍,在 AI 推理端(DeepMD+LAAMPS)将实现 2.9 倍的性能提升,在总体 AI 负载 上实现近 3 倍的性能提升。

软件生态会否也成为英特尔突围的阿喀琉斯之踵?

与 AMD 一样,英特尔推进 AI 产品布局成功的另一大障碍或许是软件生态。英特尔的 oneAPI 不直接与 GPU 通用运算生态圈的领军 CUDA 竞争,而是横跨 CPU、GPU、FPGA、 NPU 等多种硬件,以及 CUDA、ROCm 等不同软件平台,试图建立统一的生态圈,但这 种兼容所有软件和硬件的思路,落地效果如何,能否突出 CUDA 重围,目前看还需进一步 判断。英特尔的软件框架 oneAPI 于 2019 年底开始测试,2020 年 9 月推出了 1.0 正式版, 比 CUDA 晚了 13 年。对此,英特尔也承认 oneAPI 推出较晚,但同时也认为目前只是 AI 的起步点。对比英伟达 CUDA(Compute Unified Device Architecture)于 2007 年发布, 通过先发优势和长期耕耘,生态圈已较为成熟,为英伟达 GPU 开发、优化和部署多种行业 应用提供了独特的护城河。全球 CUDA 开发者 2020 年达 200 万,2023 年已达 400 万。

ARM 对数据中心蠢蠢欲动,能耗优势凸显,或将与 x86 分而治之

我们认为服务器 CPU 市场的竞争格局在近年来加速深化。随着数据中心及 HPC 领域能耗 飙升,低能耗成为了服务器 CPU 的一大关注重点,众多厂商纷纷加码低能耗产品以求突破。 除英特尔和 AMD 的 x86 架构外,一直深耕移动端、标榜低功耗的 ARM 对于服务器市场 也来势汹汹,凭借其低能耗优势开始从移动端逐渐向服务器端蔓延,攻城略地。AMD 以“每 瓦性能”为秘密武器在市场中占有一席之地,从重视“每核性能”的英特尔手中撬动市场 份额。但英特尔也痛定思痛,准备于 24 年推出 Intel 3 制程的低功耗服务器 CPU Sierra Forest 试图收复失地。Sierra Forest 标志着英特尔专注低能耗的 E 核 CPU 产品线的开辟, 该产品线将于未来持续迭代,并计划于 2025 年推出基于 Intel 18A 的 Clearwater Forest。 值得关注的是,由于 ARM 的单核面积也远小于 x86 核,因此在同样芯片尺寸下可承载更多 核心数。通过“堆核”的方式,ARM 架构处理器得以在性能快速提升下,仍保持较低的功耗。 ARM 已于 2023 年 9 月 14 日在美国纳斯达克上市,苹果、谷歌、英伟达、AMD、英特尔 和台积电等科技巨头均是此次发行的基石投资者。亚马逊早在 2018 年已在 AWS 中大量运 用 ARM 架构的自研 Graviton CPU;英伟达的异构芯片 Grace Hopper 中,Grace CPU 也 采用了 ARM 架构;而微软的自研服务器芯片 Azure Cobalt 100 CPU 同样基于 ARM 架构, 将于 24 年上市并在微软云上运行通用计算工作负载。初创公司方面,由英特尔前任总裁 Renée J. James 创立的 Ampere 也专注于为云服务商提供服务器 ARM CPU。

x86 和 ARM 架构在服务器端各有优势,或将分而治之

我们认为 ARM 和 x86 CPU 架构在 AI 应用里各有优势。低能耗的 ARM 架构和高性能的 x86 架构可分别负责较轻和较重的工作负载。由于 ARM 架构从性能层面上或不能直接与 x86 相比,因此我们不认为其能有朝一日完全取代 x86 架构。但我们也强调,在云计算任 务和数据模态多元化的趋势下,加上随着 AI 和云计算领域对节能的要求提高,ARM 架构本 身的能耗优势越趋凸显。因此,我们认为 ARM 架构的 CPU 将逐渐在 AI 推理端占一席之地。 由于 GPU 可分担部分工作负载,因此对服务器 CPU 来说能耗相对性能或更为重要。上文 所说,ARM 架构原来主要应用于移动端,因此相比 x86 能耗较低,这点不管在 AI 或是数 据中心的应用中都较受青睐。反过来,x86 架构则追求高性能和拥有较丰富的指令集,在 AI 里也可分担推理负载,与 GPU 在功能上可互补。在 AI 应用里,GPU 凭着其高算力,针 对并行计算,在视频处理、图像渲染等方面的优势虽毋庸置疑,但我们认为并非所有工作 负载都能单纯由 GPU 完成,也须由 CPU 进行控制调用及发布指令。因此,在 CPU+GPU 架构里的 CPU 可负责控制及发出指令,指示 GPU 处理数据和完成运算(如矩阵运算)。值 得一提的是,AMD 在 MI300A 里的 CPU 选用了 x86 架构,而 英伟达的 GH200 里 CPU 则采用了 ARM 架构。我们认为,两者的选择各有优势。我们认为英伟达也是看准这点(公 司也曾对 ARM 提出收购),加上在这类 CPU+GPU 架构中,CPU 或仅需发挥其部分性能, 如向 GPU 发出指令等,其他性能如 AI 训练和推理则可交由 GPU 或其他 AI 加速器负责, 因此 ARM 架构的 CPU 已能胜任。

AI 加速器 Gaudi,将弥补服务器 GPU 的暂时缺席

从发展历程来看,传统推理端主要依赖 CPU 处理大多数相对简单的低算力推理任务。推理 所需要的算力本身比训练所需要的算力要低,因此推理端的门槛相对训练端较低。然而, 目前 AI 模型的规模和复杂度跟过去相比提升,随着更多工作负载将逐渐纳入到推理领域, 对于算力的要求也会提高。我们认为,AI 推理市场在可预计的未来或将显著扩大,但我们 需强调,与此同时,考虑到采用英伟达最高性能的GPU来进行推理工作或不符合成本优势, 因此目前各类芯片都在此领域获得一席之地,包括 GPU、CPU、以及自研 ASIC 等依然在 相互竞争。 目前,英特尔的 AI 芯片布局包括:GPU 产品 Ponte Vecchio(23 年一季度推出)和下一 代 Falcon Shores(公司准备在 2025 年推出),以及 ASIC 芯片 Habana Gaudi 系列(Gaudi 2 目前正在出货,公司计划在 2024 年推出 Gaudi 3)。从产品规划上来看,英特尔目前在 GPU 产品方面或暂时掉队,但 ASIC 方面的 Gaudi 2 和 Gaudi 3 或能有效填补了 2025 年 Falcon Shores 推出前的空白时间。

英特尔的 AI 相关 GPU 和 ASIC 产品,Gaudi 后续会将被集成到 GPU 里

1)Ponte Vecchio:在 2021 年发布,但在 2023 年一季度才推出。Ponte Vecchio GPU 结构复杂,一共有 47 个功能片,分 5 个制程。英特尔在 2021 年 8 月 19 日的 Architecture Day 宣布 Ponte Vecchio GPU(Xe HPC)的计算层采用了台积电 N5 工艺,基底采用了 Intel 7,Xe Link I/O 是台积电 N7,另外 Rambo Cache 采用的是 Intel 7,对比 H100 和 MI300 的台积电 N5 制程。晶体管数量超 1000 亿个,高于 H100 的 800 亿,但低于 MI300X 的 1530 亿。内存属 HBM2e,落后于 H100 和 MI300X 的 HBM3。

2)Falcon Shores:原定为 XPU(即 CPU+GPU 异构架构)产品,并准备于 2024 年推出, 但在 2023 年 3 月,英特尔称 Falcon Shores 将为其下一个纯 GPU 产品,接棒 Ponte Vecchio GPU,且延后至 2025 年才推出。2023 年 5 月,英特尔在 ISC 2023 会议上再次确认 Falcon Shores 将推出仅 GPU 版。反观,英伟达的 GH200 和 AMD 的 MI300A 也属 CPU+GPU 架 构的 AI 芯片。目前 Falcon Shores 的参数细节还未完全公布,已知道有 288GB 的 HBM3 和 9.8TB/s 的内存带宽,并能支持较低的数据精度,如 BF16 和 FP8。英特尔在 23Q3 业绩 会确认,到 2025 年 Gaudi 将集成于 Falcon Shores GPU 内,而根据 Tom’s Hardware 2023 年 11 月 13 日报道,英特尔的产品路线图中并没有 Gaudi 3 处理器的后继产品,这或意味 着 Gaudi 与 Falcon Shores GPU 合并后,将承担英特尔首个 HPC 和 AI 芯片的职责。

3)Habana Gaudi:Gaudi 是由英特尔在 2019 年 12 月,以 20 亿美元收购的 Habana Labs 设计的 ASIC 芯片。Gaudi 主要用于 AI 工作负载,并适用于作为加速器配合公司的 CPU 一同使用,提升 CPU 在 AI 推理和训练的处理效果。第一款 Gaudi(16nm)于 2019 年 6 月推出,而 Gaudi2(7nm)在 2022 年末已推出。Gaudi 2 的架构特点是异构,包含 2 个 MME(Matrix Multiplication Engine,矩阵乘法引擎)和 24 个 TPC(Tensor Processor Core, 张量处理核),前者负责处理所有可转换成矩阵运算的任务,例如卷积、GEMM(General Matrix Multiplication)等,后者处理其他类型的运算。这两种计算引擎可并行使用,因此两 种类型的运算可重叠进行,这也是 Gaudi 2 可有效提高运行 AI 模型速度的原因。

ASIC 在特定场景与领域中,性能具备优势已有先例。我们看到 Gaudi 2 在一些基准测试 里表现较 A100 优秀:1)推理端:HuggingFace 在 2023 年 3 月对 Habana Gaudi 2 与 A100 进行了大模型(BLOOMZ)推理的基准测试。BLOOMZ 是一个 1760 亿参数的文本生成模 型。推理延迟测试的结果显示,Gaudi 2 比 A100 快 1.2 倍。而针对小参数版本的 70 亿参 数 BLOOMZ-7 模型进行的推理测试中,Gaudi 2 比 A100 快 3 倍;2)训练端:Habana Labs 对 Habana Gaudi 2 与 A100 进行了基准测试,运行了两款芯片在 RestNet50 和 BERT 模 型训练的测试,称其训练吞吐量可达到英伟达 A100 的两倍。Databricks 2024 年 1 月 4 日 在其官网表示, Gaudi 2 在训练和推理均表现出色,并展示出最佳的每美元性能。然而, 想要与英伟达在训练端匹敌,Gaudi 还要面对 H100。英伟达在 2022 年 11 月对 H100 和 Gaudi 2 进行了对比,在 ResNet 模型上,H100 比 Gaudi 2 快 1.1 倍左右,而在 BERT 模 型上,H100 则比 Gaudi 2 快 2.4 倍。

在具体应用中,英特尔将 CPU 与 ASIC 同时部署在 AI 解决方案中。2023 年 5 月英特尔和 BCG(Boston Consulting Group,波士顿咨询)的一项合作,就使用了 CPU+ASIC 的组合 AI 解决方案,BCG(未上市)将结合使用 Xeon 以及 Gaudi 系列产品,为 BCG 以自己在 咨询行业多年来的海量文件数据训练出的人工智能模型提供算力支持。类似的行业应用场 景广阔,尤其是在行业内积累了大量数据,重视网络安全和隐私,并希望使用 AI 来赋能这 些数据的企业。 以上的合作也衍生出来一家新的 AI 软件公司。英特尔宣布成立 Articul8 AI,专为企业客户 提供生成式 AI 软件。2024 年 1 月 4 日,英特尔宣布在数字资产管理公司 DigitalBridge Group 和其他投资者的支持下,将围绕人工智能软件业务组建一家新的独立公司。该公司将被命 名为 Articul8 AI,且不会公开上市。它起源于英特尔与波士顿咨询集团(BCG)合作的企业 人工智能技术项目。英特尔利用自己的超级计算机开发了一种生成式人工智能系统,该系 统可结合开源和内部开发的技术来读取文本和图像。英特尔进一步优化了该系统,使其能 在 BCG 的数据中心内运行,以此来增强隐私和安全性。英特尔表示,Articul8 AI 将提供全 栈生成式人工智能平台,支持企业客户将其数据、训练过程和推理活动安全地存储在企业 云、本地部署或混合部署环境中。这一平台的灵活性允许客户根据自己的需要,选择数据 和应用程序的部署方式和时间。

量子计算会是英特尔未来在超级计算机的秘密武器?

放眼未来,英特尔在量子计算的软硬件探索方面也有望取得领先。与其他采用超冷效应或 激光等方法的量子计算不同,公司选择在硅上进行实验。英特尔将推出可持续的量子计算, 并在实际算法上实现量子优势(quantum supremacy)。公司将在 2030 年左右实现以量子 计算为基础的下一代超级计算机,该技术将是人工智能与高性能计算的交汇。英特尔自 2015 年起在量子计算机领域投入研究资源,目标是在 2025 年前实现 1000 个量子比特(qubit) 的可通用量子计算系统,以及在 2030 年实现拥有一百万个量子比特的计算机。现在的量子 系统只包括数十或数百个纠缠的量子比特,这限制了它们解决现实世界的问题。为了实现 量子实用性,商业量子系统需扩展到超过一百万个量子比特,并克服量子比特脆弱性和软 件可编程性等艰巨挑战。

分拆 FPGA 业务,向晶圆制造优先战略转型

英特尔于 2023 年 10 月宣布分拆可编程解决方案部门(PSG,Programmable Solutions Group)业务(当中包括 FPGA),此举应可释放出资金,以集中火力投资于晶圆代工业务, 同时或有望释放 FPGA 业务自主性。英特尔曾看中 FPGA 芯片灵活性的优势,计划将 Xeon 处理器与 FPGA 结合,作为高度定制的集成产品,为 AI 计算提供支持。2013 年,FPGA 龙 头之一 Altera 与英特尔合作,就采用英特尔 14 nm tri-gate 晶体管技术制造 Altera FPGA 达成协议。随后在 2015 年英特尔收购 Altera,希望赋能其数据中心和 AI 产品。英特尔以 167 亿美元收购 Altera,而该公司 2015 年的营收约为 17 亿美元,因此该收购价格对应 PS 约为 10x,高于当时行业平均 8.3x,体现了英特尔对 FPGA 推动数据中心产品进一步升级 的乐观预期。然而,由于 Altera 在被英特尔收购后制程从台积电转为 10nm 工艺,而 10nm 工艺延迟又导致 Altera 产品延期,且英特尔将 FPGA(即 PSG)业务作为 DCAI 的一部分, 将 FPGA 与数据中心产品的结合作为 PSG 业务的重点,从而拖慢了其在传统 FPGA 市场 前进的脚步,导致 PSG 业务增长放缓。2023 年 10 月初,英特尔宣布拆分 PSG 业务,分 拆后的 FPGA 公司将于 2024 年 1 月 1 日起作为独立实体运营。此举或可让原 PSG 团队重 获 FPGA 业务上的自主性和灵活性,并重新参与包括数据中心、通信、工业、汽车和航空 航天等多个领域的竞争,同时通过让 FPGA 业务自负盈亏和对外融资,为英特尔释放出资 金,以加大晶圆代工业务的投资。

CCG 业务:PC 复苏态势向好,AI PC 或引领新变革

我们预计英特尔 CCG 业务 2024/2025/2026 的营业收入为 322/341/358 亿美元,对应营业 收入同比为 10%/6%/5%。疫情以来的高基数影响以及 PC 市场库存已基本出清,我们认为 复苏已至。截至 23Q3,全球 PC 出货量已连续 2 个季度实现环比增长,同比下滑趋势放缓。 而英特尔于 23Q3 业绩会也表示,公司库存在 23 年上半年已出清,下半年营收有望实现连 续环比增长。展望 24 年,我们认为随着 PC 库存回到正常水平、微软停止支持 Win10、以 及 Win12 和 co-pilot 的推出带动新一轮的换机需求潮,将为 PC 市场带来较大的增量。此 外,AI PC 的崛起也将为 CCG 业务增长锦上添花。根据研究机构 Canalys 在 2023 年 9 月 的预测,全球 AI PC 出货量到 24 年第四季度将占全球 PC 总出货份额的 25%以上,预计在 2025 年成为市场主流产品,并在 2026 年占整体销售额的一半。英特尔正积极推进 AI PC 计划,目前已与 100 多家软件厂商紧密合作,为 PC 市场带来数百款 AI 增强型应用。我们 认为,英特尔的 AI PC 产品线完善,公司预计酷睿 Ultra 处理器 24 年将为全球笔记本电脑 和 PC 制造商的 230 多款机型带来 AI 特性,并计划在未来 2 年内交付 1 亿个客户端处理器。 我们认为英特尔凭借其完善的 AI PC 产品布局及其内置的低功耗 CPU 和高算力 AI 加速器 (NPU),有望在 AI PC 领域取得领先优势。

全球 PC 出货量或已触底,多因素共振促成长,AI PC 锦上添花

PC 市场触底反弹,Windows 系统换代及 AI PC 崛起拉动换机潮

我们认为截至 23Q3,PC 市场下滑或已触底。我们认为随着疫情后 PC 出货量已由高基数 回落,23H2 PC 库存开始恢复正常水平,且 Windows 系统换代及 AI PC 崛起,均带动换 机潮出现。全球 PC 出货量在疫情早期大增,导致基数较高,但随着疫情放缓 PC 出货量大 减。IDC 在 2023 年 12 月 21 日发布的预计中,2024 年全球 PC 出货量有望实现 3.4%的同 比增幅;23Q3 全球个人电脑出货量为 6820 万台,同比虽下降 7.6%,但下滑趋势放缓, 环比则增长 7.8%,连续两个季度出现环比上涨趋势(23Q2 的环比增长为 8.3%),我们认 为已表明 PC 市场走出低谷。此外,考虑到四季度为传统消费旺季,“黑五”大促叠加假日速 销,PC 出货量应重返正轨。英特尔 CEO Pat Gelsinger 在 23Q3 业绩电话会中表示,公司 库存在 23 上半年已出清,下半年客户端业务营收有望实现连续环比增长,预计 2023 全年 全球 PC 市场出货量可达 2.7 亿台;而 AMD 同样在 23Q3 电话会上称 PC 市场已恢复正常 周期,并将于下半年持续改善。

安全隐私叠加模型轻量化趋势,AI 民主化需求从云转向低功耗端侧

我们认为,端侧 AI 将成为 AI 计算的下一个发展重心。端侧 AI 部署是一种将 AI 模型(数 据和计算)和应用均置于个人或移动设备上运行的方式,并在处理器中新增了 NPU 模块(AI 加速器),提供更强大的 AI 算力。随着生成式 AI 模型的使用量不断增长,云端难以满足隐 私需求。端侧 AI 的发展也需软硬件的配合,包括轻量化、小型化的 AI 模型,以及高效、低 耗的 AI 芯片。为了助力 AI 的端侧运行,业界已开始压缩训练模型,并采用 FP8 的浮点精 度格式,以降低对算力的要求,从而为 AI 训练和推理带来更大自由度,进一步推动 AI 民主 化。英特尔正积极推广 SYCL 代码替代 CUDA,以完善其生态系统和增加在高性能训练领 域的竞争力,真正使人工智能适用于所有人。

AI PC 相比手机兼具散热及应用场景优势,或先成为 AI 端侧主力,并引领 PC 新增长

我们认为,在这波 AI 端侧的崛起过程中,AI PC 或率先成为主力,鉴于其在散热和应用场 景均具备优势。热传导和热对流为目前手机及电脑的主流散热方案,而手机相对电脑散热 面积小,热传导及热对流效率较低,因此在散热性上具有天然劣势,且手机便携性需求高, 设计以轻薄为首也限制了散热系统的部署。2023 年 9 月推出的 iPhone 15 Pro 系列的散热 问题或带出了 AI 手机在散热方面的隐忧。iPhone 15 Pro 搭载的 A17 Pro 为全球首颗台积 电 3nm 制程的 ARM 架构 SoC 芯片,助力手机性能迎来突破性提升。在运算速度层面,CPU 提高了 10%,GPU 提高了 20%,NPU 处理速度增至 A16 仿生芯片的 2 倍,算力提升至 35 TOPS。我们认为,过热问题或是为了轻薄设计而在散热系统上作出妥协,亦或是与 3nm 制程工艺仍使用 FinFET(而不是 GAA)架构有关。

大模型轻量化及芯片设计改良,助力端侧 AI 蓬勃发展

端侧可支持的垂直领域模型参数量相对较小。GPT-4 的参数量约为 1.8 万亿,相较于 GPT-3 的 1750 亿参数有大幅提升,而 Meta 的 LLaMA-7B和谷歌的 Bert-large 等的垂直领域模型, 其参数量仅为 70 亿或 3.4 亿。进一步压缩后参数量可减至千万级别,这些压缩后的垂直领 域模型在特定场景下性能不逊于基础模型,为端侧 AI 部署提供了可能。端侧 AI 应用场景丰 富,包括文字生成图像或对话、NLP、编程、私人助理等。这些应用场景所需的大模型参 数量一般在 10 亿-150 亿之间,已符合在端侧运行的范围内。

各大芯片和 PC 厂商均进军 AI PC,商业化落地节奏明快

PC 厂商正在积极探索从 Smart PC 向 AI PC 转变,扩展丰富的 AI PC 应用场景。此前对 PC 进行 AI 智能化仅限于 Smart PC 阶段,即从应用场景出发(Always on Always),例如: 人机交互,包括语音智能唤醒、免接触式场景和开盖开机等功能。目前,随着生成式 AI(AIGC) 的迅速发展,将助力 Smart PC 向着 AI PC 的方向持续转化。

各大高管亮相,推进 AI 应用规模化落地

联想提出“All For AI”战略,全栈智能布局全面升级。2023 年 10 月 24 日,联想在 Lenovo Tech World 2023 上首次展示了 AI PC、大模型压缩技术、人工智能双胞胎(AI Twin)等创 新产品。联想 AI PC 计划于 2024 年 9 月后正式上市。AI Twin 是可在多平台、多环境上运 行的对话个人 AI 助手。联想全栈智能全新升级之后,AI Twin 可通过压缩模型在大模型终 端设备上离线运行,譬如参考用户的旅行日记和笔记,为用户提供更个性化的旅行计划。 混合 AI 大模型框架包括私域大模型的微调、个人大模型的压缩以及数据管理+隐私保护技 术等 3 项技术。混合 AI 框架采用了模型微调与企业知识向量数据库相结合的方式,让企业 可通过特定数据进行额外的训练和微调,在端侧再加入企业知识矢量数据库中的特定知识, 从而有效处理特定任务,并得到精确的结果。同时,可根据模型参数的重要程度,对大模 型进行适当压缩,这既显著缩小了大模型,同时还保持了性能,可让大模型直接在个人终 端设备上运行。AI Twin 和大模型压缩技术可跨终端、跨平台、跨架构,让个人在终端体验 到 AI,而升级的基础设施和应用服务,则能让企业使用 AI。

英特尔重点下注 AI PC,从现在到 2025 年产品规划完善

我们认为 AI PC 或将成为英特尔 CCG 业务的强劲推动力。英特尔不仅积极构建 AI PC 生 态,还制定了完善的 AI PC 处理器产品规划。英特尔于 23 年 10 月的 Innovation Day 推出 “AI PC 加速计划”,并预计与超过 100 家企业合作,改善未来 PC 在游戏、视频、安全性能 等环节的 AI 性能,目标在 2025 年实现 1 亿台个人电脑的 AI 赋能。我们将在下文中以 2023 年 12 月英特尔发布的首款 laptop(笔记本)端 AI PC 处理器 Meteor Lake 为起点,梳理英 特尔未来 AI PC 产品规划。

基于 Intel 4 的 Meteor Lake 标志着英特尔 AI PC 战略打响了第一枪

英特尔的首款 AI PC 处理器 Meteor Lake 已于 23 年 10 月上市,并在 12 月 14 日“AI Everywhere”发布会上正式发布,该处理器标志着英特尔 40 年来最大的 PC芯片架构转变, 集成 GPU、NPU(神经处理单元)和 CPU,兼具低功耗和 AI 加速功能等优势。Meteor Lake 首次采用分离式模块化(Tile-based / Chiplet)设计,再采用 3D Foveros 封装。处理器划 分为:计算模块(Intel 4)、I/O 模块(N6)、SoC 模块(N6)、图形模块(N5),三种不同 的制程技术。我们认为英特尔与台积电的合作(及未来的更多合作)是重要看点之一。公 司借助台积电的成熟工艺,可更专注于发展 CPU 制程和更快实现成本效益的突破。 Meteor Lake 的 AI 算力强劲,总算力高达 34 TOPS。但 Al 加速支持只有在 Windows 12 发布后才会开始显现其价值,公司预计 Windows 12 将于 24 年推出。其 NPU 可使 PC 在 本地高效运行 AI 推理任务,同时其 tGPU 具备高性能,可与 NPU 协同运行 AI 工作负载。 第三方 mooreslawisdead 官网认为 Meteor Lake 中的 tGPU 单元(核显)使用的 Iris Xe 或 将足以替代笔记本显卡。

基于 Intel 20A 的 AI PC Arrow Lake 于 24 下半年推出,将采用 RibbonFET 和背部供电

下一代基于Intel 20A节点的 AI PC Arrow Lake将于2024下半年推出,GPU单元将升级。 与 Meteor Lake 主要适用笔记本端不同,Arrow Lake 将同时覆盖笔记本端和桌面端。Arrow Lake 的一大重要升级在于 GPU 架构将升级至 Xe -LPG+,即 Meteor Lake 中 GPU 的增强 版本,主要改进在于引入 XMX 计算单元,即 eXtended Matrix eXtensions(扩展矩阵),该 技术专为 FP64、FP32、FP16 和 bfloat16 格式的矩阵乘法运算设计,可执行 DPAS(点 积累加收缩)这一特殊运算指令,从而更高效地支持 XeSS 超分技术。另外,Intel 20A 也 新增两大创新技术,RibbonFET 和 PowerVia,RibbonFET 让带状的晶体管沟道整个被栅 极环绕,能更有效的控制电流流通,而 PowerVia 则降低了电源干扰的影响,通过更紧凑的 设计可有效提升晶体密度。根据 wccftech 官网 2023 年 11 月 29 日报道,Arrow Lake-H 已 有样片流出,“H”表示该芯片适用于笔记本端高性能游戏本。Arrow Lake-H 的 CPU 单元由 6 个 P 核和 8 个 E 核组成,CPU 核微架构有较大优化,引入了新一代 Lion Cove(P 核) 和 Skymont(E 核);GPU 单元将继续采用台积电代工,基于 3nm 制程。

Lunar Lake 将接棒 Arrow Lake,Panther Lake 基于 Intel 18A 将在 2025 年出台

Lunar Lake 将于 2024 年在 Arrow Lake 之后推出,重点布局低功耗,旨在实现每瓦性能 的突破性提升。英特尔在 2023 年 Innovation 大会上展示了在 Lunar Lake 上运行 Riffusion 和 Stable Diffusion 生成式 AI 大模型的突出效果。Tom’s Hardware 官网 2023 年 11 月 21 日的报道则披露了关于 Lunar Lake MX 的更多细节,Lunar Lake MX 也将采用 Lion Cove (P 核)和 Skymont(E 核)微架构,NPU 单元包含多达 6 层 NPU 4.0 AI 加速器,封装技 术将沿用 3D Foveros 技术,能实现每瓦性能的突破性提升。在制程方面,该芯片在英特尔 PC CPU 路线图上显示将基于 Intel 18A 节点。 英特尔于 23 年 10 月 19 日的 Innovation Day 上展现了丰富的端侧 AI 应用场景的落地,其 中 Lunar Lake 运用其内置 AI 加速器在几秒内就可生成一首 Taylor Swift 风格的歌曲和一张 戴着牛仔帽的长颈鹿图片。这些生成式 AI 负载完全在端侧进行,无需与云端互联,从而缩 短了运行时间并能保障隐私。为了加强 AI 算力,英特尔将和 CyberLink 在 NPU 应用方面 进行紧密合作,以达到更理想的推理加速效果,并和 Blackmagic Design DaVinci 合作, 优化 Core Ultra 的媒体引擎。 Panther Lake 基于 Intel 18A 节点制造,将于 2025 年推出,并最快于 24Q1 投产。Panther Lake 将采用全新 Cougar Cove(P 核)和 Darkmont(E 核),iGPU 由 Lunar Lake 的 Xe2 升级至 Xe3 "Celestial"微架构。公司在 23Q4 电话会称 Panther Lake 将很快进入晶圆厂。

AMD 同样积极布局 AI PC 芯片及应用生态,跟英特尔又再狭路相逢?

AMD 已于 2023 年初率先推出首个 x86 架构 AI PC 处理器 Ryzen 7040,又于 2023 年 12 月推出新一代 x86 架构 Ryzen 8040 “Hawk Point”处理器,AI 性能较强且产品代际更迭迅 速。AMD 已于 2023 年初推出集成 NPU 的 Ryzen 7040 系列 PC 处理器,基于 TSMC 4nm 制程,内置 AMD Ryzen AI 引擎,NPU 最高算力可达 10 TOPS,可在本地以较低功耗执行 AI 工作负载。Ryzen 7040 系列合作商目前已覆盖宏碁、华硕、戴尔、联想、惠普、小米等 各大品牌厂商。2023 年 12 月 7 日 AMD Advancing AI 大会上公司又推出了 Ryzen 8040 “Hawk Point”处理器,该处理器相比 Ryzen 7040 “Phoenix”主要改进了 NPU 运行速度,整 体算力达 39 TOPS,NPU 算力提升至 16 TOPS,AI 大模型运行性能最高可提升 40%,游 戏性能最高提升 80%。截至发布日,AMD 已向合作商发出 Ryzen 8040 “Hawk Point”,而 公司预计其正式上市时间为 24Q1。紧随 Hawk Point 之后,集成下一代 XDNA2 NPU 的 Ryzen 8050 “Strix Point”也将于 2024 下半年发布,生成式 AI 性能将高达 Hawk Point 的 3 倍;高配版 Strix Point Halo 集成 40 个 RDNA 3+ GPU 计算单元,AI 算力达 40 TOPS。

AI PC 竞争格局:ARM 架构来势汹汹,x86 能否招架?

CPU 主流架构分为 x86 与 ARM 两类,前者使用复杂指令集(CISC),后者使用精简指令 集(RISC)。X86 架构具有:1)丰富的指令集,性能卓越,能在短时间内完成大量复杂的 计算;2)广泛的软件支持与安全技术,兼容性与通用性高,产业化规模大等优势。然而在 多模态等 AI 应用趋势推进,节能需求凸显,而 x86 芯片面积大、晶体管数量多,导致能耗 较高。ARM 具有:1)体积小,能耗低、成本低;2) 通用寄存器多,寻址方式灵活,指令 执行速度快等优势,因此在数据中心与 AI 应用中,逐渐受到青睐。目前 AMD 与英特尔的 桌面级与服务器级 CPU 主要采用 x86 架构;高通、苹果、三星等移动端和嵌入式系统中通 常采用 ARM 架构。

英伟达:或可发挥 AI 技术优势弄潮 AI PC 时代

多方接连入局 ARM 架构 PC CPU,PC 端 ARM 架构竞争渐趋激烈。根据路透社在 2023 年 10 月 24 日报道,随着微软与高通的排他性协议即将在 24 年到期,AMD 和英伟达或将 在 2024 年加入高通行列,为微软设计基于 ARM 的处理器,或最早于 2025 年推出。该计 划瞄准了苹果的自研 ARM 芯片,目前 PC 端 ARM CPU 几乎被苹果垄断。 回顾历史,英伟达进军 ARM CPU 市场的战略早已有迹可循。2020 年 9 月,英伟达曾提出 以 400 亿美元收购 ARM。ARM 在 2020 年的营收约为 20 亿美元,该收购价格对应 PS 为 20x,显著高于当时行业平均 9x 的估值;再对比 2016 年软银私有化 ARM 的 320 亿美元, 虽然英伟达的收购计划在 2022 年 2 月 8 日正式宣告告终,但我们认为英伟达愿意付出约两 倍于行业平均市值溢价收购 ARM,体现了其看准 ARM 的低能耗优势,希望将其有效融合 到公司擅长的 GPU 和 DPU 数据中心领域的战略规划。此外,英伟达数据中心产品 GH200 中的 Grace CPU 就已采用 ARM 架构,拥有一定 ARM CPU 设计经验。

高通:深耕移动端功耗优势突出,推出骁龙 X Elite 进军 AI PC 芯片

除了新进入者英伟达,从 2016 年就开始研发 ARM PC CPU 的高通在去年 10 月的 2023 骁龙峰会上也发布了最新一代 AI PC 芯片骁龙 X Elite,该芯片基于高通自研 ARM 架构 Oryon CPU,集成 AI 功能,采用台积电 4nm 制程工艺,兼具高性能和低功耗优势。高通 凭借其在低能耗移动端芯片制造领域的长期积淀,未来或可缩小与 Windows 系统 PC 和苹 果 Mac 系列 PC 的差距,同时其在 AI 大模型开发和端侧应用上的推动或将进一步提升其 在 AI PC 时代的竞争力,从而在 PC 市场占据重要席位。 X Elite 集成 CPU、GPU 和 NPU,重点优化了 AI 性能,宣称最高总算力可达 75 TOPS, 其中独立的 Hexagon NPU 最高算力达 45 TOPS,为行业领先,支持在端侧运行超过 130 亿参数的生成式 AI 模型;而 Adreno GPU 较 Ryzen9-7940HS GPU 性能达 90%的提升, 而功耗则降低 80%。高通预计搭载骁龙 X Elite 的 PC 预计将于 2024 年中面市,首发厂商 包括微软、联想、戴尔和惠普等。

苹果:进一步提升 AI 性能并降低功耗,NPU 算力为 18 TOPS

除了基于 Windows 操作系统的 PC 端 ARM 处理器,苹果 M 系列芯片兼具能耗及 NPU 优 势,最新 M3 系列芯片进一步提升了 AI 性能并降低功耗。根据 IDC 23Q3 的数据,自苹果 为 Mac电脑发布自研 ARM芯片以来,M系列 ARM PC 处理器市场份额在三年内几乎翻倍, 截至 23Q3 M 系列芯片占 ARM PC 处理器市场份额的 90%以上,基本占据垄断地位。低功 耗是苹果 M 系列芯片的一大核心优势,而苹果于 23 年 10 月推出的 M3 芯片更是重点关注 了每瓦性能的提升。该芯片为业界首款采用台积电 3nm 制程的个人电脑芯片,同时改进了 内置 GPU 和 NPU 的设计,以提供更优的图形处理和 AI 任务性能,GPU 增加了硬件加速 网格着色、光线追踪等渲染功能和动态缓存等功能,NPU 算力达 18 TOPS。苹果官方表示 M3 在 AI 任务上相比 M1 有 60%的性能提升,总体运行速度较 M1 有 35%的提升。

回顾英特尔因制程落后,在 PC CPU 也流失份额,如今万事俱备东山再起

跟在服务器端一样,英特尔于 2016 年以来,因制程开始落后导致 PC 端市场份额也逐渐被 AMD 蚕食。2016 年 6 月,AMD 推出 Zen x86-64 微架构。对比彼时英特尔的 Skylake 架 构,Zen 的 CPU 部分面积较小,缓存空间有所提升,且散热片间距加宽,默认频率更高, 功耗更低,价格也较低。随后在 17 年初上市,同样基于 Zen 架构的 Ryzen 7 系列 PC 端 CPU,采用了 14nm 制程及 8 核 16 线程工艺,对标同为 14nm 制程的英特尔酷睿 i7-6900K (基于 16 年 6 月推出的 Broadwell-E 升级架构)。从此时开始,AMD 的 PC 端产品制程已 逐渐逼近英特尔,而蚕食份额的趋势也初见苗头。

Mobileye 业务:ADAS 技术奠基者,技术转型或面临挑战

我们预计英特尔 Mobileye 业务 2024/2025/2026 的营业收入为 19.5/27.7/36.0 亿美元,对 应营业收入同比为-6%/42%/30%。我们认为 Mobileye 未来的营收增速或会逐渐趋缓。 Mobileye 于 2024 年 1 月 4 日发布盈利预警,大幅下调 24 年营收预测,鉴于客户库存过 剩引发砍单。 Mobileye Global(MBLY US)目前为上市公司,根据 Wind 的最新数据,英特尔目前占 Mobileye 94.87%的股份,为主要股东。2022 年 Mobileye 业务营收同比增长 35%,增长动 力主要来自高级驾驶辅助系统(ADAS)和自动驾驶汽车(AV)的普及。不过,Mobileye 在上述的盈利预警里预计,2023 年收入约为 20.76-20.80 亿美元;预计 2024 年营收将在 18.3-19.6 亿美元,远低于此前彭博一致预期的 25.9 亿美元;预计 24Q1 营收将较去年同期 的 4.58 亿美元下降约 50%,低于彭博一致预期的 5.57 亿美元。Mobileye 认为 Tier 1 客户 在 21 年和 22 年决定增加基础 ADAS 类别的库存,导致目前库存过剩,因此预计 24Q1 处 库存消化期,但也预计到 24 年底客户库存将恢复至正常水平。从历史营收上看,Mobileye 2023 年前三季度营收为 4.58/4.6/5.3 亿美元,分别只占英特尔总收入的 3.9%/3.5%/3.7%, 因此营收下调或对英特尔整体影响不大。营收同比增长分别为 16%/-1%/18%,增长主要得 益于保时捷、大众集团与极氪等客户的合作。

英特尔分拆 Mobileye 业务二度上市,24 年或处库存消化期

2022 年 10 月 26 日,英特尔分拆 Mobileye 在纳斯达克二度上市,当时市值为 230 亿美元。 创立于 1999 年,总部位于以色列的 Mobileye 靠机器视觉算法成功起家,此后推出了 EyeQ 系列芯片及配套的辅助驾驶解决方案。在智能汽车早期市场,这套“算法+芯片”的商业模 式帮助 Mobileye 迅速打开市场,也让其成功跻身 ADAS 领域老大。在 2017 年被英特尔以 约 153 亿美元成功收购后退市,英特尔先是将其激光雷达以及雷达开发团队并入 Mobileye, 随后斥资 9 亿美元收购以色列城市交通数据初创公司 Moovit,让 Mobileye 成长为一家全栈 自研自动驾驶平台公司。在 2022 年 Mobileye 二度上市,上市首日以每股 26.71 美元开盘, 最终当日股价报收 28.97 美元/股,较 21 美元的发行价溢价达 37.95%。

ADAS 市场蓬勃发展,各芯片大厂及车企入局自驾芯片

随着电动车的普及,ADAS(Advanced Driver Assistance System)成为汽车行业的热门名 词。ADAS 主要通过摄像头和超声波及毫米波雷达获取环境数据,经过处理分析后,为驾 驶员提供信息和辅助,包括预警和主动干预措施,提高行车安全性。ADAS 系统发展迅速, 已成为汽车产业升级的一大动能。根据 Preerence Research 在 2023 年 10 月公布的数据, 2022 年全球自动驾驶汽车市场规模为 1,217.8 亿美元,预计到 2032 年将达到 23,539.3 亿 美元左右,2022-2032 年复合年增长率为 34.5%;2022 年全球高级驾驶辅助系统(ADAS) 市场规模为 446.2 亿美元,预计到 2032 年将达到 1582.4 亿美元,2022-2032 年复合年增 长率为 13.5%。

竞争格局:芯片算力落后加上各方入局,Mobileye 积极寻找转型道路

“黑盒子”模式或已不合时宜,整车创新协同能力落后

Mobileye 选择的软硬件结合打包出售的“黑盒子”模式逐渐被市场放弃。“黑盒子”交付 方案是通过将芯片与算法的深度耦合,从而将完整的芯片架构、操作系统、智能驾驶软硬 件系统打包,并交付给车企。在 Mobileye 十年多的调教下,“黑盒子”解决方案帮助车企 实现从 L0 级的碰撞预警,L1 级的 AEB 紧急制动、ACC 自适应巡航,到 L2 级的集成式巡 航等各种功能,但弊端也逐渐凸显,车企无法对内部算法进行调整与修改。Mobileye 甚至 在与一些车企签订合同时,明确规定不允许车企自行开发感知视觉算法。相比之下,英伟 达以及国内一些车载芯片厂商,如地平线等,可在每一层都提供开发工具(比如英伟达 CUDA 开发软件),客户可根据需求进行相应的调整。

L3 以下市场受到冲击,芯片算力较为落后

Mobileye 作为机器视觉龙头,主要占据 L3 以下的自动驾驶芯片市场,但如今受到越来越多 合作车企的抛弃。英伟达、高通、华为、地平线等同行快速崛起,无论在芯片算力还是在 开放性上都令车企更满意。短短几年间,多家车企先后与 Mobileye 分手,特斯拉早年就转 向自研,而宝马则牵手高通,蔚来、理想、小鹏等也投向英伟达。2022 年及以后的新款车 型中,尤其是电动汽车,较多都选择了英伟达、高通,以及国内的华为、地平线、黑芝麻 的自动驾驶芯片。

Mobileye 在芯片算力上被各大厂商拉开了距离。自动驾驶芯片作为车辆“大脑”,需要处 理各种数据,因此对算力的要求也越来越高。英伟达率先打响了算力军备竞赛,在 2019 年 发布了单芯片算力为 254 TOPS的 Orin,又在 2021年发布单颗算力达 1000 TOPS的 Atlan。 2022 年,英伟达更是发布 2000 TOPS 的 Thor,让 Atlan 尚未量产而直接“自我淘汰”。反 观 Mobileye,其在 2022 年发布的 EyeQ Ultra,算力仅有 176 TOPS,还不如英伟达此前 的 Orin。尽管 Mobileye 曾多次表示“算力不是唯一标准”,但作为客户方的车企往往更在 乎直观的算力。 毕竟,作为 ADAS 技术奠基者与市场领头羊,Mobileye 的市占率仍然占据着明显优势。 Mobileye 累计发布了八款 EyeQ 芯片,截止 2023 年 7 月 1 日,以出货量累计超过 1.5 亿 颗,超过 800 种车型搭载,Mobileye 占据 ADAS 市场当之无愧的龙头位置。据 Gartner 研究机构副总裁盛陵海对集微网表示,Mobileye 在 ADAS 市场的占有率在 2019 年之前一 度超过了 90% (截至 2023 年其占有率约为 70%),2023 年全年出货量约为 0.37 亿套。

AI 无处不在战略拓展至汽车市场,英特尔宣布加速汽车领域布局,将 AIPC 引入智能驾舱。 英特尔在 CES 2024 大会上宣布收购 Silicon Mobility 公司,一家专注于智能电动汽车能源 管理 SoC 的芯片和软件公司。同时,英特尔也推出了全新的 AI 增强型软件定义车载 SoC 系列,抗衡同样布局车用半导体市场上的高通和英伟达,并宣布 ZEEKR(极氪)将成为首 家采用这款全新 SoC 的汽车厂商。不同于 ZEEKR 和 Mobileye 智能驾驶芯片的合作,该产 品聚焦智能座舱芯片领域,实现车载 AI 功能,将 AI 运算带到软件定义汽车中。ZEEKR 将为车辆创造增强的客厅体验,包括驾驶员和乘客监控、AI 语音助手、电子镜、高清视频 会议通话和 PC 游戏等,为用户提供更加多元化的娱乐功能。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告