2023年百度专题报告 秉持对流量入口和内容生态的布局思路

1. 盈利预测

1.1 流动性层面:存在估值修复机会

1 月至今市场交易逻辑反复摇摆。流动性方面,市场从 2023 年 1-3 月初经历了软着陆定价,主要由于非农 就业、CPI、PCE 数据展现通胀和经济的韧性,以及利率提升对需求的抑制作用可能存在滞后效应,尤其是美联 储主席鲍威尔国会听证会后,市场进一步重新定价国债收益率曲线陡峭化。3 月至今由于 SVB 等风险事件的出 现,市场进行衰退定价,表现为远端利率的快速回落,而随着市场重新稳定信心,此前过于激进的衰退预期交 易有所降温。当前的利率曲线较 1 月水平,近端一定程度上反映了通胀和经济的韧性,远端仍然定了部分衰退 预期。

具体到 PE 中枢方面,1-2 月由于利率曲线明显上移,主要是对软着陆叙事的乐观预期,带动 EPS 预期修复; 2-3 月初通胀数据展现粘性,市场可能低估通胀的延续性,因此利率曲线进一步上移,带动 PE 中枢下降;3 月 初 SVB 风险事件出现后市场预期快速转向衰退,即美国可能面临一次“金融危机”,带动利率曲线快速下移, 导致 PE 中枢上行,最终修复之 2 月初的高点水位附近。3 月底至今市场情绪回归稳定,利率曲线较 3 月底有所 上移,但仍预期衰退,且指数主要公司发布业绩影响业绩预期,标普及纳斯达克 PE 中枢走势分化。 年初市场预期的中美景气度差距周期逻辑并未被高频数据佐证,相反美国经济数据反映状态健康,而国内 1 季度 GDP 数据超预期,当前处于逻辑既无法证伪也难以证实的中间地带。我们认为,未来国内结构性复苏叠 加产业转型,在取舍中短期牺牲效率的概率较高,而美国衰退预期与 Fed/近期的经济数据不符,当前的利率预 期可能偏于乐观,存在潜在的下行风险。但需要注意的是,恒生科技指数 4 月中旬以来显著跑输纳斯达克指数, 这里可能存在额外的空间保护,对恒生科技而言,如果不存在额外的负面因素,其具备潜在的估值修复机会。

1.2 基本面层面:基本面拐点确立,中长期把握新增长曲线

百度主要业务均有望在 23 年走出新趋势,且大模型及自动驾驶可能蕴含新增长机会 在线营销业务受疫情影响承压,但春节后逐步恢复。百度核心广告在 4Q22 经历-6%的同比下滑,其中搜索、 联盟广告收入预计同比继续下滑,信息流广告等则维持增长。据财报电话会,短视频为 4Q22 广告收入增长做 出贡献。展望 1-2Q23,春节前由于部分城市仍处于疫情达峰过程,因此节前仍然受到疫情带来的负面影响压制。 节后随着经济逐步恢复,广告需求有望逐步恢复,其中二三线城市恢复较快,且医疗、旅游、本地生活等线下 行业反弹幅度较大,在线游戏则表现较弱。整体上,我们认为 1Q23 环比提升明显,4Q22 确定为基本面的底部, 1-2Q23 向上趋势明显,期待广告业务跟随经济共同复苏。

云业务受疫情影响交付和新签,疫后预计逐步恢复。云业务 4Q22 受疫情影响交付和新签都受到延迟。以 智能交通为例,金额超 1000 万元的新签城市数量同比、环比均出现回落。据财报电话会,云业务从商机到签约、 交付存在几个月的周期,因此从疫后经济恢复到云业务收入的反弹可能是逐步的过程,而非 V 型反弹,整体看 云业务全年有望继续高于互联网同业的增速。此外,云业务逐步提升利润率,有望实现盈亏平衡。 智能驾驶取得积极进展,布局持续领先,预计开展实现商业化。2022 年 12 月 30 日,百度首批获准在北京 开展全自动无人驾驶测试。4Q22,百度自动驾驶共完成 56.1 万订单,截止 2023 年 1 月,百度累计向公众提供 超过 200 万订单。百度在自动驾驶领域的布局领先,随着搭载百度自动驾驶相关产品的智能汽车面市,百度自 动驾驶业务预计逐步实现商业化,并在 24 年以后贡献实质性营收。

2. 投资分析

流动性方面,市场从 2023 年 1-3 月初经历了软着陆定价,主要由于非农就业、CPI、PCE 数据展现通胀和经济的韧性,以及利率提升对需求的抑制作用可能存在滞后效应,尤其是美联储主席鲍威尔国会听证会后,市 场进一步重新定价国债收益率曲线陡峭化。3 月至今由于 SVB 等风险事件的出现,市场进行衰退定价,表现为 远端利率的快速回落,而随着市场重新稳定信心,此前过于激进的衰退预期交易有所降温。当前的利率曲线较 1 月水平,近端一定程度上反映了通胀和经济的韧性,远端仍然定了部分衰退预期,整体偏乐观一些。基本面 层面,百度搜索广告业务预计受益经济复苏,且效果广告受益序列较品牌广告媒介更优先,信息流广告则受益 展现形式的效率继续驱动广告业务增长。

3. 移动生态:治理结构明显改善,业务发展保持韧性

百度移动生态主要包括百度、百度贴吧、好看视频、全民小视频。 百度搜索的商业模式是流量分发的节点中加入广告,但大型 App 的出现导致流量自循环,削弱外部流量分 发商。百度在移动生态方面的收入主要是信息流广告和搜索广告,托管页收入本质是信息流和搜索广告的合集。 信息流广告是百度布局移动端后兴起的广告形式,在网页/PC 时代百度收入以搜索广告为主。搜索广告的逻辑 是,用户主动搜索内容,在相关内容中加入相关商业化广告,并吸引点击和进一步转化。但移动端内容孤岛导 致用户的搜索需求可能无法被良好满足,导致流量被分流,增长前景受到限制。

3.1 复盘百度的转型之路:公司治理边际改善,把握正确战略方向

百度早期对于移动互联网的认知是“更小的屏幕、更慢的速度”“与网页搜索没有什么不同”。根据新浪 科技,百度李彦宏布局移动互联网的思路是将 PC 互联网的搜索框移植到移动端,2010 年,百度推出了移动开 放平台以及移动框计算。2011 年,百度推出全新首页、移动终端平台等产品,新上线的百度首页在传统的搜索 框下,增加了导航通知、实时热点、应用、新鲜事四大模块,同时新首页页面将向所有站长、开发者、服务提 供商开放。 百度在移动互联网时代转型缓慢是“搜索思维”导致的结果。从后视镜的视角看,2011 年百度提出“中间 页”战略,2021 年提出的“X+Y”战略,都是围绕搜索业务,通过投资并购或战略合作等方式丰富搜索结果,满足用户需求。而这种思维来自百度在 PC 互联网时代的成功经验。百度在 PC 互联网时代的成功主要是 1)2006 年前凭借先发优势和技术优势开拓市场,并从中脱颖而出;2)2006-09 年在与 Google 的竞争中维持优势,2009 年后 Google 受李开复离开,“不雅词”事件,信息审查影响,2010 年 Google 高级副总裁、首席法律官大卫·德 拉蒙德公开发表声明,宣布 Google 关闭在中国大陆市场搜索服务,并将搜索服务由中国内地转至香港。

技术优势及先发优势驱动百度、Google 占据市场份额。2000-2006 年,百度等基于词型统计、超链分析的 搜索引擎出现,并逐步取代基于人工查询、半自动编辑和人工申请收录的目录索引类引擎 Yahoo,此时表现为 新一代搜索引擎的份额集体性扩张,尤其是 Google 及百度。此时 Google 总部只有 5-6 人的团队负责中文搜索, 因此 Google 早期的份额扩张更多来自口碑传播。 营销活动强化用户心智,加速行业出清。相比新浪、搜狐等由门户转型布局搜索引擎的对手,百度业务聚 焦且技术领先,并通过一些较为成功的事件营销塑造用户心智。例如,2002 年底百度推出“搜索大富翁游戏” 通过礼品等奖励引导用户使用百度搜索引擎;2003 年 6 月《中国电脑教育报》发起“Google vs Baidu——两大 搜索引擎对决搜索之巅”,并吸引用户进行评测;百度 2005 年推出的《唐伯虎》系列广告片强化“百度更懂中 文”的心智。从结果看,一系列营销活动并未阻止 Google 份额的提升,但大大强化了百度和 Google 对标的心 智,以至于行业其他竞争对手的份额快速收缩,中国 PC 互联网搜索引擎行业进入寡头时代。

Google 份额的落后主要原因是跨国集团对本土化适应能力不足。2005 年 Google 正式进入中国,但《互联 网信息服务管理办法》要求过滤搜索结果,屏蔽非法信息,引发 Google 内部以及外媒舆论风波,同时缺乏 ICP 牌照运营也受到关注。2007 年 6 月,Google 正式获得 ICP 牌照并将 Google.com 用户引入 Google.cn。在此过程 中,Google 中国时任负责人李开复及其团队需要不断向美国总部汇报、解释,相比本土公司其决策、执行流程 更繁琐,导致行动缺乏灵活度1,例如 Google 中国并未在网吧等地进行付费推广,将搜索引擎预设为 Google, 而竞争对手百度则“深谙其道”。另外,2007 年 Google 爆出“地图门”事件,2009 年爆出“不雅词”事件, 这些舆论事件影响了 Google 的公众形象和团队士气。2010 年 Google 再度受信息审查困扰,但创始人之一谢尔 盖·布林(Sergey Brin)决定退出中国大陆搜索引擎市场。

跨国集团适应能力弱本身是一种“大企业病”,由于业务本身涉及多国家地区,对单一市场的调整边际成 本较高。典型例子是百度于 2002 年下半年推出 MP3 搜索,并获得市场欢迎,但 Google 由于受版权困扰等因素, 直到 2009 年 3 月 Google 才与巨鲸音乐网合作推出正版音乐 MP3 供用户免费下载,而百度由于当时是非上市公 司,且当时版权保护环境相对宽松,利用这些特点实现差异化优势。另外,由于 Google 不允许把个人数据保存 在中国,导致 Gmail、YouTube 等服务无法在直接提供给国内用户,最终结果是 Google 中国一直缺乏账号体系。 但 2003 年百度俞军基于共同搜索构建的兴趣社区,推出百度贴吧,后续推出百度知道、百度百科等产品,进一 步巩固相比Google的差异化优势。此外,中国用户有一些特定的使用习惯,例如百度搜索结果打开新窗口,Google 以前不开新窗口,原来的搜索结果找不到,不少中国用户并不习惯;例如拼音扩展和相关检索。

百度在竞争中不断丰富搜索内容,自然延展出内容模块,但并未发展出内容生态。据统计,2005-2009 年 期间,百度推出了包括百度空间、百度视频、百度地图、百度杀毒、百度 Hi、有啊、百付宝等二十多个产品, 涵盖社交、娱乐、出行、即时通讯、电商、在线直播。在 PC 互联网时代,搜索引擎是流量中枢,上述产品可 以依赖百度的导流实现增长,但互联网产品并非简单地依靠流量就能成立,还需要对用户理解的深刻洞察。 百度并非没有尝试布局内容,但问题在于几经反复。2009 年百度提出“转型媒体平台”战略,以期打造一 个满足用户需求的超级平台,在垂直搜索和社交媒体争夺流量的时代,依然保持搜索巨头的地位。2010 年,百 度确立“中间页战略”2,希望通过投资或自建一批“中间页”网站从而提升百度长尾关键词的价值。2015 年百 度提出 O2O 战略,2016 年任旭阳回归后建议剥离。2017 年提出转型 AI 战略,2019 年,百度提出“搜索+信息 流”双引擎战略,加快建设“百家号+小程序”的两大生态,加速内容建设,应对移动互联网变局。2021 年百 度提出移动生态的“X+Y”战略布局,即“横向开拓用户规模,纵向深耕行业垂类”的方式,推进整个生态向 服务化、人格化升级。

百度“全家桶”本质上是依靠搜索导流才成立的产品,而在搜索不再重要的移动互联网,它们就会失去流 量难以生存。他们缺乏用户行为的闭环链路,更类似于中转站,而非目的地。以百度贴吧为例,《百度的那些 人和事》提到,俞军最早创立贴吧是想到将搜索相同关键词的用户连接起来,这是贴吧流量来源的问题。贴吧 用户留存和活跃的问题在于,贴吧流量容易自发集中化,因为头部贴吧的流量大,用户互动性更强,但另一方 面顶贴导致优质内容不容易沉淀,从而出现劣币驱逐良币的情况。贴吧的大多数内容来自搬运和转载,加上流 量分发的不均衡,对创作者的激励效果比较弱,长期存在自削弱的倾向。

历史包袱和战略误判使得百度错失移动互联网先机。从 PC 互联网到移动互联网,百度犯了与微软类似的 错误——将 PC 的交互习惯和思维移植到手机和其他移动设备。屏幕尺寸的变化不仅仅是量变,更是质变,因 为大屏幕下鼠标+键盘的交互更顺畅,网页可以填充更多内容供用户选择,但小屏幕下主要是触屏交互,小尺寸 屏幕对内容的容错率远低于大屏幕。所以小屏幕下信息流分发是比搜索更好的解决方案,但 2012~14 年百度和 360、搜狗仍在 PC 搜索引擎方面进行竞争,分散了注意力,一定程度上影响了百度在移动互联网的布局。此外, 移动端 Web 并未如 PC 端取得市场领先,而是 APP 生态逐步兴起,这主要是技术成熟度/硬件等因素导致。

另一方面,超级 APP 的出现导致搜索引擎无法实现 PC 互联网时代的广覆盖。以中国、东南亚为代表的地 区相比欧美更容易出现超级 APP。根据墨腾创投分析4,这主要是由于 1)监管对数据收集、反垄断限制,以及 用户隐私保护意识强,APP 横向扩展的倾向受到较强抑制;2)移动互联网发展时,多数领域已有垂类巨头,而 东南亚、中国则仍有较多领域缺乏玩家;3)相对较低的用户价值驱动企业选择多元化。超级 APP 的格局导致 流量集中于少数平台,而且 APP 的开放程度弱于 Web,且部分平台屏蔽/封禁外链的做法导致移动端搜索引擎 的覆盖度远弱于 PC 端,导致用户体验较差。 2012 年底百度调整策略转型无线,但转型后陷入 O2O 大战。2012 年 11 月 7 日,百度董事长李彦宏发布内 部信,提到“发现用户的搜索行为从 PC 往移动上迁移,就应该主动引导用户更早的去迁移到无线上,这样就 可以借助 PC 上的优势,把移动做起来,而不是拼命维持现状,想把用户留在 PC 上”5。于是百度自 2013 年起 强化对移动入口的布局,2013 年上线手机百度,投资收购 91 无线,上线轻应用。

秉持对流量入口和内容生态的布局思路,2013-16 年百度的对外投资存在过度补偿的倾向。2013-16 年百度 广泛参与了多个业务领域的投资收购,涉及 PPS 视频、91 无线、纵横文学、糯米网、沪江教育、猎豹移动、Uber、 快手、作业帮、百度外卖等。当时处于创投火热阶段,腾讯、阿里巴巴等在此时期也采取广泛布局的策略,因 此我们理解此时百度的积极参与既是对过往错失移动互联网布局的补偿,同时也是 FOMO(Fear of Missing Out) 情绪作祟。问题在于,互联网巨头通过扶持新兴领域巨头进行“代理人战争”。 前期过度扩张“战线”导致行业景气下降时资金压力加剧,百度逐步剥离此前收购和内部孵化的多数资产。 随着 2015 年下半年行业进入寒冬,前期投资的公司对互联网巨头“输血”的依赖加强,而百度在多条战线与腾 讯、阿里巴巴有所竞争,这产生了较大的资金压力。因此,2015 年 7 月百度宣布“航母计划”,分拆百度外卖、 91 桌面、作业帮、百度音乐、百度视频、百度文学等业务,实质是剥离部分资产降低资金负担,从而集中资源 支持部分 O2O 业务。

陆奇加入后帮助百度确立 AI+信息流双引擎战略。2016 年 5 月任旭阳回归百度6,战略层面推动百度重新梳 理战略方向,放弃 O2O。相应的人事影响则是此前积极支持 O2O 战略的百度前战略顾问何海文、百度前战略部 副总裁金宇和百度前技术副总裁刘骏先后离职。2017 年 1 月,陆奇博士加入百度,提出四象限理论,确立 Feed 流、人工智能的主航道;大商业、搜索、地图、知道、百科、糯米等应用环绕的护城河。其中,Feed 流为移动 基础,人工智能则是百度长久奋斗的目标。

战略重新聚焦后,百度大量布局移动端内容:1)发布百家号,面向所有用户开放注册;2)布局短视频, 发布好看视频、全民小视频;3)外部投资聚合,小红书、知乎等。百家号创建初期,百度与 MCN 机构合作, 主要措施是通过补贴将其他平台的内容同步发布至百度;百度和小红书、知乎的合作形式是单条视频、图文内 容以小程序等形式集合在百度生态内,但操作、观看更多内容是以跳转 APP、链接等形式转至小红书、知乎生 态内实现。

从过程上看,方向纠偏是战略上正确,但具体执行层面存在一定的偏差。从舆论反映可管中窥豹,首先是 百家号,2019 年 1 月《搜索引擎百度已死》7引发社会广泛关注(人民网语8),为了快速推进百度内容生态, 百度搜索结果中百家号、爱奇艺、百度贴吧、百度经验等占比异常高,导致用户体验受到严重影响;其次是百 度 APP,《不惜持续弹窗:为什么百度非要你用它的 App?》指出百度在网页端持续弹窗提醒用户下载百度 APP, 想要提升百度 App 用户数和使用频率,但代价是损失 Web 端百度的用户体验。

百度真正的转变来自“人”的变化,体现在水面之上的变化就是人员和组织架构的变化。2017 年 12 月, 崔珊珊回归百度。2018 年,崔珊珊开展约一百场小范围座谈会(每场 5~7 人),倾听员工讲遇到什么问题。后 来百度成立了文化委员会,李彦宏担任主席,崔珊珊任秘书长。百度成立文化委员会的第一目标是构建治理体 系,最重要的是纠偏,具体措施是确立员工晋升过程中的文化一票否决权。据崔珊珊访谈,从第一曲线到第二 曲线过渡,存在部分干部不干活,思想守旧的情况,因此百度进行了大比例的高管层面的人员调整以及组织架 构的变革。总结来看, 百度的变化是崔珊珊回归后在李彦宏授意下,推动公司治理体系改革,在过程中对旧思 想、不干活的干部进行大比例调整(干部年轻化),并同时进行组织架构的调整,避免组织的惯性导致新人犯 与老人同样的问题。

百度的改变首先来自自上而下思路的转变,陆奇加入后提出四象限理论,提出 1)把握根基不被对手动摇, 即建立起移动搜索生态,稳住百度的基本盘;2)百度需要开辟新航道。陆奇给出的方向是智能云、短视频、智 能驾驶等。其次,组织架构层面,增加 IDG、SLG、AIG 等 AI 体系,不断强化资源投入,保持战略定力。再次 是自上而下的制度变化,即 OKR、干部轮岗、全员沟通会制度化。2018 年 12 月,在百度集团资深副总裁、百度文化委员会秘书长崔珊珊的带领下,百度由原来的 KPI 模式更改为 OKR 模式。2019 年春节前夕,百度董事 长兼 CEO 李彦宏制定公司最高目标(Objectives)和关键结果(Key Results)后,员工自上而下逐层拆解,依次 制定团队和个人目标及关键结果,基层员工已于 2019 年 1 月 31 日全部提交完毕。此后,2019 年 2 月百度对三 位副总裁沈抖、吴海锋、郑子斌进行轮岗,解决业务之间的信息差,结合 OKR 改革,强化协作,减少内耗的作 用明显。2019 年年中,简单之约(百度内部全员沟通对齐会)被制度化下来,并每个季度制作成课件并定期考 核,要求公司 80%以上员工参加。 百度正在重塑企业文化,坚定执行既定战略方针。可以说,2017-19 年来的人事、组织架构、公司制度的密 集调整正在重塑企业文化,一个例证是百度集团副总裁张东晨、副总裁侯震宇相继回归百度。1Q21 财报电话会 上,百度创始人兼 CEO 李彦宏提到“随着 AI 推动技术发展进入新阶段,众多前百度员工重新回归”。未来, 我们认为百度相比过去会大幅提升战略的执行能力,在既有战略方向上,移动端+网页端维持搜索广告的业务根 基,新业务诸如智能驾驶、智能云等业务积极探索,发掘第二增长曲线。

3.2 业务:广告受益经济修复及广告主预算回升,新广告产品有望贡献增量

百度核心的收入中在线营销收入占比~70%,主要由百度、百度贴吧、好看视频、全民小视频的广告收入贡 献,其他收入包括智能云、智能驾驶。我们在移动生态部分主要分析以上 App 产品的广告业务。

根据 Alexa,百度 2016-18 年平均 PV 在 20 亿左右,2019-21 年平均 PV 在 10-15 亿,2019 年百度加强了对 手百等移动生态产品的导流,一定程度上导致 Web 端 PV 的中枢下滑,但好处是手百等移动产品的用户规模在 2019 年增速有所回升,即加速转型。

由于内容生态尚未搭建成熟,机械导流而来的用户留存率存在一定问题,因此我们看到 2021 年后除手百外, 其余百度移动生态主要产品的 DAU 均有所回落。因此,百度移动生态的广告收入贡献方面,手百 App>>贴吧>> 其他产品。我们主要以手百 App 作为分析对象。 百度 App 人均单日信息流推荐量估计为 93 条。据百度 2018 世界大会9,百度 App 的日活用户数已超过 1.6 亿,搜索的日均响应次数超 60 亿,搜索结果中首条结果需求满足率超过 40%,信息流日均推荐量超 150 亿。结 合 QM 的人均时长,我们按环比变化估计百度信息流产品的每日人均信息流推荐量。

百度信息流主要是百度搜索框下信息流、视频 tab 信息流,测算信息流 Ad load 需要额外考虑两条信息流的 转化关系,即搜索框下信息流插入了部分视频合集,用户点击视频合集后下滑消费自动转入视频信息流。 测算方法如下,考虑到用户使用时一般是一天内多次打开,每次打开使用一段时间,因此在统计时需要考 虑这一差异。如果信息流的广告填充是均匀分布的,那么我们统计时按用户每天消费的信息流总量即可,反之 则需要拆分成多次统计。而信息流广告填充是一个较强假设,我们较难论证这一假设在时序上持续稳定有效, 因此采取将单日 90+条信息流拆分成多次统计。据 2020 年百度移动生态大会,百度 App 日活已突破 2.3 亿,每 天人均打开次数超过 10 次。

百度移动生态产品方面的近期变化就是百度地图会员商业化升级(to B)。2023 年 3 月,百度地图进行会 员产品的商业化升级,具体权益包括 1)店铺装修、转化工具;2)搜索排名提升;3)品牌榜单、详情页推荐 位;4)专题活动。整体而言,百度地图会员产品是围绕本地生活行业进行商业化,目前产品开放的行业包括教 育、家装、维修、律师、车后、文体器材、整形美容、植发、眼科、口腔、体检、医疗服务/器械,整体看是一 些低频高客单的行业,近似于美团的到店综合类目,存在市场空间大,线上化率低等特点。

全量放开行业后付费上限为 50 万商户,中性估计下远期商业化规模在 6~12 亿元。根据 2020 年百度地图发 布会10,截止 2020 年 12 月,百度地图已实现 90%数据生产环节 AI 化,全新升级了生态全景 2.0,累计注册开 发者数量已突破 200 万。在政企合作方面,百度地图拥有超过 170 个政府合作项目,同时其全景地图覆盖了 95% 以上国内城市,超过 50 万商家入驻。如果按算术平均数考虑实际 ARPU 大约在 1 万元左右,考虑潜在的折扣等 11,按 50%计算对应 0.5~1 万元的 ARPU,极限商业化贡献在 25~50 亿元。百度地图的会员产品更近似于销售线 索而非构建交易闭环,因此在不对餐饮商户开放的情况下,按 60%餐饮商户占比,综合商户付费渗透率 60%估 计,实际商业化贡献在 6~12 亿元。

总结来看,百度移动生态广告业务可以拆分成 1)新产品推出,提供较多增量;2)既有产品的升级,实现 效率改善,贡献温和增长。广告产品的丰富和结构改善驱动百度广告业务产品周期变化,叠加外部的宏观经济、 行业景气度变化,二者共同影响百度移动生态广告业务的增速。

4. 智能云:MaaS 浪潮有望加速经济智能化发展

从收入结构上,百度云收入主要来自 1)视频云,包括 IaaS 层的 CDN 及 PaaS 层的音视频解决方案;2) AI 服务,包括语音、图文识别、AI 开放平台等服务;3)其他等。 基于公开数据结合简单假设,我们推测百度云收入中广义视频云 2022 年约 75 亿元,占比较高。根据 IDC 及 Synamedia,我们可以得到 2017-20 年 CDN 市场规模,假设 2021-22 年的同比增速分别为 10%、5%,并基于 IDC 统计的市场份额,我们可以推测百度云历年的 CDN 规模。结合 IDC 视频云统计,由视频云扣除 CDN 即 PaaS 层视频云规模。我们推测百度云收入中广义视频云 2022 年约 75 亿元,占百度智能云收入的 41.4%。

基于类似逻辑,我们推测百度智能云 AI 公有云部分收入 22 年约 21 亿元,占百度智能云收入的 11.7%。 市场竞争方面,从市场份额上看,公有云市场 AI 服务方面百度智能云处于领先地位,其次是阿里云、华 为云,腾讯云次之。市场份额主要与集团其他业务的技术积累有关,例如腾讯、百度在人脸识别布局积累较深; 在计算机视觉方面,百度依靠自动驾驶、数字人等领域积累领先市场,腾讯凭借金融、泛娱乐领域的技术积累 逐步追赶;NLP 主要应用于情感分析、营销管理,智能语音涉及会议访谈转写,字幕生成等,腾讯云在以上领 域涉猎相对较少,处于落后追赶地位;对话式 AI 典型案例即语音助手、在线客服,阿里、百度、华为凭借在智 能设备等领域的积累处于领先地位。 未来 AI 公有云市场的发展主要由新场景、新技术驱动。目前 AI 公有云市场中人脸识别是应用较广的场景, 推广接受度较高,市场进入平稳期,且人脸人体识别技术正在进入成熟期。智能语音也从高速增长进入应用场 景深耕阶段。AI 市场高速增长的场景主要是对话式 AI、机器学习平台两个领域,上述两个领域 1H22 同比增速 高于大盘平均,NLP 基本与大盘增速接近(68.0% vs 69.2%)。

未来 AI 云服务市场格局变化主要受新兴领域格局影响。NLP、对话式 AI、机器学习平台等合计占 2021 年AI 云服务市场规模约 48.7%,考虑其他领域增速相对平缓,格局较为确定,未来新兴领域占 AI 云服务市场份 额扩张,对整体份额影响提升,且细分领域仍处于高速增长发展阶段,格局存在一定不确定性,因此对 AI 云服 务格局的变化核心是研判以上三个细分领域的成长与竞争情况。

4.1 NLP 云服务:范式转移驱动新趋势,前期积累有望逐步兑现

大模型取代垂直小模型成为行业趋势(MaaS)。NLP 可以分为自然语言理解(NLU)和自然语言生成(NLG) 两部分,细分任务包括分类、匹配、序列标注、阅读理解、序列到序列、序列到动作序列及语言模型。由于下 游任务的范式迁移,垂直领域的任务可以通过变换为其他任务,因此模型的通用性增强。同时零样本、小样本 学习提升了模型的训练效率,并降低了整体的调试成本,使得大模型提供服务的门槛降低。综合来看,大模型 至少在一定程度上能够取代垂直小模型,并通过 MaaS 的形式提供服务,这可能成为行业未来的发展趋势。

大模型领域的研究核心要素包括模型结构、预训练模型、下游调试、模型部署、模型推断等。根据青源会, 大模型研究领域存在一定问题,包括同质化严重的情况,多数厂商采取类似的模型架构,例如 GPT、Bert、T5 等。由于模型架构同质化,影响模型效果的核心因素更多是工程方面的技巧、细节。总体上,大模型领域的研 究机会主要包括 1)模型结构,例如非注意力交互机制、稀疏路由结构等;2)预训练模型,例如预训练任务设 计、模型更新方法等;3)下游调试,如探索任务微调效率提升方法;4)模型部署,如统一的任务范式,通过单一模型支撑多种任务;5)模型推断,如模型压缩、剪枝、动态路由等。我们对比不同厂商大模型研发水平也 主要参照上述框架。

模型结构上,百度 ERNIE14是基于 BERT 引入知识图谱。具体来讲,2019 年 4 月 ERNIE: Enhanced Representation through Knowledge Integration 提出基于 BERT 的改进掩码策略,1)在单词级别随机生成掩码并引 导模型预测(BERT 框架,basic-level masking),2)词组级别(phrase-level masking)、实体级别(entity-level masking)随机生成掩码并引导模型预测。通过引导模型预测词组、实体,模型训练隐性地15引入知识图谱概念。 例如:哈利波特是 J.K.罗琳写的小说。单独预测哈[MASK]波特或者 J.K.[MASK]琳情况下,模型无法学到 哈利波特和 J.K.罗琳的关系。如果把哈利波特直接 MASK 掉的话,那模型可以根据作者,就预测到小说这个实 体,实现知识的学习。

ERNIE 2.0 引入持续学习框架,解决知识遗忘及训练效率的问题。ERNIE 1.0 相比基础版 BERT,改变了掩 码策略(引入知识图谱)和数据结构(加入多轮对话语料),提升了模型预测准确率。此后学界讨论通过多任 务学习提升模型的预测准确率,例如微软研究团队在《Multi-Task Deep Neural Networks for Natural Language Understanding》中论证了通过在预训练模型中加入有监督的下游任务,能够优化模型在 NLU(自然语言理解) 方面的效果。因此,后续的一个思路就是通过堆叠训练任务提示模型预测准确率,但相应存在一个问题,即模 型出现学习新知识后容易遗忘旧知识,ERNIE 2.0 主要的变化就是针对这一问题提出持续学习框架,实现知识 库扩充,优化模型效果。 常规的模型训练即序列训练模式,即后一个模型训练是建立在前一个模型训练结束后,从模型参数的角度, 后一个模型训练初始参数为前一个模型,但训练结束后参数有所调整,且由于训练是基于后一个任务,其对此 前任务的预测准确率可能低于此前的训练结果。学界此前的解决思路是将多个任务同时训练,确保模型对不同 时序加入的任务等权学习,但每新增一个任务,模型都需要重新训练此前所有的任务,这对应较高的训练成本。 ERNIE 2.0 提出序列多任务学习(Sequential Multi-task Learning)模式,通过给每个任务分配 N 个训练迭代,自 动将每个任务的 N 个迭代分配到不同训练阶段,兼顾学习效果和效率,较 BERT 框架继续优化。

ERNIE 3.0 引入大规模参数,在包括纯文本和知识图谱的 4TB 语料库上预训练一个知识增强的 100 亿参数 模型。为了处理语言理解和生成的任务,ERNIE 3.0 设计了一个统一的预训练框架,整合了自编码网络和自回 归网络。我们在来自不同任务范式和领域的各种数据集上构建了广泛的实验,结果表明,与之前最先进的预训练模型相比,ERNIE 3.0 是有效的16。 ERNIE 3.0 相比 2.0 最大的变化就是参数规模和数据规模的提升。T5 和 GPT-3 的经验表明,扩大预训练语 言模型的规模可以提高其泛化能力。百度团队认为 GPT-3 等模型由于缺乏知识图谱,在自然语言理解方面表现 不理想,但另一方面自编码网络下零样本/小样本学习的效果较好。因此 ERNIE 3.0 融合了自编码网络和自回归 网络,扩大数据/参数规模,训练后的模型可以很容易地用于自然语言理解和生成任务的零样本学习、少样本学 习或微调。 此外,ERNIE 3.0 的语料库包括百科、Feed、百度搜索(包括百家号、知乎、贴吧、经验)、网络文本、 QA-long、QA-short、Poetry 2&Couplet 3、医疗、法律、金融等领域的特定数据以及百度知识图谱(超过 5000 万条事实),相比 CLUECorpus2020(100GB)、中文多模态预训练数据(300GB)、CPM-2 使用的 WuDaoCorpus2.0 (2.3TB 中文数据和 300GB 英文数据)和 PanGu Corpus(1.1TB)相比,ERNIE 3.0 采取了当时最大的中文预训 练语料。

ERNIE 3.0 TITAN 引入可控、可信自监督模型,提升文本生成的可靠性,此外提出在线蒸馏框架。百度研 究团队在 2021 年 12 月发布的论文中提到,虽然像 GPT-3 这样的大规模语言模型表现出很好的文本生成能力, 但对于用户来说,要控制生成结果并获得与事实相符的文本仍然是一个挑战。换言之,GPT-3 可能存在胡编乱 造等问题,导致生成内容与事实存在明显偏差。为解决这一问题,ERNIE 3.0 TITAN 引入可信可控内容生成自 监督模型,包括自监督的对抗性损失(self-supervised adversarial loss)和可控的语言建模损失(controllable languagemodeling loss)。其中,前者主要区分模型生成内容与事实,这实际上是一个二进制的分类问题,最终通过交叉 熵损失函数(cross-entropy loss)训练模型参数;后者是在 ERNIE 3.0 可控数据集 Dc={x1, x2, . . . , x|Dc|}上使负 对数似然损失最小。

此外,为了更好地利用计算资源和更环保地进行蒸馏,百度研究团队提出了在线蒸馏方法 OFD(On the Fly Distillation)。具体过程是每当教师更新一步,学生就向教师更新一步。在训练过程中,学生的学习目标(即老 师)会随着时间的推移而改变。OFD 允许教师培训和蒸馏同时进行。这样做的好处是我们可以在教师的预训练 中更好地利用教师的前向传播来进行蒸馏,而不像现有的知识蒸馏方法需要从教师那里获得额外的前向传播来进行蒸馏。OFD 不会影响教师的训练,因为蒸馏损失的梯度不会从教师那里流出。蒸馏损失不会从 TA 或学生 那里流回教师。辅助蒸馏层(Auxilliary Layer Distillation)主要是解决学生前馈神经网络无法得到训练的问题: 由于在蒸馏过程中传输的知识是注意力概率分布,因此,在蒸馏块中的前馈网络,不会在蒸馏过程中进行训练。 而在训练调优结束后,ALD 则会被丢弃。 GPT-3 的成功得益于着眼于更大的问题,ERNIE、BERT 等的落后反映业界研究的一些弊病。可以看到, 相比 GPT-3,ERNIE 在模型结构方面引入多层次掩码、知识图谱、在线蒸馏框架、可控可信自监督模型等,设 计了更精巧的模型,并搭建了面向应用的易用框架,且在评测集上表现超越同时期的模型,但从后续的 ChatGPT 应用效果上看,包括 ERNIE 在内的多数团队都不曾达到类似的效果。

从技术路线上看,包括 ERNIE 在内的多数厂商选择 BERT 路线(Encoder-only),少数选择 T5 路线 (Encoder-Decoder),较少选择 GPT 路线(Decoder-only)。这种选择可以从学术影响力看出,BERT 论文的 被引用量远大于 GPT 系列论文及 T5 系列论文。事后看,当前 OpenAI 旗下 GPT 系列模型的领先得益于早期技 术选型的成功,这一成功是建立在以下基础上——GPT 的学界/业界影响力小于 BERT,导致多数厂商选择跟踪 BERT 的工作。 GPT 路线此前的影响力弱于 BERT 路线主要由于 1)Google 品牌背书;2)开源精神;3)产研结合难度。 OpenAI 旗下的 GPT 路线基于 Transformer 架构,将解码器单独取出,论文发布时间早于 BERT 论文发布时间。 但论文的业界影响力弱于 BERT,我们认为,这主要由于 Google 的品牌背书,Google 研究团队在 AI 领域的研究积累导致业界对其研究关注度更高。另一方面,GPT 系列论文发布后,相关数据集、模型不完全开源,导致 其他研究团队很难跟进和复现其研究成果,这进一步削弱了业界/学界跟进研究的动力。最重要的是,OpenAI 团队解决问题的思路与当时业界/学界有所差异,此前研究人员更倾向于设计精细的模型结构和高效的方法,实 现相同规模下效果更优,而 GPT 引入 Few-Shot/Zero-Shot 下表现没有明显好于 Fine-tuning 下的其他模型,只是 在数据量和参数量指数提升后表现快速提升。

这里存在 2 个问题:1)线性外推的思维定式。2)业界研究的思维习惯:追求效率,聚焦更具体的问题。 首先是线性外推的思维定式18,多数研究团队选择优先调整模型结构和训练方法等路线的隐含假设是,规模扩张 不会对技术路线的效率产生明显影响,或者即使产生影响,但相比规模扩张带来的成本,其投入难度很难同比 扩大。后者则涉及到业界追求效率的思路,关注投入产出比,这种思路的本质是投入资源稀缺,要在有限的资 源投入下最大化产出。而研究思路背后是互联网公司 AI 实验室与业务部门的博弈。

纵观国内外互联网公司的 AI 研究部门,其大致经历了职能制、矩阵制、事业部制等架构,背后反映了大 厂对 AI 科研部门的不同期许和考核体制,这种激励体制也影响了 AI 科研部门的中长期发展。2013 年成立的 FAIR 采取职能制,其定义 Facebook 的 AI 部门为 FAIR + Applied Machine Learning(应用机器学习团队)+ Product Groups(产品部署团队)19。但 2018 年组织架构调整后,FAIR 转向矩阵制,即 AI 实验室同时对业务部门和技 术领导(一般是 CTO 体系)负责。2021 年底 FAIR 进一步调整,将旗下 AI 研究团队并入业务部门,转向事业 部制。从职能制向矩阵制、事业部制,考核体制上越来越接近业务,越来越远离学术影响力/前瞻研究,这种转 变大多是由于互联网公司面临营收、利润压力,业绩压力倒逼研究团队转向业务团队的“外包”,压力下部分 研究人员离开业界,重回学术界,这是过去我们看到的业界 AI 研究的循环。

更大的趋势在于 1)开源带来的技术扩散,头部科研院所及互联网科技公司相比中小公司/科研院所的相对 优势在缩减,这主要由于过去 AI 领域的创新主要来自方法论层面,而非工程层面,而方法论的创新更随机;2) 对大型科技企业的监管约束趋严,大多数美国互联网科技企业都是在 1990 年后成立,并受益于 20 世纪末、21 世纪初的反垄断监管,在快速发展阶段经历了经济高速增长、监管边际宽松的环境,但 2017 年以来欧盟、韩国 等对谷歌、亚马逊、Meta、苹果公司、微软等加强监管,导致大型科技公司面临较高的监管压力。

此外,舆论环境对中小型创业公司容忍度更高也是影响大公司创新成本的要素。包括 Meta、Google、微软 在内的科技公司此前推出类似产品时都出现过由于语言模型生成内容存在虚假、政治不正确的情况,并引发舆 论热议,从而迫使产品下线。例如 2015 年 Google 将黑人女性的图片识别为 Gorilla(大猩猩)22;2016 年微软 聊天机器人因种族歧视言论迅速被下线23;2021 年 Facebook(Meta)将黑人男性标注为 Primate(灵长类动物) 24。对于大型科技公司的舆论和监管压力天然高于创业公司25,这也导致其面临较高的合规成本,丧失部分灵活 性。 回到百度,一个有趣的问题在于为何百度在国内 AI 领域布局相对领先同行。我们认为核心在于组织架构 调整驱动业务/研究结合,导致 AI+云业务融合发展较早,从而在大模型的工程训练、前瞻研究方面均有所布局, 表现为整体的相对领先。

研究与工程落地协同发展的产业趋势。根据 FAIR 前负责人 Yann LeCun,“FAIR 和 AML 都会做研究以及 工程驱动的开发。我会说 FAIR 把 75% 的精力投入到研究,25% 的精力放在了工程上。而 AML 也许是 75% 的 工程,以及 25% 放在了研究上。FAIR 和 AML 的分界线是特意模糊的。有些人在两个组织里脚踩两只船。他 们是 FAIR 年轻的工程师们,我们把他们称为“研究工程师”,他们和研究科学家一起做研究项目。而当这些 项目从研究阶段到开发时,有些研究工程师会选择跟随他们的项目到开花结果,这样就会进入到 AML 团队。 这是非常好的方法,把最先进的技术从研究状态散播出去”。26 具体到 GPT 路线,我们在论文解析部分提到,GPT 相比 BERT 路线的思路差异在于希望通过扩大数据/参 数规模实现效果提升,而非通过模型结构优化提升既定投入下的效果,因此对于工程能力的要求较高。在 GPT 技术路线的积累更多是研究+工程的协同,而非依靠研究院或工程团队单独推动,因此从技术追赶的角度,更早 地解决工程和研究团队协同工作问题的公司,往往在技术追赶中可以取得先机。

百度 2019 年将 AI、云业务与技术中台合并,统归 CTO 管理,并提出云智一体。百度于 2018 年 12 月将智 能云事业部(ACU)升级为智能云事业群组(ACG),同时承载人工智能 To B 业务和云业务,由尹世明负责, 向张亚勤汇报。搜索公司及各 BG 的运维、基础架构和集团级共享平台整合至基础技术体系(TG),整合后 的 TG 向王海峰汇报,王海峰同时继续负责 AIG27。2019 年 9 月,智能云与 CTO 体系融合,百度副总裁、百 度智能云总经理尹世明携团队向集团首席技术官王海峰汇报28。至此,百度形成了 AI+技术中台+云体系融合, 统归 CTO 管理,并进一步升级 AI+云战略。 作为对比,腾讯云、阿里云与技术中台的运行相对独立,由不同高管负责,组织上的协同性相对弱于百度29。 百度研究与工程的协同在结果上体现为,深度学习框架、机器学习平台、计算集群平台等环境搭建完善,且整 体性能处于国内领先。百度 PaddlePaddle 深度学习框架在 Github 上的关注度、点赞量等指标均处于国内领先, 而阿里巴巴、腾讯、字节跳动在深度学习框架方面积累相对落后。根据 MLPerf 榜单,PaddlePaddle 及百舸计算 平台在单机、分布式环境中特定条件下取得性能领先,体现了框架和性能的先进性。

除性能外,工程环境的稳定性也尤其重要。英伟达在《Efficient Large-Scale Language Model Training on GPU Clusters》论文中预估过:1750 亿参数的模型,在 3000 亿样本的规模下,1024 卡也需要训练 34 天。如何保证 在有故障发生的情况下,模型能持续稳定的训练,也是亟需解决的问题。根据 Susan Zhang 教授30,Meta 在 OPT-175B 模型的训练中出现了 50 多次的断点(需要回到 Checkpoint 重启训练),下图中不同颜色代表着模型 连续训练的时间。而根据 GPT-4 技术报告,OpenAI 认为 GPT-4 模型训练的重要因素是工程环境的完善搭建。

实现训练的稳定性主要方式有提升计算集群并行能力/性能。阿里云研究团队于 2020 年发布《EFLOPS Algorithm and System Co-design for a High Performance Distributed Training Platform》,提出 EFLOPS AI 计算集 群,关键技包括网络化异构计算服务器架构、高扩展性网络架构、与系统架构协同的高性能通信库。基于上述 技术突破,阿里云在万卡规模下基本实现线性扩展31(92%),作为对比,百度百舸 AI 异构计算平台千卡规模 的加速倍在 90%以上。

整体而言,百度在深度学习框架、计算平台等领域具备较好的优势,在模型结构设计、部署等方面有更好 地积累、学术/业界影响力更强,技术路线转向 GPT 后部分经验仍可以复用,在国内同业中具备相对优势。但动 态地看,基于相同技术路线发展出来的大模型在效果上可能同质化,即使由于模型结构的精调等可能存在一些 优劣差异,但这种差异是否能传导至市场份额,最终形成企业的护城河,这是值得进一步探究的。

4.2 对话式 AI:软硬结合助力业务稳步发展

对话式 AI 分为 to C 场景和 to B 场景,腾讯云在智能家居、驾驶、客服等领域有所布局。对话式 AI 的 to C 场景包括智能家居、智能驾驶、智能随身设备、智能办公,to B 场景包括智慧医疗、智慧金融/电商/电信(智能 客服、智能外呼)、智慧教育、智慧政法/公检法。但 to C 场景中往往 AI 能力与硬件搭售,因而份额会被智能 手机、家居厂商等侵蚀,或被行业布局较早的厂商占据。 阿里云、百度云依靠既有业务/场景进行技术验证、迭代,形成正循环。对比同业,阿里云主要布局 To B 场景,例如智能客服、营销,阿里的优势是产品能够在生态内应用验证,同时技术研发较早。根据 IDC,阿里 云智能客服成为国内唯一入选 IDC 全球 MarketScape 报告解决方案提供方,且取得 Major Players 位置32。阿里 云智能客服最早于 2015 年试运行,逐步应用至手淘、Lazada、盒马等生态,并于 2017 年正式对外向政府、企 业和开发者开放。百度云主要布局 To C 场景,百度的优势是基于亿级日搜索量沉淀的自然语言处理技术、知识 图谱、语音技术等,且 2017 年发布 UNIT(智能对话定制与服务平台),布局至今持续积累生态;另外百度在 硬件方面也有一定布局,例如小度同学,自动驾驶,此外百度开放底层技术能力,使得部署模式更灵活,客户 接受度也较高。

4.3 机器学习平台:国内应用规模领先,技术沉淀积累深厚

机器学习平台的竞争优势是 1)功能谱系广,2)性能强,3)安全保障,4)兼容性好。功能方面,机器学 习平台需要确保机器学习框架、模型的全面覆盖;性能上,数据标注、算法编辑、模型训练性能强意味着机器 学习的效率较高;安全方面,业务逻辑、数据、代码的安全性对大型企业、部分行业客户尤其重要;兼容性上, 平台方难以完成所有工作,而是需要和其他框架、数据格式、算法兼容。 第四范式聚焦少数行业做深产品,互联网云厂商采取小步快跑策略广泛布局快速迭代。行业竞争方面,第 四范式布局较早具备先发优势,2014 年 12 月对外发布先知平台,且创始人/核心高管技术实力较强,在部分行 业积累成功案例并逐步复制,2015 年发布金融行业产品及服务,18-19 年发布零售、能源行业产品及服务,目 前市场份额领先。百度 PaddlePaddle 于 2013 年内部成立,2016 年 9 月对外开放,截止 2022 年 5 月,飞桨已累 计凝聚 477 万开发者、服务 18 万企事业单位、创建 56 万 AI 模型34,是国内应用规模第一的深度学习框架和平 台。阿里巴巴 2015 年底推出 PAI 平台,作为机器学习比赛平台,并于 2018 年开启商业化,其官网披露的支持 框架目前是国内厂商中最全面的;华为云于 2017 年 9 月推出机器学习平台,目前拥有自研开源框架 MindSpore。 腾讯云于 2018 年 3 月推出深度学习平台 DI-X,目前演化为 TI 平台35。

从企业而言,第三方 AI 企业聚焦部分行业的 AI 模型策略更扎实,互联网云厂商的策略需要更多的人力和 资源投入,且在市场快速增长的过程中,开拓新行业/新场景的难度比优化已有行业/场景难度更低,往往企业会 投入更多资源用于份额扩张,但并未实现客户的价值提升,这种增长存在一定隐忧。但对于互联网云厂商而言, 云计算本身是集团内部的业务之一,其面临与其他业务部门资源分配的竞争,如果规模扩张不够快,所获取/能 够调动的资源就会被挤压,因此云厂商内部负责人往往存在“增长焦虑”,只有快速提升市场份额,才能够稳 定云业务在集团内部的地位,同时获取更多资源以优化/迭代算法、模型,实现客户价值提升。

5. 智能驾驶:前瞻布局+持续投入,有望成就新增长曲线

百度智能驾驶事业群组分为自动驾驶、车联网、智能交通业务组,对应三大业务。整体布局包括车端、路 端、云端,车端产品包括车载座舱、激光雷达、AI 芯片,并与吉利成立集度汽车;路端产品包括高精度地图; 云端由数据闭环、AI 研发、数据采集、云仿真测试、运营监管等解决方案组成。ACE 交通引擎则是车路协同解 决方案。

5.1 云端:自动驾驶云 Apollo Cloud+Robotaxi

5.1.1 自动驾驶云解决方案:数据采标、AI 研发、仿真测试等能力社会化

自动驾驶云是基于云的全流程解决方案,包括数据的采集、标注、存储、管理、训练、清洗、评测全流程 配套产品和服务。具体而言,自动驾驶云解决方案包括 1)数据闭环解决方案;2)AI 研发解决方案;3)数据 采集标注解决方案;4)云仿真测试解决方案;5)运营监管解决方案。整体而言,自动驾驶云解决方案是将百 度在自动驾驶业务开展过程中积累的能力开放给客户。

2020 年国内自动驾驶数据采集、标注市场规模约 6.22 亿元,百度位列份额第一。根据 IDC,自动驾驶的数据采集、标注需求占市场整体较大比例,2020 年占比 35%,主要来自于车内驾驶舱以及车外道路环境感知等场 景。另外,IDC 提到 AI 基础数据服务市场基本成熟,客户需求聚焦标注质量、标注效率、知识经验、数据安全, 以及整体成本具有较高性价比。份额方面,随着 AI 介入数据采集、标注,规模效应显现,平台型厂商份额整体 提升,其中百度、海天瑞声分列 2020-1H21 年市场的第一、第二。根据海天瑞声招股说明书,百度 2019 年 的市场份额达 11%,海天瑞声市场份额达 8%。若假设百度的份额维持 11%,自动驾驶的市场规模占比保持 35%水平,则 2025 年百度数据采标收入规模预计达到 4.75 亿元(2020 年约为 0.68 亿元)。

2022 年国内自动驾驶仿真测试市场规模预计为 93 亿元,22-25 年 CAGR 预计达 66.7%。由于市面上并未 有第三方机构测算国内自动驾驶仿真测试市场规模,我们参照全球自动驾驶市场及自动驾驶仿真市场的比例, 结合国内自动驾驶市场规模,予以简单估计,得到 21-25 年的自动驾驶仿真测试市场规模,其中 22 年预计达 93 亿元,25 年达到 431 亿元,22-25 年 CAGR 达 66.7%。 自动驾驶仿真测试市场参与者主要包括互联网平台和自动驾驶厂商,前者强于数据、软件开发能力,后者 在业务反馈周期上更短,聚焦自身需求开发仿真平台。根据璞跃研究36,互联网仿真平台在仿真方面起步相对 较晚,在汽车功能探索方面经验较少,但是具备大数据优势,软件开发能力强。科技公司进行仿真软件的探索,目的是进入市场庞大的汽车行业,建立更大的数据平台,形成新的业务增长点;自动驾驶解决方案商:主要针 对自身需求研发定制化仿真软件,较少对外提供仿真服务,但借助于充足的资金、丰富的道路实测数据支持, 自身研发驱动力,在自动驾驶仿真方面具有很强的竞争力。此外,国内初创企业在汽车传统仿真领域存在短板, 自动驾驶仿真方面积累薄弱,创新性不足。

换句话说,自动驾驶仿真测试市场的格局取决于下游自动驾驶汽车的格局,因为自动驾驶汽车厂商规模扩 大后,自研的规模效应逐步显现,可能将多数预算用于自研仿真测试平台而非外部第三方平台。此外,传统车 企转型的新能源品牌在软件开发等领域能力往往相对欠缺,更倾向于联合开发或采购第三方方案,初创而来的 新能源车企更倾向于自研。 目前我们关注到乘联会预估的前七大新能源汽车厂商分别为比亚迪、特斯拉、上汽通用、长安汽车、吉利 汽车、广汽埃安、上汽。其中,除特斯拉完全自研外,吉利汽车、广汽埃安采取联合研发,比亚迪、上汽集团、 长安汽车采取外部购买的方式,但供应商也较为分散。

5.1.2 Apollo Robotaxi:技术积累领先行业,政策鼓励下逐步推广落地

萝卜快跑是是基于百度 Apollo 提供自动驾驶出行服务的平台,目前已经在北京、上海、广州、深圳、重庆、 武汉、成都、长沙、合肥、阳泉、乌镇、沧州等城市开始运营。根据百度官网,3 月 22 日百度获批上海首批无 驾驶人智能网联汽车创新应用测试通知书,将在上海浦东新区开启全无人自动驾驶测试。 商业化前景方面,2022 年发布的 Apollo RT6 将 L4 级别自动驾驶单车成本控制在 25 万元左右37,按 5 年运 营周期计算,单月单车成本约为 4100 元,较网约车平台成本更低,能够有效降低消费者打车成本。行业龙头滴 滴于 4 月 13 日举办自动驾驶开放日,宣布 2025 年量产无人车,未披露具体成本,但从量产进度上落后于百度。 结合百度 L4 级别自动驾驶路测里程领先行业,技术积累时间较长,我们认为综合实力方面百度预计领先其他竞 争对手。

5.2 车路协同:智能交通引擎 ACE 涵盖产品及解决方案

百度 ACE 交通引擎采用“1+3+N”的发展框架。1 个“数字化交通基础设施”指“车路云图”全栈技术为核 心的数字底座;3 大智能引擎分别为 Apollo 自动驾驶引擎、车路协同引擎、MaaS 出行引擎,N 类开放应用包括 包括以智慧交管、智慧高速、智慧停车为代表的数字化,APP、车机、度小镜、智能路口为代表的网联化,以 及 Robobus、Robotaxi、阿波龙为代表的自动化。通过构建”车-路-行-云-图-网”全栈智能交通体系,满足城市交 通管理、产业发展和民众出行实际需求,实现城市交通高质量管理闭环。

智能交通 ACE 是由底层产品和解决方案组成。底层产品包括地图开放平台、智能网联终端(度小镜)、 百度城市扫描仪、交通大数据接口服务、人口地理大数据接口服务等。 根据《百度 Apollo 智能交通白皮书》,百度在智能交通领域的解决方案包括 1)车路协同,主要强调将道 路多端信息联网,从而实现自动驾驶规模化应用。总体上车路协同更多是未来自动驾驶应用的基础。2)智能信 控,通过 AI 视觉技术和交通地图大数据,辅助交通信号系统决策,降低道路延迟时间,提升道路通行能力。3) 智能停车,基于 AI 视频技术实现停车的无人化管理,提升停车泊位的周转率提升,进而实现 ROI 提升。4)智 能公交/货运/出租,基于自动驾驶技术能力和车路协同方案,实现公共交通效率提升,提升货运安全性和节约能 耗。5)智能车联,通过软件、系统接入的方式以低成本实现设备的智能控制,红绿灯通行引导、碰撞预警、辅 助驾驶等功能。6)其他,包括园区物种、自主泊车等解决方案。

5.3 车端:智能座舱、智能驾驶、智能地图全栈布局

在车端智能化方面,百度 Apollo 全栈布局,旗下产品包括智能驾驶(Apollo City Driving Max、Apollo Highway Driving Pro、Apollo Parking),智能座舱(小度车载 OS、小度车载语音 SDK),智能地图(车载导航地图、高 精地图、人机共驾地图)。

5.3.1 智能驾驶:集度汽车预期 2H23 交付,有望逐步贡献实质性业绩

根据 Apollo 官网,Apollo 领航辅助驾驶是将国内 L4 级智驾技术降维到 L2+的量产高阶辅助驾驶。百度的 辅助驾驶技术覆盖范围城市道路、高速公路、停车端,基本涵盖了用户出行的各类场景,且具备识别异形红绿 灯,环岛路口、非结构化道路等能力。

技术方案上,百度采用视觉算法和激光雷达结合的解决方案,基于大数据、大模型、小型化技术,结合自 动驾驶和车路协同,实现车、路端的感知能力提升。硬件方面,Apollo Highway Driving Pro 采用 4 个鱼眼摄像 头、1 个长距离毫米波雷达、4 个角毫米波雷达、12 个超声波雷达、5 个中长距摄像头以及 1 个选配摄像头。 Apollo City Driving Max 采用 4 个鱼眼摄像头、1 个长距离毫米波雷达、1 个长距毫米波雷达、12 个超声波雷达、 7 个中长距摄像头以及 2 个激光雷达。

商业化方面,辅助驾驶产品的落地更多依赖集度汽车的量产及销售,预计 2H23 开始实质性贡献业绩。根 据集度汽车机器人生态伙伴大会,集度汽车 CEO 夏一平表示“集度首款量产车 2023 年 7 月 SOP,下半年开始 正式交付。首批门店计划于 2023 年进军国内 46 个城市,初步完成销售网络的全国布局。此外,集度汽车在 2028 年计划拥有交付 80 万辆新车的能力。”

5.3.2 智能座舱:百度 IVI 份额位列行业领先

根据 Apollo 官网,百度在智能座舱领域的产品主要是小度车载 OS、小度车载语言 SDK。其中,小度车载 OS 五个核心组件:大屏智能车机组件,液晶仪表盘组件,流媒体智能后视镜组件,小度车载机器人组件,智能 挡风玻璃组件。

5.3.3 智能地图:车载导航地图、高精地图均位列行业前列

智能地图板块分为车载导航地图、高精地图、人机共驾地图。车载导航地图方面,2021 年高德地图前装搭 载量达 413.94 万辆,占比 35.51%,百度地图前装搭载量达 169.11 万辆,占比 14.51%。根据头豹研究院,2021 年前装地图导航市场分为联网与离线两类,前者具备 4G/5G、Wifi、SD 卡功能,License 授权价格为 50-80 元/ 个,离线地图导航 License 价格为 10-20 元/个,整体市场上联网地图导航占比 78%,离线占比 22%。据此估算, 百度 2021 年车载导航地图产品收入预计达 0.91 亿元,高德地图 2021 年对应 2.24 亿元。 高精地图方面,根据 IDC 统计,2021 年中国高精度地图市场规模为 6.46 亿元人民币,同比增长 36.3%。其 中百度地图份额约为 32.2%,高德地图份额为 12.5%。据此推算,百度高精地图 2021 年收入约为 2.08 亿元,高 德高精地图 2021 年收入约为 0.81 亿元。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告