2025年传媒互联网及电子行业专题报告：2025，国产AI机会正启——字节生态篇

东吴证券2025/02/07
举报

1、国内AI产业正进入加速时刻

2024是重塑认知的一年：大模型间技术和份额差距逐步缩小

2024年是大模型继续探索能力边界的一年，也是大模型间技术差距缩小的一年，体现在：其他大模型玩家与OPENAI的差距缩小（代表玩家Anthropic）、开源模型与闭源模型差距缩小（代表玩家META、DEEPSEEK）；中国大模型与海外顶尖大模型差距缩小（代表玩家DEEPSEEK）。

差距缩小还体现在份额指标上，大模型一家独大的局面并不可持续：根据企业支付管理 SaaS 公司 Ramp的数据，23年11月底OpenAI token消耗占总量近90%，24年9 月降到近80%；根据Artificial Analysis调研数据，大多数开发者会调用至少2个以上的大模型（N=265）。

算力受限下找更优解，2025将是国产AI进击的一年

2025年1月，DeepSeek发布推理模型DeepSeek-R1，同步开源模型权重，以更低的成本实现接近OPENAI推理模型O1的性能。DeepSeek首次验证了可通过纯强化学习（RL）激励大语言模型推理能力，无需监督微调，并提出包含冷启动数据和多阶段训练的 DeepSeek-R1 训练管道，提升模型性能与实用性，在推理任务上的性能与OpenAI-o1-1217相当，API定价上不到o3-mini的一半，仅为o1的4%。模型更新后DeepSeek热度急剧攀升，App登顶中国大陆、美国等75个地区的iOS免费榜总榜，成为全球上线后增速最快的 AI 原生应用，网页版访问量持续攀升。

DeepSeek在国内高端算力受限的情况下持续寻找更高效的模型训练方式和提高模型表现的更多路径，并将研究成果进行开源，将大幅推动国内AI 产业前进。根据暗涌对DeepSeek创始人梁文锋的采访， DeepSeek押注了三个方向，数学和代码、多模态以及自然语言。我们看好在DeepSeek 这类创新型玩家的贡献下，2025年国内大模型整体能力与海外顶尖模型的差距进一步缩小，并以更低的推理成本推动AI技术更广泛更深入的落地。

视频生成模型国内逐渐追平，期待2025年国内进展

相比自然语言大模型，视频生成模型的技术所处阶段更早。2024年随着SORA的发布以及海内外多个玩家的努力，视频生成模型在生成单帧质量、语义与视频内容的一致性以及视频内容时序一致性等方面有所突破，主流视频生成模型基本可以在5分钟以内基于文字/图片生成5秒钟720p的视频；但区别于自然语言大模型，视频模型存在连续性弱、输出随机的局限性，用户难以一次性生成符合预期的视频，其中的技术难点仍需要玩家攻克。

国内玩家逐渐追平海外顶尖水平。海外Google的VEO2模型在生成视频的时长、清晰度和质量（更好的保真度、准确度和相机控制）上都强于SORA。而根据DEEPMIND测试结果，在VEO和其他模型的倾向对比上，偏好快手的视频生成模型可灵和MINIMAX视频生成模型的用户分别占33%和30%，高于SORA的27%，其中在与可灵对比中会偏好谷歌VEO的用户只占一半，我们认为国内头部玩家已逐渐追平海外顶尖水平。可灵2024年6月份发布，是全球首个用户可用的视频生成大模型，在模型能力上持续打磨、快速迭代，实现用户数环比快速增长，根据快手 2024Q3业绩电话会，可灵AI商业化单月流水超千万人民币。进入2025年，我们期待国内以快手为代表的头部玩家在视频生成关键技术上进一步取得突破，推动AI视频在创意/娱乐行业渗透率加速提升。

2、为什么说字节链是最值得重视的AI产业机会之一

TOP级资源+创新者的姿态，字节已成AI领域最激进的玩家

字节已成为目前大厂中在AI领域布局最激进的玩家，给产业链上下游合作伙伴带来新发展机遇。 TOP级资源：1）资金。作为国内头部互联网企业之一，字节强大的资金实力为其AI资本开支、人才引进、多赛道布局等提供支撑；2）流量。根据QuestMobile，字节旗下抖音APP月活近8亿人、单用户每日使用时长超过2小时，此外还有数十款APP，包括今日头条、西瓜视频、懂车帝、番茄小说等等涵盖多个细分领域，流量优势明显，可为其AI应用导流（2024年11月豆包接近90%的用户与抖音APP重合）。创新者的姿态：相比百度、阿里等大厂，字节在大模型领域起步较晚，2023年初才成立首个专注于大型模型研发的团队Seed，同年11月成立新部门Flow专注于AI技术应用。但内部极为重视，已退任CEO的创始人张一鸣亲自下场，定期复盘内部AI进展，并亲自监督AI核心人才招聘。字节在AI领域的激进表现在：不断加码的资本开支、高薪聘请AI顶尖人才（如阿里通义技术负责人周畅，零一万物前算法副总裁黄文灏，面壁智能原核心成员、序智科技创始人秦禹嘉等）、大模型持续追赶、应用领域全方位推进。

字节产业链充满机会：豆包大模型虽非顶尖，但快速追赶

字节的豆包大模型在总体能力上并非国内顶尖，但布局全面，且正在快速追赶。豆包大模型家族2024年快速迭代，且已形成较全面的模型矩阵：7月推出豆包语音识别模型Seed-ASR和语音生成基座模型Seed-TTS，9月推出音乐生成模型框架SeedMusic、视频生成模型PixelDance与Seaweed，12月推出豆包代码大模型Doubao-coder和视觉理解模型，同时豆包大模型上下文窗口提升至300万字的业界极限；25年 1月发布豆包大模型1.5Pro版本，综合能力显著增强，低训练/推理成本，全面提升多模态能力、推理能力，多项公开评测基准上全球领先。根据MMLU等国际权威基准测试以及国内SUPERCLUE测试结果，豆包大模型与国际顶尖大模型、国内头部大模型的差距正逐渐缩小。 2024年，豆包大模型支撑超过50个应用场景，其中豆包成为国内最受欢迎的AI产品，通过火山引擎豆包大模型服务30多个行业，日均tokens调用量超4万亿，较5月增长 33倍。

字节产业链充满机会：降低模型成本，推动应用加速

大厂中字节大模型率先大幅降价，国内大模型价格进入“厘时代”。（1）2024年5月，在Deep Seek和智谱相继降低大模型价格后，字节的豆包大模型也跟进降价，旗舰模型价格降至每 0.0008 元 / 1K input tokens 和 0.005 元 / 1K output tokens，较行业均价降低99.3%，大模型价格进入“厘时代” 。阿里云、百度云、腾讯云随之跟进，阿里大模型降价幅度接近97%，9月再次降价；百度ERNIE Speed、ERNIELite宣布免费，ERNIE 4.0 Turbo定价降70%；腾讯云混元多款大模型推理token降价，降价幅度 50%-87.5%。（2）12月豆包视觉理解模型售价定为0.003元/ 1K input tokens ，比行业均价便宜85％，视觉理解大模型价格进入“厘时代”；阿里也随之跟进。大模型作为AI产业重要基建，其价格降低有望通过更低的试错成本提高企业大模型使用意愿，助力更多开发者开发AI应用，推动国内AI产业加速。

3、字节AI生态及产业机会框架初探

云：火山引擎有望弯道超车，助字节卡位AI时代重要基建

大模型对算力的需求给字节云服务一次弯道超车的机会。

相比阿里巴巴（2011年）、腾讯（2013年）、百度（2015年）、华为（2017年）等大厂，字节向外推出云服务的时间较晚（ 2021年火山引擎正式发布全系云产品），在客户基础、传统云基础产品等方面存在不足。

但随着大模型训练推理需求不断增多，云服务客户还关心大模型相关的AI infra等能力，这方面所有云厂商都在同一起跑线，而火山引擎的迭代速度几乎是厂商里面最快的。火山引擎针对AI infra进行了多项优化（以GPU为中心的AI infra分布式业务体系、使用GPU直接远程内存访问技术等等），推动大模型成本降低，吸引更多细分行业的需求，反过来推动火山引擎寻找更高效云服务方案，实现飞轮效应。此外豆包作为国内日活最高的AI应用，也为火山引擎云服务在AI领域的能力提供标杆案例。

火山引擎在2024年进展飞速： 2024年上半年火山引擎在国内GENAI IaaS服务厂商中排名第2，好于其在整个云服务市场中的排名；根据智能超参数，2024年全年在公开市场中标24单项目，在大模型公司中排名第4，项目较多集中在四季度。火山引擎在大模型领域的增长也带动其传统云计算服务，一定比例的CPU 算力、数据库等需求来自大模型客户。从豆包大模型日均token使用量变化也可以看出火山引擎增长态势：从2024年5月的1200亿增长至12月的4万亿，增长32倍。展望2025年，随着豆包大模型能力增强和成本降低，火山引擎以更高性价比和更专业的GEN AI 云服务拓展更多行业客户，其份额有望进一步提升，助力字节卡位AI时代重要的基建环节。

产业机会：随着云调用量提升，特别是推理需求增加，字节有望加大算力相关投入，服务器、AI芯片、PCB、散热等产业链环节的合作公司有望受益于订单增长。

AI助手豆包：高举高打+优秀用户体验，用户规模与质量双高

豆包是字节基于豆包大模型推出的类chatgpt产品（海外版为cici），相比其他聊天机器人应用，豆包在具备较好模型性能和较全面功能的基础上，提供了优秀的用户体验，实现了更好的用户活跃和留存。叠加大规模买量等原因，豆包应用用户数在2024年6月份之后迎来高速增长，一跃成为全球用户数第2大的AI应用。

豆包移动端提升用户体验的核心能力之一：领先同行的实时语音聊天功能，在情感理解和表达能力等方面表现优秀。2024年7月，基于全新的豆包语音识别模型SeedASR和语音生成基座模型Seed-TTS，豆包大模型能听懂20种以上方言夹杂的对话，学会在说话中表达情感，可随时被打断，能在交互中“插话”，还能保留吞音、口音等人类习惯。2025年1月更新推出实时语音通话功能，根据豆包团队测试结果，豆包实时语音大模型在测试用户整体满意度的评分为4.36，GPT-4o 为 3.18。其中 50% 的测试者对豆包实时语音大模型表现打出满分；在“一听就是 AI 与否”评测中，反馈GPT-4o和豆包实时语音大模型“过于 AI ”的比例分别为超过 30%和2% 以内。模型在情感理解、情感承接以及情感表达等方面取得显著进展，能较为准确地捕捉、回应人类情感信息。

AI教育豆包爱学：建议关注产品重大迭代和用户增长趋势

豆包爱学是一款AI教育应用，原字节大力教育旗下的河马爱学，后更名为“豆包爱学”。2024年9月以来，豆包爱学APP 在iPhone效率APP免费榜排名稳居前20名，下载量和MAU提升迅速。目前国内尚未跑出特别有代表性的AI教育应用，主要系模型幻觉问题难以彻底解决以及教育场景容错率低等原因，但考虑到字节大模型在与学习场景相关的数学推理、空间与计数理解等多项视觉理解基准上性能领先，我们看好豆包爱学后续继续以优于同行的产品体验实现用户快速增长。建议关注大模型推理性能增强对AI教育行业的影响、豆包爱学的重大迭代以及用户增长趋势。

报告节选：

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）