2024年游戏行业专题报告：AI生成3D，关注游戏行业“AI拐点”

国泰君安证券2024/03/27
举报

1. 游戏产品的趋势：3D 化、UGC、碎片化

1.1. 3D 化：3D 建模成为头部产品标配

头部手游已经进入全面 3D建模时代。根据sensor tower 发布的统计数据，过去 48 个月中，曾进入全球手游收入 top10 的游戏共 38 款，上榜超过 10 次的游戏有 16 款，其中大多都涉及到 3D 建模，7 款游戏为绝对头部，上榜超过 30 次，其中 5 款游戏依赖于 3D 建模视角（《王者荣耀》《绝地求生》《ROBLOX》《原神》《Pokemon GO》）。随着手机终端的性能提升和价格下降，玩家游玩 3D 游戏的门槛在持续降低，而 3D 在画面展现的丰富度和美观度上要优于传统 2D，自然会受到更广泛玩家群体的认可。

1.2. UGC 化：平台提供基础玩法，用户自己生产内容

游戏本质是“内容”和“玩法”的体验，后者可重复体验，更容易留住用户。游戏玩家在游戏中希望收获好的内容认知或是游玩体验，大多数游戏都可以在“内容”或“玩法”的二元划分中找到自己更偏向的一级。从近年来的头部游戏产品来看，偏向“玩法”属性的明显更多，如《王者荣耀》《绝地求生》等，这些游戏并不重视故事性，玩家重复体验相似的玩法；而“内容”属性的包括《原神》《PokemonGO》等，玩家更关注主线故事或人设故事的体验。

具体而言,“内容”就是要“讲好一个故事”，游戏通过线性叙述（如各类单机游戏）、丰富而具体的人设（如二次元向、收集类）等获得玩家的认同，因此游戏运营方要持续进行内容更新和投入，如不断推出新内容、资料片，从而延长游戏的内容时长，留下玩家，因此大型 MMORPG 的主线剧情会持续更新，如《剑网 3》需要运营团队十几年来持续保持每年 2-4 次的资料片更新频率，《魔兽世界》的每次更新都伴随着大量的主线剧情的更新，给用户以“追剧”般的体验。而“玩法”核心是“一次好的体验”，玩家重复游玩相似的内容，只是过程和结果不尽相同，玩家希望从游戏中收获的是体验或成就，关注玩法的创新性、体验的顺畅性，所以如 MOBA、“大逃杀/吃鸡”类等游戏，每个赛季的更新主要是推出新主题、新英雄/装备、新装饰/商品，从而丰富玩法中的各类元素，核心工作量在于对游戏模型的更新。如《王者荣耀》每 3 个月为一个赛季，最新的 S34 赛季，贴合新春时期，采用了 “天穹节”的设定，相应推出了一系列皮肤、战令计划、组队功能方面的更新，而核心玩法或者剧情并没有大幅变化。

UGC 已经成为过去十年新玩法出现的重要来源。近年来的头部游戏中， “MOBA”、“大逃杀/吃鸡”、“自走棋”等玩法占据重要位置，相对传统的 MMORPG、三消、卡牌等玩法，已经成为了重要的游戏类型，这些玩法都是脱胎于玩家的二次创作，或是借助成熟游戏中的 UGC 功能，是玩家创意的体现，玩家会通过 MOD 的形式修改游戏的外观或玩法，一些游戏产品官方直接提供各类 UGC 板块，如地图编辑器、创意工坊等，玩家可以通过对游戏提供的现有元素进行组合，设计出新的玩法，再进行发扬光大，形成了最后商业成熟的玩法。

如“MOBA”就是来自《魔兽争霸》的地图编辑器。“MOBA”也被称为“类 DotA”，其原型来自经典即时战略游戏《魔兽争霸》中地图编辑器的一张地图《defense of the ancients》，该地图奠定了上中下三路防守、攻破对手大本营、操控单一英雄升级和购买装备等基本玩法要素，经由《Dota》、《Dota2》《英雄联盟》《王者荣耀》等产品一路发展至今，核心玩法基本没有改变，可以说“MOBA”的核心就是来自玩家创意。再比如“大逃杀/吃鸡”玩法来自《武装突袭》的玩家 MOD。“大逃杀/ 吃鸡”出处是日本电影《大逃杀》中提到的竞争淘汰机制，游戏《武装突袭》的 DayZ MOD 设定了拾取随机装备、压缩生存空间、最后一人胜出的玩法，爱尔兰玩家格里尼做了进一步设计，将原 MOD 中的僵尸元素剔除，形成了如今拾取枪械和物资、对抗其他竞争者的形态。之后《DayZ》独立成为一款游戏，这种玩法也出现了更多竞品，如《H1Z1》《PUBG》，甚至手游端的《小米枪战》《荒野行动》《和平精英》，在这个基础上也增加了很多其他元素，衍生出包括《APEX》《堡垒之夜》《永劫无间》之类的“吃鸡+”的玩法。

除了玩法外，玩家也可以通过逻辑和剧情触发的方式创造内容。如《魔兽争霸》的编辑器提供了剧情触发的选项，通过角色的动作设计和镜头设计，玩家可以调整画面观察视角，使用 3D 模型演绎事先编辑好的剧情。像素风的模拟创意游戏《Minecraft》中，大量玩家借助基本元素搭建自己的地图世界，制作游戏，甚至制作剧集内容，如 2014 年由神游八方制作的《我的三体》第一季，前 8 集由初期团队借助《Minecraft》的游戏引擎制作而成。

1.3. 碎片化：小游戏崛起，适合更广泛受众的轻量需求

由于网络基础设施改进和供给的极大丰富，移动互联网用户注意力被短视频为代表的碎片化内容进一步分散。从使用时长占比上看，短视频的时长占比从 2019 年的 15.2%逐年提升到了 2022 年的 28.5%，即时通讯与在线视频的时长占比被相对压缩。

类似短视频，小游戏由于轻量化、便捷的特点，近几年活跃度明显提升。用户规模角度来看，截至 2023 年 6 月，微信小游戏累计服务用户超 10 亿，MAU 超 4 亿，背后是截至 2023 年达到 30 万的庞大开发者群体。

抖音方面，截至 2023 年 12 月，抖音 DAU 超 6 亿，其中小游戏人群占比 49%，抖音小游戏 DAU达 3 亿，相比 2021 年的 0.8 亿增幅超过 200%。抖音小游戏榜 Top50 中，一半左右的游戏为偏轻度玩法。近两年来抖音小游戏活跃用户增长迅速，2023 年增速较上年增加近 3 倍。

小游戏吸引了更多原本不玩游戏的用户，扩大了游戏基本盘。根据微信公开课 PRO，微信小游戏的用户中，游戏流失用户及非游戏用户来源占比分别为 41%和 22%，仅 37%为原本游戏活跃用户。

小游戏玩家付费仍有提升空间。在 2022 年的调查中发现，纯小游戏付费用户单价整体较低，53.2%只玩小游戏的用户每月在游戏中消费金额不到 50 元，相对而言，纯 APP 游戏的付费用户中 70%以上的月花费超过 50 元，说明近期还在培养消费习惯的阶段。

微信小游戏市场或将在 23 年达到 400 亿，关注变现成长趋势。小游戏依托微信、抖音等超级流量平台，借助“点击即玩”的轻量模式，快速触达大量用户，又以简单、快节奏、高粘性的玩法留存，用户规模长足增长，市场已经迈过了发展的早期阶段，微信小游戏市场规模预计 2023 年可达 400 亿以上，增速达 50%，体现了这一细分方向的潜力。

2. “AI 生成 3D”作用于核心环节，可影响 B/C 两端

2.1. 目前生成式 AI 多作用于游戏的脚本、原画设计等环节

游戏产品是文本、图片、音频、视频、动画、编程代码等多种内容形式的综合，从规划到上线运营涉及复杂的生产过程，一般而言可划分为四个环节：

1）概念阶段，主要是文字形式，如各种提案、脚本的文档，策划人员需要讨论并确立游戏项目的玩法、世界观、风格等主基调方向，从而完成系统、剧情、关卡等内容的策划工作，为后续的正式开发奠定基础，因此该内容需要尽量详细和严谨。2）demo 开发，一般涉及简单的开发工作，开发者会做出一个“草稿” 从而对策划概念进行验证和调整。 3）开发阶段，一旦确认游戏的方向，产品进入正式开发，就涉及到程序（代码）、美术（图像、3D、视频）、音频音效等多个生产环节，中间也会有各种测试，这一阶段也是游戏生产需要人员、时间、金钱最多的环节。 4）上线运营阶段，游戏开发完毕后上线，进入宣发和运营状态，游戏产品与其他内容产品的一个巨大差异在于，其上线后仍然需要持续更新和维护，如推出新资料片、新的付费项目等，或多或少仍然涉及各类开发工作。

生成式 AI 经历一年多发展，但目前仍主要用在文本、图像环节。游戏行业使用 AI 由来已久，如画面渲染、程序逻辑等环节，AI 可以辅助提升效率，而随着 2023 年 ChatGPT 为代表的生成式 AI 大发展，这种辅助作用呈现扩大化、低门槛化的趋势。由于 AI 在不同领域发展水平不一，在游戏的不同环节发挥的作用也有不同。脚本设计、文档写作、智能 NPC：相对最成熟的文本类 AI（ChatGPT、 NewBing、文心一言等）已经可以较好的胜任脚本写作等工作内容，甚至一定程度上接管智能 NPC 的角色。代码编写：GitHub Copilot 等 AI 依据庞大的代码数据训练基础，能够一定程度上扮演程序员的辅助角色。美工：画图 AI 如 Midjourney、SD、DALL-E 等也已经能够较好完成任务，AI 绘图已经较多用于素材、原画、宣传图等。视频动画：Runway、Pika 等工具的生成长度和一致性相对还不成熟，更多用于要求不高的宣传材料上，模型设计：暂不能形成足够质量的内容，目前只能用作参考辅助用。

2.2. B 端：3D 生产过程复杂，生成式 AI 可极大改进效率

3D 模型的生产一般包括多个环节，建模的上游是策划和美工提供的概念设计，基于对方给定的原画、2D 概念图，建模师需要构思出 3D 造型并通过多个建模软件逐步实现，整体而言要经历模型设计（制作中模、雕刻高模、拓扑低模）、UV 拆分、贴图、绑定骨骼、制作动画等过程，然后再交给工作流下一环节的程序员，进行代码编辑和导入引擎，建模过程可能用到 MAYA、Zbrush、Substance Painter 等多个软件，上手难度较大、耗时较长。

3D 模型制作效率提升对大型游戏进展有重要影响。以 2024 年初大卖的 Steam 游戏《幻兽帕鲁》为例，根据创始人的分享，其一开始制作时，一个建模师制作一个帕鲁（游戏中的生物）的 3D 模型花费了一个月，由于不同帕鲁的体型差异巨大，骨骼匹配无法简单复用，每个帕鲁需要独立设计动作，每个帕鲁需要约 20 个动作，按照每个动作 1 天工作量，则还需要额外的 20 个工作日。该游戏中共有 100 余种帕鲁，如果全都按照原有方式制作，理论上完成全部 100 个帕鲁模组需要花费 5000 天以上，而游戏工作室最终在 3 年时间完成了这部作品。影眸科技发布的演示视频展示了其 Rodin Gen-1 模型的使用效果，能够借助图生 3D 的能力，直接拖拽一张宝可梦图片，通过选项生成提示词，在 10 秒内完成一个表面光滑、细节尖锐的高质量白模。

2.3. C 端：一键定制化模型，高自由、低门槛 UGC 游戏可期

游戏内容制作的效果一般与制作难度成正比，前者体现为自由度、精美程度等，后者则体现在工具上手难度等，游戏内容制作包括多种类型：专业游戏制作人员开发的游戏，效果最强，但也需要用到各类编程、建模的专业开发，专业性极强；其次是 MOD 开发，一般来自第三方团队或比较有技术力的个人，官方也可能参与其中，是以游戏补丁的形式添加进游戏内容；再次是各类创意工坊或地图编辑器，沙盒类游戏会鼓励玩家利用这类功能进行创作，并与其他用户交流；最低的是面向玩家的游戏内的创造玩法，如搭建房屋、制作道具等，作为玩法的一部分，组合和功能一般有限，但是上手难度也极低。

“一键生成”式的 3D 创建可降低创作门槛到 C 端，打破制作效果和制作难度的正相关性。“AI 生成 3D”的进步或将直接影响创意工坊/地图编辑器的运行逻辑，通过一键生成定制化 3D 模型的方式，UGC 效果有望提升至 MOD 开发的水平，而上手难度能够降低至“游戏内创造玩法”，从而打破效果与难度的相关性，帮助游戏玩法丰富化、内容厚度提升。

3. 技术积累、新工具频出，“AI 生成 3D”或有加速

3.1. 技术积累：数据积累触及突破边缘，各模态依序推进

3.1.1. Objaverse 与 OpenUSD 推动训练数据积累

3D 资产数据集 Objaverse-XL 达到千万级别，且具备较强多样性。2023 年发布的 Objaverse-XL 包含约 1020 万个 3D 模型，远超过半年前 Objaverse 1.0 的 80 万个，相比目前 2D 图像领域最大的开源数据集 LAION 还有较大差距，但这一数量级已经接近 ImageNet，后者是当前多个图像人工智能模型的训练基础数据集。从构成来看，Objaverse-XL 包含的 3D 模型主要从 Github、Sketchfab 及 Thingiverse 等平台爬取，包括手动设计的物体、地标和日常物品的摄影测量扫描，以及历史和古董的专业扫描，具备相当强的多样性。这意味着“AI 生成 3D”的数据限制已经接近突破。 Objavers 已经催生出了一些 3D 生成模型。2023 年 12 月 14 日，图片生成 3D 模型 Stable Zero 123 发布，Stability.ai 从 Objaverse-XL 中筛选出高质量、精确和数据标注准确的模型，以便 Stable Zero 123 在生成过程中更有效地理解和创建 3D 模型。单图生成 3D 模型的 TripoSR 基于 LRM 原始算法，并通过精细筛选和渲染的 Objaverse 数据集子集以及一系列的模型和训练改进，显著提高了从有限训练数据中泛化的能力，增强了 3D 重建的保真度。3 月 19 日，基于视频扩散模型的 3D 生成模型 Stable Video 3D（SV3D）发布，其同样使用 Objaverse 数据集训练。

OpenUSD 联盟力推 3D 格式标准统一，成员数量规模持续扩大。3D 应用广泛，但由于场景丰富、生产环节繁多，长期缺乏统一的标准和格式。 2023 年 8 月，皮克斯、Adobe、苹果、Autodesk、NVIDIA 与 Linux 基金会下属的联合发展基金会共同宣布成立 OpenUSD 联盟（AOUSD）， OpenUSD 联盟旨在通过提升 OpenUSD 格式的发展来推动 3D 生态系统标准化，NVIDIA 宣布将通过 NVIDIA Omniverse 与新的技术组合、 ChatUSD 和 RunUSD 等云应用编程接口（API）以及全新 NVIDIA OpenUSD 开发者计划来推进 OpenUSD 的发展。2023 年 12 月，AOUSD 宣布新增 Cesium、IKEA 等 12 位成员，2024 年 3 月又增加 Intel、Siemens 等 8 名成员，联盟成员规模进一步扩大。我们认为 USD 格式的推广有利于 3D 模型数据的积累，对 3D 生成相关 AI 算法的推进有基石作用。

在 GTC2024，将有 7 场会议讨论 OpenUSD，涉及其与生成式 AI 的结合（NVIDIA）、与 Adobe 的集成（Adobe）、半导体制造厂数字孪生（三星）、 AI 视觉（西门子）、实景娱乐产业（Moment Factory），英伟达表示将继续投资发展 USD 在媒体、娱乐等行业工作流中的应用，以实现工业数字化工作流以及下一代计算机视觉和生成式 AI。

AOUSD 计划 2024 年完成核心规范审查和反馈修订。根据 AOUSD 官方发布的时间表，24 年第一季度，AOUSD 将发布核心规范的初步大纲，经过 Q2 和 Q3 的正式审查后，在 Q4 发布修订，最终在 2025 年 Q3 之前完成最终批准。

3.1.2. “视频生成”扩大到场景层面，将与“3D 生成”相互促进

“视频生成”扩大到场景层面，需要 3D 重建技术来保证一致性。视频生成技术在 2023 年底以来快速发展，Runway Gen2、Pika 1.0、sora 的效果和视频内容丰富度持续提升。不同于早期的单一物体对象和小幅度运镜，仅需要在生图过程中通过 Control Net 等方式，即可满足物体层面的一致性水平要求，sora 将行业标准抬升到穿梭镜头、航拍镜头的水平，这种时候只有通过 3D 重建，才能确保场景的一致性，因此视频生成的进步会反过来要求和促进 3D 生成的发展。 OpenAI 文生视频模型 Sora 可体现物体关系雏形。2 月 16 日，OpenAI 发布文生视频模型 Sora，据官方介绍，此次发布的 sora 是一个 diffusion Transformer 模型，从效果上而言：1）其能够生成具有多个角色、特定运动类型、主体和背景的准确细节的复杂场景，模型能够理解物品是如何存在于现实世界中的；2）模型对语言有深度理解，使得其能够精准解析提示词，从而生成有生动情感的角色，能够保持高度一致性的生成多个镜头。

部分演示视频被认为体现了 3D 关系的雏形。在 Sora 生成的“海盗船在咖啡杯中缠斗”视频中，两艘微缩船只在“咖啡海”中互相追逐环绕，视频体现了液体的动力学效果，包括波浪和船只移动时液体的流动，还需要精确模拟光线，包括咖啡的反光、船只的阴影，以及可能的透光效果，展现了“类 3D”的效果。而在“视频拼接”功能的展示中，基于给定的“西部世界”和“海底城市”两端视频，sora 可以借助物体的遮挡关系，在运镜后展示“西部世界”背后的“海底世界”，从而实现拼接的效果，这个过程中也展现了模型对于物体相对关系的理解。

图像生成 3D 视频模型 Stable Video 3D 明确融合 3D 重建技术。2024 年 3 月 19 日，Stability AI 开源了 SV3D，包括两个版本： SV3D_u，支持单个图像生成轨道视频，无需相机调节； SV3D_p 扩展了 SVD3_u 的功能，支持单个图像和轨道视图，从而可以生成沿特定的摄像机路径创建 3D 视频。 SV3D 的生成质量、多视角、一致性等相比之前的 Stable Zero123、 Zero123XL 都有大幅度提升，该模型就是借助了其视频模型 SVD 模型优秀的视频生成能力，提升了 3D 重建水平，从而确保 3D 视频的一致性。

3.1.3. 3D 生成显著落后其他模态，具备向上压力

一个内容形态下的 AI 产品发展可以划分为三个阶段，分别以“模型”、 “产品”、“成本”为中心，这是由数据的积累和应用落地的逻辑而形成的变化：“模型效果”阶段会有层出不穷的新模型（特别是开源）超越之前的模型；而到了“产品落地效果”阶段，AI 产品开始考虑用户体验，从而获取更多的用户和数据反馈，形成持续改进；最成熟的“成本压缩” 阶段，AI 产品已经具备数据基础，开始降价或实质降价，进行市场份额竞争和利润获取。 3D 形态是目前 AI 生成领域最早期的阶段，模型层面还未定型，将吸引更多关注。相比之下发展阶段最靠前的是文本形态，已经在尝试成本压缩；图片生成也已经基本稳定技术路径，开始关注产品使用门槛；视频生成仍在尝试确立技术效果标准的初期，sora 有望确立标杆。

3.2. 工具端：“AI 生成 3D”产品开始密集突破

3.2.1. DUSt3r、TripoSR 可以利用简单照片生成 3D 模型

DUSt3R 可通过简单照片生成 3D 场景重建，或可改变原有生产流程。该工具不需要任何相机校准或视点姿势的先验信息，就可以完成任意图像的密集或无约束 3D 重建。据用户实测，通过 2 张照片，该工具可以在 2 秒钟之内重建场景，可生成 3D 图、深度图、置信度图和点云图，实际测试中还发现，即便是输入两张没有任何重叠内容的图像，甚至输入图像来自两个不同相机，都能够实现构建。该项目在在单目/多视图深度估计以及相对位姿估计三个任务上，均取得最优成绩。 TripoSR 可将单张图片转换为 3D 模型，推动 3D 内容创作可能性。3 月 5 日，Stability AI 宣布与华人团队 VAST 合作发布 TripoSR，只需短短的 0.5 秒，TripoSR 就能把单张图片转化为一个几何结构完整、材质纹理清晰的 3D 模型。和 Sora 作为视频生成模型使用的 Transformer 架构相似， TripoSR 基于 Transformer 架构，这种方式将图像生成 3D 模型的任务理解为一场跨维度的语言翻译，认为每一张输入的图像都是一种独特的语言，模型的任务则是将这种图像语言翻译成 3D 模型语言。从不管是人物角色、家装建筑、食物摆件，TripoSR 都能理解和还原，无需任何 prompt 和专业知识，甚至无需依赖 GPU，能够输出可视化的详细 3D 物体。

3.2.2. 英伟达 ACE 利用生成式 AI 改变玩家与 NPC 的互动

NVIDIA ACE 可帮助开发者利用生成式 AI 创建虚拟数字人物。2023 年 COMPUTEX 展会上，英伟达发布了“NVIDIA Avatar Cloud Engine (ACE) 游戏开发版”，该 AI 工具基础模型由三部分构成，包括 NeMo、Riva 和 Audio2Face，分别提供语言模型、文字语音识别和转换、基于音频创建面部动画的能力。

CES 2024 上，英伟达宣布推出适用于 NVIDIA Audio2Face (A2F) 和 NVIDIA Riva 自动语音识别 (ASR) 的 ACE Production Microservices。英伟达指出，生成式 AI 技术将彻底改变游戏，让 NPC 不再局限于预先录制的脚本，而是能与玩家进行有意义的互动。

借助 ACE 和生成式 AI 技术，NPC 的构建和互动方式有望改变。以 2023 年首次公开的 NVIDIA KAIROS 为例，其利用 NPC 开发平台 Convai 创作完成，创作过程中利用 NVIDIA Riva 完成语音转文本和文本转语音功能，利用 NVIDIA NeMo 为其对话式 AI 提供支持，并利用 Audio2Face，在 AI 助力下通过语音驱动面部动画，以上模组无缝集成到 Convai 服务平台中，并馈送到 UE 5 和 MetaHuman 中，最终玩家可以通过麦克风直接与 NPC 进行自然流畅的对话，NPC 在语音回答时会做出相应的唇形、表情和动作，甚至直接采取行动，如递上一碗拉面、关上灯等。除了 Convai 之外，Charisma.AI、Inworld、米哈游、网易游戏、掌趣科技、腾讯游戏、育碧、UneeQ、完美世界等开发者都在积极迎接 ACE。

3.2.3. 谷歌 Genie 提供 2D 层面的“图生游戏”雏形

谷歌发布 110 亿参数基础世界模型 Genie，可通过单张图像提示生成可玩的交互式环境。2024 年 2 月 26 日，谷歌发布其 110 亿参数基础世界模型 Genie（精灵）。Genie 学习了 20 万小时的未标注互联网视频，无需监督即可训练，可以使用其以前从未见过的图像作为提示，无需任何动作标注，便可以确定谁是主角，并让用户能够在生成的世界中对其控制。

Genie 由潜在动作模型、视频分词器，以及自回归动态模型三大核心组件构成。Genie 由三大组件构成，1）潜在动作（latent action）模型，用于推断每对帧之间的潜在动作；2）视频分词器（tokenizer），用于将原始视频帧转换为离散标记（token）；3）自回归动态模型，用于在给定潜在动作和过去帧标记的情况下，预测视频的下一帧。由此产生的学习潜动作空间，不仅实现了用户交互，还有助于训练智能体模仿看不见的视频中的行为。 Genie 未来将从游戏领域扩展至其他领域，应用前景广阔。Genie 是一种全新的生成式 AI 范式，能够从图片、草图到真实世界图中生成可玩世界。与动作不可控的 sora 相比，Genie 是由行动驱动的世界模型，具有推断行动的能力，能够以从未见过的图像作为提示，创建和播放人们幻想中的虚拟世界。谷歌指出，虽然 Genie 目前的展示主要在游戏上，但其未来应用远不止于此，它是一种通用的方法，可以应用于多个领域而不需要额外的领域知识。

4. 游戏落地前瞻：行业多个方向或发生积极变化

4.1. “开放世界”首先受益

从效率提升角度来说，对 3D 需求越大的将受益越多，因此游戏地图面积广阔、内容丰富、模型众多的“开放世界”游戏将显著受益于“AI 生成 3D”的突破，特别是游戏自身的更新周期加快，如大量的 3D 资产搭建需求可以加速完成。 “开放世界”的“大地图、多内容、高销量”。当前主要开放世界产品包括 NS 平台的《塞尔达传说：王国之泪》（2023），PC 与主机端的《荒野大镖客》（2018）、《GTA5》（2015），多端开放的《原神》（2020）等，开放世界游戏不限制玩家的游玩路线，无过渡的全地图探索，提供了充足的可玩性，很多游戏上线多年仍然受到玩家热烈喜爱，销售成绩方面也极为突出，如《GTA5》在 8 年间卖出超 6000 万份，《原神》全球销售额超过 40 亿美元。 “开放世界”游戏需要极大的投入，特别是美工、建模人员众多。从游戏体积来看，几款主要“开放世界”游戏的安装体积都高于同平台游戏，主机端大多在 80-100G 之间，以手机端为主的原神也达到 40G；同时， “开放世界”游戏的地图提供充分的自由度，因此可游玩面积十分广阔，可体验的内容时长也相对丰富，这些都需要大量的 3D 模型来填充地图或是支撑起剧情的内容演绎，也就构成了对美工、建模的需求。

如《荒野大镖客 2：救赎》耗资超过 5 亿美元，制作周期 8 年，地图规模 28 平方英里，NPC 数量多达一千，其开发团队（不含外包）约 1200 人，主要由程序员和美工构成；《异度神剑》开发商 Monolith 工作室官网显示共有员工 264 人，美工人数最多，达到 51%，其次是程序员（16.3%）、策划（15.9%）；知名媒体游戏葡萄称，《原神》项目研发第三年，团队超 300 人，含 100 多位美术、30 多位策划、60-70 位程序及其他，米哈游刘伟也提到《原神》项目团队在 19 年底已经增至 400 人。

游戏公司仍在加码“开放世界”赛道。近年来，以《GTA5》《塞尔达传说：旷野之息》《原神》等为代表的一批“开放世界”游戏获得了极大的关注度和商业成功，诸多国内手游公司也积极布局，除了已经上线的《原神》《幻塔》《逆水寒》之外，腾讯、网易、米哈游、叠纸均有基于特定 IP、主题或玩法要素的“开放世界”项目在持续推进。

4.2. 更多、更好的游戏“UGC”

4.2.1. “大 IP 的 UGC 化”：形成 IP 的“内容-影响力”循环

大 IP 产品适合进行 UGC 模式的探索：1）UGC 就是在用“玩家群体的创意”去补充“游戏团队的创意”，UGC 能够切实丰富玩家可体验的内容，也有利于 IP 影响力的提升；2）大 IP 产品一般具备优质的基础设施，特别是精细、丰富的原作参考或是现存建模资产，UGC 的原材料相对丰富；3）大 IP 产品有充足的用户群体，足够多的用户基数能够提供持续、庞大的创意基数；4）IP 号召力，能够激发玩家的初期积累和“二创” 热情，如《幻兽帕鲁》就是以贴近“宝可梦”的风格快速吸引大量新用户。《堡垒之夜》、《原神》等游戏已经开始探索 UGC 的设计。海外的热门游戏《堡垒之夜》，也积极拓展游戏编辑模式，其与 unreal 合作推出的内容编辑器 Unreal Editor for Fortnite，已经能够吸引专业游戏开发者加入 UGC 生态，甚至已经有 3A 游戏团队选择在堡垒之夜游戏内直接做新游戏。米哈游也已于近期在官方放出 UGC 相关的系统策划、关卡策划、战斗策划等岗位的招聘需求，明确提到：“需要熟悉不同的 UGC 产品的编辑器以及对应的生态”“具备引擎底层应用水平，有能力将完整关卡拆分为小颗粒度的零件，使其在更多模块适用”。米哈游发布的招聘公告还强调：“参与制作的内容，将是与《原神》主体同等重要的模块”，充分体现了其加码 UGC 的决心。

4.2.2. “UGC 平台 IP 化”：玩家群体创意共建IP

国内外优质沙盒游戏已经证明了 UGC生态对IP的塑造作用。《ROBLOX》《MINECRAFT》《蛋仔派对》等沙盒产品以高自由度为特色，辅以优良的创作者生态，官方提供曝光、话题度甚至物质激励，构成独特的 UGC 和 PUGC 生态。如《ROBLOX》自身并没有很强的 IP 设定，主要依靠自由的玩法，吸引了广大年轻用户的认可，用户规模持续走高，截至 2023Q4，用户日活规模已经达到 7150 万，2023 年其用户中 16 岁以下占比达 58%，而近几年趋势也可看出，年轻用户的认可在逐步转移到更成熟的用户，25岁以上占比从2020年的14%提升到了18%，《ROBLOX》正在持续拓展其影响范围。《蛋仔派对》同样是来自网易的原生 IP，在持续不断的 UGC 经营下，生态极大丰富，相应的形象认知度也得以提升，再辅以推广、联名活动等，将形象成功打造成了 IP。

AI 的出现能够提升 UGC 质量和门槛。如《蛋仔派对》已经开始尝试在工坊模式增加 AI 功能，借助“万能生成器”功能，玩家只需要给出自己想要的物品的关键词，AI 就会基于现存的模块进行组合，拼出符合要求的模型，这有利于玩家多元化的创意表达，同时也降低了用户使用的门槛。

4.3. 重视“创意兑现”逻辑：发行、运营与小游戏

对于发行和运营公司而言，业务重点是发现下一个“Dota”或“自走棋”。近期生成式 AI 领域变化频出，文生图领域 DALL·E、SD3 进一步精进，文生视频有 sora 拉高行业水准到 60s，纯文本领域也有国产大模型 Kimi Chat 将文本理解长度大幅扩展至 200 万字上下文，这些都会对游戏的生产形态和产品供给带来增量。小型项目供给预计会增加，“玩法孵化” 可能催生新的玩法，需要公司能够快速反应，关注“创意兑现”，能够率先识别潜力项目，具备强大的发行对接能力、突出的项目或 IP 运营能力的公司可以受益供给端的丰富化。小游戏仍然是不可忽视的平台。除了前文讨论的小游戏蓬勃发展的行业背景之外，“AI 生成 3D”带来的产业加速也对小游戏为代表的轻量化产品具备价值，产品形态可能进一步轻量化甚至模糊游戏与“互动应用” 的界限，借助流量平台强大的分发能力，小游戏可能发展为“游戏版抖音”，市场价值或有进一步发掘的空间。

4.4. MR 平台或有新变化

新的硬件、新的交互方式、对应新的游戏玩法。在主机时代，操控方式是手柄，游戏的操纵维度相对有限；随着 PC 逐渐成为游戏的重要载体，键鼠的交互方式下，射击类、即时战略、ARPG 等需要比较复杂、精准操作的游戏类型发展起来；手机、平板等硬件则让触摸屏成为了新的交互方式，早期出现的是《水果忍者》《神庙逃亡》等读取手指动作的便携游戏；VR 也催生了《节奏光剑》等空间互动游戏。 MR 出现后，游戏的交互方式和内容也会迎来变革，大量 3D 内容需求可借助 AI 满足。在立体显示的空间环境里，三维空间手势交互更加重要，游戏内容预计会全面 3D 化，以适应虚拟和现实的结合趋势，AI 生成 3D 的需求会极大提升；语音交互的重要性也会提升，因此更需要有 AI 能够通过简单的自然语言指令，生成对应的反馈乃至动作，如要生成一个虚拟物品，缺少了键鼠的精准控制，比较合适的工作流程是通过自然语言描述让 AI 直接进行生成，同样构成了“AI 生成 3D”的适用场景。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）