2025年DeepSeek领衔大模型创新,数字科技政策与产业协同发展

1. 政策环境与支持

在国家层面,国家发改委、工业和信息化部以及国家数据局等密集发布了多项数字 科技政策文件,涉及到数据基础设施建设、企业数据资源开发利用、数据标注产业高质 量发展以及人工智能赋能新型工业化等多个方面,为加快推动新质生产力发展和进一步 促进数字经济与实体经济深度融合提供了有力支撑。 2025 年 2 月 10 日,国务院总理李强主持召开国务院常务会议时提出,要把提振消 费摆到更加突出位臵,促进‚人工智能+消费‛、健康消费等,持续打造消费新产品新场 景新热点。2 月 20 日,李强总理主持国务院第十二次专题学习时进一步强调,要大力 促进科技消费,用好我国应用场景丰富、技术迭代能力强等优势,加快人工智能技术推 广,释放人工智能终端产品等消费潜力。

1.1统筹布局国家数据基础设施,夯实数据要素价值释放基础

国家数据基础设施是从数据要素价值释放的角度出发,面向社会提供数据采集、汇 聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,是集成硬件、软 件、模型算法、标准规范、机制设计等在内的有机整体。纵观人类经济发展史,每一轮 产业变革都会孕育新的基础设施。数字经济时代,网络设施、算力设施、应用设施等构 建了数字基础设施。当前,数据成为关键生产要素,催生新的技术—经济范式,重塑产 业发展方式,推动数字基础设施向数据基础设施延伸和拓展。建设和运营国家数据基础 设施,进一步促进数据‚供得出、流得动、用得好、保安全‛,对于支撑数据基础制度 落地、构建全国一体化数据市场、培育发展新质生产力具有重要意义。 2025 年 1 月 1 日,国家发展改革委、国家数据局、工业和信息化部联合印发†国 家数据基础设施建设指引‡明确提出,利用 2—3 年左右时间,围绕重要行业领域和典 型应用场景,开展数据基础设施技术路线试点试验,支持部分地方、行业、领域先行先 试,丰富解决方案供给。到 2029 年,基本建成国家数据基础设施主体结构,初步形成 横向联通、纵向贯通、协调有力的国家数据基础设施基本格局,构建协同联动、规模流 通、高效利用、规范可信的数据流通利用体系,协同构筑数据基础设施技术和产业良好 生态,国家数据基础设施建设和运营体制机制基本建立。

根据†国家数据基础设施建设指引‡,国家数据基础设施具有数据采集、汇聚、传 输、加工、流通、利用、运营、安全八大能力。其中,数据流通利用设施是 国家数据基础设施的重要组成部分,为跨层级、跨地域、跨系统、跨部门、跨业务数据 流通利用提供安全可信环境,包括可信数据空间、数场、数据元件、数联网、区块链网 络、隐私保护计算平台等技术设施。 †国家数据基础设施建设指引‡提出了五大重点建设方向: 一是建设数据流通利用 设施底座。按照统一目录标识、统一身份登记、统一接口要求,建设数据流通利用设施 底座。建立覆盖政府、行业、企业等主体及国家、省、市、县等层级的全国一体化的分 布式数据目录,形成全国数据‚一本账‛,支撑跨层级、跨地域、跨系统、跨部门、跨业务的数据有序流通和共享应用。建立全国一体化的分布式数字身份体系,规范身份标 识生成、身份注册和认证机制。建立统一的数据资产凭证、交易凭证结构、生成与验证 机制,支持利用区块链、加密技术、智能合约等手段提高凭证的可溯性和信任性。构建 标准化、规范化的交互接口,实现数据基础设施的互联互通。二是建设数据高效供给体 系。在数据标注产业的生态构建、能力提升和场景应用等方面先行先试。链接公共数据, 主动公开的企业数据和个人数据,以及各类高质量数据集,对社会形成统一的数据资源 开放目录。研究制定高质量数据集建设相关标准,从数据生成、注释定义到数据管理的 全过程,确保数据标注的准确性和数据模型的专业性。制定高质量数据标注与交付规则, 提高训练数据质量。支持农业、工业、交通、金融、自然资源、卫生健康、教育、科技、 民航、气象等行业领域打造高质量数据集。三是建设数据可信流通体系。建立高效便利 可信的数据流通机制,促进数据大规模、低成本、安全自由流通。支持建设企业可信数 据空间、行业可信数据空间、城市可信数据空间,探索建设个人可信数据空间、跨境可 信数据空间。支持基础好、有条件、意愿强的行业和城市,先行先试数场建设。鼓励行 业、地方积极探索建设区块链网络、隐私保护计算平台等新技术设施。四是建设数据便 捷交付体系。加强数据交易场所体系设计,统筹数据交易场所优化布局。支持数据交易 场所创新发展,鼓励各类数据进场交易。构建集约、高效的数据交付基础设施,为场内 集中交易和场外分散交易提供低成本、高效率、可信赖的数据交付环境。促进各类数据 交易所、交易平台互联互通。五是建设行业数据应用体系。加强场景牵引,建设面向工 业制造、现代农业、数字金融、智慧医疗、智慧交通、跨境物流、航运贸易、卫生健康、 绿色低碳、气象服务、数字文化等重点行业领域的数据应用体系,发挥企业主体作用, 促进行业数据应用创新。

国家数据局数字科技和基础设施建设司司长杜巍在 2025 年 1 月 6 日国家数据局新 闻发布会上指出,国家数据基础设施是制度、技术、应用的有效承载,是释放数据价值 的物理依托,数据流动量每增加 10%,将带动 GDP 增长 0.2%,数据流动对各行业利 润增长的平均促进率为 10%左右。当前我国进入了以数据为关键要素的时代,对基础设 施提出了新的更高的要求,建设国家数据基础设施成为释放新时代‚数据石油‛价值的 关键。 算力是推进数据基础设施建设、发挥数据要素价值的重要基础,算力设施对于支撑 各行业数字化转型升级、赋能科技创新进步、实现社会高效治理具有重要意义。国家发 展改革委高技术司副司长赵志丹表示将从统筹推进算力资源一体化布局、深化算力与行 业融合应用、推进算力与绿色电力协同发展三个方面加快推进算力基础设施建设,更好 发挥算力的底座支撑作用。工业和信息化部信息通信发展司副司长孙姬指出,工信部将 加强与国家发展改革委、国家数据局协作,按照‚点、链、网、面‛的工作思路体系化 推进相关工作,持续提升算网综合供给能力。一是稳步推动优化算力布局,实现算力中 心‚单点提质‛。二是着力强化技术协同创新,促进算力产业‚串珠成链‛。三是适度超 前建设网络设施,加快网络升级‚连算成网‛。四是持续丰富算力应用场景,引导模式创新‚全面赋能‛。面向重点行业领域,培育推广一批带动性强、示范效应突出的算力 应用场景。 我们认为,†国家数据基础设施建设指引‡提出形成全国数据‚一本账‛,是对党的 二十届三中全会关于‚建设和运营国家数据基础设施,促进数据共享‛部署的有力落实, 为指导推进数据基础设施建设,促进开放共享、释放数据价值以及加快推动新质生产力 发展提供了重要的制度保障。

1.2加快基础性制度供给,着力推动数据产业高质量发展

当前数据作为新型生产要素已经深刻融入经济社会各领域,加快构建以数据为关键 要素的数字经济,离不开强有力的数据产业的支撑。近期国家数据局会同多个部门连续 发布了†关于促进企业数据资源开发利用的意见‡†关于促进数据产业高质量发展的指 导意见‡†关于促进数据标注产业高质量发展的实施意见‡†关于完善数据流通安全治理 更好促进数据要素市场化价值化的实施方案‡等多项文件,为继续深化数据 要素市场化配臵改革,推进企业数据资源开发利用,加快发展壮大数据产业,进一步完 善数据流通安全治理提供了有力支撑。

†关于促进企业数据资源开发利用的意见‡从健全企业数据权益实现机制、培育企 业数字化竞争力、赋能产业转型升级、服务经济社会高质量发展、营造开放透明可预期 的发展环境等五个方面作出具体部署,以深化数据要素市场化配臵改革为主线,以激发 企业创新活力为关键,以健全企业数据权益实现机制为重点,充分发挥企业主体作用, 分类推进企业数据资源开发利用,提升企业竞争力,赋能产业数字化转型,助力提升治 理效能和公共服务能力,为培育新质生产力、推动高质量发展提供有力支撑。 †关于促进数据产业高质量发展的指导意见‡面向数据采集汇聚、计算存储、流通 交易、开发利用、安全治理和数据基础设施建设,从加强数据产业规划布局、培育多元 经营主体、加快数据技术创新、提高数据资源开发利用水平、发展数据流通交易、强化 基础设施支撑、提高数据领域动态安全保障能力、优化产业发展环境等八个方面部署了 系列政策举措,为加快繁荣数据产业生态,发展壮大数据产业和培育一批具备国际竞争 力的数据企业,加快培育全国一体化数据市场提供重要支持。

数据标注产业是对数据进行筛选、清洗、分类、注释、标记、质量检验等加工处理 的新兴产业,培育壮大数据标注产业对于提升数据质量,推动人工智能创新发展具有重 要支撑作用。†关于促进数据标注产业高质量发展的实施意见‡以促进数据开发利用、 赋能经济社会发展为主线,主要围绕深化需求牵引、增强创新驱动、繁荣产业生态、优化产业支撑四个方面提出相关政策举措,着力培育数据标注新业态,布局数字科技新赛 道。同时,†关于促进数据标注产业高质量发展的实施意见‡还提出,到 2027 年,数据 标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长 率超过 20%,培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创 新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业 生态,构建创新要素聚集、产业链上下游联动、区域协同发展的新格局。值得一提的是, 2025 年 1 月 9 日,国家数据局综合司发布通知征集数据标注优秀案例,旨在充分展示 各地在数据标注领域的应用成效,充分发挥标杆引领作用,为人工智能提供高质量数据 供给,助力探索符合我国国情的数据标注产业发展路径。 数据作为新型生产要素通过深度融入经济社会各领域,有利于提高资源配臵效率, 催生新产业新模式,实现推动经济发展的倍增效应,但与此同时,也可能带来新的安全 风险。随着数据开发利用不断深入,数据流通成为大势所趋,数据安全正在从以加强网 络安全防护为主的‚静态安全‛,逐步转向以防范数据流通风险为重点的‚动态安全‛。 完善数据流通安全治理,在防范数据流通风险的前提下深化数据开发利用,既是守好安 全底线的题中之义,也是释放数据价值的必然要求。

†关于完善数据流通安全治理 更好促进数据要素市场化价值化的实施方案‡坚持 问题导向,从四个方面提出了 7 项主要任务:一是明晰企业数据、公共数据、个人数据 的流通安全规则。在企业数据方面,重点是推动明晰重要数据认定、提供、脱敏等方面 的规则;在公共数据方面,重点是明晰数据提供方、接收方的安全责任,完善授权运营 过程中的安全管理;在个人数据方面,重点是推动明晰个人信息匿名化规则,完善个人 数据权益保障机制。二是完善数据流通过程中的责任界定、安全技术应用要求。通过推 动构建各负其责的界定机制,完善数据安全审计和溯源机制,探索新型治理模式。同时, 在落实数据分类分级保护要求前提下,引导企业采取不同的安全技术开展数据流通,加 强数据流通安全技术应用,做好数据流通安全防护。三是丰富数据流通安全服务供给。 通过推动数据安全服务机构向规模化、专业化、一体化方向发展,培育数据流通安全检 测评估、安全审计等服务,丰富和扩大数据流通安全服务供给,提升数据流通安全效能。 四是防范数据滥用风险。†关于完善数据流通安全治理 更好促进数据要素市场化价值化 的实施方案‡提出依法严厉打击非法获取、出售或提供数据的黑灰产业,依法依规惩处 利用数据开展垄断、不正当竞争等行为,加强重点行业领域数据安全风险监测,完善数 据流通安全事故或纠纷处臵机制,提升数据流通安全风险应对能力。值得一提的是,国 家数据局党组成员陈荣辉在参加 2025 年 2 月 18 日国家数据局新闻发布会时明确提出, 国家公共数据资源登记平台将于 3 月 1 日正式上线试运行。这个平台不仅是公共数据资 源的管理系统,也是信息披露和资源发现的窗口,全社会都可以来这里找数据、找产品。

在着力推动数字经济和数字社会高质量发展方面,要推动构建数字产业集群梯次布 局体系,在重点区域布局一批具有国际竞争力的数字产业集群。深入实施数字化转型工 程,搭建公共服务平台,培育服务商,推进适数化改革。在培育壮大全国一体化数据市 场。细化数据流通交易规则,推动发布数据流通交易标准示范合同。推进数据资源化和 产品化,建立数据产品质量监督管理机制。激励数据富集型企业加大供数力度,吸引更 多经营主体投身数据市场建设。出台促进数据交易机构高质量发展政策文件,探索数据 要素价值实现模式和路径。 在增强数据资源价值释放驱动力方面, 积极推动公共数据资源管理和运营机制改 革,以公共数据开发利用引领撬动各方数据的融合应用,大力推动企业数据资源的开发 利用。围绕重点场景建立数据融合任务清单,加快形成应用成果。实施可信数据空间发 展行动计划,组织开展企业、行业、城市、个人、跨境各类可信数据空间创新试点试验。鼓励地方建立数据企业培育库,培育一批生态带动和产业引领力强的数据企业。 在夯实数据基础设施支撑力方面,要遵循‚三个统一‛夯实数据基础设施底座,遵 循市场规律培育产业生态,要遵循法律法规和安全要求,筑牢数据安全‚防火墙‛,建 立健全数据安全相关标准规范。在促进数据领域国际合作深化方面,要落实体系化推进 数据领域国际合作的行动方案,稳步推进与重点国家和地区的多双边合作。为中外数字 企业发展创造良好发展环境,既支持鼓励中国企业,特别是中国数字企业‚品牌出海‛ ‚质量出海‛,为世界各国提供数字化转型好的方案和经验,也坚持为在华企业务实解 决问题,提供高质量服务。

1.3深入实施‚AI+‛行动,推进信息化和工业化深度融合

2024 年 12 月 26-27 日,全国工业和信息化工作会议在京召开。会议强调,2025 年要围绕高质量发展,推进信息化和工业化深度融合,探索建立工业数据流通和交易机 制。坚持‚点、线、面‛协同,加快规上工业企业、专精特新中小企业数字化转型全覆 盖,面向重点行业‚一业一策‛制定数字化转型指南,用三年时间建设 200 个高标准数 字园区。分行业分区域布局一批制造业数字化转型促进中心。推进工业 5G 独立专网建 设,壮大多层次系统化工业互联网平台体系。实施‚人工智能+制造‛行动,加强通用 大模型和行业大模型研发布局和重点场景应用。全链条推进基础软件、工业软件技术攻 关和成果应用,加快建设先进计算产业体系。 2025 年 1 月 5 日,国务院国资委党委委员、副主任谭作钧出席在中国电信党校举 办的中央企业人工智能特训班结业式时指出,要紧跟人工智能最新发展,主动拥抱人工 智能浪潮,强化人工智能思维,把握人工智能发展规律,努力成为人工智能发展的探索 者、组织者、带动者。要加快学习应用人工智能,深扎人工智能‚根技术‛,深入实施 ‚AI+‛行动,强化人工智能赋能千行百业、驱动科技创新,让人工智能成为产业升级 跃迁的强劲引擎。 根据国家互联网信息办公室披露的生成式人工智能服务已备案信息显示,截至 2024 年 12 月 31 日,共 302 款生成式人工智能服务在国家网信办完成备案,其中 2024 年新增 238 款备案。

1.4各省市近期数字科技政策综述

近期各省市聚焦‚人工智能+‛,以算力供给、算法模型、数据语料以及应用场景深 化为重要抓手,围绕自动驾驶、具身智能、低空智联网、新材料、生物医药和文化等重 要领域,通过财政补贴、标准引领以及数字基建强化等多元化手段,着力推动技术创新 和产业升级,旨在加速推动人工智能赋能千行百业,为新质生产力发展提供重要支撑。 具体来讲,各省市的数字科技政策呈现这样几个共同点:一是重视财政补贴对人工 智能产业的促进作用,包括山东省、深圳市、东莞市和呼和浩特市等地方均提出了对符 合资助条件的项目提供‚算力券‛或‚模型券‛补贴。二是多个省市都将未来的两到三 年视为关键期,并在政策文件中着力强调自主创新和核心关键技术突破的重要性,比如 †杭州市人工智能全产业链高质量发展行动计划(2024—2026 年)‡明确提出要重点发 展具有自主核心技术的人工智能推理芯片和训练芯片、可编程逻辑门阵列(FPGA)等 通用芯片,†北京市自动驾驶汽车条例‡强调支持自动驾驶座舱、自动驾驶解决方案和 感知、决策、通信、控制等关键技术研发。三是注重产融结合,强调‚人工智能+‛应 用场景深化,着力推动人工智能与交通运输、生物医药、新材料以及文旅等产业的深度 融合。以自动驾驶为例,†浙江省智能网联汽车产业发展行动方案(2025—2027 年)‡ 明确提出到 2027 年要实现 L3 级及以上高阶智能网联汽车量产,大规模、多场景应用 初具规模,智慧交通生态加速融合。四是把高质量数据集建设摆在更加显眼的位臵,高 质量数据集是构建可持续 AI 生态的关键要素,对于提升模型精度,增强模型泛化能力 以及驱动复杂场景技术创新具有非常重要的意义。东莞市†关于加快推动人工智能赋能 制造业高质量发展的若干措施‡提出到 2027 年要形成不少于 30 个行业级数据集和知 识库,呼和浩特市支持以绿色算力、人工智能为支撑的新一代信息技术产业集群发展的 激励措施(征求意见稿)‡则为支持治理高质量数据集按训练使用量、数据质量等经评选为优秀案例的数据集项目予以 10 万元的一次性奖励,苏州市交通局出台†‚人工智能 +交通运输‛实施方案(2025-2027 年)‡也要求构建建设、养护、监管、运行四大数据 集。

1.4.1 长三角三省一市加快推进‚人工智能+‛行动

(1)上海:‚模塑申城‛助力建设人工智能‚上海高地‛

2024 年 12 月 27 日,上海市印发†关于人工智能‚模塑申城‛的实施方案‡,旨在 加快建设人工智能‚上海高地‛,打造人工智能世界级产业集群,加速人工智能赋能新 质生产力。†关于人工智能‚模塑申城‛的实施方案‡瞄准技术前沿,坚持应用牵引, 明确提出到 2025 年底,建成世界级人工智能产业生态,力争全市智能算力规模突破 100EFLOPS,形成 50 个左右具有显著成效的行业开放语料库示范应用成果,建设 3-5 个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。在强化 基础底座赋能方面,†关于人工智能‚模塑申城‛的实施方案‡要求打造超大规模自主 智算集群,构建多层次语料供给体系,建设虚实融合超大型实训场,加快行业基座大模 型体系创新。与此同时,†关于人工智能‚模塑申城‛的实施方案‡明确提出要在智能 终端、科学智能、在线新经济、自动驾驶和具身智能五大重点行业加快打造关键生产力 工具,在金融、制造、教育、医疗、文旅和城市治理六个重点行业着力推动垂直应用。根据网信上海微信公众号披露数据显示,截至 2025 年 2 月 22 日,上海市已经 累计已完成 66 款生成式人工智能服务登记。

2025 年 1 月 3 日,在上海市‚人工智能+‛行动推进大会暨中国—金砖国家人工智 能发展与合作中心基地启用仪式上,‚模塑申城‛五大公共服务平台正式亮相,分别由 上海仪电集团运营上海智能算力公共服务平台、库帕思牵头‚模塑申城‛语料普惠计划、 上海人工智能实验室运营大模型评测与验证中心、上海创智学院牵头‚百人百项‛青年 科学家计划。会上还发布了上海首批‚模塑申城‛行业应用示范基地,推动‚人工智能 +‛金融、制造、教育、医疗、文旅、城市治理等重点行业的应用落地。根据†徐汇区 加快建成全国人工智能高地三年行动计划(2025—2027 年)‡,徐汇将推进‚人工智能 +‛十大行动。徐汇正构建‚一核引领、三圈辐射、多点支撑‛的人工智能产业发展新 格局,即以模速空间为‚核爆点‛、大模型科创街区为‚强纽带‛强化徐汇滨江发展引 领,以漕河泾开发区、徐家汇环交大地区、北杨人工智能小镇为‚三圈‛辐射周边。值 得一提的是,徐汇区将为中小企业推出‚算力券‛‚语料券‛等创新服务,同时还将大 模型备案奖励从最高 200 万元提高至 500 万元,算力补贴从最高 1000 万元提高到 2000 万元,新推出最高 3000 万元的营收奖励和最高 5000 万元的研发投入奖励。

(2)浙江:加快打造‚算力强省‛

2025 年 1 月 23 日,浙江省政府副秘书长周向军在新闻发布会上强调,要打开人工 智能转化通道,加快‚人工智能+医疗‛‚人工智能+科学数据‛‚人工智能+制造‛等场 景应用项目建设。浙江省发展改革委党组书记、主任杜旭亮指出,2025 年浙江省将主 要从这样四个方面加快打造全国人工智能发展的创新高地:一是加快构建新型算力体 系。聚焦‚算力强省‛,浙江省将进一步推动存量算力设施改造升级,集约化布局建设 5 个万卡智算集群,力争 2025 年全省算力规模超过 100EFlops。出台智能券专项政策, 对人工智能企业使用算力、语料、模型成本提供一定比例补贴,显著降低我省人工智能 企业发展成本,助力企业轻装上阵。二是加大高质量数据供给。依托国家数据要素综合 试验区,加快推动高质量数据集语料库建设,实施高质量数据开源开放倍增计划,探索 数据要素价值化路径,完善数据要素定价、流通、交易、使用、安全等政策标准和体制 机制,创新公共数据授权运营方式,优化数据跨境流动监管措施,为人工智能发展提供 有力的数据要素支撑。三是鼓励人工智能创新应用。浙江省近期将出台†浙江省‚人工 智能+‛行动计划(2025-2027 年)‡,鼓励地方政府、领军企业、行业协会和专业服务 机构加大人工智能场景开放,促进人工智能赋能千行百业。同时,浙江省还将聚焦为行 业提供共性解决方案,支持建设一批‚人工智能+‛重大项目,在用地、用能、排污权 和资金等方面给予大力支持。四是加大基金支持力度。浙江省已设立 30 亿元省人工智 能产业基金,主要在人工智能领域投早、投小、投长期、投科技。2025 年,浙江省将 争取国家创投基金在浙江设立相关子基金,争取国家人工智能产业基金投资浙江更多的 项目。

2025 年 1 月 8 日,为全方位提升杭州人工智能产业能级,推动人工智能全产业链 创新链融合发展,打造全国领先、国际一流的人工智能产业创新发展高地,杭州市经济 和信息化局印发†杭州市人工智能全产业链高质量发展行动计划(2024—2026 年)‡提 出,到 2026 年,力争全市智能算力集群规模在国内同类城市中领先,形成基础通用大 模型 1 个以上、行业专用模型 20 个以上,建成人工智能特色产业园区 10 个,集聚开 源模型生态企业 1000 家以上,努力打造全国算力成本洼地、模型生态最优城市和人工 智能产业发展高地。†杭州市人工智能全产业链高质量发展行动计划(2024—2026 年)‡ 围绕高水平实施‚人工智能+‛行动和数字经济创新提质‚一号发展工程‛,以算力普惠 供给为驱动,以模型创新突破为关键,以数据有序流通为支撑,以场景融合应用为牵引, 重点实施算力设施‚强基‛行动、科技创新‚提能‛行动、产业招引‚提质‛行动、产 业生态‚提效‛行动和行业应用‚提速‛行动‚五大‛行动,构建人工智能全产业链推 进体系,为高水平重塑全国数字经济第一城、奋力推进‚两个先行‛提供有力支撑。

(3)江苏:苏州实施‚智造十大行动‛,镇江创造‚第二曲线‛

2025 年 1 月 3 日,2025 年苏州市新型工业化推进会议提出全面实施‚苏州智造十 大行动‛,加快构建‚1030‛产业体系,提质增效推动苏州新型工业化走在前、做示范, 加快打造全球具有领先地位的‚智造之城‛。2 月 14 日,在苏州市‚人工智能+‛创新 发展推进大会上,苏州发布†苏州市支持人工智能领域人才发展的若干措施‡和†苏州 市高水平建设‚人工智能+‛创新发展试验区的若干措施‡,前者围绕人才引进、培养、 评价、激励、服务等方面,集成推出 9 条针对性举措,夯实人工智能产业发展的人才根 基(对顶尖人才顶格支持,给予最高 1 亿元项目资助和最高 1000 万元购房补贴,并在 实验设备场地、算力服务供给、团队配臵优化等方面给予‚定制化‛支持)。后者聚焦 推动高质量产业技术创新、促进高水平应用场景拓展、强化关键要素供给和完善产业创 新生态四大领域,并提出对国家人工智能重大工程和应用场景的申报主体,分层分类给 予最高 1 亿元、2000 万元、500 万元支持。对招引的参数量超千亿的通用大模型,给 予最高 2000 万元支持。对市级培育的垂类大模型给予最高 50 万元支持。根据澎湃网 援引苏州发布公众号的数据显示,2024 年,苏州市人工智能产业实现营收超 2300 亿元, 聚集核心企业 667 家、产业链上下游相关企业超 2100 家,构建了从科创型中小企业到 行业龙头的完整企业梯度体系,初步形成涵盖人工智能基础层、框架层、模型层、应用 层等较为完整的产业链,获批国家人工智能赋能新型工业化先导区。

此外,镇江市出台†镇江市人工智能产业发展三年实施方案(2025-2027 年)‡,因 地制宜明确智能软件、可穿戴智能设备等五个重点主攻领域,勾画了未来三年人工智能产业发展的路线图和任务书,旨在力促人工智能和实体经济深度融合。†镇江市人工智 能产业发展三年实施方案(2025-2027 年)‡汲取国内领先城市以及省内多地人工智能 产业发展经验,此次实施方案结合我市人工智能产业发展现状,确立了‚聚焦产业特色, 创造‘第二曲线’,打造人工智能产业发展先行区‛的定位,明确提出到 2027 年,全市 人工智能产业规模进一步提升,人工智能相关产业规模突破 400 亿元。重点领域加快突 破,培育 1-2 个行业应用大模型,打造不少于 10 个具备地方特色和示范效应的人工智 能应用场景。要素保障机制逐步完善,算力总规模突破 4000PFLOPS(FP16),建成 1-2 个具备产业特色的人工智能产业园,构建人工智能产业创新生态。

(4)安徽省:人工智能产业先导区正式启动,推动算力变‚训力‛

2024 年 12 月 28 日,安徽人工智能产业先导区在合肥高新区启动。先导区将聚焦 优化建设推进机制、分层分类制定招引政策、推动算力变‚训力‛、构建科技领军企业 生态、打造百亿级基金丛林、建立国际交流合作中心、提升赛会层级、设立顶级智库等 关键环节,全力打造我省人工智能产业发展的标杆示范地和优势聚集地,为我省打造人 工智能产业创新发展高地提供新引擎、塑造新 IP。根据安徽日报,安徽人工智能产业先 导区从谋划到启动,已带动人工智能众多优质项目和服务资源加速聚集聚合,12 家企 业已确定入驻;已接入算力数据、模型开发、场景创新、金融保障、人才培育、政务服 务等 6 大类 25 项关键服务能力。先导区未来还将在更高层次、更大范围发挥科技创新 的引领作用,加快建设 40+垂类大模型、打造 100+应用场景、招引 100+顶尖人才团队, 推动大模型、大算力基础优势转化为赋能千行百业源动能,催生引领新质生产力发展, 加速打造具有全球影响力的人工智能科技创新策源地和新兴产业聚集地。 2025年1月2日,芜湖市发布†芜湖市关于发展新质生产力率先突破行动方案(2024 —2027 年)‡,明确提出要推动新兴产业‚新‛融合,发挥新能源汽车和智能网联汽车、 新一代信息技术、机器人、低空经济、人工智能等产业资源禀赋,加快跨领域、跨产业、 跨集群深度融合,打造若干具有全国引领力、全球影响力的战略性新兴产业融合集群。 到 2027 年,形成 1 个万亿级的新能源汽车和智能网联汽车产业集群,4 个千亿级的智 能家电、先进光伏和新型储能、新材料、新一代信息技术产业集群,争创 1—2 个国家 级战略性新兴产业集群。在新一代信息技术产业领域,支持企业聚焦智能终端、智能网 联汽车等领域,发挥‚东数西算‛数据中心集群算力资源优势,加快布局各类算力供给, 构建算力、算法、数据、应用资源协同一体。

1.4.2 北京:AI 赋能自动驾驶、新材料和文化领域

自动驾驶汽车在智慧交通和智慧城市建设中发挥着重要的牵引带动作用。2024 年 12 月 31 日,北京市发布†北京市自动驾驶汽车条例‡,旨在固化北京实践经验,解决 制约自动驾驶创新应用活动的突出问题,为北京市自动驾驶汽车创新应用和规范管理提 供有力的制度性保障,促进自动驾驶汽车技术和产业持续、规范、健康发展(见表 2)。 †北京市自动驾驶汽车条例‡共七章四十八条,包括总则、技术创新、基础设施规划建 设、上路通行管理、安全保障、法律责任和附则。一是明确自动驾驶工作的总体要求; 二是明确鼓励支持自动驾驶汽车技术创新和产业发展的政策措施;三是从鼓励多种技术 路线融合发展的角度对基础设施建设作出规定;四是对自动驾驶创新应用活动进行了全 环节规范,实行包容审慎监管;五是明确了自动驾驶汽车安全保障的相关要求,以更好 平衡促进产业发展与保障首都安全的关系。我们认为,†北京市自动驾驶汽车条例‡的 颁布实施是北京加快推进新质生产力发展的重要立法举措,为广大自动驾驶汽车企业营 造清晰、透明、稳定、开放的制度环境,也为政府开展产业促进和规范管理工作提供了 法治遵循。 2025 年 1 月 27 日,北京市科学技术委员会等部门印发†北京市加快推动"人工智 能+新材料"创新发展行动计划(2025-2027 年)‡(见表 2),贯彻落实中央经济工作会 议"开展'人工智能+'行动,培育未来产业"的工作部署,充分发挥北京在人工智能、新材 料领域的创新优势,把握人工智能赋能新材料创新发展重大战略机遇,抢占国际新材料 科技与产业创新制高点,深入推进新型工业化。†北京市加快推动"人工智能+新材料"创 新发展行动计划(2025-2027 年)‡从融合创新源头攻关、新材料数据设施构筑、智能 实验室建设、新业态培育和创新生态提升等 5 个方面凝练形成 18 项具体任务。我们认为,†北京市加快推动"人工智能+新材料"创新发展行动计划(2025-2027 年)‡坚持创 新策源,强化技术引领,瞄准"人工智能+新材料"发展前沿,以融合理论创新带动基础 研究、关键核心技术攻关,加速新技术、新产品的涌现,切实发挥人工智能在新材料创 新策源能力提升中的赋能作用。

在人工智能赋能文化领域方面,北京市科学技术委员会等部门在 2025 年 1 月相继 发布了†北京市科技赋能文化领域创新发展行动计划(2025-2027 年)‡和†北京市促 进科幻产业发展行动计划(2025-2027 年)‡,前者旨在深入贯彻落实国家文化数字化战 略,促进首都科技创新与文化产业双向赋能、双轮驱动,加快实现文化领域数字化赋能 与信息化转型,后者聚焦科幻产业发展,旨在进一步激发潜在高技术附加值的消费需求, 通过优化空间布局、注重 IP 转化、着力强链补链、强化产业生态,激发科幻产业在文 化软实力、科技创新、大众消费等方面的赋能与带动作用,将科幻产业打造成为首都新 兴产业发展新引擎。其中,†北京市科技赋能文化领域创新发展行动计划(2025-2027 年)‡明确提出,到 2027 年,突破一批文化和科技融合关键技术,实现 5 项以上重大 标志性文化基础设施智能化改造,打造 10 个以上科技赋能文化标杆应用场景,促进 100 项以上新技术新产品应用推广,建设一批文化和科技融合示范基地和产业园区,涌现一 批具有核心竞争力的文化与科技融合领军企业、独角兽企业和专精特新企业。我们认为, 此举将有助于推动新一代三维建模、空间智能交互、数字孪生、虚拟现实、增强现实等 技术在文化产业的应用,进一步丰富文化消费的多样性和便捷性,为文化产业繁荣和提 振智能文化消费提供有力支撑。 此外,2025 年 1 月 26 日印发的†2025 年市政府工作报告重点任务清单‡还明确 提出要大力推进集成电路、人工智能、生物医药、生物育种等九大专项攻关行动,着力 提升共性技术供给能力,在人工智能、商业航天等领域突破一批关键核心技术。

1.4.3 广东:实施数智技术赋能行动

2025 年 2 月 6 日,广东省印发†广东省建设现代化产业体系 2025 年行动计划‡提出实施数智技术赋能行动:一是要拓展软件和信息服务应用。做强做优鸿蒙、 ‚鲲鹏+欧拉‛、PKS 等自主基础软件生态,围绕汽车、装备、家电、电子信息四大行 业推动自主可控工业软件研发应用。聚焦产业链龙头企业扩大试点应用场景开放,打造 一批试点应用标杆项目。发展教育、医疗等领域线上服务,支持游戏产业健康发展。二 是推动人工智能深度应用。实施‚人工智能+‛行动,促进人工智能与生产制造、消费 终端、教育医疗、城市管理等深度融合,打造一批大规模使用的人工智能终端产品和一 批人工智能示范应用场景。加快粤港澳大湾区枢纽节点韶关数据中心集群建设,支持东 莞建设滨海湾人工智能新区。三是加快数字化转型。扎实推进 4 个国家级、14 个省级 中小企业数字化转型城市试点工作,加快建设一批跨行业跨领域工业互联网平台。发挥 链式改造带动作用,引导企业加大数智技术、绿色技术应用,促进中小企业数字化转型, 加快发展新产品、新工艺、新设备、新材料,推动 1 万家工业企业技改数转。 人工智能是新一轮科技革命和产业变革的重要驱动力量,为了抢抓人工智能发展机 遇,佛山市湾区人工智能集聚地先行启动区在 2024 年 12 月 20 日在桂城正式启动建设。 惠州市工业和信息化局于 2024 年 12 月 30 日发布的†惠州市数字产业基地高质量发展 若干政策‡明确提出,要开展人工智能核心技术挖掘攻关。支持人工智能企业申报市重 点领域研发项目,开展人工智能关键核心技术攻关,形成一批具有核心自主知识产权的 科技成果。对竞争性重大研发项目和重点研发项目,市级资金分别给予最低 200 万元和 50 万元资助,对以‚揭榜挂帅‛方式组织的项目,按照技术交易额的一定比例给予最 高 300 万元补助。深圳宝安与前海、横琴、南沙共同签署†智能网联汽车示范应用试点 互认合作框架协议‡,创新性构建了‚三体系一提升‛的互认机制(即异地互认的资格 体系、异地开放的道路体系、异地协同的监管体系),共同推动粤港澳大湾区智能网联 汽车产业发展水平提升。

1.4.4 其他省市加快推进‚人工智能 +‛行动相关政策一览

2025 年 1 月 3 日,山东省印发的†2025 年促进经济稳健向好、进中提质政策清单‡ 提出要加快发展人工智能,设立人工智能产业基金,重点支持算力算法、行业大模型、应用场景拓展等项目建设。实施‚算力券‛奖补政策,对使用人工智能算力且算力赋能 效益显著的应用场景,按照算力采购合同总金额的 5%进行奖补,奖励额度最高 500 万 元。聚焦人工智能、集成电路等领域,再推出 100 个省级数字产业重点项目,在用地等 方面给予省级保障。同时,要加快培育一批数据基础设施标杆工程,对符合国家发展导 向、数据赋能效益突出的数据基础设施项目,每个项目最高给予 1000 万元奖补。省级 筹集 3500 万元资金,支持公共数据汇聚治理、历史数据电子化、高质量数据集建设、 数据流通交易,激发数据要素市场活力。 山东省大数据局副局长綦琳在出席新闻发布会时表示,数字经济的蓬勃发展对数据 流通利用和价值释放提出了更高的要求,迫切需要构建更加安全、高效、智能的数据基 础设施。本次政策清单将重点围绕人工智能算力推广、数据基础设施标杆项目培育出台 支持政策。一方面,实施人工智能‚算力券‛奖补政策。山东省将实施人工智能‚算力 券‛奖补政策,由省级财政安排 3000 万专项资金,针对采购山东省内人工智能算力, 且算力赋能效益显著的应用场景进行奖补。对符合条件的算力交易合同,最高按照总金 额的 5%进行奖补,单个企业的累计奖补总额可达 500 万元。通过财政奖补,引导省内 数据中心优先布局人工智能算力,进一步发挥算力基础设施对数字经济的乘数效应。另 一方面,积极培育数据基础设施标杆工程。山东省级财政将安排 4000 万元专项资金, 引导省内企事业单位高质量建设可信数据空间、数场、数据标注基地等数据基础设施。 山东省大数据局将组织择优遴选,对符合国家及山东省发展导向、数据赋能效益突出的 数据基础设施项目,最高给予 1000 万元奖补。2 月 11 日,省大数据工作会议在济南召 开。会议强调,要以数字强省建设为统领,聚焦数据要素市场化配臵改革,围绕数字产 业化、产业数字化、数据价值化、治理服务数字化,改革攻坚,创新突破,全面深化数 字赋能,打造一批标志性成果,圆满完成‚十四五‛规划目标任务,奋力开创全省大数 据工作新局面。

2025 年 1 月 14 日,在‚干字当头 勇挑大梁 青岛走在前‛主题发布会上,青岛将 新一代信息技术、人工智能两个产业作为优先发展的先导产业。其中,新一代信息技术 重点发展磁存储芯片、先进封装、新型显示技术等细分赛道,打造特色鲜明的新一代信 息技术产业发展高地,力争到 2027 年,新一代信息技术产业规模达到 2000 亿元。人 工智能重点发展海洋领域大模型、垂直领域大模型、人形机器人等细分赛道,拓展人工 智能赋能应用领域,打造世界级海洋人工智能集聚区。力争到 2027 年,人工智能产业 规模达到 1200 亿元。 在湖北,武汉市于 2025 年 2 月 18 日发布†武汉市促进人工智能产业发展若干政 策措施‡(见表 2),锚定‚打造国内一流的人工智能创新集聚区和产业高地‛,推动人 工智能赋能新型工业化,推动大模型、智能体、人形机器人等前沿技术及产品的研发和 应用推广,分别从支持关键技术突破、强化普惠算力供给、增强模型创新能力、支持公 共服务平台建设等 10 个方面给予支持。其中,在强化普惠算力供给方面,†武汉市促进 人工智能产业发展若干政策措施‡要求推动算力网络优化,每年安排不超过 300 万元资 金,支持开展算力网络运行监测、质量评估、算网协调发展等建设。根据算力使用情况 每年设立总额不低于 1000 万元的算力服务券,重点支持中小企业购买算力服务,对企 业使用算力服务费用给予 50%最高 20 万元补助。 在四川,成都市发改委等八部门于 2025 年 2 月 24 日发布†成都市推动数字经济 高质量发展行动方案‡,文件共计 7 个部分、24 条细化举措,内容涵盖了总体要求、数 据要素市场化配臵改革、数字基础设施、数字新技术新赛道、推进数字化转型等内容, 为成都市数字经济高质量发展明确了关键节点和具体目标。

2. AI 技术创新与研发进展

2.1 2025 年国际消费电子展(CES 2025)AI 新看点

2025 年 1 月 7 日,国际消费类电子产品展览会 (CES)在美国拉斯维加斯开幕, 本届展览会吸引了来自 4500 多家参展公司和来自全球 150 多个国家和地区的 14.1 万 余名参会者。CES 2025 以‚深入未来(Dive In to the Future)‛为主题,以人工智能作为核心话题,展示了 AI 技术在 PC、智能驾驶、医疗保健、可穿戴设备、智能家居以 及能源转型等领域的最新应用成果,人工智能所驱动的先进生产力已经成为全球革新的 关键力量。 英伟达是本次展会最受市场瞩目的企业之一,其创始人兼首席执行官黄仁勋在开幕 式主题演讲中介绍了一系列新产品,涉及到游戏、自动驾驶、机器人和代理 式 AI 等多个领域。

其中,GeForce RTX 50 系列 GPU 具备业界领先的 AI TOPS 算力,可在游戏渲染 的同时为拥有自主意识的游戏角色提供动力。GeForce RTX 50 系列 GPU 可增强创意 工作流。RTX 50 系列 GPU 作为首款支持 FP4 计算精度的消费级 GPU,与上一代产品 相比,让 AI 图像生成(如 Flux 模型)性能至高提升 2 倍,并可让生成式 AI 模型在本 地以更小的显存占用运行。其中,GeForce RTX 5090 D GPU 拥有 920 亿个晶体管, AI算力最高可达 2375 TOPS。Blackwell架构的创新和DLSS 4使得 GeForce RTX 5090 D GPU 的性能高达 GeForce RTX 4090 D GPU 的 2 倍。DLSS 4 还引入了图 形行业首个 Transformer 模型实时应用。基于 Transformer 架构的 DLSS 超分辨率和光 线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细 节并增强抗锯齿效果。GeForce RTX 50 系列 GPU 支持 DLSS 4,发布之日即有超过 75 款游戏和应用支持该技术。 英伟达还推出了个人 AI 超级计算机 NVIDIA® Project DIGITS,黄仁勋表示,AI 将 成为每个行业的主流应用。借助 Project DIGITS,Grace Blackwell 超级芯片将惠及数 百万开发者,将 AI 超级计算机臵于每位数据科学家、AI 研究人员和学生的案头,助力 他们参与并缔造 AI 时代。借助 Grace Blackwell 架构,企业和研究员可以在运行基于 Linux 的 NVIDIA DGX OS 的本地 Project DIGITS 系统上进行模型原型设计、调优和测 试,并将其无缝部署在 NVIDIA DGX Cloud™、加速云实例或数据中心基础设施上。开 发者可以在 Project DIGITS 上制作 AI 原型,然后在使用相同的 Grace Blackwell 架构 和 NVIDIA AI Enterprise 软件平台的云端或数据中心基础设施上进行扩展。

英伟达在展会上宣布推出多个生成式 AI 模型和 Blueprint,将 NVIDIA Omniverse™ 一体化进一步扩展至物理 AI 应用,如机器人、自动驾驶汽车和视觉 AI 等。英伟达面向 物理 AI 开发者社区开放 Cosmos 世界基础模型,无论公司规模大小,研究人员和开发 者都可以在英伟达允许商业使用的开放模型许可下,自由使用 Cosmos 模型。构建 AI智能体的企业还可以使用在 CES 上推出的新开源 NVIDIA Llama Nemotron 和 Cosmos Nemotron 模型。英伟达宣布用户可提前访问用于视频搜索与总结的新版 NVIDIA AI Blueprint。该 Blueprint 基于 NVIDIA Metropolis 平台构建,借助 NVIDIA Cosmos Nemotron 视觉语言模型 (VLM)、NVIDIA Llama Nemotron 大语言模型(LLM)以及 NVIDIA NeMo Retriever 的强大能力,为开发者提供了构建和部署能够分析大量视频和 图像内容的 AI 智能体工具。

此外,NVIDIA DRIVE 合作伙伴在 CES 2025 上展示最新移动出行创新技术。英伟 达宣布自动驾驶汽车平台 NVIDIA DRIVE AGX™ Hyperion 已通过两家业内权威的汽车 功能安全和网络安全认证评估机构——TÜV SÜD 和 TÜV Rheinland 的行业安全评估。 这一成就提高了自动驾驶汽车安全、创新和性能的标准。英伟达还宣布,丰田、Aurora 和大陆集团已加入全球移动出行领导者行列,利用 NVIDIA 加速计算和 AI 开发构建乘 用与商用车型。 英特尔在 CES 2025 上发布了全新英特尔®酷睿™ Ultra 处理器(第二代)。其中, 基于英特尔® vPro®平台的全新英特尔®酷睿™ Ultra 200V 系列移动处理器,能够为企业 提供 AI 驱动的生产力和提升的 IT 管理能力,英特尔®酷睿™ Ultra 200HX 和 200H 系列 移动处理器拥有更加出色的性能核(P 核)和能效核(E 核),以及专为 AI 加速打造的 集成 NPU,并采用了英特尔锐炫™显卡。基于英特尔最新核心架构打造的全新 HX 系列 处理器拥有多达 24 个核心(8 个性能核和 16 个能效核),H 系列处理器拥有多达 16 个 核心(6 个性能核和 8 个能效核,以及 2 个低功耗能效核),这些全新处理器为游戏玩 家、创作者和专业人士提供了随时随地游戏和创作所需的计算能力。

与上一代 HX 系列处理器相比,英特尔酷睿 Ultra 200HX 系列的多线程性能提升了 高达 41%。英特尔酷睿 Ultra 200H 系列处理器采用了多达 8 个英特尔 X e 核心的英特 尔锐炫™显卡,其配备了为 AI 加速打造的英特尔®矩阵引擎,与上一代 H 系列处理器相 比游戏性能提升了高达 22%。在整个平台上,全新处理器的 GPU、CPU 和 NPU 能够 带来高达 99 TOPS 的算力。英特尔还在本次展会上发布了包括英特尔® 酷睿™ Ultra 200S/H/U 系列处理器、英特尔®酷睿™ 200S/H 系列处理器、英特尔®酷睿™ 100U 系列 处理器等在内的重点边缘产品,旨在提供可扩展性和卓越性能,满足多种应用场景的需 求。 此外,英特尔还从整车平台到云端为汽车厂商打造全面解决方案,涵盖了高性能计 算、车载独立显卡、人工智能、电源管理和区域控制器,以及和亚马逊云科技共同开发 的英特尔®汽车虚拟设计环境(VDE)等,既能解决汽车厂商所面临的成本控制和性能 拓展等问题,也能让 SDV 开发和部署的速度更快、效率更高、更具成本效益。英特尔 推出了适用于电动汽车动力总成系统和区域控制器应用的自适应控制单元(ACU),通 过对整辆车的电气/电子架构进行优化来改变传统零散汽车架构的低效问题。英特尔宣称,与传统解决方案相比,ACU 带来了更长的续航里程、更快的充电速度和更灵敏的 驾驶体验,同时还能显著降低每辆车的物料清单(BOM)、电机尺寸和电池成本。ACU 降低了每千瓦成本并提高了能源效率,使车辆能够回收高达 40%的动力总成系统能量损 失。全球统一轻型车辆测试程序(WLTP)显示,ACU 还能将效率提升 3%~5%。

AMD 在 CES 2025 上推出了全新的锐龙 9900X3D 和 9950X3D 系列台式机处理器 和第二代手持游戏 PC 处理器——锐龙 Z2。锐龙 9950X3D 是专为游戏玩家和内容创作 者打造的全球领先的 16 核处理器,配备 16 个‚Zen 5‛ 核心和 AMD RDNA 2 图形处 理芯片。全新的锐龙 Z2 处理器配备多达 8 个‚Zen 5‛CPU 核心和基于 RDNA 3.5 架 构的图形处理器,提供超快速响应的游戏体验和令人惊叹的图形效果。全新的锐龙 X3D 和锐龙 Z2 处理器产品预计将于 2025 年第一季度上市。 高通在本次展会中推出 Qualcomm® AI 本地设备解决方案(Qualcomm® AI On-Prem Appliance Solution)和 Qualcomm® AI 推理套件(Qualcomm® AI Inference Suite),前 者旨在实现在专用的本地硬件上运行生成式 AI 推理和计算机视觉,后者是一套覆盖本 地部署解决方案和云端部署的 AI 推理软件和服务。通过这些新解决方案组合,中小型 公司、企业以及工业组织可以在本地运行定制化和现成的 AI 应用,包括生成式工作负 载。与租用第三方 AI 基础设施相比,本地运行 AI 推理能够大幅降低运营成本和总体拥 有成本。高通还宣布推出最新版 Qualcomm Aware™平台,这项基于云的服务旨在帮助 企业为其终端配备定位、可视化和监测功能,从而推动物联网解决方案的发展,满足物 流、零售、能源、智能家居、机器人等行业消费者和企业的具体需求。 本次展会中也为中国企业展示在科技创新方面的最新成果提供了重要舞台。根据钛 媒体公众号援引钛媒体出海参考的统计数据显示,共有 1475 家中国(含港澳台)企业 参展,占整体展商数量的三成以上,超过了 2024 年的 1115 家,成为 2019 年以来参展 中国企业数量最多的一届。

其中,智能驾驶领域的中国力量集体亮相成为本届展会的重要看点,吉利汽车、极 氪、黑芝麻智能等公司均展示了各自在智能驾驶方面的最新技术成果。吉利汽车在 CES 2025 上发布了行业首个‚智能汽车全域 AI‛技术体系,覆盖了 C 端消费者、B 端企业 服务一级空天一提的智能生态。吉利汽车副总裁、吉利汽车研究院院长李传海表示,吉 利汽车于 2022 年发布了首个汽车行业大模型,2023 年完成研发的全场景星睿 AI 大模 型获得了中国信通院 4+能力认证,2024 年所发布的基于离散 token 的情感语音合成大 模型能够实现零样本、文字转语音、分层声学建模,在发音准确性、自然度以及和说话 人相似度方面,得分比之前的 SOTA 模型提升了 10%。吉利汽车研究院首席人工智能 科学家陈勇表示,吉利研发的端到端语音大模型,融合多模型新兴进行语义空间对齐, 构建了一个基于有监督分层情感 token 和 decoder-only 相结合的端到端语音大模型,正 在革新‚人机交互‛的体验,保证了模型对情感的感知能力。2025 年 2 月 18 日,吉利 汽车还与阶跃星辰联合发布了阶跃 Step-Video-T2V 和阶跃 Step-Audio 两款多模态大模 型。

在 CES 2025 上,极氪携 001FR、009 光辉、MIX 三款车型和多项自研核心技术亮相。其中,极氪自研的超高算力智驾域控制器平台可以同时处理 14 个八百万 30 帧摄像 头数据输入,能够更好地支持各类端到端、多模态大语言模型。自动驾驶计算芯片公司 黑芝麻智能则与 Nullmax 共同发布基于华山系列最新一代芯片 A2000 的多模态大模型 智驾方案,以创新独特的端到端技术架构和高性能自动驾驶 SoC,打造面向全场景的新 一代自动驾驶应用。根据黑芝麻智能微信公众号,A2000 多模态大模型方案以纯视觉为 核心,可支持多模态信息的输入,比如摄像头、语音等信息,帮助汽车获得能看、会听、 可读的感官能力,同时也能输出多种推理结果,包括可视化信息、场景描述和驾驶行为。 在不依赖激光雷达和地图的情况下,该方案可以通过纯视觉结合基础导航信息的方式, 提供城市领航、记忆行车、高速领航、记忆泊车等高阶功能。A2000 芯片拥有丰富的计 算资源,其工具链针对未来的算法模型友好且通用,将极大降低算法部署的工作量。基 于黑芝麻智能 A2000 家族芯片充沛的计算资源及友好通用的工具链,Nullmax 将完成多 模态大模型智驾方案的软件部署。 此外,面壁智能还在 CES 2025 展示了 MiniCPM 文本模型和多模态模型的关键特 性,以及落地 PC、智能座舱、具身机器人等领域的重要成果。面壁智能 CEO 李大海 表示,2024 年 8 月份发布的 MiniCPM-V 2.6 多模态模型参数量为 8B,不仅首次将超清 OCR 识图、实时视频理解等能力集成到端侧,也首次在端侧达到单图、多图、视频理 解等多模态核心能力全面超越 GPT-4V。面壁小钢炮 MiniCPM 系列自 2024 年 2 月发 布以来累计下载量突破 400 万,屡次登顶全球知名开源社区 GitHub、HuggingFace 大 模型趋势榜单,并且位列 HuggingFace 2024 年最受欢迎大模型中国企业第一。

学而思携搭载全新智能助手和九章大模型的学习机亮相 CES 2025,展示了在‚AI+ 教育‛的场景化落地成果和全新探索,并且学而思学习机还成功斩获本届‚TWICE Picks‛奖。联想在 CES 2025 发布了 ThinkPad X9 Aura AI 元启版 14/15、YOGA Book 9i AI 元启版、YOGA Air X AI 元启版和小新 Pro GT 16 AI 元启版等系列 AI PC。此外, 根据 36 氪公众号报道,杭州企业云深处科技和宇树科技也在 CES 2025 上展示了各自 的智能机器人新品。云深处的绝影 X30 Pro 不仅能灵活上下 45°的楼梯,还具备 IP67 工业级防护能力,能够稳健攀爬镂空工业楼梯,实现第一时间响应突发任务需求,快速 深入更多复杂场景与作业盲区,更能在-20℃至 55℃环境下作业。宇树科技的人形智能 体 Unitree G1 全身拥有 23-43 个关节,已超过人体关节数量的一半,Unitree H 的每秒 移动速度能达到 3.3 米,是全球首个能原地空翻的全尺寸电驱人形机器人,四足机器人 Unitree Go2 可以完成正向上下楼梯、跳跃、倒立、握手、空翻等高难度动作,而且配 有 4D 超广角激光雷达,感知系统性能提升 200%,可陪伴用户逛街、遛弯,或在家庭 生活中充当陪伴者,减轻人们的工作压力,语音交互还能为用户提供情绪价值。

2.2 DeepSeek 引领大模型创新浪潮

2025 年以来,国内人工智能大模型技术正在迎来新一轮创新浪潮,稀疏注意力机 制创新结合算法和硬件优化助推大模型在降低计算成本、增强长文本处理能力和复杂推 理能力方面取得了明显突破,尤其是随着深度求索公司(DeepSeek)发布其最新开源 模型 DeepSeek-R1 在国内外引发热烈关注,多家国内大模型厂商相继发布了各自最新 的大模型产品。

2024 年 11 月 20 日,DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版 正式上线。DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。该系列 模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果, 并为用户展现了 o1 没有公开的完整思考过程。 2024 年 12 月 26 日和 2025 年 1 月 20 日,DeepSeek 分别发布 DeepSeek-V3 和 DeepSeek-R1,接下来我们将结合这两个模型的技术文档对其主要工作机制和技术创 新进行简要解读。

DeepSeek-V3 采用 MoE 架构,总参数量达到 6710 亿,每个 token 会激活 370 亿 个参数,并采用了多头注意力机制(MLA)和无辅助损失的负载均衡,在 14.8 万亿 tokens 上进行了预训练,旨在通过高效的架构设计和训练优化,实现高性能与低成本的双重目 标。DeepSeek-V3 只需要 278.8 万 H800 GPU 小时即可完成完整的训练,并实现了在 多个维度对标 GPT-4o 的能力。 DeepSeek-V3 基于 Transformer 框架,融合了多头潜在注意力 MLA 和稀疏专家模 型 MoE 来提升推理效率。 MLA 主要围绕推理阶段的带宽、显存和计算效率展开,通过减少键值(KV)缓存 占用来缓解 Transformer 推理时的显存和带宽瓶颈。换句话讲,MLA 的核心思想是通过 低秩联合压缩来减少注意力机制中的查询(Query)、键(Key)和值(Value)的维度, MLA 仅需要缓存压缩后的潜在向量,这种方法在减少内存占用的同时还通过保持性能 与标准多头注意力相当,实现了高效的推理。

DeepSeek-V3 还对前馈网络(FFNs)采用了具有更细粒度的 DeepSeekMoE 架构, 与 DeepSeek-V2 相比,DeepSeek-V3 进一步拓展至 256 个路由专家和 1 个共享专家, 每个 token 激活 8 个路由专家,最多被发送至 4 个节点。DeepSeek-V3 还进一步引入 了冗余专家(redundant experts)的部署策略,旨在通过复制高负载专家并冗余部署来 实现推理阶段不同专家之间的负载均衡。DeepSeek-V3 还在 DeepSeek-V2 的架构基础 上进一步提出了一种无辅助损失的均衡负载策略,通过为 MoE 中的每个专家引入一个 偏臵项(bias term)来最大限度减少负债失衡导致的性能衰减(V3 会在训练过程中持 续监控每个训练步骤中整个训练批次的专家负债,并在每个步骤结束后负债过度/不足 专家的偏振项进行减少和增加以确保专家负载均衡)。

此外, DeepSeek-V3 还采用了多 token 预测(MTP)来提升模型性能和实现加速 推理,MTP 可以让模型在训练时一次性预测多个未来 tokens 来扩展模型的预测范围, 从而增强对上下文的理解能力(MTP 由多个顺序排列的子模块组成,每个子模块负责 预测一个额外的未来 Token)。并且,MTP 模块在推理阶段可以被弃臵(主模型独立运 行)也可以被用于推测解码以提高生成速度,这种方法在提高模型性能的同时也为加速 推理提供了可能性。DeepSeek-V3 的另一创新则是大范围采用 FP8 训练,在通过低精 度计算提高训练效率的同时保持模型的数值稳定性。为了能够更好实现算力成本和模型 稳定性之间的平衡,DeepSeek V3 将计算精度从过去主流的 FP16 降到 FP8,同时保 留了混合精度策略,尤其是在重要算子模块还保留了 FP16/32 来保证准确度和收敛性。在解决跨节点专家并行带来的通信瓶颈问题上,DeepSeek V3 采用 DualPipe算法来减少管道气泡,通过在前向和后向过程中重叠计算和通信阶段,并采用双向管道 调度来实现接近零的通信开销。在后训练部分,通过从 DeepSeek R1 系列模型中蒸馏 推理能力,DeepSeek-V2.5 在代码生成和数学问题解决任务中表现出显著提升,这种 从理模型进行知识蒸馏为后训练优化提供了一个有前景的方向。

得益于上述关键技术创新以及对算法、框架和硬件的协同优化,DeepSeek-V3 具 备非常突出的‚性价比‛。根据 DeepSeek-V3 披露的数据显示,其单次训练成本仅为 557.6 万美元,耗时低于两个月。其中,在预训练阶段,DeepSeek-V3 在每 万亿个 token 上只需要 180k H800 GPU 小时。

通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升。随着性能更强、速度更快的 DeepSeek-V3 更新上线,DeepSeek 的模型 API 服务定价也将调整为每百万输入 tokens 0.5 元(缓存 命中)/ 2 元(缓存未命中),每百万输出 tokens 8 元。

DeepSeek 的第一代推理模型 DeepSeek-R1-Zero 是一种通过大规模强化学习(RL)训练的模型,其在初始阶段并未依赖监督微调(SFT),但仍表现出卓越的推理 能力。该模型在强化学习中展现出多种强大的推理行为,但也面临着诸如可读性差和语 言混杂等调整,为了解决这些问题并进一步提升推理性能,DeepSeek 进一步开发了 DeepSeek-R1。该模型在强化学习之前加入了多阶段训练流程和冷启动数据,在推理 任务中的性能已经达到与 OpenAI-o1-1217 相当的水平。

具体而言,DeepSeek 首先收集了数千条冷启动数据对 DeepSeek-V3-Base 模型进 行微调,随后与 DeepSeek-R1-Zero 类似,执行以推理为导向的强化学习。在强化学习 过程接近收敛时,通过在 RL 检查点(checkpoint)上进行拒绝采样,结合 DeepSeek-V3 的监督数据(包括写作、事实问答、以及自我认知等领域),生成新的 SFT 数据并重新 训练模型。在微调完成后,该检查点继续进行强化学习,以涵盖所有场景的提示词 (prompt)。经过这些步骤后,得到了名为 DeepSeek-R1 的检查点,其在推理任务上 的表现与 OpenAI-o1-1217 相当。 以往的研究通常依赖大量监督数据来提升模型性能。DeepSeek 证明了即使不使用 监督微调作为冷启动,通过大规模强化学习依然可以显著提升模型的推理能力。此外, 适量冷启动数据的引入还可以进一步提高性能。DeepSeek 探索了大语言模型在没有任 何监督数据的情况下发展推理能力的潜力,重点关注其通过纯强化学习过程实现的自我 演化。 为了降低强化学习的训练成本,DeepSeek 采用了群相对策略优化 (GRPO)。这种 方法放弃了通常与策略模型大小相同的评价模型,而是通过群体得分来估计基线。具体 而言,对于每个问题,GRPO 从旧策略中采样一组输出,然后通过最大化目标来优化策 略模型。在奖励建模方面,DeepSeek 采用了基于规则的奖励系统,主要包括准确性奖 励和格式奖励,前者用于评估模型响应是否正确,后者则要求模型将推理过程包含在 和标签之间。 DeepSeek-R1-Zero 在 AIME 2024 基准测试中的平均 pass@1 得分显著提高,从 最初的 15.6%上升至 71.0%,达到了与 OpenAI-o1-0912 相当的水平,突显了强化学习 算法在优化模型性能方面的有效性。 并且,通过多数投票法, DeepSeek-R1-Zero 的性能可以进一步提升。例如,在 AIME 基准测试中,应用多数投票后,DeepSeek-R1-Zero 的性能从 71.0%提升至 86.7%,超越了 OpenAI-o1-0912 的表现。

DeepSeek-R1-Zero 的自我演化过程展示了强化学习如何推动模型自主提升推理 能力的过程。此方法提供了模型随时间演化的清晰视图,特别是在其处理复杂推理任务 能力方面的提升。DeepSeek-R1-Zero 的‚思考时间‛在整个训练过程中持续改善。这种改善并非外部调整的结果,而是模型内部能力的自然发展。通过延长测试 时的计算时间,DeepSeek-R1-Zero 自主获得了处理越来越复杂推理任务的能力。在自 我演化过程中,随着测试时计算量的增加,模型逐渐表现出复杂的行为。例如,模型不 仅会进行反思——重新审视并评估之前的步骤,还会自发地探索不同的解决方案。这些 行为并非通过显式编程实现,而是在模型与强化学习环境交互中自然产生的。这种自发 性发展大大增强了 DeepSeek-R1-Zero 的推理能力,使其能够更高效、更准确地处理 更具挑战性的任务。

与 DeepSeek-R1-Zero 不同,为了避免强化学习在基础模型上的早期不稳定阶段, DeepSeek-R1 使用了一小部分长推理链数据(CoT)进行微调作为初始强化学习模型的基础。收集数据的方式包括使用带有长推理链示例的少样本提示,直接提示模型生成 带有反思和验证步骤的详细答案,以及收集 DeepSeek-R1-Zero 输出的内容并通过人工 标注员进行后期处理。作为强化学习的起点,DeepSeek 搜集了数千条冷启动数据来对 DeepSeek-V3-Base 模型进行微调。与 DeepSeek-R1-Zero 相比,冷启动数据在可读性 和潜在的推理引导方面具有明显的优势。对于推理链中经常出现的语言混杂现象, DeepSeek 还在强化学习中引入了语言一致性奖励,该奖励会计算推理链中目标语言词 汇的占比,尽管这种对齐会导致模型性能轻微下降,但其输出更加贴合用户的阅读偏好。 最终,通过将推理任务的准确性奖励和语言一致性奖励结合,DeepSeek 通过直接求和 形成最终奖励信号并持续进行强化学习直至模型在推理任务上达到收敛。当面向推理的 强化学习达到收敛时,DeepSeek 利用生成的检查点搜集用于下一轮训练的 SFT 数据, 这个阶段的数据与冷启动不同,涵盖了写作、角色扮演等其他通用任务。具体来讲, DeepSeek 最终搜集了大约 60 万条与非推理相关的训练样本和 20 万条与推理无关的训 练样本,采用这 80 万条样本对 DeepSeek-V3-Base 进行了两轮微调训练,有效增强了 模型在多种任务上的通用能力。 为了让更高效的小型模型具备与 DeepSeek-R1 类似的推理能力,DeepSeek 还使 用上述 80 万条 DeepSeek-R1 数据集对开源模型(包括 Qwen 系列和 Llama 系列)进 行了直接微调。研究结果表明这种简单的蒸馏方法显著增强了小型模型的推理能力。比 如,以 Qwen2.5-32B 作为基础模型,直接从 DeepSeek-R1 进行蒸馏的效果优于在该 模型上应用强化学习的结果。这表明,将强大的模型能力蒸馏到小型模型中 是一个高效且效果显著的方法,而小型模型依赖于文中提到的大规模强化学习训练可能 需要巨大的计算资源,且其性能可能难以达到蒸馏模型的水平。

根据微信公众号 AI 产品榜的统计数据显示,自 2025 年 1 月 11 日 APP 上线以来, DeepSeek 上线 21 天日活量(DAU)达到 2215 万,达到 ChatGPT 日活量的 41.6%。截止 1 月 31 日,DeepSeek 在苹果应用商店 157 个国家/地区排名榜首。从国 别分布来看,2025 年 1 月,DeepSeek 应用的 MAU 为 3370 万户,中国(30.71%)、 印度(13.59%)、印尼(6.94%)、美国(4.34%)和法国(3.21%)的用户数量排名前 五。尤其是在 DeepSeek-R1 发布的几天后,DeepSeek 在 1 月最后一周客户数量高速 增长,1 月份累计获得的 1.25 亿用户(包括网站和 APP 累计不去重)中的 80%均来自 这段时间,这意味着其在 7 天内实现了 1 亿用户新增。

另外,值得一提的是,月之暗面在 2025 年 1 月 20 日发布的 K1.5 多模态思考模型,该模型的数学、代码、多模态推理能力,也达到长思考 SOTA 模型 OpenAI o1 正式版 的水平。与 DeepSeek 在 MLA、DeepSeekMoE 以及 FP8 混合精度训练等方面的创新 有所不同,K1.5 的模型设计和训练重点在强化学习的上下文扩展和策略优化等方面提 出了新思路。例如,在上下文扩展方面,K1.5 使用部分展开(partial rollouts)来提高 训练效率(也即通过重用大量先前的轨迹来采样新的轨迹),将强化学习的上下文窗口 扩展到 128k,并观察到随着上下文长度的增加,性能持续提升。在策略优化方面,K1.5 通过有效采样策略、长度惩罚和数据配方的优化来对策略进行改进,并将之与上下文扩 展相结合,为通过 LLMs 学习建立了一个简洁的 RL 框架。与 DeepSeek 的发现类似, K1.5 的训练也证实模型会随着训练提升 performance 也不断增加 token 数。 综上所述,我们认为,DeepSeek V3 和 DeepSeek R1 模型基于 Transformer,创 造性地采用了 MLA、DeepSeekMoE、多 Tokens 预测和 FP8 混合精度训练等新技术, 在提升大模型推理性能的同时显著降低了推理成本。简而言之,DeepSeek 提供了一套 高效并且低成本训练推理的模型的方法,并且能够将这种‚高效‛能力复制到小模型中, 这意味着 AI 不用大量标注数据仅靠自己‚思索‛也能变得更加高效,甚至还能降这套 升级模式‚传授‛给小模型。由于 DeepSeek 将整套训练方法以及全部模型开源,这不 仅意味着开源模型能够以更低的成本实现与最先进的闭源大模型相当的性能,还在一定 程度上重塑了大模型的技术发展范式,在降低行业门槛的同时为全球 AI 生态注入了新 的活力。展望未来,随着 DeepSeek 进一步对架构进行优化并持续探索超越 Transformer 的底层创新,将会推动开源模型加快向通用人工智能(AGI)迈进。以 DeepSeek 为代 表的大模型通过技术创新有效降低了开发成本和技术门槛,‚技术平权‛为更多企业和 开发者基于大模型开发应用提供了重要支撑。并且,随着开源大模型性能的快速提升, 人工智能各个领域的应用效果将得到明显改善,为产业升级注入了新活力。

在智能驾驶方面,包括比亚迪、上汽通用、吉利汽车和东方汽车在内的诸多车企也 纷纷宣告接入 DeepSeek 大模型,其中上汽旗下的宝骏汽车灵语智舱与 DeepSeek 大 模型已完成深度融合,是行业首批将 AI 前沿技术应用于量产车型的品牌,比亚迪宣布 璇玑架构全面接入 DeepSeek,从而实现对云端 AI 和车端 AI 的双重赋能,东风汽车宣 布旗下自主品牌已经完成 DeepSeek 全系列大语言模型接入工作,并将在近期陆续搭载 应用于东风岚图、东风猛士、东风奕派、东风风神、东风纳米在内的自主品牌车型。此 外,根据澎湃新闻报道,2025 年以内国内多地领导干部将‚新春第一课‛聚焦到 DeepSeek,已有广州、深圳、无锡、呼和浩特、赣州等多个地方政府宣布将 DeepSeek 系列大模型部署到本地政务系统,DeepSeek 将会在政务办公、便民惠企、民意速办、 数字化治理等领域发挥重要作用。 最后,我们认为,DeepSeek 的迅速推广和广泛应用将推动为行业树立了高质量数 据驱动的标杆,进一步提升数据标准的精准性、多样性,加强算力和数据的协同优化, 进一步加快 MoE 架构、强化学习训练方法和 FP8 等混合进度技术探索创新,有望助力 国内大模型产业在稳步降低成本的同时实现模型性能跃升。同时,知识蒸馏已成为将大 型模型的能力迁移至参数规模更小的模型的重要途径,蒸馏技术成为广泛部署 R1 能力 中小型模型的有效策略,使大规模端侧部署更进一步,这为小模型赋能 AI PC、耳机、 玩具和智能教育设备提供了有力支持。

3. 专家分析与见解

3.1 加快建设人工智能高质量数据集,积极推动‚人工智能+‛场景落地

人工智能的快速发展离不开高质量数据的支撑。 数据作为人工智能发展的三大核心 要素之一,是人工智能模型训练的基础要素,也是人工智能模型应用的核心资源,加快 建设人工智能高质量数据集,对于推动‚人工智能+‛场景落地具有重要意义。2024 年12 月 28 日,国家发展改革委与国家数据局等部门联合发布†关于促进数据产业高质量 发展的指导意见‡,明确提出支持企业面向人工智能应用创新,开发高质量数据集,大 力发展‚数据即服务‛‚知识即服务‛‚模型即服务‛等新业态。 高质量数据供给是推动新一代人工智能加快发展的关键要素。数据集作为训练和优 化 AI 模型的基础资源,其质量和多样性直接影响到 AI 应用的性能和效果。根据国家数 据局公众号援引科技日报信息,中国科学院科技战略咨询研究院研究员王晓明指出,当 前面向新一代人工智能的数据供给仍有不足,数据处理专用技术有待进一步突破,数据 产业和数据生态有待丰富,高质量数据集的整体规划和支持政策还有待完善。首先,通 用领域、垂直领域以及具身智能领域的高质量数据供给仍有不足。一方面,中文公开数 据在质量和数量方面落后于英文数据。另一方面,我国公共数据开放利用程度有待提高, 各地开放标准不统一,专门面向人工智能发展的高质量行业数据集仍较匮乏。其次,高 质量数据的合成、处理和利用技术亟待提升。利用深度学习和强化学习生成高精确度、 多样化合成数据的技术在成熟度和应用范围上急需突破。再次,数据主体和商业模式发 展尚不成熟。我国缺乏类似美国 Databricks 和 Snowflake‚数据+人工智能‛模式的高 质量数据汇聚和治理主体,具备大规模数据汇聚管理分析能力的公司数量不足。最后, 高质量数据集的专项规划和支持政策有待完善。我国已出台一系列数据发展相关指引政 策,但是面向新一代人工智能模型训练和场景应用的高质量数据集专项规划和支持政策 尚未出台,其建设、运营、流通、利用等方面举措有待进一步细化。

针对当前存在的资源、技术、模式、制度等方面问题,结合新一代人工智能发展的 需要,王晓明建议发挥政府和市场的协同作用,多措并举推进高质量数据集建设。 一是加快公共数据开放和企业数据流通,建设面向新一代人工智能的高质量数据 集。建议形成部门、行业、地区共同参与的协同机制,围绕高质量数据集建设,扩大数 据供给范围和规模,完善公共及行业数据标准,加速可信数据空间建设。面向医疗、教 育、科研、法律、工业、农业、物流、金融、能源、交通等重点领域建设大数据中心及 大模型行业应用创新(工程)中心,打破信息孤岛,构建完备数据生态,构建高质量数 据集,提升垂直领域人工智能模型能力。着眼自动驾驶、具身智能等未来产业需求,开 放相关公共数据,制定行业数据标准,探索企业间数据流通机制,鼓励企业和研究机构 创建高质量行业数据集。 二是围绕建设行业高质量数据集关键技术问题加大攻关力度。面向数据合成和处 理,加快开发数据合成、数据治理的关键共性技术;面向数据流通汇聚,大力推广隐私 计算、区块链等技术;面向‚数据+人工智能‛应用模式,着力开发数据管理技术,探 索新型模型结构和训练架构。鼓励面向人工智能的数据产品、数据服务企业牵头承担国 家重大项目,开展应用基础研究和关键核心技术攻关。推动产学研合作和创新联合体建 设,打造数据技术、产品和服务深度融合的新型合作模式。面向重点场景,打造数据技 术‚测试场‛,提供真实数据环境、模拟应用场景,建设中试基地,吸引企业、高校和 科研机构参与数据技术的创新和验证,加速新技术推广和应用。 三是引导企业和商业模式创新,构建人工智能数据产业生态。大力培育人工智能数 据资源、技术、服务、应用、安全、基础设施等多领域企业,重点建设面向人工智能行 业的数据产业创新平台。鼓励企业基于‚数据+人工智能‛探索多领域商业模式,支持 企业与各方合作,打造基于高质量数据集的产业创新链和生态系统。鼓励企业探索大模 型和具身智能应用场景,驱动数据产业发展。 四是加大人工智能高质量数据集建设政策支持力度。面向新一代人工智能技术开发 和应用发展需求,完善数据资源构建体系,培育数据产业,支持数据技术发展,系统推 进高质量数据集建设,强化行业应用。统筹中央和地方财政资金、产业引导基金和各类 政策性投资,加大对高质量数据集建设的投入。鼓励金融机构创新产品和服务,增加对 数据相关企业的融资支持。引导社会资本有序参与人工智能高质量数据集的开发利用。 2025 年 2 月 19 日,国家数据局在北京召开高质量数据集建设工作启动会。会议要 求积极推进落实‚人工智能+‛行动,积极推动高质量数据集建设发展工作,在推进数 据要素市场化配臵改革等领域进行了积极有效的探索。

3.2 促进数据标注能力提升,筑牢工业智能数据基础

数据标注是对企业原始数据进行加工处理,形成可服务于人工智能模型训练、数据 挖掘分析、开展检验检测等活动必须的高质量数据集的过程,主要包括筛选、清洗、分 类、注释、标记、质检等环节。†关于促进数据标注产业高质量发展的实施意见‡明确 了一系列目标及举措,清晰界定了数据标注产业的范畴、发展方向、重点领域与核心任 务,为培育数据标注新业态新模式、筑牢人工智能创新根基提供了路径指引,开启了我 国数据标注产业高质量发展的崭新阶段。 根据国家数据局官网,国家工业信息安全发展研究中心主任蒋艳指出,数据标注产 业的繁荣将成为促进人工智能赋能新型工业化的关键力量。一是坚持需求牵引,深入挖 掘制造业企业数据标注需求。有效需求是拉动数据标注产业规模化发展,促进数据技术 和制造业深度融合的强大动能。一方面,实施‚国有企业数据效能提升行动‛,以龙头 国有企业为主体,打通产业生态内数据壁垒,促进数据归集汇聚,深入挖掘制造业数据 应用场景,释放国有企业数据标注需求,支持一批规模化专业化数据标注服务商成长壮 大。另一方面,加强重点制造业领域数据标注,打造制造业通用高质量数据集,服务制 造业大模型训练和落地应用,推动人工智能大模型和制造业企业小模型结合,推动人工 智能赋能新型工业化走深走实。二是加强创新力度,精准服务制造业企业数据标注需求。 创新是数据标注产业高质量发展的核心引擎,高端化发展是数据标注产业发展的方向。 围绕核心技术攻关、标准体系完善和创新载体打造三方面重点发力,建立健全数据标注 产业创新体系和生态,促进数据标注产业。先进标注工具与技术的研发应用,是实现制 造业多源数据融合驱动的技术基础。开展相关标准研制推广,推动与制造业先行标准的 融合应用,是提升制造领域数据标注质量的关键。创新载体是实现制造业领域数据标注 创新成果转化的重要平台。三是深化产业融合,深度赋能制造业企业全链条智能化。数 据标注是人工智能深入赋能新型工业化落地的重要环节,需要将数据标注与制造业关键 环节深度融合,结合具体行业、场景、数据特点,开展数据标注模型设计。†关于促进 数据标注产业高质量发展的实施意见‡将有效推动数据标注服务和制造业需求精准匹 配,打破数据标注环节的技术和能力限制,充分利用人工智能算法对制造业企业数据资 源进行深度挖掘与分析,实现制造业关键环节的智能化变革。

3.3 构建数据安全治理新格局 促进公共数据开发利用

公共数据是我国数据要素供给体系的重要组成部分,具有公共性、权威性与规模性, 蕴藏巨大价值。各地区各部门在坚持数据开放的基础上,有序探索公共数据授权运营, 对于赋能政务服务、公共治理具有重要意义,是培育数据要素市场的关键突破口。 2025 年 1 月 6 日,国家发展改革委等部门发布了†关于完善数据流通安全治理 更 好促进数据要素市场化价值化的实施方案‡,根据国家数据局官网,国家信息中心副主 任周民和国家信息中心外网办安全管理处处长罗海宁指出,†关于完善数据流通安全治 理 更好促进数据要素市场化价值化的实施方案‡针对公共数据流通过程的安全管理, 明确了数据提供方、数据接收方、公共数据授权运营机构三方数据主体角色的数据安全 保护责任和管理要求,细化了公共数据开发利用过程中的安全要求。 第一,强化源头安全治理,提升公共数据安全成效和供数水平。公共数据涵盖的数 据范围广泛,涉及国家安全、公共利益。各级党政机关、企事业单位等政务、公共数据 来源机构作为数据提供方,应承担数据提供前的安全管理责任,在数据供给源头强化公 共数据主动治理,在供给环节保障所供出公共数据的合法性、安全性、可用性、准确性 和时效性。 第二,贯穿供出后全过程安全管理,确保公共数据在各接收主体间安全流转。公共 数据持有者、使用者作为数据流转过程中的数据接收方,要承担数据接收后的安全管理责任。一是确保公共数据接收后的存储安全,建立安全的数据存储环境,包括物理环境、 网络环境等,确保重要数据在存储过程中的安全性。二是确保公共数据使用与加工安全, 公共数据接收方应按照协议或规定中明确的数据使用范围和用途来合规使用公共数据。 采取必要的安全措施,如数据加密、访问控制、数据脱敏等对重要数据进行加工处理, 以防止重要数据泄露或被非法访问。三是数据销毁末端安全,数据接收方应根据数据的 生命周期和业务需求,制定数据销毁计划,明确数据销毁的时间、方式和范围,考虑数 据的敏感程度和重要性,选择可靠的数据销毁方法,确保数据在销毁后无法被恢复。 第三,探索公共数据授权运营安全合规制度化路径。公共数据授权运营被认为是构 建数据要素市场的关键突破口,也是繁荣数据要素市场的重要支撑,如何把控好这一环 节安全合规,备受市场关注。公共数据授权运营安全治理是一个‚制度化‛过程,授权 运营机构应建立健全数据安全管理制度,加强数据全生命周期的安全防护。一是明确授 权运营机构在经营与信用、专业资质与人才、技术安全、应用场景与数据使用等多个方 面的数据安全保护条件和能力。二是加强数据产品和服务的安全合规管理,通过建立分 类分级、访问控制、监测预警等安全管理制度,在保障国家秘密、国家安全、社会公共 利益、商业秘密、个人隐私和数据安全的前提下,依法依规在授权范围内开展公共数据 授权运营活动,充分释放公共数据价值。三是基于数据全生命周期安全防护理念,持续 完善态势感知和监测预警体系建设,切实提升公共数据授权运营过程中的安全风险监测 和应急处臵能力。

3.4 建设国家数据基础设施,筑牢数字经济发展基石

实施国家大数据战略,建设数字中国,发展数字经济已成为新时代国家的战略选择。 党的二十届三中全会提出‚建设和运营国家数据基础设施,促进数据共享‛。国家数据 基础设施建设对于数字经济发展具有基础性、战略性意义,是推动数字经济健康发展的 关键支撑。 2024 年 12 月 31 日,国家发展改革委和国家数据局、工业和信息化部发布†国家 数据基础设施建设指引‡,为指导推进数据基础设施建设,推动形成横向联通、纵向贯 通、协调有力的国家数据基础设施基本格局,打通数据流通动脉,畅通数据资源循环, 促进数据应用开发,培育全国一体化数据市场,夯实数字经济发展基础,为数字中国建 设提供有力支撑。 †国家数据基础设施建设指引‡明确提出,要利用 2-3 年左右时间,完成国家数据 基础设施建设顶层设计,明确国家数据基础设施建设的技术路线和实践路径。到 2029 年,基本建成国家数据基础设施主体结构,初步形成横向联通、纵向贯通、协调有力的 国家数据基础设施基本格局。中国科学院院士梅宏指出,†国家数据基础设施建设指引‡ 为我国数据基础设施建设给出了明确的方向和路径,对于筑牢数字经济发展基石具有重 要意义。国家数据基础设施的建设,开启了推动我国数字经济高质量发展的新阶段,也 将对全球数字经济发展起到示范引领作用。

在数字经济时代,互联网是其基础设施的关键核心。随着互联网从信息空间向人类 社会和物理世界的延伸,以及云计算、大数据、人工智能、移动互联网、物联网等新一 代信息技术的快速发展,数字经济的内涵发生了深刻变化。人机物(人类社会、信息空 间与物理世界)融合泛在计算的新时代正在开启,信息技术不再仅仅是作为既有业务流 程中提质增效的助手和工具,而是将成为引领产业组织重构、流程再造、升级发展的核 心引擎,其根源在于信息技术特别是互联网的快速发展和广泛深度应用所产生的大数据 为人类提供了认识复杂系统、探知客观规律,进而改造客观世界的新思维和新手段。 在数字经济时代,数据已成为基础性、战略性资源,成为关键生产要素,赋能赋值 生产、分配、交换和消费的各个环节,并支撑劳动力、资本、土地、技术、管理等生产 要素的网络化共享、集约化整合、协作化开发和高效化利用。要构建一套‚以数据为中 心‛的新的基础设施层,可称之为‚数据基础设施‛ ,主要包含两个层面:一是将数据 与应用解耦,使得数据可以作为互联网上可独立管理的资源被标识、定位、发现和访问, 从而在‚物理/机器‛互联网之上形成一个‚虚拟/数据‛网络‚数联网‛,实现全网一体 化的数据互联互通互操作。二是面向具体的领域和业务场景,按照数据所对应的物理实体的结构、关系来对数据进行管理和组织,使数据实体、数据活动(包括数据的传输、 存储和处理运算等)及其相互之间的关系构成一个物理世界的‚数字孪生‛,可称之为 ‚数据空间‛。数据空间可视为围绕现实世界的个人或机构所构建的‚全量‛数据集, 数据应用运行在特定数据空间内,以满足各类场景化需求。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告