为 了应对算力需求和资源约束的主矛盾,围绕效率提升持续创新,必将成为未来数据中心发展的核心方向。
过去,人类在科学的边界之内,不断发现万物规 律,并创造生产工具,推动社会从农耕文明、工 业文明进入到数字文明的数字化阶段。未来,AI 以新的生产力形式出现,在人类定义的边界之内, 以更高的效率和更快的速度进行分析和创造,将 数字文明带入智能化阶段。 人类善于分析,但 AI 可能做的更好。“分析型 AI”已经得到广泛应用,可以分析一组数据,一 组图片,并在其中找到模式,用于多种用途,无 论是预防欺诈或是目标识别。
人类擅长创造,但 AI 可能做的更快。随着“生 成式 AI”的快速发展,AI 已经开始创造有意义 和美丽的东西,如写诗、绘图,并且效率更高。 生成式 AI 在图像生成领域的进展来自扩散模型 (Diffusion model)的应用,是一种从噪声中生 成图像的深度学习技术。在自然语言处理(NLP) 领域的进展来自于 ChatGPT,这是一种基于互 联网可用数据训练的文本生成深度学习模型,用于问答、文本摘要生成、机器翻译、分类、代 码生成和对话的 AI。在代码生成领域的进展则 来自代码生成系统 AlphaCode 和 Copilot。2022 年 2 月,DeepMind 推出了他们的最新研究成果 AlphaCode。它是一个可以自主编程的系统,在 Codeforces 举办的编程竞赛中,超过了 47% 的 人类工程师,这标志着 AI 代码生成系统,首次 在编程竞赛中,达到了具有竞争力的水平。
I 技术正加速进入千行万业,如在气象行业,利 用 AI 大模型能够在 10 秒内给出未来七天的天气 预测结果,对比传统的 HPC 数值预报方法,在 预测速度上提升了 10000 倍以上;在证券行业, 某金融企业基于 AI 大模型实现了准确率达 90% 的企业财务智能预警,较传统机器学习模型准确 率提升了 11%。AI 大模型正逐步从智能对话、 短文创作、图片生成等消费应用场景,扩展到办 公、编程、营销、设计、搜索等商业应用场景, 并将进一步扩展到金融风控、智能客服、辅助诊 断、医疗咨询等企业应用场景,为千行万业注入 新生产力。 人类正在从分析型 AI 理解世界迈向生成式 AI 创 造世界。面向 2030,具备认知能力的 AI 像我们 熟悉的土地、植物、空气、阳光一样无处不在: “一辆会自己行驶的汽车、一个会自己做饭的机 器人、一个会自己管理的通信网络、一个会自我 优化的软件平台”将会成为人们日常生活的一部 分,并支撑着人类文明的持续进化。
几千年前科学以归纳为主,通过观测和实验来描 述自然现象;过去数百年出现了理论研究分支, 利用数学模型进行分析;过去数十年出现了计算 分支,针对复杂问题,使用计算机进行仿真分析; 21 世纪初期,新的信息技术已促使新范式的诞 生,即基于数据密集型科学研究的“第四范式”, 通过将理论、实验和计算仿真统一起来,由仪器 收集或仿真计算产生数据、由软件处理数据、由 计算机存储信息和知识、科学家通过数据管理和 统计方法分析数据和文档。 数据密集型科学研究,将产生海量数据需要分析 处理,如模拟脑神经网络,探索人脑上亿个神经元之间如何连接与工作,将带来每秒高达 100TB 的数据吞吐量;自动驾驶车辆每天将产生数十 TB 数据用于训练视觉识别算法;用电子显微镜 重建大脑中的突触网络,1 立方毫米大脑的图像 数据就超过 1PB;而天文专家需要从数十 PB 海 量数据中分析发现新天体。PB 级数据使我们可 以做到没有模型和假设就可以分析数据,将数据 丢进巨大的计算机集群中,只要有相互关系的数 据,统计分析算法可以发现过去的科学方法发现 不了的新模式、新知识甚至新规律。
科学数据已成为科学研究的关键成果和重要的战 略性资源,面对喷薄而出的数据需求和数据量,如何存储、管理、共享这些科学数据,成了全球 科学家关注的热点,也是下一代数据中心的重要 应用场景。当这些规模计算的数据量超过 1PB 时, 传统的存储子系统已经难以满足海量数据处理的 读写需要,数据传输 I/O 带宽的瓶颈愈发突出。 而简单地将数据进行分块处理并不能满足数据密 集型计算的需求,并与大数据分析的初衷相违背。 目前许多具体科学研究中所面临的最大问题,不 是缺少数据,而是面对太多的数据,却不知道如 何处理。 当前的超级计算机、计算集群、超级分布式数据 库、基于互联网的云计算等并没有完全解决这些 矛盾,计算科学期待一次全新的革命!

虚实融合是下一代互联网发展的主要方向,一个具 有高沉浸式交互体验的虚实融合的多维空间,将极 大地提高人与信息的交互体验和经济活动效率。 虚实融合的发展包括两个方向: 一是由实向虚,基于虚拟世界对于现实世界的模 仿,通过构建沉浸式数字体验,增强现实生活的 数字体验,强调实现真实体验的数字化。在移动 互联网时代,主要通过文字、图片、视频等 2D 形式建立虚拟世界,而未来在元宇宙时代,将真 实物理世界在虚拟世界实现数字化重造,建立虚 拟化,具备多维交互能力的虚拟世界。
二是由虚向实,超脱对于现实世界的模仿,基于虚拟世界的自我创造,不但能够形成独立于现实 世界的价值体系,还能够对现实世界产生影响, 实现数字体验的真实化。如增强现实游戏通过设 置与品牌联动特定地点发放限量购物券的方式, 帮助品牌方吸引消费者关注,实现数字体验对真 实消费的带动。 从技术层面来看,虚实融合的多维互动体验离不 开计算机图形图像的多维空间计算能力支持和低 延迟网络服务。同时,它还需要强大的人工智能 认知能力的辅助,以及泛在通达的数据连接,计 算和网络的能力将直接决定了虚实融合的深度和 广度。
面向千行万业的数字孪生是数据中心的重要应用 场景。根据第三方预测,全球数字孪生市场空间 的年复合增长率将达到 40.1%,预计到 2030 年 将达到 1310.9 亿美元。数字孪生涉及建模、感知、 仿真、渲染、大数据、人工智能等新一代信息技 术的综合集成应用,是数字经济发展的重点领域 之一。
伴随各行业智能化的推进,城市、制造、交通、 水利、能源的数字孪生应用需求快速增长,从端 云两侧同时拉动数据中心算力需求。其中,基于 WebGL 的数字孪生应用快速发展,带来终端的 升级需求;基于云渲染的数字孪生应用,带来云 端算力的快速增长。应对算力快速发展的需求, 应从加强算力供给、提升集约化利用水平、加强 渲染算法研究等方面推动算力产业升级。
过去 10 年内,智能手机和移动互联网重塑了人 类生活方式和企业生产模式;今天,智能化和电 气化正在重构汽车行业的核心竞争力和生态。重 塑和重构的背后是强大的算力、算法和数据构成 的数据智能,是敏捷迭代、弹性伸缩、韧性自愈 的云原生的 IT 系统。未来随着大模型 AI、万物 互联、社会化数据协同和数字孪生的新技术推动, 与现实世界结合更紧密的千行万业也将快步进入 云原生为基础的智能世界。 各行业的领先者和现有分工的颠覆者正在凭借前 瞻性思维实现更深层次的智能化,推动云原生特 征明显的信息技术和运营技术的融合,赋予产品、流程、组织精细化、敏捷化的全新竞争力。随着 数字系统越来越复杂、发布变更频度越来越高、 算力越来越密集、分布越来越广泛,企业将越来 越依赖平台能力,越来越多的企业将全面拥抱云 原生技术。 普惠化的云原生技术给传统的企业甚至个体带来 将生产、经营活动现代化的机遇,消除数字化鸿 沟,提供简单、经济而又专业、个性的智能化路 径。当云端算力、数据服务 API、涂鸦化的 IOT 控制流程设计、商品化的行业 AI 算法组合时, 每个拥抱变化的企业获得与领先者同步的智能化 能力。
在全球积极应对气候变化目标下,绿色低碳成为 数据中心的重要发展方向,大部分国家或地区均 在单体数据中心领域相继发布了相应政策。中国 在充分论证研究基础上,规划布局了 8 大算力网 络国家枢纽节点,引导大规模数据中心适度集聚, 通过实施“东数西算”工程,积极探索构建形成 以数据流为导向的新型算力网络格局。
围绕绿色可持续发展,数据中心相关企业已经开发了大量创新技术来实现基础设施建设与运营过 程中的高效化和低碳化,并且已经在现有或新建 的数据中心中实施。如苹果公司在数据中心范围 内部署分布式太阳能、风能、沼气等可再生能源 发电设施,以及与可再生能源电站签署长期采购 协议,为自有数据中心供电,通过一系列措施实 现 数据中心使用 100% 可再生能源。微软公司 在智能云绿色数据中心建设时提出需要在选址、 建设及运营的全流程将数据中心的“能源流”“数据流”“业务流”有效协同起来,实现绿色高效。 华为云贵安数据中心采用自然冷却技术,包括直 通风制冷和部分高密度服务器就近利用湖水散 热,并通过余热回收利用技术等将数据中心的热 量进行采集,用于办公区取暖,在设计中既充分 结合了贵州自然条件的优势,也融入了绿色低碳的可持续发展理念。 实现“能源流”、“数据流”和“业务流”的多 流协同,是面向 2030 年构建高能效数据中心的 关键。