AI带来网络安全的内生与外部推动需求。
AI 时代赋能多应用场景,数据价值体现。自 2017 年以来,全球企业对于 AI 的使 用已到达了一个稳定高峰。根据麦肯锡数据,近四年,全球使用 AI 的企业数量占比在 50-60%之间,较 2017 年 20%的水平已提升 2.5X。平均每个公司都会使用近四种 AI 能力,比起 2018 年的 1.9 种也近翻倍。其中,流程自动化、计算机视觉、自然语言分 析、对话界面和深度学习已经成为前五大 AI 用途。而从训练到应用的逻辑来说,AI 的 广泛应用,其核心基础是高质量、与应用场景贴合的海量数据资源。
数据量随设备增长,“量价齐升”带动大数据。根据思科的《年度互联网报告》, 2023 年地球上的连网设备数量将是全球人口的大约三倍,从 2017 年的人均 2.4 台提升 至 3.6 台。IP 地址即网络地址+主机地址,网络站点所连接的 IP 数量也由于练级设备增 长而处于爆发的阶段。根据 IDC 的《中国物联网连接规模预测,2020-2025》,仅我国 物联网 IP 连接量已在 2020 年达 45.3 亿,有望在 2025 年达到 102.7 亿,CAGR 为 17.8%。由于每一个设备联网后开始产生数据流量, 其独有的 IP 地址的数量增长即代 表全网数据也将继续大增。根据思科的《年度互联网报告》,2022 年全球网络数据流量 将达 799EB(1EB=十亿 GB),同比增长 21%。在数据总量增长的大环境下,总体数 据的价值随之提升,有望直接带动大数据产业的发展。
大数据市场规模可观,软件部分增速高。收益于数据量增长,我国大数据市场及相 应软件市场规模、增速可观。沙利文研究预计 2022 年我国大数据市场规模为 1049 亿元, 同比增速 24%,其中软件约 305 亿元,同比增速 30%,占比约 29%。在大数据行业的高 增速之下,数据智能分析工具、大数据管理平台等软件的需求有望进一步提升。

chatGPT 出世,加速了高质量大数据和高算力时代进程。相比传统 AI 算法,GPT 模型的区别在于通过海量参数,进一步提升了模型的精确度。 初代的 GPT 模型参数是 1.17 亿,而 GPT2 的模型有 15 亿个参数,参数增加了 10 倍之多。第三代的 GPT3 模型,参数达到了 1750 亿,是 GPT2 参数的 100 倍。正是由 于参数的指数级提升,使得模型的使用效果大幅提升。而此类参数上亿的模型,通常称 之为“大模型”。 GPT 模型基于 Transformer 架构,这是一种由谷歌的 Vaswani 等人于 2017 年引入的 神经网络类型。Transformer 架构特别擅长对序列数据中的长距离依赖进行建模,这使 其非常适合自然语言处理任务。
为了训练 GPT 模型,OpenAI 使用了来自互联网的大量文本数据,包括书籍、文章 和网站。该模型使用一种称为无监督学习的技术进行训练,这意味着它学会了在没有人 类监督的情况下预测文本序列中的下一个单词。 GPT 模型能够生成连贯和语法正确的文本,已被用于广泛的自然语言处理任务, 包括语言翻译、文本补全和文本生成。
AI 及大模型带来高算力需求,即硬件建设需求。根据 lambdalabs 报导的数据, GPT3 若使用 V100 需要训练 355gpu 年,就是建立在理论数据下,以 V100 理论算力 28 TFLOPS 计算的(直接将 FP 32 的理论算力 14TFLOPS 乘以 2,以得到 FP16 的理 论算力)。若使用 RTX8000,假设 15TFLOPS,将花费 665GPU 年 (资料来源: OpenAI's GPT-3 Language Model: A Technical Overview (lambdalabs.com)) 。由此 计算的 GPT3 的训练算力,整体达到 3.14E23 FLOPS。若仍然以 V100 就算,若要将 训练一次的周期降低至 1 周内,则需要 2 万片 V100GPU。大量的 GPU 算力,意味着 数据中心的大举建设。

算力即数据中心,运营商加大支出带来市场爆发。以服务器插八张 GPU 来计算, 两万片 GPU 的 AI 训练带来的服务器增量,即 1250 台服务器。而两万片 GPU,以 trendforce 预计约为 chatGPT3.5 所需数量,未来可能超过 3 万颗。考虑到国内各大互 联网、IT 厂商相继投入大模型,未来服务器、数据中心的建设已是高确定性事件。
根据三大运营商 2022 年年报计划,1)中国移动:2023 年,对算力网络的资本开 支预算提高到 452 亿元,同比增长近 35%。新增投产云服务器超过 24 万台、新增投产 对外可用 IDC 机架超 4 万架;2)中国电信:2023 年在 IDC 方面将投资 95 亿元,实现 IDC 机架规模超过 56 万架;在算力投资 195 亿元,使算力总规模达到 6.2EFLOPS;3) 中国联通:2023 年算力网络资本开支将达到 149 亿元,占总资本开支达 19.4%,同比 增长超 20%。IDC 机架规模达到 39 万架。
数据中心建设,存在内生网安需求。由于骨干网、云端数据中心其自身 1)边界访 问安全需求;2)数据保护需求;3)运行状态检测运营需求,对于网络安全设备有天 然需求,首要包括:1)防火墙、交换机、WAF、负载均衡、上网行为管理等网关类需 求;2)漏洞扫描、IDS\IPS(即态势感知)、抗 DDoS 等传统抗攻击需求;3)SIEM、 数据库审计、运维审计等运维检测类产品;4)vpn、邮件安全等租户需要的设备产品。 因此,运营商也是网络安全传统的一大收入来源。此外,金融、互联网等存在自建数据 中心需求的客户,其网安需求增长逻辑类似。因此,我们认为,AI 乃至大模型时代, 网安设备的硬需求为同向增长状态。

AI 的存在,也赋能了网络攻击。网络安全乃至数据安全的本质是攻防,攻击者盗 取破坏信息,防护者保护信息。由于防守者永远是被动,即使是态势感知也无法阻止最 开始的破坏入侵, AI 带来的降本增效首先受益方是攻击者。根据 MIT TechnologyReview 对于 300 个网安公司人员的采访数据,2021 年 60%的采访对象已经难以应对 自动化的网络攻击,96%的人已经在开始遭受 AI 网络攻击,部分使用了 AI 进行防御。 近期发布的腾讯《2023 产业互联网安全十大趋势》也指出,chatGPT 类技术辅助 写代码的能力大大降低了攻击者的技术门槛,而可以对于漏洞攻击、钓鱼攻击、鱼叉攻 击等常用的攻击方式进行快速上手和创新。我们认为,AI 的成长,会带来攻击量增长, 网安的技术性需求会由于攻击事件的催化而得到释放。