盘古预训练大模型已经从学术大模型转变为产业大模型,形成了“基础大 模型-行业大模型-细分场景大模型”的发展路径,并在医疗、互联网、金融、煤矿、农业、 气象等领域中实现降本增效。
盘活工业数据,盘古 CV 大模型赋能工业质检。华为目前已经推出盘古矿山大模型、盘古 电力大模型、盘古制造质检大模型等 L1 行业模型,并针对偏光片质检、电力巡检、铁路 TFDS 检测、传送带异物检测等具体任务,通过“预训练+微调”打造 L2 细分场景模型。 盘古矿山大模型助力煤矿场景智能化。盘古矿山大模型对海量无标注的矿山场景数据进行 无监督自主学习,覆盖采、掘、机、运、通等主营业务及 1000 多个细分场景,大幅缩短 模型开发时间,有效保障井下安全。其中,基于 5G+AI 全景视频拼接综采画面,实现了远 控采煤、安全生产、主运智能检测系统代替人工巡检,使得异物识别精度超过 98%,动作 规范识别准确率超过 95%,井下安全事故降低 90%以上。
针对电力巡检场景,传统 AI 模型开发面临数据标注低效、缺陷种类多、模型开发成本高 等挑战。依托华为盘古 CV 大模型生成的电力行业预训练模型实现了以较少的人工标注进 行快速迭代,使得样本筛选效率提升约 30 倍,筛选质量提升约 5 倍;同时一个模型可适 配上百种缺陷,模型平均精度提升 18%,开发成本降低 90%,真正做到了规模化可复制。 针对铁路 TFDS 检测场景,该场景要求识别上百种故障类型。标注困难、样本不均衡、未 知故障预测成为主要挑战。华为推出基于盘古 CV 大模型的铁路 TFDS 开发方案,利用大量 铁路无标注样本预训练,使其在小样本的故障检测中获得更优性能,同时基于缺陷检测算 法,打造未知故障预测流水线,为铁路故障检测设下第二道关卡,使故障召回率达到 90%, 准确率提升 7%以上,正常样本滤除率降低约 9%。
盘古 CV 大模型引领智慧物流,从“人的银行”走向“物的银行”。盘古大模型协助浦发 银行打造浦慧云仓项目,实现了 1 个模型覆盖 9 种物流场景,监测收货、入库、在库和出 库全流程。浦发银行借助盘古大模型对叉车入库时的货堆进行精确计数,确保了货物入库 的真实性。此外通过借助小样本学习能力,大大节省了识别仓库中上百种外观不同箱体的 样本采集和标注工作量,将项目开发周期从1-2个月缩短至2-3天,极大降低了开发成本, 提高了开发效率。

盘古 NLP 大模型已广泛应用于智能营销和智能舆情等场景。在智能营销领域,盘古 NLP 大模型可以通过文本匹配,问答和对话系统、意图识别等关键技术更好地赋能销售环节, 取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,其中循环智能“盘古” NLP 平台凭借突破性的零样本 AI 建模技术,极大降低了 AI 建模成本,提升了 10 到 1000 倍 AI 建模效率,目前已在多家银行、保险、证券等金融机构的数字化客户经营场景落地, 实现了销售管理的智能化提升。在智能舆情领域,盘古 NLP 大模型可以利用文档信息抽取、 情感分类、文档自动摘要等技术,在金融、电商、政务领域实现精准图情分析、企业运营 软件分析等。
聚焦行业细分场景,盘古 NLP 大模型在智能文档检索、智能 ERP、小语种大模型等领域先 后领地。在智能文档检索方面,盘古大模型团队获得了中国法律智能技术评测类案检索赛 道第一名,基于盘古 NLP 大模型构建的司法领域大模型能够赋能类案检索、法条推荐、司 法信息抽取、罪名匹配等一系列下游应用;在智能 ERP 方面,盘古预训练大模型与广发证 券合作企业财务智能预警项目,在该项目中,2019 年有 496 家企业被监管处罚、问询或 被 ST 处理,盘古大模型预测出其中 439 家,覆盖率近 90%,其中被监管处罚企业 111 家, 盘古大模型全部命中。在小语种大模型方面,华为与合作伙伴开发了支持千亿参数的阿拉 伯语 NLP 大模型,语义理解准确率达到 95%。
打破“双十定律”,盘古药物分子大模型加速新药研发进程。新药研发风险大、周期长、 成本高,为此医药界存在“双十定律”,即一款新药从研发到上市,平均需要 10 年时间和 10 亿美元的投入。针对上述难题,盘古药物分子大模型采用无监督学习模式和业界独有 的“图-序列不对称条件自编码器”深度学习网络架构,对市面上真实存在的 17 亿个药物 分子的化学结构进行预训练,实现了结构重构率、合法性、唯一性等指标全面优于现有方 法。其次,盘古分子生成器生成了 1 亿个创新的类药物小分子筛选库,其结构新颖性达到 99.68%,并且可以有效地生成理化性质相似的新化合物;基于盘古分子优化器,科研人员 实现了对起始分子化学结构的优化,并且能够改善药物分子的特性,盘古药物分子大模型 已经在 20 余项药物发现任务上实现性能最优(SOTA)。此外,西安交通大学第一附属医 院利用盘古药物分子大模型设计出的全新的广谱抗菌药物 Drug X,让先导药的研发周期 从数年缩短至一个月,研发成本降低 70%,打破了医药界的“双十定律”。
预测精度首超传统数值预报方法,盘古气象大模型突破中长期气象预报难题。中长期气象 预测准确率往往较低,传统数值预报将气象监测数据代入数学物理方程式进行预测,难以 改变中长期气象预测的困境。盘古气象大模型是首个精度超过传统数值预报方法的 AI 预 报方法,预测精度在 1 小时到 7 天内均高于传统数值方法(欧洲气象中心的 operational IFS),同时能够提供秒级全球气象预报,预测速度提高 10000 倍以上,台风轨迹预测准 确度世界第一,相比欧洲气象局提升约 20%,并且可实现 20 公里范围内、小时级、13 层 最高精度气象预报,如台风生成时间与移动轨迹预测的预测准确率超过 85%。此外作为 L1 行业模型,盘古气象大模型还能够为航天航空、海运、农业、交通出行、新能源等领域提 供 AI 气象分析能力。
先“楼”一步实现节能降耗,先“人”一步制造舒适环境。针对室外环境,盘古大模型能 够帮助企业实现智能能耗监测、节能减排,实现了电力能耗降低 15%以上;针对室内环境, 盘古大模型实现了对空气质量的监控与预测,相较于小模型,盘古大模型实现了 TVOC、 甲醛和 CO2 的预测精度分别提升 10%、15%和 15%。
AI 赋能时尚设计,盘古多模态大模型大幅提升设计开发效率。盘古多模态大模型基于亿 级自然图像进行预训练,并在十万级时尚产业数据上进行微调和优化,得到适用于服装行 业的盘古时尚多模态大模型。在技术层面,为了应对并行处理海量数据的挑战、提高模型 预训练的效率,盘古团队融合了稀疏训练、模型并行、数据并行等多种优化策略和算法, 实现了以天级为单位完成训练。在实际运用中,基于盘古多模态大模型中的“以文生图” 能力,时谛智能公司将服装设计周期从三周缩短至 3-5 天,化解了时尚设计产业中开发设 计周期长、生产成本高等一系列难题。