下面对部分模型进行简要介绍:
文心:文心大模型是百度为主体发布的产业级知识增强大模型,能够理解和生成自然语言,同时结合 知识图谱,提升了学习效率和可解释性。文心大模型包括多个子模型,如ERNIE、PLATO、鹏城-百 度·文心等,分别在语言理解、文本生成、跨模态语义理解、对话互动等领域取得多项技术突破。其中 鹏城-百度·文心是全球首个知识增强千亿大模型,参数规模达到2600亿,在60多项典型任务中取得 了世界领先效果,在各类AI应用场景中均具备极强的泛化能力。
悟道:悟道是北京智源人工智能研究院开发的一系列超大规模预训练语言模型,包括悟道1.0和悟道 2.0。悟道2.0于2021年6月发布,参数量达到1.75万亿,并在世界公认的9项 Benchmark 上达到了世 界第一,在多项基准测试中超越OpenAI GPT-3、DALL·E以及Google ALIGN等先进模型;除此之外智源通过FlagAI开源平台,将悟道GLM正式开源。
盘古:华为盘古β大模型是循环智能与华为云联合推出千亿参数中文语言预训练模型,鹏城实验室 提供算力支持。华为盘古β是2020年4月25日发布的Transformer encoder-decoder的中文理解模型, 在权威的中文语言理解测评基准CLUE榜单中,总成绩及阅读理解、分类任务单项均排名第一。而鹏 程·盘古α大模型是鹏城实验室与华为联合研发的全球首个完全开源开放、以中文为核心的两千亿参数的预训练生成语言模型,包括鹏程·盘古α、鹏程·盘古增强版、鹏程·盘古多语言大模型和鹏程·盘 古对话生成大模型。
混元:该模型在国内最权威的自然语言理解任务榜单CLUE上取得了优异的成绩,并且已经成功应用 于腾讯广告、搜索、对话等多个核心业务场景。2022年底,混元1T大模型利用腾讯太极机器学习平台 的高效算力和低成本网络,用千亿模型热启动的情况下,可以在256张显卡上一天内完成训练。
通义千问:2023年4月,阿里正式发布“通义千问”,该模型基于10万亿级参数的大模型底座M6模型。 该模型在电商、制造业、文学艺术、科学研究等领域有广泛应用前景,并且已经实现了商业化落地。
封神榜-姜子牙:2023年5月17日,IDEA研究院发布“姜子牙通用大模型V1”,姜子牙通用大模型v1 (Ziya-LLaMA-13B-v1)拥有130亿参数,从LLaMA-13B开始重新构建中文词表,进行千亿token量级 的已知的最大规模继续预训练,使模型具备原生中文能力。再经过500万条多任务样本的有监督微调 (SFT)和综合人类反馈训练,进一步激发和加强各种AI任务能力。
知海图AI:2023年4月,面壁科技与知乎合作的知海图AI正式发布,该项目在开源的双语预训练语言 模型CPM-Bee基础上进行研发。值得一提的是,作为参数量10B的CPM-Bee模型,不仅有十余种原 生能力,更是具有强大的通用语言能力。CPM-Bee模型于2023年1月15日在 ZeroCLUE 榜单上登顶 榜首。
GLM-130B及ChatGLM:GLM-130B是清华大学发布的预训练语言模型,具有1300亿个参数。根据其 官网介绍,该模型不仅支持中文和英文双语,两种语言的精度均于发布时对比其他模型具有明显优 势,除此之外,GLM-130B具备快速且基本无损推理的能力,并兼容包括昇腾NPU、英伟达GPU、海 光DCU等多种架构的智能计算芯片。2023年3月,对话模型ChatGLM-6B及千亿对话模型ChatGLM由 智谱AI(由清华大学计算机系技术成果转化而来)正式发布。
MOSS:2023年2月由复旦大学邱锡鹏教授团队正式发布,并于4月正式上线并开源。开源代码涵盖模 型训练和推理代码,开源数据包括超100万条对话训练数据,开源模型包括160亿参数中英双语基座 语言模型、对话模型及插件增强的对话模型。 要想大模型蓬勃发展,仍需在以下几大方面继续努力。
提升算力水平:算力是支撑大规模预训练语言模型训练和部署的关键因素。因此,集中力量建设“中 国算力网”,像使用电力一样使用算力,将成为未来我国人工智能基础建设中的重要一环。一方面赋 能用户根据需求灵活获取和使用各种类型和规模的AI算力服务,降低人工智能应用开发和部署的门槛和成本;另一方面也使得大规模算力跨区域协同计算成为可能,为我国人工智能产业发展提供强 有力的支撑。
加强数据资源建设:数据是训练大规模预训练语言模型不可或缺的基础,如何建立我国的数据标准以 及数据工程化实现方案对于提升我国在自然语言处理及语言大模型成果产生方面,将产生重大意义。
探索新颖有效的模型架构:ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言模型 性能和泛化能力的核心要素。诸如多头注意力机制的改进、深度残差网络的优化、人类反馈强化学习 (RLHF)的应用以及在多模态数据处理及应用方面的探索和尝试,均对新一代大模型的产生,提供 了巨大的支持。