科大讯飞在大模型训练方面具有核心算法积累、数据积累和应用、算力支撑三大优势。
核心算法积累:讯飞多年来在 Transformer 深度神经网络算法方面拥有丰富经验,2022 年累计获得了常识阅读 理解挑战赛 Open Book QA、知识推理阅读理解任务 QASC、逻辑推理基期阅读理解挑战赛 ReClor 等 13 项认 知智能国际竞赛冠军;开源了 6 个大类、超过 40 个通用领域的系列中文预训练语言模型,在 Github 平台获得星 标数位列同类中文预训练语言模型第一并远超第二名。
数据积累和应用:科大讯飞拥有语音及语言信息处理国家工程研究中心多年研究过程形成的积累,公司产品在中 文语音市场占有率领先,为公司提供了丰富的中文文本数据积累;同时,公司在教育及医疗等行业的深度应用为 公司积累超过 50TB 的行业语料,讯飞人工智能开放平台日使用量超过 50 亿人次,为公司提供了专业场景下的 垂直数据资源;公司在教育、医疗、智慧城市、办公、汽车等领域的广泛应用也为大模型的创新推广提供了应用 场景保障。
算力支撑:公司在总部自建有数据中心,目前已建成 4 城 7 中心深度学习计算平台,在工程技术方面实现了百亿 参数大模型推理效率的近千倍加速,为大模型训练及规模化应用奠定硬件基础。此外,公司的训练、推理在国产 平台上的方案已跑通成型,公司也牵头承担了国家自主可控人工智能平台的诸多项目,与华为、寒武纪、曙光等 企业建立深度合作,实现大模型训练自主可控。
星火大模型已具备较强的文本生成、多轮对话、逻辑推理及代码生成等能力,进而实现 AIGC 能力对公司垂直行业应 用的升维重塑。讯飞星火大模型已具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能 力等通用人工智能七大维度能力,V1.5 版本进一步带来更强的开放式知识问答能力、逻辑推理和数学能力以及多轮 对话能力,实现大模型获取即时信息更新。讯飞通过底层大模型的理解认知能力支撑上层应用价值提升,大模型提供 的内容生成能力将赋能教育、工业、医疗等场景应用,支持讯飞听见及办公硬件等消费者产品实现更强的文本概括及 生成等能力,提升讯飞各类产品的人机交互体验及个性化服务精准性,从整体上提升讯飞各大产品线为用户提供的价 值量。目前,讯飞已将星火大模型与教育、办公、汽车、数字员工、工业、医疗六大产品线结合,实现场景内个性化 程度大幅提升,人机交互体验更加顺畅,达成 AIGC 能力对公司垂直行业应用的升维重塑。
教育:学习机实现作文高级批改,能识别错别字、语句不通,及根据作文要求评价内容,快速完成普通教师 30 分钟的批改量;英文作文纠正拼写错误、词汇用法和句型结构。讯飞星火语伴 APP 提供 AI 开放式英文对话练习 能力,实现 AI 虚拟老师、实时口语纠错、多语种翻译等功能。
医疗:讯飞星火大模型赋能诊后康复管理平台,根据患者各项就诊数据,为患者提供详尽的诊后康复计划,并可 根据患者的后续检查结果及医生反馈进行实时调整;此外,AI 线上问诊功能可对患者进行针对症状的详细询问, 并根据患者的病历情况及主诉症状给出针对性建议。
工业:讯飞羚羊工业互联网平台为工信部“双跨”工业互联网平台,依托 AI+大数据能力实现企业服务供需高效 对接。与星火大模型结合后,讯飞羚羊 APP 通过大模型能力、工业平台上的知识库和服务资源,进行 AI 企业经 营问题分析,提供相关服务和解决方案的对接和推荐,实现供需高效匹配;此外,企业可基于星火大模型构建企 业知识大脑,通过工业知识库+企业内部知识库+星火大模型实现 AI 协助企业运营。
办公:在办公本、录音笔、讯飞听见等办公产品中提供语篇规整及规整前后对比,会议纪要并根据手写内容概括 会议重点,根据录音实现品宣文案、新闻稿件等各风格需求一键成稿,并可翻译成多种语言。星火大模型+讯飞 智慧屏实现会议多模态纪要留痕,多风格纪要整理,以及自动化工作待办输出。

汽车:实现车内实时语音交互,实现路线搜索、行程规划、故事朗读、电话录音并纪要等功能。
数字员工:实现更加智能的虚拟人智能交互;基于星火大模型,用户可用自然语言操控讯飞 RPA,完成自动数 据分析并以 PPT 形式生成数据分析报告等任务。
预计星火认知大模型仍将以平台+赛道的模式为公司创收。一方面,星火认知大模型作为公司的 AI 能力底座,能够直 接以平台开放 API 接口的模式赋能开发者,该形式下目前可能的收费模式包括订阅收费、按流量收费或收取授权费用 等。参考 ChatGPT 目前的收费标准($0.002 / 1K tokens),假设星火 API 价格约为 15 元/1M tokens,假设每个接 入的应用平均每日接入人数 1 百万,平均每人每日使用 1000 token,则单应用每日可为讯飞贡献 1.5 万元收入。若讯 飞星火大模型可赋能 400 个应用,则星火大模型 API 可贡献收入 22 亿元/年。另一方面,星火大模型能够直接赋能公 司教育、医疗、办公、汽车等行业垂直领域应用,提升产品功能,进一步通过提高 ARPU 和用户粘性的方式为公司 增加收入。
星火助手中心开放用户自定义 AI 能力,星火助手生态拓展大模型功能边界。讯飞推出星火助手中心,已上线 200+ 助手,包括文章润色、合同助手、职业规划师、模拟面试官等。星火助手中心支持用户通过设定助手类型、功能描述、 是否需要上下文理解、助手指令(prompt)等字段,自行搭建需要的星火助手功能,并可上架至助手市场,开启 AI 能力的用户共创。星火助手中心一方面让用户能根据自身需求构建标准化可复用的 AI 能力,提升星火大模型的使用 体验,另一方面,用户可将助手能力上架开放给星火全用户,构建星火助手生态,通过用户共创拓展大模型功能边界, 提升产品价值量。
能力+插件+产业开放共创,讯飞与开发者共建星火生态。目前,讯飞已拥有 400 万+实名认证开发者以及 500 万+合 作伙伴,基于星火大模型的 AI 能力,讯飞将为生态伙伴提供从产品、技术到生态资源、渠道体系等方面的深度培训 赋能。此外,讯飞还将开放星火大模型插件能力,通过开发者生态进一步拓展大模型能力边界。产业合作方面,讯飞 已与 36 个行业、超 3000 家企业达成合作意向,打开星火大模型垂直行业赋能空间。