2023年恒生电子研究报告:金融大模型重磅升级,信创进展迅速

1. 恒生大模型 LightGPT 重磅升级,光子生态全面赋 能金融业务场景

1.1. 金融大模型 LightGPT 能力全面提升

LightGPT大模型能力持续升级。2023 年 6 月 28 号恒生发布 LightGPT。 通过在模型训练数据中充实更多金融知识,LightGPT 的专业能力得到了 重大提升,大模型的多轮对话能力、表格识别以及 JSON 格式识别取得 了相应进展。如果粗略比较,目前恒生 LightGPT 的能力和去年 11 月发 布的 GPT 3.5 应该大体持平。根据公司在金融技术大会上的介绍,在 2023 年底恒生将继续优化大模型的推理性能和逻辑能力,攻克复杂指令识别 的难关,使得任务的拆解和编排方面能够支持更复杂的业务场景。

LightGPT 在各个方面的性能指标都有明显提升。大模型效果整体提升 15%,安全合规性提升 13%,推理速度提升 50%,推理和训练全面适配 华为昇腾系列,且并面向金融机构实现 LightGPT-7B 的开源。 通过投研和投顾相关的训练数据改造大模型,增强了大模型专业性。针 对投研和投顾的应用场景,只在应用或者模型的外部做文章改善是有限 的,有一些东西必须通过训练灌输到大模型中。因此,针对投研和投顾 场景,恒生利用金融专业术语、简称、监管要求等投研和投顾相关的训 练数据改造大模型,提升大模型在抽取观点、识别图文和理解专业术语 等方面的能力,不断提高模型专业度。

LightGPT 适配了华为昇腾系列,缓解算力问题。为了解决算力问题, 恒生与华为进行合作,将 LightGPT 适配到华为昇腾系列,并提供了两个 版本的数据。其中,70B 的版本是恒生生产用的大模型,而 13B 的版本 则是方便各机构练手的小规模模型。

LightGPT 用专门的金融数据训练,不断提升安全合规性。如果大模型 不用专门的金融数据进行训练,就不能很好地应对安全合规方面的挑战, 会出现幻觉、合规风险和缺乏依据等各种问题。因而,公司基于专业金 融数据,有助于从根本上提升模型的合规性。

1.2. 光子系列产品打通金融 AI 应用的最后一公里

光子生态与大模型强强互补。光子是介于应用场景和大模型中间层的一 个完整生态,是金融应用对接大模型的“中控”部位。光子生态建设包 含三个层次:第一层是适配大模型,中间层是提供公用能力,第三层是 场景落地。光子生态可以与大模型实现优势互补,解决大模型数据的实 效性和事实性问题。另外,大模型本身虽然有一道保险,但仍然存在安 全合规的问题,而光子在应用过程中有双保险提供全面保障机制,可以 实现全流程自动化安全管控和实时高效的安全处理。

光子三大连接构建智能金融。光子有三大连接,首先,连接模型,充分 发挥大模型的能力。其次,连接金融行业专属资源。资源主要来自金融 机构,具有不同于 C 端用户的特点。最后,连接应用场景,对接各种应 用。在连接资源方面,恒生光子结合本地知识、金融数据以及专业知识 站点为用户提供更精准和及时的答案。在连接模型方面,光子可以实现 模型接入统一管控并屏蔽模型对接差异,使其不仅能够连接 LightGPT 本 身,还可以连接国内其他可用的大模型。在连接应用方面,光子提供简 单的配置,使应用与大模型的对接变得非常简单,让几分钟开发一个应 用成为可能。

光子系列产品可以为金融机构的投顾、合规、客服、运营等业务注入 AI 能力,成为金融从业人员的智能助手。恒生大模型在应用场景的尝试包 括重塑模式和嵌入模式。重构模式是基于大模型能力重构应用。在重构 模式下,恒生结合数据、资源以及大模型的语言和知识能力打造四大“新 物种”,分别是光子·文曲、光子·方圆、光子·善策和光子·慧营。“新 物种”可以利用人工智能大模型的能力代替人类完成相关岗位的工作, 其中,光子·文曲是面向投资顾问的一站式内容创作平台,光子·方圆 专注于投资合规领域,光子·善策聚焦投顾咨询场景,光子·慧营则定 位于资管与托管产品的运营助手。嵌入模式是指将大模型的能力作为 Copilot 嵌入到原有应用系统中,通过光子对接应用自身的 API 和数据要素进行相应的提取和扩展。恒生嵌入模式下的产品包括光子·问学和光 子·数见。光子·问学是金融业务岗前培训的学习陪伴助手。光子·数 见是在数据中台基础上叠加大模型的语言能力,提供业务数据智能查询 与分析等服务。

恒生将持续构建以光子为核心的生态系统,完善智能产品矩阵。光子生 态包括重塑模式和嵌入模式。重塑模式下,人工智能将替代人类完成工 作,而嵌入模式将变革现有产品的操作交互方式。通过引入大模型,用 户在使用嵌入模式的产品时将能够用语言指令控制既有应用,实现一步 到位的操作。为了打造嵌入模式的产品,恒生计划在原有系统界面中添 加一个对话框,用户可以通过对话框与光子对话。光子能够连接后台 API, 从而提供更加智能和高效的服务。此外,重塑模式和嵌入模式可以交织 在一起,形成 Agent 智能体。智能体可以将复杂指令拆解为单个步骤, 调用和组合不同的能力完成任务。大模型赋能后,传统应用可能将变成 一个个服务,而真正的应用可能就是大模型的对话框。

2. WarrenQ 焕新升级,助力投研数智化发展

2.1. WarrenQ 产品升级,一站式投研工具平台持续完善

智能投研平台 WarrenQ 全新升级,推出 WarrenQ 小程序、ChatMiner、 AI 写作和语音速记别等全新功能。第一,WarrenQ Chat 推出全新移动端应用程序,用户可以随时随地获取金融信息、行业概况、研究报告观点、 公司 F9 数据和行业 EDB 数据等信息都可以在微信小程序中轻松获取。 第二,ChatMiner 能力升级。WarrenQ 针对上百页的大文档场景进行特 殊优化,实现文档解析速度和数据读取速度的大规模提升。在 ChatMiner 的帮助下仅需十几秒就可以完成对 500 页招股说明书的文档解析。 WarrenQ 还根据研究员的关注焦点优化问题推荐。完成文档解析后, ChatMiner 会自动推荐相关问题,如公司主营业务、行业排名以及市场竞 争格局等,用户点击推荐问题即可快速定位到相关信息。

第三,WarrenQ 推出 AI 写作新功能。AI 写作结合了 WarrenQ 的三段式 脑图和 GPT 能力,用户只需输入标题,系统就会生成一个大纲。用户可 以查看大纲,确认内容是否符合预期。如果满意,用户可以根据每个子 标题生成相应的段落,每个段落都支持溯源,用户可以清楚了解生成内 容的来源。 第四,WarrenQ 发布语音速记新功能。用户可以将录音上传至 WarrenQ 的语音速记实时进行语音转录。语音速记能够自动识别讲解人,实现录 音片段与文字的一一对应。如果用户不理解某段文字,只需点击对应的 录音片段,系统即可将其定位至录音中的相应时间点。WarrenQ 还将 ChatMiner 与语音速记相连接,助力用户提升工作效率。如果录音时间过 长,用户可以直接向 ChatMiner 提问而无需阅读文字内容,借助 ChatMiner 的快速解读能力,获取录音的关键信息。

金融行业大模型需求场景调研显示,私有库问答场景需求量最大。私有 库问答属于 RAG 类应用,基于大模型和向量数据库将金融机构自有积 累的知识库通过 Chat 形式实现友好问答。智能投顾/投研的 Chat 助手的 需求量排名次之。恒生聚源首先通过投研方式让大模型能够处理大量金 融数据,再引入话术生成和推荐策略,并结合内部和外部的知识库,最 终形成一个 All in One 的 Chat 型小助手。大规模文档的深度挖掘和问答 场景的需求量排名第三。处理大规模文档时,需要将大模型与其他相关 AI 技术结合,从而实现针对招股说明书、公告、研报等的深度问答、比 对、挖掘以及辅助写作功能。

大模型技术使得 All in One 成为可能,一个大模型底座可以支持 N个场 景。在传统的 NOP 方法中,针对不同的业务场景通常需要训练和维护多 个小模型,每个小模型都需要针对特定的任务开发。但是大模型的出现 让 All in One 成为可能,基于一个大模型底座就能够支持 N 个场景。面 向落地应用,大模型增强方式主要有两个方向。第一个方向是数据增强, 即类 RAG 的方向。第二个方向是外挂工具。WarrenQ 已经集成了众多投 研领域的常用工具,比如常见的问答形式、脑图形式、笔记形式、语音 速记和在线 Excel 和 Word 文档等。由于金融领域的数据是 TB 级别的数 据,因此语控万数成为了大模型+N 场景的一大难点问题,也是技术上必 须攻克的难点和重点问题。只有找到准确的数据,才能打通落地场景的 通道,实现真正的应用。

2.2. WarrenQ 多场景落地,持续加强金融垂域“搜读算写”

恒生聚源参与了工银瑞信最新大模型创新项目 FundGPT 的建设。在其 中部署了 WarrenQ Chat 和 ChatMiner 两款落地型产品,并使用向量数据 库技术帮助客户对接内部知识库,成功构建了一个覆盖投研、财富、投 教等大规模场景的 All in One 的智能问答小助手。

公司对券商投行业务场景进行了优化。投行业务涉及众多大规模文档, 如招股说明书和相关底稿等,处理四五百页的大规模文件既耗时又繁杂。 恒生聚源大模型技术可以优化这一场景,首先利用 PDF 解析技术创建智 能目录,对招股说明书和底稿进行结构化处理,从而帮助用户快速找到 所需信息,大大节省文档查找和整理时间。其次,使用大模型+向量库+ 数据库的方式,实现底稿与正文的精确匹配,直接溯源文件内容与数据, 提高文件核查的效率和准确性。

针对固收场景同样进行了性能提升。固收场景同样涉及海量数据,包括 信用数据、地方经济内外部评级和市场资讯等数据。恒生聚源首先将固 收场景的各种数据与大模型建立一一映射,再围绕固收场景其他需要引 用的内容,利用大模型强大处理能力赋能整个固收问答。

恒生聚源也通过使用大模型,针对投顾、投研人员的业务需求,为其业 务过程各关键环节提供内容支持和工作引导,辅助金融从业人员提供更 好的服务,达到提升效率和降低成本的效果。

目前恒生聚源已经与十几家金融客户进行大模型在实际应用场景的共 创,未来将进一步赋能业务场景和业务团队。恒生聚源从 2023 年 6 月 28 日开始进行大模型产品的初尝试,到现在已经与十几家金融客户共同 探索了如何将大模型技术应用于实际业务场景。在金融技术大会上,公 司表示也将带来更加深度场景化的产品,真正将大模型技术融入金融从 业者的日常工作流程中,形成数据闭环和数据飞轮。基于 DataScience 的 思路,WarrenQ 将根据数据分布给出更智能的推荐,使大模型真正变成 贴心陪伴的小助手。

比肩微软 Copilot,WarrenQ“搜读算写”深入金融垂域,更具特色。 “搜”,WarrenQ Chat 对标微软的 New Bing,其与 New Bing 最大的区别 在于 WarrenQ Chat 的底层可以访问聚源全库,并链接金融库。这些金融 库的数据来自聚源数据库,确保了数据的准确度和权威性,从而避免大 模型胡说八道。“读”,微软 Copilot 主要进行自动摘要,而 WarrenQ 基 于 ChatMiner 产品,深入招股书、研报、公告等各个场景。WarrenQ 可 以对 500 多页的招股书进行快速解析,并自动推荐研究员关注的问题。 “算”,微软 Copilot 结合 Excel与 GPT 提供数据分析等服务,而 WarrenQ 在演算板上提供金融板的数据浏览器、金融板的变量计算,并且基于金 融域常用场景搭建在线估值模型。“写”,WarrenQ 新上线的三段式脑图 是一个 All in One 的文档,支持 Markdown、Word 和 PPT 格式的随意切 换,并且可以用 GPT 续写大纲和脑图,其特色是能够插入可自动更新的 活数据,底层由聚源数据库提供支撑,保证用户更好地在金融场景内开 展业务。

3. 恒生 UF3.0 内存交易不止于快,助力自主创新落地

3.1. 证券行业交易系统的性能提升迅速

对于证券行业核心交易系统而言,数据库的处理能力及性能至关重要,也是自主创新改造中十分关键的部位。目前恒生 UF3.0 已经开始搭载新 的技术引擎、内存数据库技术来满足系统对性能的要求。 证券核心交易这块的技术近年来一直在发展。首先,整个行业全面自主 创新进入了深水区,已经从原来的办公系统、管理系统进入到了核心业 务处理系统,而且向着大容量、高可用、高可靠等一些要求发展。2022 年证券协会发布了网络信息安全的三年提升计划,特地指引了核心业务 系统下一步的发展要求,在这个要求背后是技术的全面发展和引领未来 的变化。证券行业正在成为金融资本市场非常重要的技术发展的贡献者, 同时也在将这项技术进一步地向更广大的零售投资者进行发展。

证券行业从刚开始有市场就进入到了电子化时代,随后内存技术逐步成 熟,实现自主可控。场内交易、电脑作业、营业部单体化结构,这是早 期年代的技术从业者的工作主体。进入到 21 世纪,交易的网络化,从区 域集中到大集中,把现场的交易逐步引导到线上化的网上交易和手机 APP,这背后原因是中间件技术和传统大型关系型数据库成为主流。到 2012 年,交易的专业化、高频量化成为市场不可忽视的一股力量,所以 在内存技术和低延时的一些硬件上,不断地有各类的厂商和各类的新技 术涌现,也有一批券商里面能够展现出来非常有影响力的系统,体现了 极速通道、就近原则,但在那个时候,它们还只能覆盖到一些少量的客 户和少量的高精尖投资者。进入到 2020 年至 2023 年,内存技术越来越 成熟,已经可以通过内存数据库部分地替代传统的关系型数据库,将高 性能的交易技术和服务普惠化,通过低时延的平台,将低时延的硬件以 及各类关系型数据库及内存数据库进行很好的结合,实现自主可控、专 业分工,将交易技术更加专业化。

3.2. UF3.0 内存交易产品实现全栈信创适配与性能创新提升

恒生 UF3.0 内存交易产品将带给行业不止于快的全新交易体验。这款产 品可以满足行业对于自主创新、大容量、高并发、高可用、低时延、易 运维的新需求。除了业务系统自主创新之外,公司也一直与众多生态伙 伴保持深入合作,积极参与金融自主创新建设,全力助推金融自主创新 落地。 恒生电子从 2020 年开始在内存技术上将原来的少量用于专业投资者、 机构投资者的交易技术往零售业务场景上去发展。在这个过程中公司成 立了恒生的新一代核心交易系统的全景图,核心业务系统是在券商的核 心业务的基础上,分为基础平台和业务平台,下图底层都是自主创新的 各项基础设施,从桌面浏览器到数据库、网卡、CPU 等等,全部实现了 全栈信创适配,并且在部分客户已经实现落地。在最核心的交易环节, 内存交易技术一直是行业内努力去尝试的,而恒生在这个过程中也在积 极地考核实践,目前恒生在这项技术上已经完全就绪,并且能够实现在 行业内批量上线。

UF3.0 这款内存交易产品主要有六大特点。首先,它是一个完全自主创 新、全栈信创的产品,能够适配市场上主流信创芯片、操作系统、服务 器、网卡以及数据库,在它最核心的交易部分采用恒生自研的内存数据 库技术,并且在数据持久化处理上可以适配 OB、Gauss、Golden 以及一 些主流的数据库,同时它具备大容量、高并发、高可用、低时延以及易 运维等特性。

在基础设施适配上,非常重要的一项工作是跨平台混合部署来满足客户 自主创新逐步替代。从自主创新角度来讲,无论是在持久化数据库适配 上,还是网络设备层、计算设备层、操作系统,公司全栈适配了市场上 主流的信创的设备,并且在这个基础上还会不断地去适配更多的设备, 让客户有更多选择。因为信创是一项非常艰巨的工作,在这个过程中又 要保证核心业务系统的稳定性,所以在整个的实现路径中一定是逐步替 代,从双轨到单轨逐渐实现的。 所以公司在技术平台总部的支持下,目前实现了这套技术能够搭载在不 同信创的适配层上。公司的业务应用代码是同一套,通过平台层来屏蔽 硬件以及系统差异。这意味着,如果在信创技术软硬件上有多种选择,未来应用层是不需要做调整的,同时也支持跨平台的通讯和信息交互, 实现同一套系统的不同应用可以部署在信创、非信创、信创 a、信创 b 等 不同的环境里面,通过平台层来屏蔽硬件的差异,实现跨平台通讯,最 终满足混合部署的能力。

UF3.0 大容量体现在数据量大上——500 万账户。行业的一些头部客户 在测试的时候分两档,一档叫 300 万客户,一档叫 500 万客户。500 万 客户意味着内存的交易技术可以进入到一个新水平,因为任何交易在量 小的时候,它的交易并发、交易时延、交易可靠性都能保障。当它量大 到一定程度,还要保持高可用、高可靠,这是一个非常苛刻的技术要求。 而恒生电子目前在 500 万账户上可以完全适配现在交易需要。 UF3.0 在并发上也实现了性能领先。证券行业交易在集合竞价的上下午 都有一次非常并发的大量委托同时提交的场景,在这个过程中伴随着委 托的提交还会有查询、登录,所以证券行业核心交易应用对并发有着高 要求。目前在 500 万账户等级下,公司纯委托吞吐可以达到 10 万/tps, 混合请求可以达到 120 万/tps,这个数据目前在市场上处于非常领先的 地步。在这背后是技术团队在读写分离、在高并发设计中使用了自己的 多线程并发的 MVCC 技术、三重防死锁机制以及运维单线程有限处理 等等。公司整体的限流能力、通过 API 和前端存储降低发送速度,来保 证整个交易过程中券商的信息技术团队、运维团队的可靠。

除了高性能,UF3.0 还能保证高可用。因为证券零售交易不允许出现错 误,RTO 和 RPO 要严格遵循主备切换为 0。这背后是采用多线程的处 理,保证能够有最大化容错,同时通过交易配比、多个查询及数据结果 强一致来实现主备的 RTO 和 RPO 为 0。并且在这个过程中,数据保障 机制也是通过内存数据库的实时快照、redo 日志落地、物理数据库的超 级备份三层保障机制来保证数据绝对不会丢失。公司经过实验室测试, 在 RTO 为 0、RPO 为 0 的情况下,回切到原来的物理的关系型数据库的 时间小于等于 1 分钟,超越了市场上已有的上线案例。这种能力对公司 未来能够批量化地为整个行业交易升级提供了基础性保障。

低时延方面,UF3.0 系统能够实现核心穿透在 50 微秒以内,全链路上行 在 1 毫秒以内。这背后是恒生多年来在内存技术上的沉淀和进步带来的 结果。恒生坚持软硬件结合,所以恒生一直在与华为、硬件提供厂商讨 论硬件上怎么去满足低时延要求。软硬件结合可以结合多维度的数据进 行优化,包括通信线程模式的深度优化、并行处理框架、统一操作系统 的资源封装以及网卡内核旁路技术、RDMA 技术、内存池的管理技术, 这些技术保证了低时延,这个速度真正能够实现把专业投资者的场景普 惠应用到所有的零售投资者。

在运维方面,整个 UF3.0 内存交易的产品设计和开发过程中,充分借鉴 了原来做 UF2.0 和做 UF3.0 交易系统过程中所遵循的一体化和全链路 日志规范要求。在这个过程中公司又参考了信通院发布的运维可观测的 要求,在内存数据管理上做了一个非常有帮助的工具,能够支持单表、 多表的查询、操作、更新等等。并且考虑到整个交易链路随着业务的发 展会产生变化,所以还提供一个时延分析工具,这个时延分析工具最开 始在机构快速交易系统上能够非常有效地去监测到每一笔交易在各个 交易的链路上所耗时的大小,从而有效地提升交易效率。现在把这个技 术也应用到 UF3.0 内存交易上面来实现软硬一体全链路时延监控、一站 式性能监控,通过侵入式和非侵入式两种模式结合来统一分析。 另外,在系统的安装和部署方面,实现了一键升级、一键部署,并且支 持版本回退,全程白屏化操作。同时,因为交易行情瞬息万变,在容量 扩增上可以支持动态扩容,把部分客户迁移到新增站点上。在软件升级上也支持蓝绿发布和金丝雀发布。

4. 恒生信创布局迅速,经验领先

4.1. 信创产品发版节奏快,上线完成率高

对于证券行业核心交易系统而言,数据库的处理能力及性能至关重要, 也是自主创新改造中十分关键的部位。目前恒生 UF3.0 已经开始搭载新 公司从 2018 年开始做信创。一开始公司就认为技术平台一定要考虑信 创,当时恒生在做 Light 技术平台,所以一开始做的事情是做到与数据 库无关、平台硬件无关,这是第一个考虑点。在 2018 年 Light 技术平台 推出之后,2019 年与信创第一批试点的浙商证券一起做了用户中心,当 时整个信创技术栈实现了落地。在 2020 年、2021 年、2022 年正常地按 照一批、二批、三批试点,全面在推进信创。

恒生所有的产品总共归类是 33 类,但不止 33 个产品。所有产品在技术 栈无外乎都在这 33 类里面。在 33 类信创发版情况方面,到目前为止 80% 已经全发了,计划 2023 年年底 100%发,所以全员都在为这件事情而努 力。33 个产品中已经有 14 个是真实在用了,是有客户上线的。目前整 体做信创的项目有 100 多家,单轨上线的有 60 家,双轨的有 11 家,实 施中的还有 50 多家。

4.2. 沉淀业务经验,保证创新引领

公司 100 多个项目积累了很多信创的经验。经过公司系统性盘点,总结 了 6 点信创中的主要问题。第一是数据库问题。在开始只有 Oracle 可选 的背景下,只能按 Oracle 语法写。现在线上数据库有 200 多个,所以一 开始在做系统的时候要思考怎么让一个业务系统能适配 200 多种数据库, 至少要适配 3-5 种。 其次是信创的稳定性怎么保障。稳定性也是客户最关注的问题,如果上 线后数据库或者硬件出问题,怎么能切回来以及怎么保证监管要求,是 要考虑的问题,所以业务的连续性保障是要考虑的。第三,在过去大量 使用了开源,而现在有很多信创商业中间件,它跟开源的迭代速度是有 差距的,所以一旦选择了商业中间件之后,商用中间件功能补全也是现 在亟需解决的问题。第四是桌面终端怎么换;第五个点是低时延设备, 这是更难的难题,目前来看,换低时延的设备一定会落后于没有换低时 延设备的,所以在业务系统上要做哪些改进能够降低一些时延,这也是 要考虑的点;最后一个点是连续业务、连续性保障,目标是所有业务系 统上线信创设备之后,原来的运维技能还能用。

公司提出“一次 SQL 编写,处处运行”,解决数据库难点。在该方面, 公司拆成了三个阶段。第一个阶段是开发前做了一个扫描工具,所有 Oracle 语法跟信创数据库的语法不兼容的或者特殊函数都识别出来,公 司花了两三年时间去积累所有数据库上的不同点。具体地,在引擎里面 先去扫,发现有与 Oracle 不兼容的且必须得用的话,就在不同的数据库 中换不同的写法;第二阶段是在开发阶段,提供统一 SQL,在这一层会 转换,因为知道规则之后,就可以转成想要的比如 Oracle、高斯、OB 的 语法来运行。换上自己 SQL 引擎后,基本上代码就能跑通,经过公司内 部测试,95%的都可以转,但性能会有一点下降;最后最难的是测试, 测试人员要把所有数据库都布一遍、再跑一遍,所以在这一层又加了一 些工具来帮助测试人员并行跑,如果有部分出问题,就把对应的 SQL 挑 出来看写法,并进行更改。所以在公司内部,开发是要求按照公司自身 的 SQL 标准写一次,通过这些工具化、前端扫描、中间的转换以及最后 的检测,当识别出来有问题后,再针对信息进行修改。因为行业的数据 库是外在的,公司自身能做的是尽量去适配多的数据库,来降低行业的 一些改造成本。

第二个难题是升级,公司提出三步走的方式,实现稳妥迁移,从而保证 业务的连续性不受影响。在升级方面,因为 Oracle 最稳定,因而所有项 目第一件事情是上 Oracle 版本。但公司在做这件事情的同时会帮助把信 创数据库上线,同步验证信创数据库的容量和稳定性问题,在测试环境 里不停用真实的数据跑它的功能。第二阶段就开始在网关这一侧去做流 量切换,开始找定点客户、定点功能在信创数据库里面跑。但公司跟 Oracle 数据库一定是双向同步的,这其中公司用了两种同步工具,一种 是 Oracle 往公司产品这边同步,一种是公司往 Oracle 同步。这样的好处 是公司的数据库出问题后 Oracle 还能用。在这个过程中一点点切,直到 最后全部切到了信创数据库之后,还把 Oracle 数据库继续放着,会把所 有数据往 Oracle 数据库继续同步,这里每个阶段时间长短都是根据系统 的不同来决策的,比如周边一点的系统,可能第一阶段用 1 个月,第二阶段用 3 个月,最后一阶段用 2 个月,一起 6 个月做完。核心交易系统 因为要并轨运行,需要更长的时间。所以公司在上线的时候,提出三步 走的方式,实现稳妥迁移。

技术平台适配、商用中间件功能补全,来实现业务无感知。原来直接用 业务系统访问开源中间件 SDK。商业中间件使用中,也是把开源中间件 换成商业中间件的 SDK。这件事情看起来简单,但是对一个工程化的项 目来说没办法这样简单处理,因为如果公司所有业务系统都这样,每个 客户代码得重新编一遍。所以公司在技术平台上做了封装,把所有的 SDK 都做了一层适配层。但比如东方通、宝兰德可能没有 RabbitMQ 的 一些高可靠或者通用的协议以及通配符,因为商业中间件有自己的开发 计划,跟开源相比,商业中间件没有开源中间件的一些特性,但是这些 特性对业务开发来说非常有价值,比如用了之后可以少写很多代码,但 没有的时候,解法是在技术平台这一层做很多业务上的加强和加固,例 如商业中间件不支持通配符,那就在技术平台做通配符。中间件的开发 规范标准都是一样的,中间件也有很多,因为一个项目里面,会有大大 小小的中间件,如果是 Java,则有上千种,小到一个日志的发布、一个 JSON 组件的封装,所以会非常复杂。公司的 JRES 平台在做这一层事情 上花了很大代价,最终实现了业务对代码无感。

桌面终端是一直很少有厂商去碰的痛点。在金融行业,Delphi、C#、QT 这三种是主流,但现在 Delphi 可用性差,C#面临着微软,QT 之前开源,但 1.5.2 版本之后版本都不开源了,所以国内面临着选什么的问题。公司 原来的桌面终端大量是基于 C#写的,这也是 Windows 上性能最好的一 种写法,即 WPF 的语法,后来公司利用的一个开源的框架 Avalonia 也 兼容 WPF 语法。公司现在内部要求对桌面终端的操作体验、极致性能 的要求没那么高,不要用桌面终端去写,用 Web 端去写,所以公司 80% 的页面现在是纯 Web 页面,这样就不存在信创的问题了。但对于金融行 业,仅 Web 端是不够的,所以公司花了很大代价在做这件事。但未来还 是用公司自己的桌面终端操作系统的开发框架,所以公司最近也在跟 UOS 的一个操作系统 DTK 接触,最终公司会切到这条主线上。总之, 桌面终端上,公司内部首选 Web 端,原来的桌面端尽量不会修改。

在信创里的低时延设备跟传统终端相比,国内还是有很大差距。所以公 司在中间件层、OS 层以及硬件层,也做了很多自身能做的事。比如在中 间件层,X86 和 ARM 芯片遇到一个问题,即在 ARM 上,公司原来用的 是自旋锁或者内存加锁技术,锁会导致 CPU 使用 100%,其本质问题是 芯片指令集的问题。在内核这层,公司专注于 RDMA、网络调优,旨在 屏蔽一些网络层的协议栈来加速消息的通信速度。在低时延的场景上, 更多关注信创的硬件性能;在软件设计上,公司在尽可能地去优化。

在所有信创系统最终上线后业务连续性需要得到保障。因为一个系统的 上线可能只有一年,但是它的运行可能是 10 年,为了保证运行过程中所 有信创问题能够及时被发现,所以公司提出口号“1 分钟发现、5 分钟定 位、10 分钟恢复”。在具体实现上,公司把所有硬件指标和业务指标进 行梳理,明确指标后才能及时发现问题。但如何将指标定位到一个场景 里面去发现问题?所以公司又针对不同的场景梳理场景种类,包括全链路日志、异常日志、操作系统日志、各种中间件日志等,做到 5 分钟就 能找到问题相关的日志。找到之后就能恢复,恢复的手段包括重启、再 开个节点移过去、灰度升级,公司保证了指标全、日志全、处置手段全。 随着极速交易分布式的到来,基本上没有可能让某个运维人员可以知道 问题出在哪台机器上,可能它都不是在机器而是一个容器,所以只能通 过全链路、通过运维工具来解决这个问题。运维也是一个要不断进步的 领域,要基于工具不断去迭代它的工具、场景和指标,再去写代码,用 Python 或者开发语言完善处置手段。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告