2022年星环科技研究报告 企业级的大数据基础软件开发商

一、企业级的大数据基础软件开发商

星环科技围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提 供基础软件及服务,已形成大数据与云基础平台、分布式关系型数据库、数据开发与智 能分析工具的软件产品矩阵,支撑客户及合作伙伴开发数据应用系统和业务应用系统, 助力客户实现数字化转型。

(一)提供大数据基础软件、技术服务以及解决方案

公司致力于为客户提供数字化基础设施底层、中间层的基础软件和技术服务,支持客户 的技术团队及合作伙伴构建数据和业务应用系统,助力客户进行数字化转型。公司具体 主要提供两大类的产品和服务:第一类是大数据基础软件业务,包含基础软件产品和技 术服务;第二类是应用与解决方案,主要针对大数据应用场景,提供大数据存储、处理 以及分析等相关场景下的咨询及定制开发等服务的解决方案;除上述两类业务以外,公 司根据客户及项目需求销售少量第三方软件、硬件等其他业务。

1、大数据基础软件业务

星环科技的大数据基础软件业务主要包含基础软件产品及其配套的技术服务。公司基础 软件产品中主要包含大数据与云基础平台软件、分布式关系型数据库软件、数据开发与 智能分析工具软件等三种产品,其中分布式关系型数据库收入占比较小。由于大数据基 础软件专业性较强且对于整个信息系统的重要性较高,需要提供技术服务支持,结合客 户需求,公司建立了相应的技术服务标准和服务等级,提供针对性的技术服务。 ① 大数据与云基础平台软件:大数据基础平台(TDH)和数据云平台(TDC) 公司自主研发的 TDH 是一站式大数据基础平台,是通用的高性能大数据平台,提供标 准的 SQL 开发接口,有着优秀的数据库兼容性。目前已在已经在政府、金融、能源、制 造业等十多个行业内落地。

TDC 是一款基于容器技术的数据云平台,支持将大数据基础平台、分布式关系型数据库、 智能分析工具等大数据软件以 PaaS 云服务的方式提供给客户,满足客户对数据平台的多 租户、弹性可扩展和使用灵活性的要求,可以在一个云平台上支撑大量的用户需求和数 字化应用,适用于建设大型企业的数字化基础设施、城市大数据中心的数据平台、企业 级数据应用云以及跨多数据中心的数据平台等场景。

② 数据开发与智能分析工具:TDS,Sophon 和基于隐私计算技术数据要素流通工具集。TDS 是公司研发的一款用于大数据开发的工具集。TDS 内置多个数据工具产品,为企业 构建数据仓库、数据湖、数据中台,提升业务客户对数据资产的利用效率,帮助客户实 现数据对业务的赋能。 Sophon 是一款一站式人工智能平台,包含一系列数据分析与机器学习建模工具的智能分 析工具软件。Sophon 能够一体化地完成数据采集、数据接入、模型构建、模型测试、模 型管理、知识存算和推理以及辅助决策流程,支撑各类业务的数据分析、探索与服务。 通过 Sophon 内置的统计算法、机器学习算法和深度学习算法,用户能够更高效地进行大 规模复杂数据分析和预测性分析,从而辅助业务决策,提高企业的数字化运营能力和智 能化决策能力。

基于隐私计算技术的数据要素流通工具集,即公司基于 TDS 和 Sophon 的多个产品打造 了星环数据要素流通工具集,该工具集能够为数据资源方和数据消费方提供一系列的数 据安全防护和隐私计算的能力,在各方数据不出域的前提下,提高数据流通参与方在数 据存储、传输、发布、分析和联合建模等各个环节的安全保障。

2、应用与解决方案

用户可应用大数据进行数字化转型及价值发掘的场景众多,潜在需求较大,但由于相关 领域较新、技术专业性较强,用户对如何运用大数据构建相关信息系统希望得到专业的 建议和支持。为了协助用户理解大数据信息系统的使用功效及搭建相关大数据应用,针 对一些特定应用场景,公司提供大数据存储、治理以及分析相关的咨询、定制开发等服 务的解决方案。在解决方案的服务实施中,公司可以搭配自身产品进行销售,并通过为 用户解决问题,进一步推广公司产品、树立行业示范标杆,产生业务价值。

(二)创立近十年,发展稳步推进

星环科技成立于 2013 年,致力于打造企业级大数据基础软件,围绕数据的集成、存储、 治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务。公司成立后不 断加强自身硬实力、发布新产品以拓展市场,后续分别发布了 Inceptor 分析型数据库, StreamSQL 技术、Sophon、云产品 TDC、ArgoDB、StellarDB 等产品,目前公司产品已 经在十几个行业应用落地,拥有超过一千家终端用户。2022 年,星环科技科创板上市。

(三)营收保持高速增长,体系逐步完善费用下降

随着公司近年来产品线逐渐完善,所覆盖领域认可度和知名度持续提高,公司营业收入 也随之快速上升。2019-2021 年,公司营业收入增速均高于 25%,2021 年,公司营业收 入达 3.31 亿元,同比增加 27.26%。其中,公司最主要收入来源为软件产品与技术服务, 2019-2021 年占比均为 90%以上。公司覆盖金融、政府、能源等多个领域,产品获得众 多行业龙头客户的高度认可,金融和政府收入占比逐步攀升。2019-2021 年,公司最主要 收入来自于金融行业,收入占比持续上升,至 2021 年,金融行业收入占比为 42.58%, 同比上升 2.68pct;政府收入来源仅次于金融行业,2021 年,政府收入占比为 27.90%, 同比上升 4.96pct。

公司近年来,销售毛利率整体维持在较高水平且波动较小。2021 年,公司综合毛利率为 58.94%,与 20 年相比增长 0.92pct。分产品来看,应用与解决方案对毛利率影响较小, 因此排除。其他业务除技术服务外,毛利率均相对稳定。公司软件产品授权业务毛利率最高,2019-2021 年毛利率均在 95%以上,也是影响综合毛利率最重要的业务。技术服务 近年来毛利率呈上涨趋势,2021 年毛利率为 36.65%,对比 2019 年提高 21.83pct。

费用率前期整体呈下降趋势,去年开始趋于稳定。星环科技近年来整体费用支出较高, 因此虽毛利率维持在较高水平,但净利润依然为负。2021 年,公司研发费用率 42.46%, 管理费用率 40.89%,销售费用率 61.42%。从各项费用拆分来看,人工成本是公司最主要 的费用支出。2021 年职工薪酬分别占管理费用、销售费用、研发费用比例为 41.67%、 77.95%、86.89%。

销售费用中职工薪酬占比较多的原因:一方面,公司仍处于快速扩张阶段,为加速在更 大范围内推广公司基础软件产品、进一步扩张公司规模,公司持续扩大销售及技术支持 队伍,从事销售业务及售前支持的人员数量及工作量增多。另一方面,公司所处的大数 据行业属于新兴产业,产品专业性强,需要更专业的销售人员帮助合作伙伴和客户理解 新技术及产品应用,因此,公司销售体系和销售人员培训体系需更加专业和完善,才能 使销售人员更好地满足产品销售需求,进而提高公司的销售水平。

管理费用中职工薪酬占比高的原因为,公司保持有竞争力的薪酬水平以吸引人才, 2018-2021 年管理人员人均薪酬水平有所提高。同时,随着公司经营规模逐步扩大,为更 好地支持业务开展,公司增加了管理职能部门的人员,因此职工薪酬金额相应增加。 研发费用中,公司研发人员薪酬增长主要系人员数量增长及人均薪酬水平提升所致。研 发人员是保证公司不断创新产品服务的基础。公司高度重视技术研发投入,以保证公司 核心技术的持续完善以及相关产品的快速迭代。

公司人员数量由 2019 年末的 720 人上升至 2021 年末的 1024 人,完善了研发体系、销售 体系、管理体系等方面的建设,人力资源的爬坡式需求已经过去。随着公司业务持续发 展,规模效应已逐步显现,人均创收呈增长态势,2020 年,公司人均创收达 32.99 万元, 同比增长 36.32%;2021 年,人均创收基本持平原因系当年公司加大了研发、管理等相关 人员招聘力度,所带来的收入效应会有延迟。未来人员扩张方面,将重在进一步优化研 发和销售相关力量和提高效率,且在公司继续提升经营效率和拓展业务的情况下,规模 效应会愈加明显,人工创收有望进一步提高。

二、数据库行业迭代发展,国内厂商有望把握机遇突围

(一)数据库发展历程

首款企业级数据库产品诞生于上世纪 60 年代,六十余年发展过程中,数据库共经历前关 系型、关系型和后关系型三大阶段。 前关系型阶段数据库的数据模型主要基于网状模型和层次模型,代表产品为 IDS 和 IMS, 该类产品在当时较好地解决了数据集中存储和共享的问题,但在数据抽象程度和独立性 上存在明显不足。 关系型阶段以 IBM 公司提出关系模型概念,论述范式理论作为开启标志,期间诞生了一 批以 DB2、Sybase、Oracle、SQLServer、MySQL、PostgreSQL 等为代表的广泛应用的关 系型数据库,该阶段技术脉络逐步清晰、市场格局趋于稳定。 后关系型数据库阶段由于数据规模爆炸增长、数据类型不断丰富、数据应用不断深化, 技术路线呈现多样化发展,数据模型不断丰富、技术架构逐渐解耦,一部分数据库朝着 分布式、多模处理、存算分离的方向演进。

互联网时代,非关系型数据库针对关系型数据不足衍生出来。同时由于步入互联网 Web2.0 和移动互联网时代,许多互联网应用表现出高并发读写、海量数据处理、数据结 构不统一等特点,关系型数据库并不能很好地支持这些场景。非关系型数据库有着高并 发读写、数据高可用性、海量数据存储和实时分析等特点,能较好地支持这些应用的需 求。因此,一些非关系型数据库也开始兴起。为了解决大规模数据集合和多种数据类型 带来的挑战,NoSQL 数据库应运而生,其访问速度快,适宜处理互联网时代容量大、多 样性高、流动性强的数据。

(二)大数据应用发展迅速,数据库市场空间加速增长

全球大数据软件市场预计到 24 年将达到 377 亿美元,2019-2024 年复合增速为 17.3%。 全球大数据市场规模由 2015 年 231 亿美元增长至 2019 年的 496 亿美元,年复合增长率 约为 21.1%,全球整体市场规模有望在 2024 年超过 800 亿美元,2019 至 2024 年复合增 长率约为 11.8%。全球大数据软件市场规模由 2015 年的 67 亿美元增长至 2019 年的 170 亿美元,年复合增长率为 26.2%,超过硬件和服务收入增速,并且预计软件市场规模将 在 2024 年达到 377 亿美元,年复合增长率约为 17.3%。在大数据软件中,随着大数据管 理平台和数据应用中间件产品的成熟,未来将贡献更多的收入占比。

中国大数据软件市场预计到 24 年将达到 492 亿元,2019-2024 年复合增速为 27.5%。中 国大数据市场在过去五年间经历快速增长,整体市场规模增长速度快于全球整体市场。 2019 年,中国大数据市场规模达到 627 亿元,2015-2019 年复合增长率达到 31.9%。其中, 大数据硬件为市场主要的收入来源,2019 年大数据市场硬件收入达到 247 亿元。中国大 数据软件市场由 2015 年的 52 亿元增长至 2019 年的 146 亿元,年复合增长率为 29.5%。 伴随着中国对数据运用重视程度日益提高,用户对于大数据软件采购预算增加趋势明确, 中国大数据软件市场将在未来五年继续保持高速增长,整体软件市场规模将在 2024 年达到 492 亿元,2019-2024 年复合增长率为 27.5%。虽然现阶段大数据软件收入占比较小, 但得益于较高的细分市场规模增速,未来大数据软件将占据更多的市场份额。

(三)国外龙头垄断格局被打破,国内数据库厂商迎来发展机遇

国内外对比:以往以 Oracle、IBM 和微软为代表的国外关系型数据库已在逐步退出国内 市场。国产软件产品替代将是未来关键,研发投入大、科技硬实力强的国内企业成为最 大受益者。2021 年 H1 到 H2,本地部署模式和公有云模式的国内关系型数据库占比均在 上升,期间华为、阿里、达梦、人大金仓四家主要国产本地部署模式的关系型数据库市 场份额加总占比从 31.10%上升至 31.40%;阿里、腾讯、华为三家主要国产公有云模式的 关系型数据库市场份额加总占比从 69.50%上升至 69.90%。

国内竞争格局:国内公司主要分为三类,分别是云厂商、ICT 厂商和专业软件公司。云 厂商基本被阿里和华为垄断,进入壁垒高。ICT 厂商发展势头也十分迅猛。为保障国家 信息安全,自主研发的国产大数据生态体系正在形成,此前国产软硬件发展面临的格局 分散、生态基础不完善、规模用户群体缺乏等障碍正被逐步攻克。

相较于同业龙头尚有不足,但公司技术、客户基础扎实,有望获得快速成长。公司成立 于 2013 年,整体经营规模相对较小,传统 ICT 厂商经过多年的经验积累,已经累积了一 定的客户资源,但公司的核心技术优势和客户护城河将会带动公司产品客户的逐步增加。

(四)国产替代、分布式、云原生构成数据库发展趋势

数据软件越来越重要,国产软件替代趋势明显。近年来各种政策发布,《2022 年国务院 政府工作报告》、《“十四五”数字经济发展规划》、《“十四五”大数据产业发展规划》、《中 华人民共和国个人信息保护法》、《中华人民共和国数据安全法》、《中华人民共和国国民 经济和社会发展第十四个五年规划和 2035 年远景目标纲要》都提到发展相应的自主国产 数据软件内容。此外,俄乌战争中美国制裁俄罗斯前车之鉴,为我国科技自立敲响警钟。

分布式系统成为行业技术架构主要的发展方向。随着海量及异构数据的数据分析需求增 长,需要的计算、存储和 IO 等资源也在极速增加。集中式架构通过改善硬件配置来提 升存储和处理能力,但单台主机可配置的资源存在上限,因此传统的集中式架构软件难 以满足海量及异构数据的数据集的处理和分析需求。而为了处理 TB 以及 PB 级别以上 的数据规模,分布式的架构将数据分散在网络上多个通过高速网络互联的节点上联合计 算。因为数据分布在不同节点,在进行计算任务时,任务也会被切分成多个子任务,分 发到多个节点上同时进行计算,能充分利用整个集群各个节点的计算资源、存储资源和 IO 资源,可线性提升集群的存储和处理能力。因此,分布式架构能较好的处理该类问题, 这也是分布式架构相对于传统单机架构的核心优势。

云原生大数据平台架构成为未来的主要发展方向。云原生的代表技术包括容器、服务网 格、微服务、不可变基础设施和声明式 API,这些技术能够构建容错性好、易于管理和 便于观察的松耦合系统。结合可靠的自动化手段,云原生技术使工程师能够轻松地对系 统作出频繁和可预测的重大变更。云原生技术有利于各组织在公有云、私有云和混合云 等新型动态环境,构建和运行可弹性扩展的应用。面对客户日益增长的海量数据、多种 数据结构实时化、智能化处理需求,云原生的大数据平台架构凭借计算存储解耦、资源 池化、Serverless 等核心技术,提供了高弹性拓展、海量存储、多种数据类型处理及低成 本计算分析的能力。相比传统数据库,云原生数据库及数据管理平台天然具备灵活性, 能够提供强大的创新能力、丰富多样产品体系、经济高效的部署方式和按需付费支付模 式。

三、“技术+生态”构筑核心竞争,多领域积累成长动力

(一)自研能力迭代发展,细分领域取得领先

不断积累自研能力,技术取得多项突破。公司专注于分布式技术、数据库技术、编译技 术、数据云技术等基础软件领域的研发,通过自主研发,公司已实现多项技术突破,截 至 2022 年 6 月 30 日,公司已获授权境内专利 77 项(其中发明专利 74 项),境外专利 8 项。自成立以来,公司以大数据基础平台软件为切入点,并逐步发布相关新的软件产品 来完善公司的大数据产品矩阵,不断丰富的产品系列为客户提供数据全生命周期的高效 管理工具。公司于 2013 年发布 TDH2.0 起,不断加强自身自研能力,目前至 TDH9.0, 其中大部分技术已使用自有研发的专有软件。

公司基于分布式架构的大数据基础平台、分析型数据库产品已达到业界先进水平。公司 相关产品已通过国际知名组织 TPC 的基准测试 TPC-DS 并通过官方审计,公司也是该基 准测试自 2006 年标准发布以后全球首个通过官方审计的软件厂商。2020 年,根据 IDC 《MarketScape:中国大数据管理平台厂商评估,2020》,公司在关键战略、关键能力等 维度评价综合能力排名市场第四,是中国大数据管理平台市场的领导者。

(二)“业务、客户、伙伴”三位一体,构建公司发展生态

业务协同,提供一站式数据管理解决方案。围绕数据集成、存储、治理、建模、分析、 挖掘和流通等数据全生命周期管理的各个阶段,公司研发了一系列软件产品,包括大数 据与云基础平台、分布式关系型数据库、数据开发与智能分析工具等软件产品、软硬一 体机产品及相关技术服务,实现“一站式”数据管理解决方案,产品具备多模型数据的统 一数据处理平台、较丰富的 SQL 支持度、基于容器的数据云操作系统、较强的分布式事 务支持能力、完善的分布式存储管理系统等特点,具备差异化的产品竞争能力。同时坚 持核心技术自主研发,逐渐完善产品布局,为企业客户和合作伙伴提供覆盖数据全生命 周期管理的产品与服务。

深耕客户,提高客户壁垒,致力于打造生态链闭环。大数据基础软件作为信息系统的重 要基础设施,客户不会轻易替换已采购的产品,公司在关键行业、重要客户的持续积累 和众多的标杆案例落地奠定了自身的行业地位和护城河。公司坚持“平台+生态”发展战略, 通过与合作伙伴深度合作开发各个行业的数字化解决方案,累计合作伙伴数量数百家。 公司通过提供标准化的基础软件产品,助力行业合作伙伴为终端用户开发大数据应用, 在金融、政府、能源、交通、制造等领域已累计有超过 1,000 名终端用户选择使用公司 基础软件平台。未来公司将进一步深耕行业客户,不断拓展行业内新客户,持续服务老 客户,形成品牌沉淀,为长期发展打下坚实基础。

同时公司也在积极开拓合作伙伴,探索联合解决方案提升粘性。为保障国家信息安全, 自主研发的国产大数据生态体系正在形成,此前国产软硬件发展面临的格局分散、生态 基础不完善、规模用户群体缺乏等障碍正被逐步攻克。随着国产大数据生态体系进入快 速协同发展阶段,公司积极同众多生态合作伙伴共同探索,深耕行业场景,打造联合解 决方案,形成更全面的服务能力。目前已有 500+知名公司成为公司的合作伙伴,合作伙 伴数量提升也有助于提高用户粘性,提高客户复购率,推动公司收入进一步发展。

(三)恰逢国产数据库重大机遇期,公司客户积累深厚粘性强

公司在大数据领域较早实现规模商业化,在金融、政府、交通、能源等行业实现了超过 上千家客户积累和沉淀,在大数据下游的关键行业中已建立了一定的知名度。其中,在 金融领域,国内多家银行、券商、基金等金融机构已采购公司产品及服务,且助力多个 客户实现了分析场景中部分关键系统的国产替代。在政府领域,公司产品已被多个部委 或省市机关部门使用,助力构建数字化政府,提升治理效率。大数据基础软件作为信息 系统的重要基础设施,客户不会轻易替换已采购的产品,公司在关键行业、重要客户的 持续积累和众多的标杆案例落地奠定了自身的行业地位和护城河。未来公司将进一步深 耕行业客户,不断拓展行业内新客户,持续服务老客户,形成品牌沉淀,为长期发展打 下坚实基础。

客户粘性强,老客户复购收入保持快速增长。在收入规模持续扩大的同时,公司重视对 于老客户的维护,随着累计的老客户数量持续增加,公司来自老客户复购产生的主营业 务收入逐年增长。2019 年、2020 年及 2021 年,公司老客户复购产生的收入金额为 0.86 亿元、1.60 亿元、2.02 亿元,2019-2021 年老客户创收逐年提高,2019 年、2020 年及 2021 年公司老客户复购金额同比增长比例为 20.10%、85.98%和 25.74%。同时,2020 年和 2021 年老客户创收占比均为 60%以上,老客户的收入对公司业绩贡献十分重要。在大数据应 用场景不断增加与公司客户基数不断增长的背景下,公司将继续扩大对老客户的运营, 为客户提供持续优质的产品与服务,使得老客户的收入持续增长。

中国大数据软件领域处于发展的历史机遇期,我国高度重视大数据在经济社会发展中的 作用,十八届五中全会提出“实施国家大数据战略”,国务院印发的《促进大数据发展行 动纲要》指出,建立安全可信的大数据技术体系是推进大数据产业基础研究和核心技术 攻关的重要目标。“十四五”规划和 2035 年远景目标纲要提出,培育壮大人工智能、大 数据等新兴数字产业,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经 济深度融合,赋能传统行业转型升级,打造数字经济新优势。

全球新一代信息产业处于 加速变革期,大数据相关底层技术处于创新突破期,国内市场需求处于爆发期,为国内 基础软件厂商带来明确的增长机遇。同时,随着国内基础软件人才的不断增加,在应对 新一代场景,不断积累技术经验过程中,国内已形成具备自主研发实力且能与国外厂商 竞争的基础软件厂商,并开始实现规模产业化落地。

四、盈利预测

关键假设: 1) 营收 2024 预计能够达到 9 个亿左右:①2024 年大数据软件市场达到 492 亿元, 2019-2024 年复合增长率 27.5%;②公司坚持核心技术自主研发,自底向上研发了大 数据基础平台的核心组件,助力金融、能源等行业实现国产替代;③截至目前公司有 超过 1000 家终端用户,老客户保持较高的复购率;④结合公司经营计划、公布的在 手订单与公司测算,到 24 年预计能够实现 1108 家客户积累,客单价提升至 82.81 万 元。

2) 毛利率:①软件产品与技术服务,标准化程度会进一步增强,并配合生态合作伙伴一 同向客户提供必要的技术服务。预测2022-2024年该业务毛利率分别为73.53%、79.57%、84.08%;②应用与解决方案,未来应用与解决方案的交付效率将有所提升,预测应用与解决方案业务毛利率2022-2024年12.00%、13.00%、16.00%;③软硬件一体机及服务,参考历史期软硬件一体机及服务业务毛利率水平保守预测2022-2024年毛利率为45.93%。

3) 费用率:公司持续投入以提高核心竞争力,但随着营收增长带来规模效应,预计公司 费用率整体保持下降。①销售费用,预计未来公司将相对平稳地增加销售相关人员数 量,有效控制销售费用率;②研发费用,研发团队及产品体系已完成初步建设,研发 费用的增长率将随着研发团队建设逐步完善及优化而有所降低;③管理费用,预计未 来刨除股权激励费用等非长期性费用,公司管理费用增速将能够有所降低,另一方面 公司管理团队架构基本成型,未来管理人员工资增长将趋稳。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告