技术和产品力构建公司护城河,海外市场空间广阔。
1、OCR 与 AI 相结合,准确率显著领先行业。OCR 技术广泛应用于文档数字化、信息检索和数据分析等领域。光学字符识别(OCR) 技术是指通过电子设备(如扫描仪或数码相机)识别纸质文档中的字符并将其转换为计 算机可处理的文本格式的过程,被广泛应用于文档数字化、信息检索和数据分析等领域。
传统 OCR 具备一定局限性,OCR 与 AI 结合成为发展新趋势。OCR 技术当前的主要瓶 颈在于复杂场景处理、数据安全与隐私保护以及技术迭代的需求。首先,在低质量图像、 手写体、复杂背景或多语言环境下,传统 OCR 的识别准确率往往会下降,因此增强复杂 场景下的识别性能已成为关键课题。此外,OCR 在处理敏感信息时必须确保数据安全与 隐私保护,这一要求构成了另一重大挑战。技术的不断迭代更新也是 OCR 领域的一大壁 垒,要求持续的研发投入以满足不断变化的市场需求和技术进步的要求。近年来,OCR 技术与人工智能(AI)的结合成为新的发展趋势。通过深度学习和神经网络模型的应用, OCR 系统在复杂场景下的识别精度得到显著提升。目前,基于深度学习的 OCR 已成为 行业主流,未来的发展方向包括一体化的端到端模型、高效轻量化模型,以及向更高智 能化的 OCR 发展,实现从“感知”到“认知”的跃升。
公司深耕 OCR 领域,融合深度学习和 NLP 技术,屡获国际奖项。自 2006 年成立以来, 公司专注于文字识别和图像处理,积累了超过 15 年的研发经验,在智能文字识别技术领 域保持行业领先。公司通过深度学习和自然语言处理(NLP)技术的加成,显著提升了智 能文字识别在复杂场景下的性能,能够应对扭曲、手写和多语言识别等挑战。公司参与 中国信通院牵头制定《文档图像篡改检测标准》,确立了该领域的行业规范。此外,公司 在 OCR 智能化服务和智能文档处理系统的多维评估中,均获得中国泰尔实验室的最高评 级,涵盖识别性能、AI 核心能力、数据安全性和可靠性。
公司构建强大的数据处理和智能识别能力,满足企业多元需求。多项技术创新构筑公司 在大数据领域的核心壁垒,有力满足企业多元化需求。首先,公司持续投入深度学习模 型开发,优化 OCR 技术,提升复杂场景中的识别精度,并支持实时数据提取与清洗,确 保数据完整性与质量。同时,公司构建了超大规模自然语言模型训练平台,融合拓扑与 语义信息,通过迁移学习高效提取商业文档关键信息,显著提升用户体验与模型性能。 公司还积极研发 AI 自学习平台,实现多业务场景中的自动迭代更新与性能优化。针对移 动端和边缘计算,公司开发模型压缩与加速技术,平衡精度、速度与存储效率,确保资源 受限环境下的高效应用。

公司产品的 OCR 识别率显著领先市场同类产品。在复杂场景下(如多语言、多版式、多 曲面等),合合信息的平均字符识别率为 81.9%,领先于百度的 70.0%、腾讯的 65.0%和 阿里的 66.9%。在中文身份证识别测试中,AI 开放平台的条目识别率达到 99.6%,显著 高于百度的 98.7%、腾讯的 95.9%和阿里的 82.1%。此外,公司产品“扫描全能王”在普 通文档和多语言数据集、困难数据集、手写数据集和复杂场景数据集的识别率均在 90% 以上,超越 Adobe Scan、WPS、夸克、百度网盘和福昕 PDF 等其他应用。另外,公司产 品在智能文档处理领域方面也有突出表现,并且支持 52 种主流语言,处于行业领先地位。
2、融入 AI 浪潮,提供大语言训练语料清洗、Agent 等服务。公司坚定融入 AI 浪潮,TextIn ParseX 助力大模型开发者解析版面元素信息。TextIn ParseX 为公司专为 LLM 下游任务设计的通用文档解析服务,能够识别文档或图片中的 文字信息,将文档解析为 Markdown 格式,并按常见的阅读顺序进行还原,赋能下游各 类大语言模型任务。
TextIn ParseX 具有多元场景,其中大模型训练语料清洗有助于为厂商提供高质量数据集。 AI 浪潮下,大模型厂商持续需要更多的高质量数据集来优化大模型的训练及推理能力。 距离 2023 年底 ChatGPT 的爆发已经过去一年多的时间,海内外大模型厂商在模型能力 的竞赛已进入白热化,公开的结构化优质数据基本已充分使用,目前许多大厂开始寻求 非公开、非结构化数据来扩展参数量,例如书籍、录像等。公司推出的 TextIn ParseX 具 有多元场景,其中大模型训练语料清洗能够高效清洗非结构化文档,准确提取核心内容, 自动过滤噪声数据,保留重要语料,有助于为大模型厂商提供增量高质量数据集。
公司积极开发 RPA/Agent 功能,增强复杂文档自动化处理能力。TextIn ParseX 提供 RPA(Robotic Process Automation,机器人流程自动化)/Agent(智能体)的功能,能 够更便捷更高效地处理文档解析优化任务。通过提供关键信息和标准输出,助力 RPA 自动化,减少数据处理时间。RPA/Agent 功能契合 AI 应用发展的产业趋势,体现出 公司积极融入 AIGC 浪潮的开放态度。
积极进行品牌建设,销售费用保持较高水平。公司销售费用从 2020 年的 1.59 亿元增至 2023 年的 3.35 亿元,复合增长率为 28.4%,主要用于广告宣传、工资福利及差旅招待, 三项合计占比超 95%。公司 2021-2023 年的销售费用率分别为 33.27%、27.19%、28.24%。 其中,广告宣传费由 2020 年的 0.92 亿增加至 2023 年的 1.98 亿元,复合增长率达 29.1%, 占销售费用总额的 59.02%,这一部分费用主要用于推广 C 端 APP“扫描全能王”。
拳头产品扫描全能王具备高效性能和卓越体验,成为“扫描”代名词。扫描全能王利用 先进的 OCR 技术,将手机和平板变为便携扫描仪,可在复杂场景中将纸质文档转换为 PDF 或图片,并实现精准的文字识别功能,支持文档归档、查找和共享。用户通过持续 积累在应用中的文档资产,实现了高用户粘性和较高的迁移成本,进一步巩固了市场中 的领先地位。扫描全能王还依靠文档分享功能促进用户的自然传播,从而实现品牌的低 成本推广效应。自 2010 年上线以来,扫描全能王持续优化功能与识别精度,带动月活跃 用户和付费转化率的增长。截至 2023 年 12 月底,扫描全能王与其他核心应用在全球的 累计首次下载量已超过 9.4 亿,月活跃用户达 1.5 亿,进一步确立了其在全球市场的领导地位。在搜索引擎中查找“扫描”,扫描全能王位于词条前列。这款应用已经在用户心中树 立了智能高效扫描软件的标杆地位,充分体现了公司在产品第一性原理上的深度打磨和 卓越成果。
公司持续推出契合市场的垂直产品,满足多样化需求。2022 年,公司推出“蜜蜂”系列, 聚焦于教育领域数字化、智能化教学需求,顺应教育信息化趋势,为教师、学生和家长 提供高效作业管理、个性化学习指导及便捷的家校互动工具。“蜜蜂作业”运用智能识 别和知识图谱技术,提供个性化学习、作业管理等功能,支持教师高效布置批改、学生 获得指导、家长实时跟进。自推出以来,“蜜蜂作业”已在全国广泛应用,下载量超数百 万,覆盖大量中小学教师、学生和家长用户。“蜜蜂试卷”则提供字迹擦除功能,帮助学 生整理错题,提升复习效率,并已集成至华为 PixLab V1 打印机,拓展智慧教育应用场 景。
凭借“起步早”的先发优势建立品牌粘性和客户资源壁垒。公司在移动互联网快速发展 的初期,率先推出了核心产品名片全能王、扫描全能王和启信宝,成功积累了庞大用户 基础,形成了显著的品牌效应,并进一步建立了用户粘性和客户资源壁垒。名片全能王 和扫描全能王凭借超过十年的品牌积淀,在行业内具有深远影响。其中,名片全能王于 2010 年被《纽约时报》评价为“为低效的名片管理带来有效的秩序”,扫描全能王则于 2013 年被《时代周刊》评为“iPhone 必备的 50 个应用之一”。这些早期的国际认可为公 司奠定了强大的品牌基础。在技术积累方面,公司在智能文字识别领域拥有超过 15 年的 研发经验,其识别准确率始终保持行业领先水平。同时,启信宝依托大数据技术,在数 据积累、算法优化和实际应用场景落地方面形成了深厚基础,其商业大数据量已突破 1000 亿条,为行业客户提供了强有力的数据支持和决策依据。
全球内具有庞大用户基础,市场空间广阔。通过持续的技术创新和产品优化,公司在全 球市场中稳固其领先地位,拥有庞大的用户基础,并获得广泛的市场认可。在 C 端市场, 扫描全能王在 App Store 的效率类应用下载排行榜中位列 105 个国家和地区的首位,名片 全能王在 43 个国家和地区的商务类免费应用下载量中排名第一;在 B 端市场,启信宝的 业务覆盖超过 2.3 亿家企业数据,积累了丰富的客户资源,处于行业领先地位。
公司核心产品稳居海内外市场龙头,展现强劲市场竞争力。公司海外收入主要由扫描全 能王 APP 和名片全能王 APP 等核心产品贡献。2020-2023 年,公司境外及中国港澳台收 入稳定增长,分别为 1.83、3.06、3.54、3.97 亿元,占公司总收入 31.67%、38.03%、35.78%、 33.43%。公司拳头产品扫描全能王在海外发展态势良好,截止 2023 年 12 月底,扫描全 能王在 App Store 上的 iOS 中国区评分为 4.9, iOS 美国区评分也为 4.9,合计评分个数超 600 万,远远超过其他文字识别类 APP 的用户评分个数。而目前海外营收占比仍然较小, 未来可增长潜力较大。 未来海外用户付费市场仍具有可观拓展空间,新兴市场尤为值得关注。从现有收入分布 来看,境外地区收入主要集中在亚洲(日本、韩国等)与北美洲(主要为美国等)。然 而,从地域拓展的角度分析,许多海外发展中国家的移动办公 APP 渗透率和付费率仍有 显著提升空间。例如,以扫描全能王为例,2023 年中国年新增付费转化率高达 1.49%, 年付费用户数量达到 513 万,而巴西、印度尼西亚、墨西哥的转化率仅分别为 0.48%、0.09%、0.25%,年付费用户数量仅为 18 万、11 万、6 万,远低于国内水平。这表明,海 外新兴市场,尤其是发展中国家,仍有巨大的用户转化和收入增长空间,值得进一步深 耕与拓展。
公司积极拓展海内外市场,抢占用户心智。通过实施本地化策略,公司在欧美、东亚等 主要市场推广产品,依托直销、经销商分成及互联网广告拓展海外收入,并与当地资源 丰富的合作伙伴协作,提升国际竞争力。为增强技术支持与服务能力,公司计划建立全 球技术支持中心,为客户提供覆盖售前、售中及售后的全面服务,包括产品升级和技术 培训。同时,公司正积极扩展全球营销网络,构建本地化销售与服务体系,并通过新媒 体运营提升品牌影响力。