互联互通的约束条件有哪些?

最佳答案 匿名用户编辑于2023/08/28 14:23

知识图谱互联互通技术由于受限于当前技术发展水平,互联互通能力仍然不够充分,完全意义上的、无约束的互联互通仍然是一个远期愿景。

一、技术层面约束条件

互联互通在技术上的主要约束条件有:

1、标准化约束

随着大数据时代和数字经济时代的到来,知识本身呈现出爆炸式的增长,尤其深入到行业领域内。由于,不同行业和应用需求不同,对知识图谱的定义也不同,在知识表示上存在形式和内容上不标准、不统一的问题,这导致在知识图谱互联互通时,各家知识异向性明显、形式繁杂,严重约束了各家知识图谱的整合。因此,在知识图谱互联互通中,基于目前知识融合的技术水平,难以自适应所有知识标准,需要在知识标准化上对不同知识体系进行约束,在知识表达形式和内容上做到尽量一致性和标准化,以实现高质量的互联互通。

2、知识内容形式约束

从知识内容形式的互联互通角度上,主要存在跨语言、跨模态和跨行业的约束。从目前技术水平以及未来技术发展趋势看,跨语言、跨模态和跨行业都是知识图谱互联互通中的严峻考验。

(1)跨语言约束 。由于语言语系种类的不同,知识图谱在不同语言互联互通融合、计算过程中存在语言之间的隔阂问题。机器翻译作为实现不同语言对齐的一种有效方式已经得到了应用级的突破,但是在知识图谱领域,需要针对孤立无上下文的知识实体进行翻译,而专业术语和实体的翻译是目前机器翻译中比较困难的问题,因此单纯依赖机器翻译实现跨语言的互联互通面临诸多挑战。随着多语言预训练技术的发展,跨语言对齐技术得到突破性进展,尤其在高资源语言上取得较大进步,但是在低资源上仍然存在与真实需求差距较大的问题。因此,受跨语言技术的发展约束,知识图谱往往限制在单一语种或者高资源跨语言上进行互联互通,缓解语言之间语义隔阂带来的图谱割裂问题。

(2)跨模态约束。 由于不同模态存在较大差异,知识图谱在不同模态互联互通融合、计算过程中存在模态之间的语义割裂问题。传统方法上,多模态往往采用模态转换的方式,通过单一模态转换实现模态上的一致性,如通过语音识别将语音转化为文本等。随着多模态预训练技术的发展,通过在大规模数据上的预训练学到不同模态之间的语义对应关系,跨模态知识构建和融合取得突破性进展,能够在统一语义空间中对不同模态知识进行向量对齐,促进了跨模态知识图谱的融合和计算。但是跨模态本身仍然存在不同模态之间信息分布不均、稀疏等问题,且目前跨模态知识表示和对齐准确率较低。因此,受跨模态技术的发展约束,知识图谱往往限制在单一模态或者特定场景的多模态上进行互联互通。

(3)跨行业约束 。目前,知识图谱已广泛应用于金融、能源、医疗、国防、制造、政务等领域,形成了一系列典型的行业应用。由于不同行业之间的知识体系不同,当前知识图谱的应用模式主要是面向垂直领域,利用行业知识数据构建特定场景的应用。在跨行业互联互通中,不同行业之间的本体体系和知识内容存在行业隔阂,甚至不同行业存在知识模式完全相反的逻辑,这严重约束了跨行业知识图谱的互联互通能力。因此,在跨行业知识图谱互联互通中,受行业之间的对齐技术约束,知识图谱往往在相同或者相似行业中进行互联互通。

3、知识质量约束

在知识图谱互联互通中,各个知识图谱存在质量不一的问题,低质量的图谱会严重降低互联互通后图谱的计算和应用,因此需要对不同知识图谱进行质量评估、互相印证和约束,从而保障知识图谱质量。知识图谱测试与评估涉及知识图谱数据、平台和算法等多个层次,目前德国Philipp Cimiano、OpenKG 等国内外专家和机构已经提出了诸多知识图谱质量评估方法。因此,可以在知识图谱互联互通过程中,利用评估指标约束知识的来源质量,以提高知识图谱互联互通的融合质量。

4、时效性约束

时效性指信息的最新程度,知识图谱的时效性可以指知识更新的程度。知识图谱中存在一成不变的常识或者真理,但更多的是动态演变的知识,对知识的时效性进行约束可以提高互联互通知识图谱的质量。尤其是在动态知识图谱分析应用中,对知识的时效性具有较高的要求。知识图谱的时效性的需求取决于具体的应用场景,例如航空公司的数据集需要较强的时效性,用户在预定某趟航班时,如果该系统的时效性较差,可能会导致用户预定已经售罄的航班,从而造成对双方都不利的影响。可使用自上一次更新或最后一次验证报表以来的时间范围来评估知识时效性。

5、技术可行性约束

技术可行性约束旨在建立一系列知识图谱互联互通技术指标体系,明确定义当前技术达到的指标水平,从而在技术约束下实现合理的互联互通需求。知识图谱互联互通技术指标体系主要分为功能性指标和性能指标体系,比如知识抽取准确率、知识融合准确率和计算推理的性能等。技术指标体系的约束,可以使互联互通更加高效,能够快速遴选出满足指标的知识图谱进行互联互通,从而减少大量图谱传输、融合和计算的成本。

6、硬件资源约束

知识图谱互联互通需要一定的网络、存储、计算资源等保障条件,但由于知识图谱互联互通面对的是不同的自治、异构系统,和每个系统相对应的硬件资源可能是在不同的需求背景、不同的技术条件下建立的,构建的硬件环境存在操作系统差异、底层数据库差异、网络环境差异和计算资源环等环境差异,且不同厂商的设备之间互不兼容,难以实现信息共享和互联互通。同时,在硬件部署上,需求能够支持单机、集群化部署,根据实际业务调整硬件资源的投入。因此,知识图谱的互通互通必须满足硬件资源的约束条件。

二、非技术层面约束条件

知识图谱互联互通除了在技术上的约束外,非技术层面的约束更加隐晦和重要,主要包括安全性约束、法律合规性约束、隐私保护性约束。

1、安全性约束

知识图谱的安全性主要包括知识本身和互联互通方式上的安全。在知识本身,主要是从知识本身的秘密性和权限角度。具有一定密级的知识必须在密级约束条件下进行传输,如机密知识需要通过专线或者专人互联互通。对于不同的知识图谱,出于对知识产权或者保护性的考虑,往往会设置不同的安全权限,仅限部分角色人员进行解析和计算,因此在互联互通中需要对不同知识进行权限约束,从而保证知识的可保护性。在互联互通方式上,主要是通过网络、物理等方式进行互联互通,需要在一些安全措施的保障下进行互联互通,如在网络中安装特殊的传输软件等。

2、法律合规约束

知识图谱互联互通必须在法律约束范围内进行,包括知识内容的合法性以及互联互通方式的合法性。知识内容的合法性主要是知识本身是否涉及政治敏感、色情、暴力等内容,是否包括明显不合情理、伦理的知识内容。互联互通方式的合法性指的是知识图谱互联互通渠道合法,不能利用非法的方式进行传输。此外,还需考虑伦理约束。知识图谱的互联互通将原本毫无关系的两种实体通过互联互通建立联系,在不同行业有些实体定义会有明显的感情倾向、思想观念的不同,会产生冲突和矛盾,伦理约束基于其在道德、情感、直觉、自我约束等方面的权威性,规范、引导和制约着互联互通的研究和发展,帮助互联互通完善其知识体系。

3、隐私保护约束

知识图谱在互联互通过程中,涉及知识的产权或者隐私性,知识图谱的产权者往往不想别人看到知识本身内容。因此需要对知识进行加密保护,主要是从知识本身、传输方式和解析计算方式等层面进行约束。对于知识本身,采用加密的方式对知识进行加工处理,传输方式上采用加密通道,在解析计算方式上实现加密计算。联邦学习和边缘计算也是互联互通的典型隐私保护性约束下的有效方式,知识本身仍掌握在本地,仅实现模型参数和中间不可读结果的互联互通,从而增强隐私保护性。