知识计算引擎可能的实现方式

最近稍微研究了下知识计算引擎的可能实现方式,总结了一些简要的思考:

链结数据模型

OWL/RDFS/RDF是目前为止,普遍被业界接受的一种描述性链接数据范式。

其优势在于描述知识的方法灵活,科研和工业界支持程度好,数据源兼容性高。劣势在于其被设计为一种能够被机器方便处理的语言,面向人的设计不够友好。人类的知识具有多样性。

试想,如果重新设计一种描述人类知识元语的方法,在考虑灵活性和表达性两个方面,势必要有所取舍和平衡。因此知识元语的描述方法上,我们暂且接受链接数据模型(Linked-Data Model, LDM)。

原生图模型

标记属性图(Labeld Property Graph,LPG)以图的方式描述数据,更加接近人类的思考和知识组织方式。在图处理和分析技术的发展,目前的理论和工程成就主要集中在LPG上。这是一个坚实的“巨人肩膀”。

领域间隙

未来的知识计算引擎,如果基于LPG的理论进行设计,从LDM到LPG模型的转化和处理将是一条必经之路。

基于此,将会缺少一个用于LPG模型进行知识推理的引擎,这不属于图计算引擎的范畴,因此是一个新的领域。

该领域理论研究虽然不新,但是工程创新始终未有突破。一个可能的原因在于知识计算并未到达临界点,未能够引起重视。这里存在一个机会。

现有的工程实践

Neo4j已经开始集成这样的能力,Grakn直接抛弃LDM另起炉灶,设计了一种语义范式。虽然Grakn能够针对自定义的语义范式进行深层次优化,在笔者看来,Neo4j的做法更加明智。

尽管各有优劣,但是这些做法都不够系统化、规范化、理论化。所支持的场景依然对用户有较高的要求。需要使用者深刻理解LDM、并且能够人为映射到LPG框架上。如果能够实现自动化,这将成为未来知识计算引擎的助推器之一。

© 2019 InnoTrek All Rights Reserved.
Theme by hiero