第二节 知识表示与知识建模

一、早期知识表示简介

知识特性:相对正确性、不确定性、可表示性、可利用性

知识分类:常识性知识、领域性知识(作用范围);事实性知识、过程性知识控制知识(作用及表示);确定性知识、不确定性知识(确定性);逻辑性知识、形象性知识(结构及表现形式)

早期知识表示方法:一阶谓词逻辑(例:has_son(X,Y))、产生式规则(IF

---THEN---置信度CF)、框架、语义网络(节点-弧-节点)、逻辑程序、缺省逻辑、模态逻辑


Horn逻辑,一阶谓词逻辑的子集

原子Atom:P(t1,t2..,tn) 

规则Rules由原子构建:


has_child(X,Y):-has_son(X,Y)  

事实是没有体部和变量的规则   has_child(Helen,Jack):-


描述逻辑:一阶谓词逻辑的可判定子集,用于描述概念和属性

概念:一个领域的子集 {x|Student(x)}

关系:该领域上的二元关系 {|friend(x,y)}

个体:一个领域内的示例 {XiaoMing}

TBox:包含内涵知识,描述概念的一般性质,例:Mother、Person、has_child

ABox:包含外延知识,描述领域中的特定个体,例:Mother(Helen)


框架

在框架理论中,框架就是知识表示的基本单位

组成:槽:用于描述所论对象某一方面的属性

         侧面:用于描述相应属性的一个方面


优点:描述完善和全面,质量高,允许数值计算

缺点:成本高,对知识库的质量要求非常高,表达形式不灵活,难与其他形式数据集关联使用。


产生式模式:


优点:自然性、模块性、有效性、清晰性

缺点:效率不高(规则库庞大、匹配费时),不能表达具有结构性的知识


语义网络

节点:表示各种事物、概念、情况、属性、动作状态等,每个节点可以带有若干属性;

弧:表示各种语义联系,指明它所连接的节点之间某种语义关系。



二、 基于语义网的知识表示框架

知识表示(representation)

什么是RDF(资源描述框架,Resource Description Framework)?

Resource:页面、图片、视屏等任何具有URI标识符

Description:属性、特征和资源之间的关系

Framework:模型、语言和这些描述的语法

在RDF中,知识总是以三元组(triple)形式出现:(主,谓,宾)

RDF也是一个图模型(节点-边-节点),资源和属性用URI标识(可以理解为ID)

RDF允许空白节点,一个资源可以是匿名的即不被URL标识(_:X),例,haofen是某一次KG讲座的讲者


RDF是数据模型(RDF/XML、Turtle、N-Triples),不是序列格式化


封闭世界假设-开放世界假设

例:(CCF ADL,speaker,Haofen)并不意味着CCF ADL讲座只有一位讲者,而是CCF ADL

讲者至少有一位讲者

带标注RDF:时间、不确定性、空间、信任等

RDF和RDFS(RDF Schema)

RDFS为RDF模型提供了一个基本的类型系统,是在RDF基础上提供了一个术语、概念等的定义方式,以及哪些属性可以应用到哪些对象上。

知识查询:

SPARQL简介

是RDF的查询语言,可以对不同的数据集撰写复杂的连接,由所有主流数据库支持

本体可以填充知识与查询之间的语义间隙

Thank you for your reading ,  welcome to correct my mistakes!!!

推荐阅读更多精彩内容