知识图谱笔记 2 知识表示与知识建模

早期知识表示简介:

知识是智能的基础,提供推理能力。

相对正确性、不确定性、可表示性、可利用性。

常识性知识、领域性知识;

事实性知识、过程性知识、控制知识;

确定性知识、不确定性知识。

早期知识表示方法:

1、First-Order Logic

Horn逻辑:

原子:has_child(Helen,Jack)

Rules:has_child(X,Y):-has_son(X,Y)

Tbox:内涵知识、Abox:断言

2、Production Rule:

IF...THEN...

CF为知识的强度

3、Framework:

<框架名>

槽名:侧面名  值1,值2,...,值p1

........................

约束:约束条件1

             .........

          约束条件n

4、Semantic Network:

节点-弧-节点

用谓词逻辑表示

基于语义网Semantic Web得知识表示框架:

W3C推荐的语义网标准栈:

表示-查询-推理-置信

最主要的方面A web of link data:SPARQL、RDF

use RDF as data format

use URLs as names for things

use HTTP URLs so that people can look up those names

RDF:资源描述框架

Resource:页面、图片、视频等任何具有URL标识符

Description:属性、特征和资源之间的关系

Framework:模型、语言和这些描述的语法

在RDF中知识总是以三元组triple形式出现

(subject、predicate、object)

RDF本身也是一个图模型(vertex,edge,vertex)

in RDF resources and properties are identified by URLs

通过namespace减少前缀冗余进行URLs的缩写

in RDF values of properties can also be literals i.e. strings of characters:(CCF ADL,theme,"KG"),此时"KG"称之为字面值literal,其他为resource

in RDF literals values of properties can also be typed with XML datatypes

字符串+类型约束

在CCF ADL上演讲了三小时:

ex:ccf_adl——ex-schema:nbHours——"3"^^xsd:interger

RDF空白节点blank nodes:

匿名的资源,作为链接某一个非匿名的资源的桥梁

A是某一次知识图谱讲座的讲者:

ex:A——ex-schema:speaker——_:x——ex-schema:theme——ex:KG

二跳,可以表示更复杂的多元关系

RDF是数据模型,不是序列化格式。

可以用XML、Turtle、N-Triples等方式表示。

开放世界假设:没有定义的内容只代表不知道,而不是不存在。

分布式定义的知识可以自动合并。

带标注的RDF(变种)annotated RDF:

(s,p,o):标志

(特朗普,就职,总统):2017年1月

RDFS(schema):

在RDF的基础上提供了一个术语、概念等的定义方式,以及哪些属性可以应用到哪些对象上。

规范了概念层schema的内容。

为RDF定义了如下词汇:

class,subclassof,type,property,subpropertyof,domain,range

OWL和OWL2

Web Ontology Language

三个子语言:lite/DL/Full

exp是命名空间http://www.example.org的别称。

等价性声明:

exp:运动员 owl:equivalentCalss exp:体育选手

传递关系:

exp:ancestor rdf:type owl:TransitiveProperty

互反关系:

exp:ancestor  owl:inverseOf exp:descendant

函数性属性(唯一性):

exp:hasMother rdf:type owl:FunctionalProperty

OWL2:OWL的新版本

SPARQL:

RDF的查询语言:基于RDF数据模型。

PREFIX:    #声明

FROM    #dataset(graph)

SELECT

WHERE{ ...... }

ORDER BY

RDF中的资源以?或者$表示变量

查询所有选秀CS328的学生:

PREFIX exp:http://www.example.org/

SELECT ?student

WHERE{

    ?student exp:studies exp:CS328.

}

查询所有的收购关系:

SELECT ?P ?X

WHERE{

    ?P finance:control ?c.

    ?c finance:acquire ?X.

}

ontology可以填充知识与查询之间的语义间隙。

把member和relative的语义间隙给填充了。

SELECT * WHERE{

    ?x member ?y.

    ?z founder ?y.

    ?z relative ?x.

}

写成规则的形式:

hold_share(X,Y):-control(X,Y)

conn_trans(Y,Z):-hold_share(X,Y),hold_share(X,Z)

JSON-LD:

JavaScript Object Notation for Linked Data

基于JSON表示和传输互联数据Linked Data的方法。

JSON-LD通过引入规范的术语表示,使得数据交换和机器理解成为基础

JSON中的:

{

    "name":"tai_park"

}

变成JSON-LD中的:

{

    "http://schema.org/name":"tai_park"

}

围绕某类知识提供共享的术语。

RDFa:

网页标记语言,扩展了XHTML的几个属性。

Wikinomics

HTML5 Microdata:

Andy

RDF+SPARQL 对比 ER+SQL:

RDF:关系显示定义(语义存在于数据中)——数据变更较为方便(图增加边更为方便)

ER:关系隐式声明(语义存在于人脑中)

ER+SQL:Dumb Data->Smart Application Code

RDF+SPARQL:Smart Data->Uniform Inference Engine

典型知识库项目的知识表示:

DBpedia:

dbo:有约束的定义

dbr:资源

dbp:没有约束而仅有数据层的定义

TAGO2:

上层->维基百科内容->lable用以实体消歧

Freebase:

data/schema/Queries

复合值类型CVT:处理多元关系。一个CVT就是一个有唯一MID的Object,也可以有多个Types。

Wikidata:

有顶层的对象:Entity

时空约束:qualifiers/reference

NELL:

文本抽取并用图整合

基于Protege本体工具的知识建模实践:

模式层/实例层

推荐阅读更多精彩内容

  • pdf下载地址:Java面试宝典 第一章内容介绍 20 第二章JavaSE基础 21 一、Java面向对象 21 ...
    王震阳阅读 73,370评论 25 504
  • 一、关于本体 1. 本体论语义学的特点: 本体论语义学与其他人工智能理论、自然语言加工系统相比有自己的一些鲜明特点...
    御风之星阅读 755评论 0 1
  • 1 知识图谱构建技术 本节首先给出知识图谱的技术地图,然后介绍知识图谱构建的关键技术,包括关系抽取技术、知识融合技...
    达微阅读 14,104评论 1 25
  • 本体、知识库、知识图谱、知识图谱识别之间的关系? 本体:领域术语集合。 知识库:知识集合。 知识图谱:图状具有关联...
    方弟阅读 18,163评论 4 42
  • 一、早期知识表示简介 知识特性:相对正确性、不确定性、可表示性、可利用性 知识分类:常识性知识、领域性知识(作用范...
    蓝星_6f42阅读 159评论 0 0