知识表示
- 数据:信息的载体和表示
- 信息:数据的语义
- 知识:信息关联后形成的信息结构(事实和规则)
- 相对正确性
- 可表示/利用性
- 不确定性
一阶谓词表示(First Order Predicate)
- 一阶逻辑的知识工程
- 确定任务
- 搜集相关知识
- 确定词汇表,包括谓词,函词和常量
- 对邻域通用知识编码
- 对特定问题编码
- 提交查询给推理过程并获取答案
- 知识库调试
- 谓词公式表示知识的步骤
- 定义谓词及变元
- 变元赋值
- 连接词连接谓词,形成谓词公式
- 状态谓词
- 初始状态
- 终止状态
- 操作谓词
- 条件
- 状态改变
- 缺点:组合爆炸
产生式表示(Production)
- $P\rightarrow Q$ (IF P THEN Q)
- 产生式的知识有可信度
- 常用结构
- 原因$\rightarrow$结果
- 条件$\rightarrow$结论
- 前提$\rightarrow$操作
- 事实$\rightarrow$进展
- 情况$\rightarrow$行为
- 产生式系统:一组产生式互相配合协调
- 规则库
- 数据库
- 控制系统
- 推理
- 正向推理
- 反向推理
- 混合驱动和控制策略
语义网络表示(Semantic Network)
- 通过有向图,其顶点表示概念,边表示概念间的语义关系,来表达复杂的概念及其相互关系
- 语义网路的推理:带求解问题构造为网络判断,某些节点/边为空(询问点),进行匹配
框架表示(Framework) 与知识图谱(Knowledge Graph)
- 框架:描述对象属性的一种数据结构
- 框架的一般表示
- 框架名
- 槽名(某一方面属性)
- 侧面(属性的某一方面)
- 值
- 万维网(World Wide Web) Web1.0
- URL: 统一资源定位符
- HTML:超文本标记语言
- HTTP:超文本传输协议
- Web 搜索引擎
- Web 2.0
- 大众参与
- 社会网络
- 语义万维网 Semantic Web
- Tim Berners-Lee 1998
- 给 Web 上的信息赋予良定的含义
- RDF 数据
- Class
- Property
- Individual
- Term:固定一组用于标注的术语,并同意其含义
- Ontology:同意一个语言用于定义新术语
- RDFS, OWL
- 灵活性
- Ontology:同意一个语言用于定义新术语
- 知识图谱:数据库,可看做一张巨大的图,节点表示实体或概念,边由属性或关系构成
- DBpedia
- YAGO
- Freebase
RDF(Resource Description Framework)
<xml version="1.0">
<Class rdf:ID="Resource"
xmlns:rdf="url"
xmlns="url">
<property> value </property>
</Class>
</xml>
- subject:resource
- predicate: property
- 字面量(literal):矩形
- 资源:椭圆
- object: value
- 三元组:<subject, predicate, object>
- 聚合工具:收集关于某一资源的所有数据并整合
- 匿名资源
RDFS(Resource Description Framework Schema)
- 资源:通过 RDF 描述的食物
- 核心属性
- rdfs:resource
- rdfs:property
- rdfs:Class
- rdfs:type
- rdfs:subClassOf
- 描述能力弱
- 局部的
- 没有存在/数量规约
- 传递,相反或对称属性
- 没有推理支持
OWL(Web Ontology Language)
- 共同理解,形式化
- 邻域中重要概念的名称+邻域中的背景知识/约束
- 本体:一个本体是一个(共享)概念化的一中(形式化的显示)规约
- Formal, explicit specification of a shared conceptualization
- OWL:W3C 负责
- OWL Lite: DL 容易实现的自己
- OWL DL: 限制在描述逻辑
- OWL Full: OWL + RDF
- 语义分层
- TBox 模式层
- ABox 实例层
- OWL 2
- OWL 2 EL: 含有大量属性和类的本体应用
- OWL 2 QL:大量实例数据(类数据库)
- OWL 2 RL:基于规则的推理引擎
知识图谱构建
- 本体工程(ontology engineering)
- 狭义:methods and methodologies for building ontologies
- 定义术语和术语间联系
- 广义:以工程化的视角考察本体的构建和管理
- 斯坦福起步法:明确范围,考虑重用,列举术语,定义类,定义属性,定义约束,创建实例
- 现实中是一个迭代的过程
- 狭义:methods and methodologies for building ontologies
- 知识图谱构建
- Data acquisition
- Semantics enrichment
- Linking to knowledge bases