知识图谱笔记 1 知识图谱概论

知识图谱与语义技术概述:

Vannevar Bush

Sir Tim Berners-Lee:以链接为中心的系统

语义网:从链接文本到链接数据

语义网络(Semantic Network)->本体论(Ontology)->Web->The Semantic Web->Link Data->知识图谱(Knowledge Graph,KG)

KG辅助搜索,从文本搜索变为语义搜索。

手工众包,格式转化,元组抽取,实体融合,链接预测,推理补全,语义嵌入。

KG辅助问答,输入自然语言,返回精确答案。

给万物都挂接一个背景知识库。

KG辅助决策。

预先抽取语义->建立数据链接,不规范数据表达->规范数据表达,粗糙数据->可计算数据。

Palantir:动态本体、Kensho:金融知识图谱。

KG辅助AI,常识推理。

KG的本质:

Web视角:像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义的搜索。

NPL视角:怎样从文本中抽取语义和结构化数据。

深度学习->学习

知识图谱->推理

各种知识图谱项目:

CYC:常识知识库。

包括了术语Terms(词)、断言Assertions(句子)

Wordnet:英语词义消歧。

ConceptNet:常识知识库。

主要依靠互联网众包、专家创建、游戏三种方法构建。

以三元组(主谓宾)形式的关系型知识构成,更加接近自然语言。

Freebase:通过开源免费吸引用户。

Wikidata:目标是构建全世界最大的免费知识库。

DBPedia:数据库版本的Wikipedia。

YAGO:集成了Wikipedia、Wordnet、GeoNames三个来源的数据。

考虑了时间和空间维度的扩展。

Babelnet:多语言词典知识库。

NELL:互联网挖掘方法从Web自动抽取三元组知识。

Concept Graph:以概念层次体系为中心的知识图谱。

OpenKG:中文知识图谱。

Zhishi.me:合成中文数据库。

cnSchema:开放的中文知识图谱Schema。

知识图谱技术概览:

数据来源:文本、结构化数据库、多媒体、传感器、众包->KG Data。

基于数理逻辑的知识表示->基于向量空间学习的分布式知识表示。

语义网知识表示框架:

RDF:Triple-based Assertion model

主语、宾语是节点,谓语是边。

RDF Graph:Directed Labeled Graph

基本数据模型:有向标记图。

RDFS:Simple Vocabulary and Schema(类比数据库表、字段的设计)

OWL:本体(Ontology)是一个概念和关系的描述,是对其形式化的定义。通过规范描述。

OWL extends RDF Schema

SPARQL:RDF的查询语言。类SQL的声明式的查询语言。

子图匹配。

JSON-LD:数据交换格式。适用于作为程序之间做数据交换。

RDFa、HTML5 MicroData:在网页中嵌入语义数据。

KG的分布式表示:

KG Embedding:KG的分布式表示,在保留语义的同时,将知识图谱中的实体和关系映射到连续的稠密的低维向量空间。

张量分解、神经网络、距离模型(翻译模型)。

知识抽取:NLP + KR:

非结构化文本数据->文本预处理->分词、词性标注、语法解析、依存分析->NER命名实体识别、Entity Linking实体链接->关系抽取、事件抽取->KR:三元组、多元关系、模态知识

基于知识工程(正则、模板匹配、规则约束)

基于本体抽取(知识挖掘,PRA)

基于模型的抽取(模型、训练)

知识存储:

基于干系数据库的存储、基于原生图的存储。

知识问答:

KBQA基于知识库的问题回答。

语义解析->语义表示->查询数据库->返回用户

知识推理:

基于已知事实推出未知事实的计算过程。

缺省推理、连续变化推理、空间推理、因果关系推理。

基于描述逻辑的推理-本体推理:

描述逻辑是一种用于知识表示的逻辑语言和以其为对象的推理方法。

知识融合:

在不同数据集中找出同一个实体。

Dedupe基于python的工具包。

LIMES不要求两个数据集的实体具有相似的结构。

知识众包:

Wikibase、Schema.ORG

典型案例简介:

Open PHACTS:药物研发的开放数据访问平台。

SAP:企业知识图谱应用。

BBC ONTOLOGIES:更好的搜索体验。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,204评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,091评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,548评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,657评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,689评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,554评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,302评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,216评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,661评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,851评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,977评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,697评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,306评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,898评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,019评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,138评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,927评论 2 355

推荐阅读更多精彩内容