基于Neo4j 图数据库的知识图谱的关联对齐（实体对齐）

计算相关性的基本步骤分为三步：
1，链接neo4j数据库，并且读取出里面的数据
2，对齐算法运算
3，拿到运算结果设定一个阀值，来判断大于阀值的就是相关。
直接上代码：
第一步：

#导入工具包
import numpy as np
from neo4j.v1 import GraphDatabase, basic_auth, kerberos_auth, custom_auth, TRUST_ALL_CERTIFICATES

##链接数据库，建立driver。
driver = GraphDatabase.driver("***********", auth=basic_auth(“neo4j”,“neo4j”), trust=TRUST_ALL_CERTIFICATES)
session = driver.session()
#读出数数据并且append到一个列表里面
dat = session.run(“MATCH (m)-[r]->(n) RETURN m.name, r.relation, n.name LIMIT 5”)
blists = []
for d in dat:
bs = str(d[0])
blists.append(bs)

第二步：

#把列表里面的数据，拿出来俩俩运算
for i in range(len(blists)):
for j in range(0,i):
a = blists[i]
b = blists[j]
print(blists[i],blists[j])
td = Jaccrad(a, b)
std =edit_distance(a, b)/max(len(a),len(b))
fy = 1-std
#取2个算法的平均值
huizon = (td+fy)/2
print('avg_sim: ', huizon)

#编辑距离算法
def edit_distance(word1, word2):
len1 = len(word1)
len2 = len(word2)
dp = np.zeros((len1 + 1, len2 + 1))
for i in range(len1 + 1):
dp[i][0] = i
for j in range(len2 + 1):
dp[0][j] = j
for i in range(1, len1 + 1):
for j in range(1, len2 + 1):
delta = 0 if word1[i - 1] == word2[j - 1] else 1
dp[i][j] = min(dp[i - 1][j - 1] + delta, min(dp[i - 1][j] + 1, dp[i][j - 1] + 1))
return dp[len1][len2]

#Jaccrad 算法
def Jaccrad(terms_model,reference):
grams_reference = set(reference)
grams_model = set(terms_model)
temp = 0
for i in grams_reference:
if i in grams_model:
temp = temp + 1
fenmu = len(grams_model) + len(grams_reference) - temp
jaccard_coefficient = float(temp / fenmu)
return jaccard_coefficient

测试结果：
福州市委,福建省福州市委
avg_sim: 0.6190476190476191
福州市委,福建省委
avg_sim: 0.41666666666666663

第三步：

huizon = (jacd+edit)/2
if 0.70 < huizon < 1: # 取一个值的区间
#判断a 和 b 的长度，目的是留下字数长的实体，然后把字数短的实体去掉。
if len(a) > len(b): # 如果a实体比b实体要长 ,删除b
rel_a,rel_b = deleted(a, b, sd)
if rel_a == rel_b: # 如果关系一样 直接删除
session.run("match(n) where n.name=’%s’ detach delete n " % (b))
else: # 如果关系不一样先把关系拿出来迁移到另外一个相似的实体上，然后在进行删除。
rels = session.run(“MATCH (n)-[r]->(m) where n.name=’%s’ and m.name=’%s’ RETURN r.relation” % (b, sd))
rls = rels.values()[0][0]
if rls:
session.run("MATCH§,(q) where p.name=’%s’and q.name=’%s’ create unique §-[:%s {relation:’%s’}]->(q) " % (a, sd, rls, rls))
session.run("match(n) where n.name=’%s’ detach delete n " % (b))
else: # 如果b实体比a实体要长 ,删除a
rel_a, rel_b = deleted(a, b, sd)
if rel_a == rel_b:
session.run("match(n) where n.name=’%s’ detach delete n " % (a))
else:
rels = session.run(“MATCH (n)-[r]->(m) where n.name=’%s’ and m.name=’%s’ RETURN r.relation” % (a, sd))
rlsd = rels.values()[0][0]
if rlsd:
session.run("MATCH§,(q) where p.name=’%s’and q.name=’%s’ create unique §-[:%s {relation:’%s’}]->(q) " % (b, sd, rlsd, rlsd))
session.run("match(n) where n.name=’%s’ detach delete n " % (a))

————————————————
原文链接：https://blog.csdn.net/for_yayun/article/details/100971894
https://blog.csdn.net/w5688414/article/details/103262721

最后编辑于：2021.12.29 20:55:16

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,539评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,594评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,871评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,963评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,984评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,763评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,468评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,850评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,002评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,144评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,823评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,483评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,026评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,150评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,415评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,092评论 2赞 355

基于Neo4j 图数据库的知识图谱的关联对齐（实体对齐）

推荐阅读更多精彩内容