姓名:贾文韬
学号:20181213886
学院:广州研究院
专业:电子信息(计算机技术方向)
【嵌牛导读】网络嵌入方法(Network Embedding)旨在学习网络中节点的低维度潜在表示,所学习到的特征表示可以用作基于图的各种任务的特征,例如分类,聚类,链路预测和可视化。
【嵌牛鼻子】网络嵌入方法(Network Embedding)异构神经网络(Heterogeneous information networks)
【嵌牛正文】
异构神经网络
异质信息网络英文全称 heterogeneous information network,也可以被译为异构信息网络,
异质信息网络G=(V,E)包括不同类型的对象和关系,每个对象属于一个特定的对象类型, 每个关系属于一个特定的关系类型。比如说文献网络、社交媒体网络等。
异构网络vs同构网络
异构网络包括不同类型的节点或链接,而同构网络只有一种类型的对象和链接。同构网络可被视为异构网络的特例。而且,异构网络可以通过网络映射(network projection)或忽略对象异质性转化为同构网络,但同时会造成重要信息丢失。传统的链接挖掘(link mining)通常基于同构网络,许多同构网络分析技术不能直接应用于异构网络。
异构信息网络
网络模式
网络模式是异构信息网络的元模板,是定义于对象类型T的节点和来自关系R的边的有向图,表示为TG=(T,R)。对于上图中定义的文献信息网络,其网络模式如下图所示。
作者和论文之间有写与被写的关系,论文和会议之间有发表于和发表的关系,论文和关键词之间有使用和被使用的关系,在论文和论文之间还存在着引用和被引用的关系。
元路径
元路径是定义在网络模式上的链接两类对象的一条路径,形式化定义为
表示对象类型之间的一种复合关系,A 表示对象类型,R 表示关系类型
一个例子
HIN不仅引入了丰富的语义信息,还引入了潜在不兼容的语义信息,这为HIN的嵌入学习带来了挑战。例如下图所示,Stan喜欢musical类型的电影,也喜欢Ang Lee导演的电影。但是Ang Lee没有导演过musical类型的电影,所以若这些节点都被映射到同一个度量空间的话,Ang Lee和musical的距离会很远,因为它们不相似。因此,在同一个度量空间中,Stan不可能同时和这两个节点距离近。
为了缓解这一问题,作者引入边的表示并且针对不同类型的边使用不同的度量空间。这样Stan节点可以在两个度量空间中分别于Ang Lee和musical距离近。
电影图例
一部电影的图例-
用六种节点类型(user、actor、country、movie、genre,director)
七种无向边类型(user to actor,user to movie...)
一种有向边类型(user to user)
现有网络嵌入方法
传统的同构网络嵌入方法平等地对待所有的节点和边,而不管它们的类型如何,这些方法没有捕捉到HINs的本质异构性。
(1)解决同质信息网络的方法通常是基于元路径的,这不能解决HIN的综合转录问题。因为元路径的选择很麻烦,而且选取出来的元路径只针对特定任务或者只能反映出HIN的部分信息。
(2)还有一些针对HIN的方法,只对特定种类的HIN或添加了副信息的HIN进行了表示学习。这些方法不能应用到一般的HIN。并且大多数针对HIN的嵌入表示方法只为表示学习提供了一个度量空间,这可以处理HIN中部分可兼容语义信息,但是若对HIN整体记性综合转录则会带来信息损失。
(3)最近的研究提出了一个方法,通过在嵌入学习前将HIN分解成多个领域的,实现了在避免信息损失的条件下(如:丰富的异质信息、潜在冲突的语义信息)获得高质量的HIN表示。但是这种方法独立地获取到了不同领域的信息,但是完全禁止了跨领域的联合学习。
推荐论文阅读
《Easing Embedding Learning by Comprehensive Transcription Heterogeneous Information Networks》
(1)研究了HIN嵌入学习中的综合转录问题,保留了HIN丰富的语义信息,并且易于在下游任务中使用。
(2)提出现实世界中的HIN存在不可兼容的语义信息,这为HIN的综合转录带来了挑战。
(3)提出算法HEER,利用边的表示和异构度量,解决HIN的综合转录问题。
(4)实验证明了HEER的有效性。
论文代码:https://github.com/GentleZhu/HEER
HEER: Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks
论文相关学习链接:https://blog.csdn.net/byn12345/article/details/104703739
https://www.cnblogs.com/chaoran/p/10156564.html
https://blog.csdn.net/akufr2065/article/details/101957346