GCN相关代码

Reference: Neural Graph Collaborative Filtering. In SIGIR 2019.
使用用户-物品隐式交互数据来构建用户-物品二分图,然后使用图卷积的方法来更新图中每一个节点的embedding,使得每一个节点中都包含着高阶邻居的信息,在推荐的场景下,这样的卷积操作相当于将协同过滤信号编码进了每一个节点的embedding函数中,如果堆叠多次这样的卷积操作,就可以捕获更高阶的交互关系。

  1. 利用交互数据来生成评分矩阵R
R = sp.dok_matrix((n_users, n_items), dtype=np.float32)
with open(train_file) as f_train:
    for l in f_train.readline():
        items = [int(i) for i in l.strip('\n').split(' ')]
        uid, train_items = items[0], itms[1:]
        for i in train_items:
            R[uid, i] = 1
  1. 将评分矩阵转化为邻接矩阵
def create_adj_matrix(R):
    adj_mat = sp.dok_matrix((n_users + n_items, n_users + n_items), dtype=np.float32)
    adj_mat = adj_mat.tolil()
    R = R.tolil()
    adj_mat[:n_users, n_users:] = R
    adj_mat[n_users:, :n_users] = R.T
    adj_mat = adj_mat.todok()
    print('already create adjacency matrix',  adj_mat.shape)
  1. 将邻接矩阵进行标准化
    添加自环(第3代GCN): adj_mat = adj_mat + sp.eye(adj_mat.shape[0])
    不添加自环:adj_mat

\color{teal}{\leftrightarrow将邻居节点聚集的结果作为当前节点的embedding表达}
e_u^{(1)} = \sum_{i \in N_u}e_i^{(0)}

可以使用L1标准化 将邻接矩阵乘度矩阵的逆(适用于单边标准化-第1代GCN),也可以使用开根号的方式,将度矩阵上每一个元素开根号之后求逆(适用于双边标准化-第2代GCN,效果更好).

def normalize_adj_single(adj):
    rowsum = np.array(adj.sum(1))

    d_inv = np.power(rowsum, -1).flatten()
    d_inv[np.isinf(d_inv)] = 0.
    d_mat_inv = sp.diags(d_inv)

     norm_adj = d_mat_inv.dot(adj)
         
     print('generate single-normalized adjacency matrix.')
     return norm_adj.tocoo()

def normalize_adj_symetric(adj):
    adj = sp.coo_matrix(adj)
    rowsum = np.array(adj.sum(1))
    d_inv_sqrt = np.power(rowsum, -0.5).flatten()
    d_inv_sqrt[np.isinf(d_inv_sqrt)] = 0.
    d_mat_inv_sqrt = sp.diags(d_inv_sqrt)
    return adj.dot(d_mat_inv_sqrt).transpose().dot(d_mat_inv_sqrt).tocoo()
    
mean_adj_1 = normalize_adj_single(adj_mat) # 单边标准化
norm_adj_1 = normalize_adj_symteric(adj_mat) # 双边标准化
mean_adj_2 = normalize_adj_single(adj_mat + sp.eye(adj_mat.shape[0])) # 单边标准化+自环
norm_adj_2 = normalize_adj_symteric(adj_mat + sp.eye(adj_mat.shape[0])) # 双边标准化+自环
  1. 一般较大的邻接矩阵无法直接和别的矩阵相乘(内存不足),需要将邻接矩阵切片后每部分单独运算,最后将结果组合在一起。
def _split_A_hat( X):
    A_fold_hat = []

    fold_len = (n_users + n_items) // n_fold
    for i_fold in range(n_fold):
        start = i_fold * fold_len
        if i_fold == n_fold - 1:
            end = n_users + n_items
        else:
            end = (i_fold + 1) * fold_len

        A_fold_hat.append(_convert_sp_mat_to_sp_tensor(X[start:end]))
    return A_fold_hat

# 将稀疏矩阵转化为tensor格式
def _convert_sp_mat_to_sp_tensor(self, X):
   coo = X.tocoo().astype(np.float32)
   indices = np.mat([coo.row, coo.col]).transpose()
   return tf.SparseTensor(indices, coo.data, coo.shape)
  1. 利用GCN来更新节点的embedding
def create_gcn_embed():
    A_fold_hat = _split_A_hat(adj_mat)
    node_embeddings = tf.concat([user_embeddings, item_embeddings],  axis=0)
    all_embeddings = [node_embedding]
    for k in range(n_layers):
        temp_emb = []
        for f in range(n_fold):
            # 稀疏tensor和稠密tensor相乘的 方法
            temp_embed.append(tf.sparse_tensor_dense_matmul(A_fold_hat[f], eu_embeddings))
        sum_embeddings = tf.concat(temp_embed, 0)
        node_embeddings = sum_embeddings
        all_embeddings += [node_embeddings]
    all_embeddings = tf.concat(all_embeddings, 1)
    user_embeddings, item_embeddings = tf.split(all_embeddings, [n_users, n_items], 0)
    return user_embeddings, item_embeddings
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,928评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,192评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,468评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,186评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,295评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,374评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,403评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,186评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,610评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,906评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,075评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,755评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,393评论 3 320
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,079评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,313评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,934评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,963评论 2 351

推荐阅读更多精彩内容