带标签数据的sku嵌入方法
方法名:Label Informed Attributed Network Embedding
简称:LANE
sku嵌入向量中应包括:user对sku的行为,sku属性,sku标签
算法基本流程
- 从用户对sku的pv序列构造网络
- 清洗出sku属性
- 输入模型计算嵌入 LANE(network,attribute,(label),dim)
- sku嵌入向量评估
- 输入seq2seq训练
- 预测
LANE 细节
网络的构造
- 从hive表里得到用户对sku的pv序列
- 将相邻的sku关系,设置为网络中node之间有一条有向边
算法伪代码
Algorithm :Label Informed Attributed Network Embedding
Input: (嵌入维度)
Input: (迭代次数)
Input: (带权邻接矩阵)
Input: (属性矩阵)
Input: ,(权重参数)
Output:H(sku嵌入矩阵)
设sku数量(即构造图中的节点数量)为,sku属性的维度为, sku标签的维度为,sku嵌入向量维度为
1 : Construct the affinity matrices and
2 : Compute Laplacian matrices , and
3 : Initialize ,
4 : repeat
5 : Update
6 : Update
7 : Update
8 : Update
9 :
10 : until max_iter
11 : return H
spark关键代码