本文介绍的Graphx的图上算法都是基于Pregel模型实现的。
用户图计算的场景:
- 基于度分布的中枢节点发现
- 基于最大连通图的社区发现(聚类)
- 基于三角形计数的关系衡量
- 基于随机游走的用户属性传播(聚类)
该系列文章主要针对Spark的Graphx组件中提供的6项图算法进行源码的简要学习和笔记记录,有不对的地方欢迎指正呀~
【1】三角形计数TriangleCount
【2】PageRank
【3】标签传播LabelProgagation
【4】最短路径ShortestPaths
【5】连通分量ConnectedComponents
【6】强连通分量StronglyConnectedComponents