分布式图计算中的图分割方法

目的

在分布式计算框架中,首先要解决数据的分割,分割后的数据被输入到各个计算节点中进行并行计算。
分布式图计算框架中,如何将整个图的数据分割,通常有以下两种方法:基于顶点的分割基于边的分割

分布式图计算

边分割

边分割

如上图所示,边分割就是将图数据按照边进行分割,将分割后的子图数据输入到不同的运算节点上进行并行计算。
边分割过程中,需要将图中的边和节点进行镜像复制,各个运算节点在运算的时候,需要不断的通信和更新图的边的状态。
谷歌提出的Pregel分布式计算框架用的就是这种分割方式。

顶点分割

顶点分割

如上图所示,顶点分割就是将图数据按照顶点进行分割,分割后与顶点相邻的顶点会被在另外一个节点进行复制。
GraphLab分布式计算框架采用的就是顶点分割方式

对比分析

从上面分割实例中可以看出,边分割结果多了4个顶点副本和3个边的副本,而顶点分割结果只多了2个顶点副本,在数据量大的应用场景下,顶点分割有明显的优势。
边分割后的副本数量增多,导致分布式各计算节点进行状态更新的通信量会明显的增加,这样也带来了不小的资源开销。
目前,采用顶点分割方式的分布式图计算框架优势比较明显。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,048评论 2 89
  • 分布式系统面临的第一个问题就是数据分布,即将数据均匀地分布到多个存储节点。另外,为了保证可靠性和可用性,需要将数据...
    olostin阅读 4,639评论 2 26
  • 图元处理(Primitive Processing) 如何在场景中使用曲面细分来添加几何细节 如何使用几何着色器处...
    RichardJieChen阅读 6,998评论 2 4
  • 这下打开了我关于化妆品的话匣子,爱美是女人的天性,化妆品又是爱美女人必须具有的辅助用品。雅芳看似个例,其实它是整个...
    云湛蓝阅读 267评论 0 1
  • 从整体来看,电视剧带有浓重的原电影情节!抒情的方法,对爱表达的方式!经典! 刚开始看,被哪句爱你一万年的表情和化妆...
    永远会很远阅读 301评论 0 2