并查集问题

并查集(Union-find or Disjoint-set)问题是一个很有趣现实中很常见的问题，也并不是一个能够无脑解决的问题。

首先贴上一个讲解详细的帖子
https://blog.csdn.net/guoziqing506/article/details/78752557

什么是并查集问题？举个例子:
有一个元素集合{A, B, C, D, E, F, G}，元素之间的关系是{AB, BC, CD, EF, FG}
我们希望将存在传递关系的元素分为一组，即得到{A, B, C, D}和{E, F, F}

1.遍历

我们的第一反应是遍历，好吧充足的时间下没有遍历解决不了的问题，
这里给出一个递归的实现,时间复杂度应该是O(n^n)吧


pointList = ['A','B','C','D','E','F','G']
linkList = [('A','B'),('B','C'),('C','D'),('E','F'),('F','G'),]
G = nx.Graph()


visted = []

def findNeighboor(v,oneSubset):
    oneSubset.append(v)
    visted.append(v)
  # 如果自己的邻居没有加入集合，就对它进行递归操作
    for link in linkList:
        if link[0]==v and link[1] not in oneSubset:
            findNeighboor(link[1],oneSubset)
        if link[1]==v and link[0] not in oneSubset:
            findNeighboor(link[0],oneSubset)
    return oneSubset

def findDisjointSet():
    allSet = []
    for point in pointList:
        if point not in visted:
            oneSubset = []
            oneSubset = findNeighboor(point,oneSubset)
            allSet.append(oneSubset.copy())
    print(allSet)
    
findDisjointSet()

2.并查集解决问题

并查集是一种树形的数据结构，参考链接
https://blog.csdn.net/doncoder/article/details/79182542
https://blog.csdn.net/fkjslee/article/details/48809903

思想如下:
初始化：每个点看做一棵树，并且为每个树的树根；树根就是每个组别的代表。

查询：对于点对(a,b)，通过a和b去向上查找他们的祖先节点直到树根，如果有相同的祖先节点，则他们在已经在一棵树下，属于同一组别。

合并：若不在同一组别，令其中一个点（比如a）所在树的根节点成为另一个点（比如b）的根节点的孩子。这样即便再查询到a，最终会判断认为a属于b的组别。

大树小树合并技巧: 小树变成大树的子树，会比大树变成小树的子树更加不易增加树高，这样可以减少查询次数。

压缩路径: 为了尽量减小树的的高度，我们可以在从每个节点进行回溯时，存储所有的中间节点（可以用递归实现），并且将他们的都直接指向根节点。这样树就会变得扁平，树高显著降低。这个方法因为要存储中间节点，会增加空间复杂度。所以一个备选的思路是每遍历到一个节点，就将这个节点变成他的爷爷节点的孩子（和其父节点在同一层了）。相当于是压缩了查询的路径，这样，频繁的查询当然会导致树的“扁平化”程度更彻底。


# 并查集

class TreeNode():
    def __init__(self):
        self.parent = None
        self.children = []
        self.data = None

# 初始化
def initDisjointSet(allRootSet):
    nodes = {}
    for point in pointList:
        node = TreeNode()
        node.data = point
        node.parent = node
        allRootSet[point] = [point]
        nodes[point] = node
    return nodes

# 查询
def findRoot(a):
    nodes = []
    while a.parent != a:
        nodes.append(a)
        a = a.parent
    for node in nodes:
        node.parent = a
    return a

# 查询 递归实现
def findRoot2(a):
    if a == a.parent:
        return a
    else:
        a.parent = findRoot2(a.parent)

# 合并
def union_set(a,b,allRootSet):
    fa = findRoot(a)
    fb = findRoot(b)
    # fa的根指向fb,合并两个子树
    fa.root = fb
    # 合并
    allRootSet[fb.data].extend(allRootSet[fa.data])
    # 删除一个子集代表
    allRootSet[fa.data] = None

def getDisjointSet():
    allRootSet = {}
    nodes = initDisjointSet(allRootSet)
    for link in linkList:
        union_set(nodes[link[0]],nodes[link[1]],allRootSet)
  # 打印最终结果
    print(allRootSet)

getDisjointSet()

并查集的时间复杂度分析
https://blog.csdn.net/johnny901114/article/details/80721436
我上面的实现查找需要的时间复杂度是O(h) 合并是O(1)
这里的链接证明最后的时间复杂度是O(log* n)
这个复杂度没看懂，偷个懒

更多内容可移步我的GitHub，谢谢
https://github.com/DaLiWangCC/Algorithm_study