container之heap

go的heap实现了堆，关于堆可以看下数据结构：堆（Heap），这里就不阐述了，go实现的源码在container/heap/heap.go中，其中包含了1个接口，5个外部方法和2个内部方法

接口

type Interface interface {
    sort.Interface
    Push(x interface{}) // add x as element Len()
    Pop() interface{}   // remove and return element Len() - 1.
}

// 其中sort.Interface的定义如下
type Interface interface {
    // Len is the number of elements in the collection.
    Len() int
    // Less reports whether the element with
    // index i should sort before the element with index j.
    Less(i, j int) bool
    // Swap swaps the elements with indexes i and j.
    Swap(i, j int)
}

也就是说，要使用heap，需要自己实现heap.Interface接口，并不是开箱即用的，除了Less方法，其他的都能根据方法名推出功能，Less方法返回bool类型，典型的实现就是两个元素的比较，通过更改比较规则，我们可以很方便的实现最大堆和最小堆

内部方法

// 这是个典型的堆向下追溯的过程
func down(h Interface, i0, n int) bool {
    i := i0
    for {
        // 先找左节点，如果左节点不存在，那右节点更不可能存在了，直接break跳出即可
        j1 := 2*i + 1
        if j1 >= n || j1 < 0 { // j1 < 0 after int overflow
            break
        }
        j := j1 // left child
        // 再找右节点，满足右节点存在且跟左节点比较符合自定义的Less方法的预期，即返回true，就让右节点去跟父节点比较
        if j2 := j1 + 1; j2 < n && h.Less(j2, j1) {
            j = j2 // = 2*i + 2  // right child
        }
        // 假设这里是找最小堆
        // min(左节点, 右节点) 再跟父节点比较，如果比父节点大，那就不用调换，直接退出即可
        if !h.Less(j, i) {
            break
        }
        // 调换父节点和min(左节点, 右节点)
        h.Swap(i, j)
        // 一旦发生了调换，那么肯定有某个子节点发生了变更，需要以该字节为父节点，重复上述操作直到未发生调换行为或者追溯到了叶子节点
        i = j
    }
    // 只要发生调换，那么i就不会再等于i0，这里是通过这个来标记整个追溯过程是否发生了父子节点的调换 
    return i > i0
}

// 堆向上追溯的过程
func up(h Interface, j int) {
    for {
        // 找到j对应节点的父节点，下面简称为j节点
        i := (j - 1) / 2 // parent
        // 如果j节点就是根节点或者j节点和父节点不满足Less方法的预期，即返回false，不用进行调换，直接退出即可
        if i == j || !h.Less(j, i) {
            break
        }
        // 调换j节点和父节点
        h.Swap(i, j)
        // 同样的一旦发生了调换，那么父节点肯定就发生了变更，需要以父节点作为子节点，重复上诉操作直到未发生调换行为或者追溯到了根节点
        j = i
    }
}

down和up，根据自定义的Less和Swap方法进行比较和调换，一个实现向下追溯，一个实现向上追溯，最终目的是为了保证每一个父节点、左子节点和右子节点的三元组满足 父节点 <=/>= min/max(左子节点，右子节点)

外部方法

// 初始化堆，构建完全二叉树
func Init(h Interface) {
    // heapify
    n := h.Len()
    // 倒序从第一个非叶子节点开始遍历，如果只有根节点一个节点，则不会执行，不满足 i >= 0
    // 为什么n/2 - 1是倒序第一个非叶子节点呢？
    // 还记得吗，堆是以完全二叉树为逻辑结构的
    // 那么假设有x个非叶子节点(x > 1)，那么节点总数有两种情况
    // 一种是最后一个非叶子节点有两个儿子节点，即2*x+1 (这个1是根节点自己)
    // 另外一个情况是最后一个非叶子节点只有一个儿子节点，即(x-1)*2+1+1 = 2*x
    // 因为n = 2*x+1 或者 n = 2*x，所以x = n/2，又因为这里使用的是索引下标，所以n/2-1是倒序第一个非叶子节点
    // 倒序保证每一个非叶子节点作为根节点的树都是最大/小堆，以此类推到根节点，就能保证整个树就是最大/最小堆 
    for i := n/2 - 1; i >= 0; i-- {
        down(h, i, n)
    }
}

// 添加元素
func Push(h Interface, x interface{}) {
    // 自定义方法
    h.Push(x)
    // 注意Push的前提是已经调用了Init方法进行了初始化
    // 这里默认添加入的元素是在尾部，所以自定义的Push方法需要注意下，别跟栈一样从顶部push
    // 因为已经是最大/最小堆了，所以只需要调用up方法，针对最末尾的节点进行向上追溯即可 
    up(h, h.Len()-1)
}

// 弹出最大/最小元素
func Pop(h Interface) interface{} {
    // 获取最末尾元素的索引
    n := h.Len() - 1
    // 将首尾元素调换，这里首位元素就是最大/最小值，是需要被pop出去的
    h.Swap(0, n)
    // 因为根节点即首位元素发生了变化，所以需要调用down方法进行向下追溯
    // 注意这里的n不是h.Len()，而是h.Len() - 1，因为有pop动作，新的长度会减1
    down(h, 0, n)
    // 这里默认是从尾部弹出，自定义实现的时候需要注意一下，别跟栈一样从顶部弹出了
    return h.Pop()
}

// 移除某个元素
func Remove(h Interface, i int) interface{} {
    // 获取最末尾元素的索引
    n := h.Len() - 1
    // 如果移除的元素不是末尾元素
    if n != i {
        // 调换节点i和节点n
        h.Swap(i, n)
        // 调用down方法进行向下追溯，这里n也是h.Len() - 1，原因同上
        // 如果向下追溯过程中发生了调换，就不用再调用向上追溯了，因为节点i的子节点都比节点i小/大(针对最大堆和最小堆)
        if !down(h, i, n) {
            up(h, i)
        }
    }
    // 弹出末尾元素
    return h.Pop()
}

// 针对某个节点i，发起堆修复操作
// 比如更改了某个节点的值，就需要重新维护
func Fix(h Interface, i int) {
    // 这里跟Remove方法中的操作基本一样，就是分别向下向上追溯的过程，不再细说
    if !down(h, i, h.Len()) {
        up(h, i)
    }
}

举个栗子

源码分析的差不多了，下面来看下应用

type hs []int

func (recv hs) Less(i, j int) bool {
    return recv[i] < recv[j]
}

func (recv hs) Len() int {
    return len(recv)
}

func (recv hs) Swap(i, j int) {
    recv[i], recv[j] = recv[j], recv[i]
}

func (recv *hs) Push(x interface{}) {
    item := x.(int)
    *recv = append(*recv, item)
}

func (recv *hs) Pop() interface{} {
    l := len(*recv) - 1
    item := (*recv)[l]
    *recv = (*recv)[:l]
    return item
}

func main()  {

    var hp hs = []int{4,2,3,7,5,1,5,3,8,9,3,2,0}
    hpPtr := &hp
    fmt.Println(hp.Less(0, 1)) // false
    fmt.Println(hp.Len()) // 13
    hp.Swap(2, 3)
    fmt.Println(hp) // [4 2 7 3 5 1 5 3 8 9 3 2 0]
    hpPtr.Push(11)
    fmt.Println(hp) // [4 2 7 3 5 1 5 3 8 9 3 2 0 11]
    hpPtr.Pop()
    fmt.Println(hp) // [4 2 7 3 5 1 5 3 8 9 3 2 0]

    heap.Init(hpPtr)
    fmt.Println(hp) // [0 2 1 3 3 2 5 3 8 9 5 4 7]
    fmt.Println(heap.Pop(hpPtr)) // 0
    heap.Push(hpPtr, -1) 
    fmt.Println(hp) // [-1 2 1 3 3 2 5 3 8 9 5 7 4]
    heap.Remove(hpPtr, 0)
    fmt.Println(hp) // [1 2 2 3 3 4 5 3 8 9 5 7]
    hp[3] = -1
    fmt.Println(hp) // [1 2 2 -1 3 4 5 3 8 9 5 7]
    heap.Fix(hpPtr, 3)
    fmt.Println(hp) // [-1 1 2 2 3 4 5 3 8 9 5 7]
}

总结

heap个人感觉是一个工具类的半成品吧，做不到开箱即用，而且使用者需要对heap的实现比较了解，否则可能容易踩坑，比如上面说到的，heap中Pop方法默认弹出末位元素，Less方法如何实现才能控制最大/小堆等等，而且使用其他方法之前必须先调用Init方法，否则结果可能是非预期的，这点heap里面也没有进行限制，最后建议如果使用heap，最好跟上面例子一样使用slice进行包装，这样接入的成本是最低的

container之heap