011 树的实现，以及广度优先遍历和深度优先遍历

链式实现：指向孩子节点的指针

使用“指向孩子节点的指针”，从root节点开始，使用指针将所有节点连成一个整体。

这里我还实现了广度优先遍历（BFS）和深度优先遍历（DFS）算法。其时间复杂度均为O(n)。

这种情况下，BFS利用队列进行遍历，DFS利用栈进行遍历。关于其中的DFS，这里的栈主要是指函数调用栈，也就是利用递归来实现。

广度优先遍历主要思路是：

利用队列进行遍历
从根节点开始把节点按顺序放入队列
每次从队列中取出一个节点，访问数据
然后将该节点的所有子节点入队
循环直到队列为空

深度优先遍历的关键是利用递归，主要步骤是:

访问当前节点数据
对当前节点的所有子节点递归调用dfs函数
进入每个子节点后，重复1、2步骤
递归调用结束后回溯到上一层

这样通过递归不断向更深层遍历，从而完成整棵树的遍历。递归会能保证从某一节点完整遍历其子树，再回溯到上一层节点。

from collections import deque


class Node:
    def __init__(self, data):
        self.data = data
        self.child_nodes = []

    def append_child(self, node):
        self.child_nodes.append(node)

    def __repr__(self):
        return f'{self.__class__.__name__}({self.data})'

    def bfs(self):
        lst = []

        queue = deque([self])

        while queue:
            cur = queue.popleft()
            lst.append(cur)
            for child in cur.child_nodes:
                queue.append(child)

        return lst

    def dfs(self):
        lst = []

        def recursive_dfs(node):
            lst.append(node)
            for child in node.child_nodes:
                recursive_dfs(child)

        recursive_dfs(self)
        return lst


if __name__ == '__main__':
    tree_struct = """\
    - 0
        - 1
            - 3
                - 4
                - 5
        - 2
            - 6
                - 8
                - 9
            - 7
    """

    root = Node(0)
    node1 = Node(1)
    node2 = Node(2)
    node3 = Node(3)
    node4 = Node(4)
    node5 = Node(5)
    node6 = Node(6)
    node7 = Node(7)
    node8 = Node(8)
    node9 = Node(9)

    root.append_child(node1)
    root.append_child(node2)

    node1.append_child(node3)

    node2.append_child(node6)
    node2.append_child(node7)

    node3.append_child(node4)
    node3.append_child(node5)

    node6.append_child(node8)
    node6.append_child(node9)

    print(tree_struct)
    print('#' * 30)
    print('bfs=', root.bfs())
    print('dfs=', root.dfs())

结果：

    - 0
        - 1
            - 3
                - 4
                - 5
        - 2
            - 6
                - 8
                - 9
            - 7
    
##############################
bfs= [Node(0), Node(1), Node(2), Node(3), Node(6), Node(7), Node(4), Node(5), Node(8), Node(9)]
dfs= [Node(0), Node(1), Node(3), Node(4), Node(5), Node(2), Node(6), Node(8), Node(9), Node(7)]

顺序实现：指向双亲节点的指针

使用“指向双亲节点的指针”，来表达树的层级结构，但这样做无法从双亲节点访问孩子节点，因而无法遍历，因此，使用一个顺序表，存储所有的节点。

这种情况下，有三种遍历方式：

直接遍历顺序表，时间复杂度O(n)。
广度优先遍历（BFS），时间复杂度O(n^2)。
深度优先遍历（DFS），时间复杂度O(n^2)。

广度优先遍历（BFS）仍然采取队列方式，深度优先遍历（DFS）仍然采取递归方式。

通常来讲，广度优先遍历（BFS）和深度优先遍历（DFS）的时间复杂度为O(n)，这里显然时间复杂度较高。

时间复杂度达到了O(n^2)，是因为这是一个极其简单的实现，关键在于：没有存储child孩子节点的指针。如果存储了，那还能再优化一下，典型的空间换时间。

于是，每找到一个孩子都需要遍历一遍顺序表，这一步骤就花掉了O(n)的时间。同时，再加上本来的遍历时间O(n)，而且两者叠加是呈现乘法的嵌套结构。所以，时间复杂度就达到了O(n^2)。

from collections import deque


class Node:
    def __init__(self, data, parent=None):
        self.data = data
        self.parent = parent

    def __repr__(self):
        return f'{self.__class__.__name__}({self.data})'


class Tree:
    def __init__(self):
        self._data = []

    def append(self, node):
        self._data.append(node)

    def traversal(self):
        return self._data

    def bfs_traversal(self):
        """
        时间复杂度O(n^2)
        """
        lst = []

        # 首先要找到 root 节点
        root_ = None

        for x in self._data:
            if x.parent is None:
                root_ = x

        queue = deque([root_])

        while queue:
            cur = queue.popleft()
            lst.append(cur)
            for x in self._data:
                if x.parent == cur:
                    queue.append(x)

        return lst

    def dfs_traversal(self):
        """
        时间复杂度O(n^2)
        """
        lst = []

        # 首先要找到 root 节点
        root_ = None

        for x in self._data:
            if x.parent is None:
                root_ = x

        def recursive_dfs(node):
            lst.append(node)

            for y in self._data:
                if y.parent == node:
                    recursive_dfs(y)

        recursive_dfs(root_)

        return lst


if __name__ == '__main__':
    tree_struct = """\
    - 0
        - 1
            - 3
                - 4
                - 5
        - 2
            - 6
                - 8
                - 9
            - 7
    """

    tree = Tree()

    root = Node(0)
    node1 = Node(1, parent=root)
    node2 = Node(2, parent=root)
    node3 = Node(3, parent=node1)
    node4 = Node(4, parent=node3)
    node5 = Node(5, parent=node3)
    node6 = Node(6, parent=node2)
    node7 = Node(7, parent=node2)
    node8 = Node(8, parent=node6)
    node9 = Node(9, parent=node6)

    tree.append(root)
    tree.append(node1)
    tree.append(node2)
    tree.append(node3)
    tree.append(node4)
    tree.append(node5)
    tree.append(node6)
    tree.append(node7)
    tree.append(node8)
    tree.append(node9)

    print(tree_struct)
    print(f'traversal= {tree.traversal()}')
    print(f'bfs= {tree.bfs_traversal()}')
    print(f'dfs= {tree.dfs_traversal()}')

结果：

    - 0
        - 1
            - 3
                - 4
                - 5
        - 2
            - 6
                - 8
                - 9
            - 7
    
traversal= [Node(0), Node(1), Node(2), Node(3), Node(4), Node(5), Node(6), Node(7), Node(8), Node(9)]
bfs= [Node(0), Node(1), Node(2), Node(3), Node(6), Node(7), Node(4), Node(5), Node(8), Node(9)]
dfs= [Node(0), Node(1), Node(3), Node(4), Node(5), Node(2), Node(6), Node(8), Node(9), Node(7)]

扩展：顺序实现与关系型数据库的“自关联”

关系型数据库的“自关联”（Self Join）（Hierarchical Relationship）可以表达树的层级结构。

在设计时往往通过一个pid字段指向双亲节点（记录行）的id字段。

这与顺序实现的原理如出一辙！

其中最典型的案例当数省市区名称：

例如：（这里主要是为了说明结构，其中部分信息可能有误）

id	name	pid
1	四川省	NULL
2	成都市	1
3	锦江区	2
4	青羊区	2
5	金牛区	2
6	武侯区	2
7	成华区	2
8	湖北省	NULL
9	武汉市	8
10	江汉区	9
11	硚口区	9
12	汉阳区	9
13	武昌区	9
14	青山区	9

其中:

四川省和湖北省在数据库里可看作根节点，pid为NULL。但其实这里可以看作是省略了国家这一根节点。
成都市和武汉市的pid为对应的省id。
成都市和武汉市管辖区县的pid为各自城市id。

这样通过自关联构建了成都和武汉的省市区三级层级关系。

可以统计每个省下面分别有多少个城市和区县等信息。例如：

SELECT 
  p.name AS 省份,
  COUNT(DISTINCT c.id) AS 城市数量,
  COUNT(DISTINCT d.id) AS 区县数量
FROM province p
LEFT JOIN city c ON c.pid = p.id
LEFT JOIN district d ON d.pid = c.id
GROUP BY p.name;

结果：

省份        城市数量     区县数量
四川省         1             5
湖北省         1             5

自关联是表达树形层级逻辑非常直观的数据库模式设计技术。

总结

广度优先遍历（BFS）和深度优先遍历（DFS）算法是两种关键的树遍历算法。BFS按层次顺序遍历树，DFS递归访问每个分支。
通常来讲，广度优先遍历（BFS）和深度优先遍历（DFS）算法的时间复杂度均为O(n)。
树可以通过链式实现，设置指向孩子节点的指针，也可以通过顺序实现，设置指向双亲的指针。
关系型数据库自关联也可表达树结构。数据库表通过引用双亲节点的id字段建立双亲-孩子关系，实现树形数据模型。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,546评论 6赞 507
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,224评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,911评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,737评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,753评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,598评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,338评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,249评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,696评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,888评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,013评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,731评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,348评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,929评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,048评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,203评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,960评论 2赞 355

011 树的实现，以及广度优先遍历和深度优先遍历

链式实现：指向孩子节点的指针

顺序实现：指向双亲节点的指针

扩展：顺序实现与关系型数据库的“自关联”

总结

推荐阅读更多精彩内容