之前谈论的链表、队列都是一对一的线性结构,那么一对多的情况如何处理呢?“树”有效的解决了这种一对多的数据结构关系。
一、树的定义
1.树的定义
树(Tree)是n(n>=0)个结点的有限集。n=0时称为空树。在任意一颗非空树中:
- 有且仅有一个特定的称为根(root)的结点;
-
当n>1时,其余结点可分为m(m>0)个互补交互的有限集T1、T2...Tm,其中每一个集合本身又是一棵树,并称为根的子树(SubTree)。
2.树的特点
- n>0时,根节点是唯一的,不可能存在多个根节点。数据结构中的树只有一个根节点。
- m>0时,子树的个数没有限制,但他们一定是互不相交的。
3.结点的分类
- 结点:树的结点包含一个数据元素和若干指向其子树的分支。
- 结点的度(Degree):结点拥有的子树。
- 叶子结点(Leaf)/终端结点:度为0的结点。
- 分支结点/非终端结点:度不为0的结点。
- 内部结点:除根节点以外,分支结点也称为内部结点。
- 树的度:树内各结点的度的最大值。
4.结点之间的关系
- 孩子(Child)和双亲(Parent):结点的子树的根,相应的,该结点称为孩子的双亲。(注意是双亲,不是单亲)
- 兄弟(sibling):同一个双亲的孩子之间互称兄弟。
- 结点的祖先:从根结点到该结点所经过分支上的所有结点。
- 子孙:以某结点为根的子树中的任一结点都称为该节点的子孙。
- 无序树和有序树:如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该数为有序树,否则为无序树。
- 森林(fores):m(m>=0)棵互不相较的树的集合。
二、树的存储结构
对于存储结构,可能会联想到前面的顺序存储和链式存储结构。但是对于数这种可能会有很多孩子的特殊数据结构,只用顺序存储结构或者链式存储结构很那实现,那么可以将这两者结合,产生主要的三种存储结构表示法:双亲表示法、孩子表示法、孩子兄弟表示法。
1.双亲表示法
双亲表示法定义
假设以一组连续空间存储数的结点,同时在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。
双亲表示的结点结构
data(数据域) | parent(指针域) |
---|---|
存储结点的数据信息 | 存储该结点的双亲所在数组中的下标 |
代码实现双亲表示法
/* 树的双亲表法结点结构定义*/
#define MAX_TREE_SIZE 100
typedef int ElemeType;
typedef struct PTNode{ // 结点结构
ElemeType data; //结点数据
int parent; // 双亲位置
}PTNode;
typedef struct { // 树结构
PTNode nodes[MAX_TREE_SIZE]; // 结点数组
int r; // 根的位置
int n; // 结点数
}PTree;
双亲表示法的特点
- 由于根结点是没有双亲的,约定根结点的位置位置域为-1.
- 根据结点的
parent
指针很容易找到它的双亲结点。所用时间复杂度为O(1),直到parent为-1时,表示找到了树结点的根。 - 缺点:如果要找到孩子结点,需要遍历整个结构才行。
2.孩子表示法
孩子表示法定义
把每个结点的孩子结点排列起来,以单链表作为存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。
孩子表示法的结点结构
孩子表示法有两种结点结构:孩子链表的孩子结点和表头数组的表头结点
- 孩子链表的孩子结点
child(数据域) | next(指针域) |
---|---|
存储某个结点在表头数组中的下标 | 存储指向某结点的下一个孩子结点的指针 |
- 表头数组的表头结点
data(数据域) | firstchild(头指针域) |
---|---|
存储某个结点的数据信息 | 存储该结点的孩子链表的头指针 |
代码实现孩子表示法
/* 树的孩子表示法结构定义*/
#define MAX_TREE_SIZE 100
typedef int ElemeType;
typedef struct CTNode{ // 孩子结点
int child; // 孩子结点的下标
struct CTNode * next; // 指向下一结点的指针
}*ChildPtr;
typedef struct { // 表头结构
ElemeType data; // 存放在数中的结点数据
ChildPtr firstchild; // 指向第一个孩子的指针
}CTBox;
typedef struct { // 树结构
CTBox nodes[MAX_TREE_SIZE]; // 结点数组
int r; // 根的位置
int n; // 结点树
}CTree;
双亲孩子表示法定义
对于孩子表示法,查找某个结点的某个孩子,或者找某个结点的兄弟,只需要查找这个结点的孩子单链表即可。但是当要寻找某个结点的双亲时,就不是那么方便了。所以可以将双亲表示法和孩子表示法结合,形成双亲孩子表示法。
show code
/* 树的双亲孩子表示法结构定义*/
#define MAX_TREE_SIZE 100
typedef int ElemeType;
typedef struct CTNode{ // 孩子结点
int child; // 孩子结点的下标
struct CTNode * next; // 指向下一结点的指针
}*ChildPtr;
typedef struct { // 表头结构
ElemeType data; // 存放在数中的结点数据
int parent; // 存放双亲的下标
ChildPtr firstchild; // 指向第一个孩子的指针
}CTBox;
typedef struct { // 树结构
CTBox nodes[MAX_TREE_SIZE]; // 结点数组
int r; // 根的位置
int n; // 结点树
}CTree;
3.孩子兄弟表示法
孩子兄弟表示法定义
任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟存在也是唯一的。因此,设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
孩子兄弟表示法的结点结构
data(数据域) | firstchild(指针域) | rightsib(指针域) |
---|---|---|
存储结点的数据信息 | 存储该结点的第一个孩子的存储地址 | 存储该结点的右兄弟结点的存储地址 |
代码实现孩子兄弟表示法
/* 树的孩子兄弟表示法结构定义*/
#define MAX_TREE_SIZE 100
typedef int ElemeType;
typedef struct CSNode{
ElemeType data;
struct CSNode * firstchild;
struct CSNode * rightsib;
}CSNode, *CSTree;