一、数据结构绪论
- 逻辑结构与物理结构
- 逻辑结构:集合、线性(一对一)、树(一对多)、图(多对多)
- 物理结构:顺序存储结构、链式储存结构
- 抽象数据类型 (Abstract Data Type,ADT):是指一个数学模型及定义在该模型上的一组操作
标准格式
ADT 抽象数据类型名
Date 数据元素之间的逻辑定义
Operation
操作1
初始条件
操作结果描述
操作2
......
操作3
......
endADT
二、算法
- 算法特性:输入输出、确定性、又穷性、可行性
- 算法要求:正确性、健壮性、可读性、时间效率高和存储量低
- 算法时间复杂度
- 推导大O阶方法
2.在修改后的运行函数中,只保留最高位
3.如果最高阶项存在且不是1,则去除与这个项相乘的常数
得到的结果是大O阶
- 推导大O阶方法
三、线性表
- 定义:零个或多个数据元素的有限序列
- 抽象数据结构
ADT 线性表
Data :
线性表的数据对象集合为{a1,a2,......,an},每个元素的类型均为DataType。其中,除第一个元素a1外,每一个元素有且只有一个直接前驱元素,除了最后一个元素an外每一个元素有且只有一个直接后继元素。数据元素之间的关系是一对一的关系。
Operation:
InitList(&l)
操作结果:构造一个空的线性表L
DestroyList(&l)
初始条件:线性表已存在
操作结果:销毁线性表L
ClearList(&l)
初始条件:线性表已存在
操作结果:置线性表L为空表
ListEmpty(L)
初始条件:线性表已存在
操作结果:若线性表L为空表,则返回TRUE,否则返回FALSE
ListLenght(L)
初始条件:线性表已存在
操作结果:返回线性表L数据元素个数
GetElem(L,i,&e)
初始条件:线性表已存在(1≤i≤ListLenght(L))
操作结果:用e返回线性表L中第i个数据元素的值
locatElem(L,e,comare())
初始条件:线性表已存在,comare()是数据元素判定函数
操作结果:返回线性表L中第1个与e满足关系comare()的数据元素的位序
PriorElem(L,cur_e,&pre_e)
初始条件:线性表已存在
操作结果:若cur_e是线性表L的数据元素,且不是第一个,则用pre_e返回它的前驱,否则操作失败,pre_e无定义
NextElem(L,cur_e,&)
初始条件:线性表已存在
操作结果:若cur_e是线性表L的数据元素,且不是第最后一个,则用next_e返回它的后继,否则操作失败,next_e无定义
ListInsert(&L,i,e)
初始条件:线性表已存在(1≤i≤ListLenght(L)+1)
操作结果:在线性表L中第i个数据元素之前插入新元素e,L长度加1
ListDelete(&L,i,&e)
初始条件:线性表已存在(1≤i≤ListLenght(L))
操作结果:删除线性表L中第i个数据元素,用e返回其值,L长度减1
ListTraverse(L,visit())
初始条件:线性表已存在
操作结果:依次对线性表L的每个数据元素调用visit()函数,一旦visit()失败,则操作失败}ADT List
- 顺序储存结构代码
#define MAXSIZE 20
typedef int ElemType;
typedef struct{
ElemType data[MAXSIZE];
int length;
}SqList;
单链表、静态链表、循环链表、双向链表
- 单链表
- 单链表储存结构代码
typedef struct node{
ElemType data;
struct Node *next;
} Node;
typedef struct Node *LinkList;
- 静态链表(早期没有指针,用数组代替指针)
- 静态链表的储存结构代码
#define MAXSIZE 1000
typedef struct{
Elemtype data;
int cur;/游标/
}Component,StaticLinkList[MAXSIZE];
头指针存放备用链表(后面空闲空间)第一个节点下标
数组最后一个元素的cur用来存放头结点(第一个插入元素的下标)
循环链表
将单链表中的终端结点的指针端由空指针改为指向头结点,链表就形成了一个环-
双向链表
- 双向链表的储存结构代码
typedef Struct DulNode{
ElemType data;
struct DuLNode *prior;
struct DuLNode next;
}DulNode,DuLinkList;
- 双向链表的储存结构代码
四、栈与队列
栈
- 栈的定义:限定仅在表尾进行插入和删除操作的线性表
- 栈的抽象数据类型
ADT 栈(stack)
Data :
同线性表
Operation:
InitStack(*S)
初始化操作,建立一个空栈*S
DestroyStack(*S)
若栈存在,则销毁它
ClearStack(*S)
将栈清空
StackEmpty(*S)
若栈为空,则返回true,反之返回false
GetTop(S,*e)
若栈存在且非空,用e返回栈顶元素
Push(*S,e)
若栈存在,插入新元素e到栈S中并成为栈顶元素
Pop(S,e)
删除栈S中栈顶元素,并用e返回其值
StackLengh(S)
返回栈S的元素个数
endADT
- 栈的顺序存储结构
typedef int SElemType;
typedef struct{
SElemtype data[MAXSIZE];
int top;
}SqStack; - 两栈共享空间
typedef struct{
SElemType data[MAXSIZE];
int top1;
int top2;
}sqDoubleStack;
判断是否满栈
top1+1==top2
-
栈的链式存储结构
typedef struct StackNode{
SElemType data;
struct StackNode next;
}StackNode,LinkStackPtr;typedef struct LinkStack{ LinkStack top; int count; }LinkStack;
栈的应用:
四则运算表达式求值:后缀表示法(逆波兰表示法)。
队列
- 队列的定义:只允许在一端进行插入操作,而在另一端进行删除操作的线性表
- 队列的抽象数据类型
ADT 队列(Queue)
Data :
同线性表
Operation:
InitQueue(*Q)
初始化操作,建立一个空队列*Q
DestroyQueue(*Q)
若队列存在,则销毁它
ClearQueue(*S)
将队列清空
QueueEmpty(*Q)
若队列为空,则返回true,反之返回false
GetHead(Q,*e)
若队列存在且非空,用e返回队头元素
EnQueue(*Q,e)
若队列Q存在,插入新元素e到队列Q中并成为队尾元素
DeQueue(Q,e)
删除队列Q中队头元素,并用e返回其值
QueueLengh(Q)
返回队列Q的元素个数
endADT
- 循环队列
- 定义:队列头尾相接
- 循环队列顺序存储结构
typedef int QElemType;
typedef struct{
QElemType data[MAXSIZE];
int front;
int rear;
}SqQueue;
队列满的条件是
######(rear+1)%QueueSize == front
- 队列的链式储存结构
typedef int QElemType;
typedef struct QNode{
QElemType data;
struct QNde next;
}QNode,QueuePtr;
typedef struct{
QueuePtr font,rear;
}LinkQueue;
五、串
- 串的定义:串是由零个或多个字符组成的有限序列,又名叫字符串
- 串的抽象数据结构
ADT 串(string)
Data
串中元素仅由一个字符组成,相邻元素具有前驱和后继关系
Operation
StrAssign( &T, chars )
初始条件:chars是字符串常量。
操作结果:生成一个其值等于chars的串T。
StrCopy( &T, S )
初始条件:串S存在。
操作结果:由串S复制得串T。
StrEmpty( S )
初始条件:串S存在。
操作结果:若S为空串,则返回TRUE,否则返回FALSE。 StrCompare( S, T )
初始条件:串S和T存在。
操作结果:若S>T,则返回值>0;若S=T,则返回值=0;若S<T,则返回值<0。
StrLength( S )
初始条件:串S存在。
操作结果:返回S的元素个数,称为串的长度。
ClearString( &S )
初始条件:串S存在。
操作结果:将S清为空串。
Concat( &T, S1, S2 )
初始条件:串S1和S2存在。
操作结果:用T返回由S1和S2联接而成的新串。
SubString( &Sub, S, pos, len )
初始条件:串S存在,1≤pos≤StrLength(S)且0≤len≤StrLength(S)-pos+1
操作结果:用Sub返回串S的第pos个字符起长度为len的子串。
Index( S, T, pos )
初始条件:串S和T存在,T是非空串,1≤pos≤StrLength(S)。
操作结果:若主串S中存在和串T值相同的子串,则返回它在主串S中第pos个字符之后第一次出现的位置;否则函数值为0。
Replace( &S, T, V )
初始条件:串S,T和V存在,T是非空串。
操作结果:用V替换主串S中出现的所有与T相等的不重叠的子串。 ######StrInsert( &S, pos, T )
初始条件:串S和T存在,1≤pos≤StrLength(S)+1。
操作结果:在串S的第pos个字符之前插入串T。
StrDelete( &S, pos, len )
初始条件:串S存在,1≤pos≤StrLength(S)-len+1。
操作结果:从串S中删除第pos个字符起长度为len的子串。
DestroyString( &S )
初始条件:串S存在。
操作结果:串S被销毁。
}
endADT
- 串的匹配
- 朴素匹配算法
一个一个匹配 - kmp模式匹配算法
算法思想:利用已经匹配过的数据,创建一个next数组。避免重复遍历
难点:理解next数组
六、树
树的定义
树是n个结点的有限集。n=0时称为空树。在任何一棵非空树:
(1)有且仅有一个特定的称为根的结点
(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集t1、t2、......、tm,其中每一个集合本身又是一棵树,并且称为根的子树-
结点的度:结点拥有的子树数,度为零的称为叶节点(终端结点)
树的度是节点的度的最大值
结点的层次从根开始定义,根为第一层,树中结点的最大层次称为树的深度(高度)
树的抽象数据类型
ADT 树(tree)
Data
树是由一个根节点和若干棵子树构成。树中结点具有相同数据类型及层次关系。
Operation
endADT
- 树的存储结构
双亲表示法
#define MAX_TREE_SIZE 100
typedef int ElemType;
typedef struct PTNode{
TElemType data;
int parent;
}PTNode;
typedef struct
{
PTNode nodes[MAX_TREE_SIZE];
int r,n;/根的位置和结点数/
}PTree;-
孩子表示法
#define MAX_TREE_SIZE 100 typedef int ElemType; typedef struct CTNode{ int child; struct CTNode *next; }*ChildPtr; typedef struct { TElemType data; ChildPtr firstchild; }CTBox; typedef struct { CTbox nodes[MAX_TREE_SIZE]; int r,n; }CTree;
线性表储存结点元素,孩子链表的孩子结点 child是数据域,储存某结点在表头数组中的下标。next是指针域,用来存储指向某结点的下一个孩子的指针
孩子兄弟表示法
typedef int ElemType;
typedef struct CSNode{
TElemType data;
struct CSNode firstchild,rightsib;
}CSNode,*CSTree;-
二叉树
定义
是n个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个跟结点和两棵互不相交的、分别称为根节点的左子树和右子树的二叉树组成。-
存储结构
- 顺序储存结构
从根节点开始遍历二叉树,遇到没有则置空 - 二叉链表
typedef struct BiTNode{
TElemType data;
struct BiTNode lchild,rchild;
} BiTNode,*BiTree;
- 顺序储存结构
-
遍历二叉树
- 定义:从根节点出发,按照一定的次序依次访问二叉树中所有结点,使得每个结点被访问依次且仅被访问依次
- 前序遍历
根左右
* 中序遍历
>左根右
* 后序遍历
>左右根
-
线索二叉树
- 定义:二叉树以某种次序遍历使其变为线索二叉树的过程称为线索化
- 二叉树的线索存储结构
typedef enum{Link,Thread} PointerTag;
typedef struct BiThrNode
{
TElemType data;
struct BiThrNode lchild,rchild;
PointerTag LTag;
PointerTag RTag;
} BiThrNode,*BiThrTree; - 中序遍历线索化
void InThreading(BiThrTree p)
{
if(p) {
InThreading(p->lchild);//左子树线索化
if(!p->lchild){
p->LTag=Thread;
p->lchild=pre;}//前驱线索
if(!pre->rchild){
pre->RTag=Thread;
pre->rchild=p;}//后续线索
pre=p; //保持pre指向p的前驱
InThreading(p->rchild);//右子树线索化
}
}//InThreading
因为此时p结点的后继还没有访问到,因此只能对它的前驱界限pre的右指针rchild做判断,if(!pre->rchild)表示如果为空,则p就是pre的后继,于是pre->rchild=p,并且设置pre->RTag=Thread,完成后继结点的线索化
- 赫夫曼树
- 定义 带权路径长度wpl最小的二叉树称为赫夫曼树(最优二叉树)
- 算法描述
七、图
- 图的定义
- 图是由顶点的有穷非空集合和顶点之间边的集合组成,通常表示为:G(V,E),其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合
- 有向边(弧):顶点vi到vj有方向,则称这条边为有向边
- 简单图:不存在顶点到其自身的边,且同一条边不重复出现,则为简单图
- 无向(有向)完全图:任意两个顶点之间都存在边
- 权:与图的边或弧相关的数
- 网:带权的图
- 回路(环):第一个顶点到最后一个顶点相同的路径
- 简单路径:顶点不重复出现的路径
- 连通图:图中任意两个顶点都是连通的
- 连通分量:无向图中的极大连通子图
- 强连通图:在有向图中,对于每一对vi,vj从vi到vj和从vj到vi都存在路径,则称G是强连通图。有向图中的极大连通子图称做有向图的强连通分量。
- 图的抽象数据结构
ADT 图(Graph)
Data
顶点的有穷非空集合和边的集合
Operation
endADT
- 图的储存结构
- 邻接矩阵
typedef char VertexType;
typedef int EdgeType;
#define MAXVEX 100
#define INFINITY 65355
typedef struct{
VertexType vexs[MAXVEX];/顶点数组/
EdegeType arc[MAXVEX][MAXVEX];
int numVertexes,numEdges;
}MGraph; - 邻接表
- 邻接矩阵
与上一章的孩子表示法思路相同
typedef char VertexType;
typedef int EdgeType;
typedef struct EdgeNode{
int adjvex; /*邻接点域,存储该顶点的对应下标*/
EdgeType weight;/*存储权值*/
struct EdgeNode *next;
}EdgeNode;
typedef struct VertexNode{
VertexType data;
EdgeNode firstedge;
}VertexNode,AdjList[MAXVEX];
typedef struct{
AdjList adjList;
int numVertexes,numEdges;
}GraphAdjList;
* 边集数组
![边集数组]XO.png](http://upload-images.jianshu.io/upload_images/1318539-703d9b755b44bc94.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
* 十字链表
【data、firstin、firstout】【tailvex、headvex、headlink、taillink】
容易求得顶点的出度和入度
-
邻接多重表
- 图的遍历
- 深度优先遍历
从图中某个顶点v出发,访问此顶点,然后从v的未被访问的邻接点出发,深度优先遍历图,直至图中所有和v有路径相通的顶点都被访问到(邻接表) - 广度优先遍历
类似于树的前序遍历(队列)
- 深度优先遍历
- 最小生成树
- (普里姆)prim算法
- (克鲁斯卡尔)kruskal算法
- 最短路径
- (地杰斯特拉)dijkstr算法
- (弗洛伊德)floyd算法
- 拓扑排序
八、查找
- 顺序表查找
- 有序表查找
- 有序查找
- 斐波那契查找
- 插值查找
- 线性索引查找
- 稠密查找
- 到排查找
- 分块索引
- 二叉排序树
- 平衡二叉树
- 多路查找树(B树)
- 散列表查找(哈希表)概述
- 散列函数构造方法
- 处理散列冲突方法
- 散列表的查找实现
九、排序
- 冒泡排序
- 简单选择排序
- 直接插入排序
- 希尔排序
- 堆排序
- 归并排序
- 快速排序